スマホ越しに聞こえる恋人・家族の声は合成されたニセモノ!? 驚愕のシステムとは? 【知らない人が多い!? 「令和元年版」理系の新常識】①

スポーツ・科学

2019/4/2

『知っていることの9割はもう古い! 理系の新常識』(現代教育調査班:編/青春出版社)

 大人になると、学生時代に苦手だった理系科目にますます距離を感じるという人も多くなるものだ。でも、理系の知識は、私たちの生活に身近な技術や情報など、生活に欠かせない知識にも必ず関わるものだ。

 あなたが苦手だと思って遠ざけていた間に、常識だと思っていた知識はとっくに古いものになっているかもしれない。この連載では『知っていることの9割はもう古い! 理系の新常識』(現代教育調査班:編/青春出版社)から、知ると誰かに教えてあげたくなるような最新の科学知識を紹介していきたい。

■スマホ越しに聞こえる相手の声は「データの合成」だった! (本書138ページ)

 携帯電話で話していると、いつもよく知っている相手の声が直接話すときとは印象が違うなと感じたことはないだろうか? 実は、その感覚は正しいそうだ。携帯電話の声は、本人の声ではなく、よく似ているけれどもまったく別の“コード化された音声”だという。

 固定電話では、本人の声を電気の波形に変換する「波形符号化式」という方法を使い、その電波は回線を通じて相手の電話へ届けられるため、本人の声を直接伝えることが可能だった。

 一方、携帯電話では音声をそのままデジタル化するとデータ量が膨大になり通信を圧迫してしまうため、データ量を少なくする「ハイブリッド符号化方式」という手法を採用している。携帯電話の中には「固定コードブック」という人の声の音源が入っており、そのコードブックの音の組み合わせによって声の特徴に「よく似た」音声を組み立てる。相手の電話口には、コードを組み合わせた音声と、オリジナルの音韻(イントネーション)情報を合成して流すのだ。

 この作業のタイムラグはわずか0.2秒だというから、ほぼリアルタイムに近い。現状でも本人の声でないと認識することは難しく、さらなる合成音声技術の進化で、音質は一層改善されていくそうだ。頻繁に顔を合わせている家族や恋人とのスマホ越しの会話が、実はすべて音声コードの組み合わせでつくられた「科学的なもの」だったのかと思うと、SF映画を見ているような不思議な気分になる…。

 本書では、このように私たちがうっかりアップデートしそびれてきた「最新の理系の常識」を教えてくれる。平成生まれの人も、昭和生まれの人も、本書を片手にあなたの知識の「新旧度」を計ってみてはどうだろうか?

文=田坂文