機械がしゃべる Voice Mixer

林 洋介

2007年9月13日名古屋学芸大学にて

コンピュータで、話をしよう

Voice Mixerは「フォルマント合成」という音響合成技術を使って機械にしゃべらせるプログラムです。 「フォルマント」とは、音に含まれる周波数の振幅が大きい部分のことで、フォルマントの周波数と時間的変化の構成パターンが、各々の音を特徴づけています。そのため、同じ波形を電気的に作ってあげれば、人の声や楽器の音など、様々な音を作り出すことができるのです。 フォルマントのピークは、低いところから「第1フォルマント」「第2フォルマント」…というふうに呼ばれます。このプログラムでは、「第1フォルマント」(横軸)と「第2フォルマント」(縦軸)を変化させることで、母音を模倣しています。 子音の合成については、サウンドファイルから選んだ「初期状態の子音+移行状態の母音」に、フォルマント合成による「最終的な母音」をタイミングよくミックスすることで、目的の子音を実現しています。たとえば、「さ」をゆっくり発音すると、「すぅあ」という感じになりますね。子音から母音に移る間にも、別の母音が存在していると考えられます。 なお、フォルマント合成の理論や実装の際のパラメータなどは、ノイマン・ピアノ著『2061:A Max Odyssey』を参考にしています。著者の一人である佐近田展康さんには、子音の合成方法と考え方について助言をいただきました。この場を借りてお礼申し上げます。

林 洋介(情報科学芸術大学院大学)

2006 (C) NATIONAL MUSEUM OF EMERGING SCIENCE AND INNOVATION