徳田・李研の音声合成技術がNTTドコモに搭載 携帯電話がしゃべる
2011年2月 投稿者: NitechPress
音声合成エンジンhts_engine APIは統計モデルを使用していることから、メモリサイズが小さいことが特徴で、情報基盤となったHMM-based speech synthesis system(HTS)は以前本紙でも紹介したSinsyやMMDAgentにも搭載されている。
同エンジンの開発を担当した大浦圭一郎特任助教(情報)は「自分が書いたコードが製品になるのは嬉しい。今回採用されたエンジンはただ読み上げ文章のみに用いられているが、その応用の可能性は高く、実際にSinsyでは歌声の合成に、MMDAgentでは感情を持った音声の合成に用いられているので、そのような使われ方も期待している。」と話した。感情表現を活かした応用については徳田恵一教授(情報)も「情報家電が人格を持って人間と意思の疎通ができる未来を目指したい」と話す。
なおHTSは携帯電話以外でもカーナビなど様々な機器に使用されており、多数の会社が採用している。これからはさらに多くの機器と会話が出来るようになるだろう。