Hirato Takesi, Yosinori Sagisaka
種々の発話様式における韻律制御の検討
Abstract:多様な口調を持つ音声の合成を目指して、韻律制御規則の検討を行った。
ここでは音韻継続長の制御、すなわち朗読調の文章における音韻継続時間長は、
ある程度の精度で設定出来るため、この時間長をもとに、通常の会話での口調に
おける音韻継続時間の設定を考察し、誤差の分析を行った。その結果、誤差の最
小値は、朗読調で17.3%、会話調で35.9%であった。おおまかに言って後者は前
者の2倍の誤差が現れることが判った。
また、基本周波数パタンの制御についても、その概形の制御が定量的に行える
枠組みが提供されているので、これを用い、朗読口調のパタンをもとに会話口調
のパタンを設定することをニュラルネットで行う実験を試みた。入力として
基本周波数の対数値を与えた結果、オープン実験で誤差の自乗平均値は28.5Hzで
あった。