TR-I-0149

TR-I-0149 :1990.2

Hirato Takesi, Yosinori Sagisaka

種々の発話様式における韻律制御の検討

Abstract:多様な口調を持つ音声の合成を目指して、韻律制御規則の検討を行った。ここでは音韻継続長の制御、すなわち朗読調の文章における音韻継続時間長は、ある程度の精度で設定出来るため、この時間長をもとに、通常の会話での口調における音韻継続時間の設定を考察し、誤差の分析を行った。その結果、誤差の最小値は、朗読調で17.3%、会話調で35.9%であった。おおまかに言って後者は前者の2倍の誤差が現れることが判った。また、基本周波数パタンの制御についても、その概形の制御が定量的に行える枠組みが提供されているので、これを用い、朗読口調のパタンをもとに会話口調のパタンを設定することをニュラルネットで行う実験を試みた。入力として基本周波数の対数値を与えた結果、オープン実験で誤差の自乗平均値は28.5Hzであった。