Masanobu ABE
Cross-Language Voice Conversion
Abstract:言語わたる声質変換の最終目的は、自動翻訳された音声(英語)に話者(日本人)の
個人性を付与することである。基本検討として、日本語と英語のバイリンガル
話者の音声を分析して、以下のことが明らかとなった。
・バイリンガルの発声した英語と日本語は、2名の日本人の発声した日本語と
比べて、スペクトルの広がりは小さく、スペクトルの分布も近い。
・英語に特徴的なスペクトルは、/r/、/æ/、/č/、/š/ などの限られた音韻に現
れる。
・英語の静的なスペクトル特徴は上述のように明らかであるが、聞こえの点
ではその差は少ない。
この結果をもとに言語にわたる声質変換モデルを考を提案し、変換実験を行っ
た。その結果、英語の音韻了解性を保存したまま日本人の声質を得ることがで
きた。また、言語にわたる声質変換モデルのための尺度を提案し、有効に使用
できることを確認した。