TR-I-0191 :1991.1

阿部匡伸

音声の個人性制御の研究

Abstract:音声の個人性を変換する目的で行った研究である。まず、コードブックマッピングによる声質変換アルゴリズムを提案し、これを評価した。次に、短時間フーリエスペクトル分析合成系を用いたピッチ周波数変換アルゴリズムを提案し、これを評価した。第三に、バイリンガル話者の英語と日本語を分析し、言語による音声スペクトルの差を明らかにした。この分析結果に基ずいて、コードブックマッピングによる声質変換アルゴリズムを用いて、言語にわたる声質変換を試みた。最後に、コードブックマッピングによる声質変換アルゴリズムをフレーム単位からセグメント単位に拡張し、声質変換の高度化を試みた。

In this report, we will discuss algorithms to change speaker individuality: i.e., speech uttered by a speaker is changed or modified to sound as if another speaker had uttered it. First, we formulate voice conversion as a mapping problem by introducing vector quantization. Secondly, we propose a new algorithm which makes it possible to synthesize high quality speech even if the pitch frequency or duration is somewhat changed. Third, we discuss if speaker individuality can be controlled across different languages. Finally, to improve voice conversion performance, we propose also to convert the dynamic characteristics of speaker individuality by using speech segments as conversion units.