TR-IT-0045 :1994

倉岡幹雄,小坂哲夫

話者クラスタリングを利用した 不特定話者音素モデルの作成法

Abstract:従来、不特定話者音声認識を行なう場合、学習話者に対する検討が十分になされたとは言えない。特定話者音声認識におけるモデル作成法と同様な方法で、話者数だけを増加させ不特定話者モデルを作成する場合が普通であった。そこで本稿では、不特定話者音素モデル作成における話者の種類と話者数について検討を行なった。また話者数が増加した場合モデル作成に計算コストがかかるという問題があった。この問題に対し、パラメータの再推定をすることなく、特定話者音素モデルを合成し不特定話者音素モデルを作成する方法を提案する。以上について不特定話者音素認識実験により有効性を検討した。