人見知りをしない音声認識機械
−誰の越えでも認識できる技術を目指して−




(株)ATR音声翻訳通信研究所 小坂 哲夫、匂坂 芳典、松永 昭一



音声翻訳をはじめ、音声を入力手段とするシステムを、不特定の人が自由に使えるようになるためには、機械はいろいろな人の声を認識できなければなりません。ATRでは、話し手によって異なる音声を認識するため、階層的にグループ化した複数人の統計モデルを用いた認識方法を研究しています。いろいろな人の声に対しても、似た声質を持つ人々の認識モデルを自動的に選んで使用することにより、認識率が向上しました。

本文へ