TR-SLT-0061 :2004.03.02

青野邦生,安田圭志,竹澤寿幸

対話音声における発話スタイルの分析と それに基づく認識率の改善

Abstract:音声翻訳システムや対話音声システムは,会話調の音声を処理する必要がある.現在の 音声認識技術は,大規模音声コーパスの開発や計算機の高速化の後押しを受け,読み上げ 調の音声に対しては高性能の音声認識システムが開発されている.しかし,会話調の音声 の認識については多くの課題が残されており,認識率を向上させる必要がある.本研究で は,まず,予備実験として単語の持つ情報である品詞,言語尤度に注目し,発話スタイル とそれらの情報との関連性を調べる.そして,それにより得られた知見に基づき,発話ス タイルの異なる二つの音響モデルを単語単位で自動選択することにより,音声認識率の改 善を行う.その結果,単独の音響モデルを用いた場合よりも,単語誤り率が,1.62ポイント 低減できている.