TR-IT-0231 :1997.08.28

高橋一裕,中村篤

生成駆動音声認識方式(GD-SR)

Abstract:本報告では、音声翻訳の際に問題となる認識誤り(脱落、湧出)を効果的に抑制し、適切に言語翻訳処理可能な結果を出力する音声認識手法を提案する。提案手法(生成駆動音声認識"Generaion Driven Speech Recognition(GD-SR)")は1度目の音声認識結果を基に文仮説を生成し、生成した仮説を言語制約として再度音声認識を行なうという手法である。 実験を行ない、従来のN-gramモデルに比較して単語正解率が6%向上し、又、認識結果の翻訳の成功率は21%向上する、という結果を得た。

In thie paper, we proposes a spontaneous speech recognition method which effectively suppresses false alarms and deletions that are serious problems for speech translation. Our method ("Generation Driven Speech Recognition (GD-SR)") generates sentence hypotheses from speech recognition results and executes speech recognition again using these hypotheses as new language constraints. In the experiment, the proposed method improved 6% in word accuracy and 21% in Japanese-English translation quality in comparison with a conventional N-gram based speech recognizer.