言葉を覚えて声を聞く
−高精度な音声認識のための言語的知識の獲得−




(株)ATR音声翻訳通信研究所 第一研究室 磯谷 亮輔、村上 仁一、Helmut Lucke



コンピュータで会話文の音声認識をより精度よく行なうためには、音響的特性の比較基準となる音響パタンのモデルに加え、構文や語彙に関する言語的な知識が必要になります。従来の小規模認識システムは言語的な知識を人手で与えてきましたが、この方法では扱う語彙数が限られ、より変化に富んだ自然な会話文を対象に含めることは困難です。このため、言語的知識を大量のテキストデータから統計処理により自動的に獲得する方法の開発が必要です。ここでは、統計的な言語モデルとその音声認識への適用について私たちの研究を紹介します。


本文へ