TR-IT-0092 :1995.2

伊田政樹,河井淳,脇田由実

混合N-gramを用いた認識システムの評価

Abstract:音声認識処理において、認識性能を向上させるため言語情報を利用する手法 が研究されている。音声認識処理と翻訳処理を統合することを考えた場合、この 双方で用いる言語モデルを統一せねばならない。しかしながら本研究室で用いて いるシステムでは、音声処理においては、認識性能の観点から単語N-gramを、 翻訳処理においてはopenな単語も扱えるように自立語は品詞、付属語は単語のN- gram(以下混合N-gramと記す)を用いている。今後、音声認識部と翻訳処理部 の言語モデルを統一化するために、翻訳処理部で用いている混合N-gramを音声認 識処理にも使用することで、N-gramを作成するにあたって用いたコーパスに対 して単語openな文の認識も可能にした場合の認識システムの性能を評価した。 さらに、認識結果を翻訳した場合の翻訳正解率を確認し、TDMTでリカバー 可能な誤認識の分析を行なった。