伊田政樹,河井淳,脇田由実
混合N-gramを用いた認識システムの評価
Abstract:音声認識処理において、認識性能を向上させるため言語情報を利用する手法
が研究されている。音声認識処理と翻訳処理を統合することを考えた場合、この
双方で用いる言語モデルを統一せねばならない。しかしながら本研究室で用いて
いるシステムでは、音声処理においては、認識性能の観点から単語N-gramを、
翻訳処理においてはopenな単語も扱えるように自立語は品詞、付属語は単語のN-
gram(以下混合N-gramと記す)を用いている。今後、音声認識部と翻訳処理部
の言語モデルを統一化するために、翻訳処理部で用いている混合N-gramを音声認
識処理にも使用することで、N-gramを作成するにあたって用いたコーパスに対
して単語openな文の認識も可能にした場合の認識システムの性能を評価した。
さらに、認識結果を翻訳した場合の翻訳正解率を確認し、TDMTでリカバー
可能な誤認識の分析を行なった。