Kenji Kita, Takeshi Kawabata, Hiroaki Saito
HMM Continuous Speech Recognition
Using Generalized LR Parsing
Abstract:高精度の連続音声認識システムを構築するためには、言語情報の利用が不可欠であり、これ
までにも、統計的言語モデル、正規文法、文脈自由文法等を用いて音声認識システムの認識率
を向上させる方法が提案されている。本レポートでは、これらとは異なる新しい方法HMM-LR法を提案する。HMM-LR法は、拡
張LR構文解析法で用いられる構文解析動作表から入力音声データ中の音韻を予測し、予測された音韻の存在確率をHMM音韻照合で調べることにより、
音声認識と言語処理を同時進行させる。この方式では、音声認織と言語処理の間に音韻ラティス等の中間的なデータを介する必要がなく、高精度のかつ効率
的な認識処理系を構成することができる。また、HMM-LR法に基づく日本語の文節認織システムを作成し、評価を行った。評価には、日本語の一般的な
文節構造を扱うことのできる一般的文法(語彙数約1000語)と認識対象となるタスクに現れる現象のみを扱うタスク向き文法(語彙数約270語)の2種類の文法を用
いた。一般的文法に対する第1位での正答率は72.0%、第5位までで95.3%の正答率を達成した。タスク向き文法に対しては、それぞれ79.9%、98.6%の正答率
を達成した。