Toshiyuki TAKEZAWA, Tsuyoshi MORIMOTO
Using Pause Information in HMM-LR Continuous
Speech Recognition Accepting Sentence Utterance
Abstract:自然な発話の認識を目指し、文を発話単位とした連続音声認識手法の検討を進めている。HMM-
LR連続音声認識手法をベースにして、統語的に適格な文を対象に、文節毎にポーズを置いても置か
なくてもよいような発話の受理を目的とした。認識過程で爆発的に増加する計算量を削減するため
に、ポーズ情報を積極的に利用する2つの手法を検討した。1つは、ポーズが検出できた時に統語的
な曖昧性をパッキングするものである。もう1つは、ポーズ情報を音素照合区間の削減に利用するも
のである。予備実験によりその有効性が確認できたので、その内容について報告する。