TR-IT-0319

TR-IT-0319 :2000.1.11

Toshiyuki TAKEZAWA, Tsuyoshi MORIMOTO

Using Pause Information in HMM-LR Continuous Speech Recognition Accepting Sentence Utterance

Abstract:自然な発話の認識を目指し、文を発話単位とした連続音声認識手法の検討を進めている。HMM- LR連続音声認識手法をベースにして、統語的に適格な文を対象に、文節毎にポーズを置いても置かなくてもよいような発話の受理を目的とした。認識過程で爆発的に増加する計算量を削減するために、ポーズ情報を積極的に利用する2つの手法を検討した。1つは、ポーズが検出できた時に統語的な曖昧性をパッキングするものである。もう1つは、ポーズ情報を音素照合区間の削減に利用するものである。予備実験によりその有効性が確認できたので、その内容について報告する。