TR-IT-0164

TR-IT-0164 :1996.3.28

Hiroyuki Sakamoto, Shoichi Matsunaga

Continuous Speech Recognition Using a Dialog-Conditioned Stochastic Language Model

Abstract:音声認識における統計的言語モデルの選択使用の効果について検討した．ここでは，音声対話システムにおいて「ユーザとシステムとの対話」という状況を想定し，ユーザ発話の音声認識において直前のシステム側の発話内容に基づき，対話の状況に応じてユーザの次発話の予測を行い，予測結果に基づいて統計的言語モデルの選択を行った．用いる統計的言語モデルは，同じくシステム側の発話内容に基づいてテキストデータの分類を行い作成した．この言語モデルの選択使用の効果を音節パープレキシティの比較および文節認識実験によって評価した．この結果，分類した学習テキストから作成された言語モデルには明らかな言語情報の偏りが確認でき，次発話予測による統計的言語モデルの選択使用は音声認識の性能の向上を期待できることが分かった．