Hiroyuki Sakamoto, Shoichi Matsunaga
Continuous Speech Recognition Using a
Dialog-Conditioned Stochastic Language
Model
Abstract:音声認識における統計的言語モデルの選択使用の効果について検討した.ここでは,
音声対話システムにおいて「ユーザとシステムとの対話」という状況を想定し,ユー
ザ発話の音声認識において直前のシステム側の発話内容に基づき,対話の状況に応じて
ユーザの次発話の予測を行い,予測結果に基づいて統計的言語モデルの選択を行った.
用いる統計的言語モデルは,同じくシステム側の発話内容に基づいてテキストデータ
の分類を行い作成した.この言語モデルの選択使用の効果を音節パープレキシティの
比較および文節認識実験によって評価した.この結果,分類した学習テキストから作
成された言語モデルには明らかな言語情報の偏りが確認でき,次発話予測による統計
的言語モデルの選択使用は音声認識の性能の向上を期待できることが分かった.