Hideaki IWAMOTO
次発話予測モデルに基づく
音声認識候補の再スコア付け
Abstract:音声認識の精度改善のために、発話間の単語共起を統計的に学習した言語モデルを利用することを
提案する。このモデルによる改善方式は、直前の発話を前提として、発話間にまたがる単語対の生起確
率から発話の尤度を求める、というものである。551発話の音声認識結果に対し、提案モデルを適用す
る実験を行った。その結果、単語認識率のerror rateを2%削減した。このうち、内容語が改変した
のは、31発話で、そのうち、23発話を改善した。この内容語に対する改善率は、74.2%である。こ
れに対して、改変があった全ての発話は51発話、そのうち改善されたものは32発話、その改善率は
62.7%である。この実験により、提案モデルの内容語への改善効果が高いことを示す。