内藤正樹,松井知子
対話音声を対象とした日本語連続音声認識システムの
試作と評価(音響モデル: ResearchJ V9)
Abstract:対話音声を対象とした音声認識システムATRSPRECの試作・評価を行った.シ
ステム構築にあたり,対話音声認識において認識性能劣化の大きな要因となる話者の
発話様式の変化に対して頑健な音声認識を実現するため,発話様式依存音響モデルを
用い,認識と同時に各発話に対して最適な音響モデルを動的に選択することで,発話
様式の変化に対するオンライン適応を実現した.日英音声翻訳システムを通した対話
音声を用いた音声認識実験によりシステムの認識性能の評価を行った.対話データの
解析の結果,音声認識システム利用者がシステムに慣れるにつれ,発話様式に変化が
見られたが,発話様式依存音響モデルの動的選択を行うことで,自然発話,朗読音声
用音響モデル各々を単独で用いた場合の誤認識が約13%削減され,発話様式の変化に
伴う音声認識性能の劣化が改善された.