TR-S-0013

TR-S-0013 :2000.11.27

内藤正樹,松井知子

対話音声を対象とした日本語連続音声認識システムの試作と評価（音響モデル： ResearchJ V9)

Abstract:対話音声を対象とした音声認識システムATRSPRECの試作・評価を行った．システム構築にあたり，対話音声認識において認識性能劣化の大きな要因となる話者の発話様式の変化に対して頑健な音声認識を実現するため，発話様式依存音響モデルを用い，認識と同時に各発話に対して最適な音響モデルを動的に選択することで，発話様式の変化に対するオンライン適応を実現した．日英音声翻訳システムを通した対話音声を用いた音声認識実験によりシステムの認識性能の評価を行った．対話データの解析の結果，音声認識システム利用者がシステムに慣れるにつれ，発話様式に変化が見られたが，発話様式依存音響モデルの動的選択を行うことで，自然発話，朗読音声用音響モデル各々を単独で用いた場合の誤認識が約13%削減され，発話様式の変化に伴う音声認識性能の劣化が改善された．

TR-S-0013 :2000.11.27

内藤正樹,松井知子

対話音声を対象とした日本語連続音声認識システムの 試作と評価（音響モデル： ResearchJ V9)

対話音声を対象とした日本語連続音声認識システムの試作と評価（音響モデル： ResearchJ V9)