Mitsuru Nakai, Harald Singer, Yoshinori Sagisaka
Use of Accent Phrase Boundary Likelihood
in a Frame Synchronous SSS-LR
Abstract:従来のフレーム同期型SSS-LRでは同一の音素履歴における異なる構文仮説は同じス
コアを共有していた。そこで、本報告では、アクセント句境界尤度計算、および、SSS-LRに
よる連続音声認識をフレーム同期に処理することによって、構文仮説を制御する手法を提
案する。
句境界尤度の計算はOne Stage DPによるテンプレート整合法を用いてフレーム毎に
句境界仮説を立て、100ms窓幅で仮説を検証することで、スコアを出力する。
フレーム同期型SSS-LR認識部では、音素履歴のLR状態がアクセント句に還元する
アクションとそれ以外のアクションの両方をもつときには、履歴を2分割し、アクセント句
に還元する側に句境界尤度を与える。
評価用テストセットSL2を用いた実験では音素認識率、単語認識率ともに向上する結
果が得られた。