Hiroaki Kokubo, Teruaki Hayashi, Hirofumi Yamamoto, Genichiro Kikui
Efficient Decoding and Memory Size Reduction
for Continuous Speech Recognition
Abstract:ATRの連続音声認識プログラムATRIUMSに実装されている探索処理の効率化,
省メモリ化手法について解説する.連続音声認識の仮説探索の高速化,省メモ
リ化を実現するためには,生成される仮説数の削減が有効である.ATRでは,
(1)同音語の言語尤度の共有化,(2)開始時刻の代表処理による先行単語の共有化,
(3)枝刈りにより不要となった単語仮説の効率的な削除手法を導入することで,生
成される仮説数の削減を図っている.また,木構造辞書に関しては,各ノード
に付与する言語スコアに近似手法を導入することでテーブルサイズを削減し省
メモリ化を図っている.評価実験では,単語グラフに登録される単語仮説の仮
説数削減と木構造辞書のfactoringテーブルのメモリ削減についてその効果を報
告する.