Tadashi OKAMOTO, Kouichi YAMAGUCHI, Shigeki SAGAYAMA and
Kenji KITA
A Study on the Adaptive Search Methods in HMM-LR
Continuous Speech Recognition
Abstract:HMM-LR連続音声認識において、現在用いられているビームサーチは最適性が保証されていない上、高い認識率を得
るためにはビーム幅を大きくしなければならず、多くの音素照合回数を必要とする。そこで今回、探索空間の縮小(=音素
照合回数の削減)をめざし、動的なビームサーチ方法と、ビームサーチとベストファーストサーチを組み合わせた方法を開
発し、認識率、音素照合回数の比較・検討を行った。前者は各深さでの尤度の分布をもとに、ビーム幅を変化さ
せるものである。音素照合回数は1/2以下に削減できたが、若千の認識率低下を招いた。後者は最初はビームサーチを行い、
ある程度候補が絞られてきた時点でベストファーストに切り替えるものである。ベストファーストサーチ単独に比べ認識率は
少し改善されるが音素照合回数は増加した。