Sugimura Kouji, Fukada Toshiaki
Speaker normalized acoustic modeling based
on 3-D Viterbi search algorithm
Abstract:高性能な音声認識システムを実現する上で、認識性能の高い音響モデルの構築は
必要不可欠な技術である。そのための一つの方法として、周波数ワーピングを用いた
話者正規化音響モデルの作成が行なわれている。しかし、従来の方法では一つの発
話内においては、ワーピング係数を固定とする制限が付けられていた。そこで今回、
ワーピング係数を発話内においても可変とし、より精密な音響モデルの作成を試み
た。その結果、ワーピング係数を発話内で固定として作成した音響モデルと比較した
場合、学習データに対して常に高い尤度を示す、音響モデルが作成できた。