TR-IT-0233 :1997.9.12

杉村耕司,深田俊明

3次元ビタビアルゴリズムを用いた 話者正規化音響モデルの作成

Abstract:高性能な音声認識システムを実現する上で、認識性能の高い音響モデルの構築は 必要不可欠な技術である。そのための一つの方法として、周波数ワーピングを用いた 話者正規化音響モデルの作成が行なわれている。しかし、従来の方法では一つの発 話内においては、ワーピング係数を固定とする制限が付けられていた。そこで今回、 ワーピング係数を発話内においても可変とし、より精密な音響モデルの作成を試み た。その結果、ワーピング係数を発話内で固定として作成した音響モデルと比較した 場合、学習データに対して常に高い尤度を示す、音響モデルが作成できた。