TR-IT-0233

TR-IT-0233 :1997.9.12

杉村耕司,深田俊明

3次元ビタビアルゴリズムを用いた話者正規化音響モデルの作成

Abstract:高性能な音声認識システムを実現する上で、認識性能の高い音響モデルの構築は必要不可欠な技術である。そのための一つの方法として、周波数ワーピングを用いた話者正規化音響モデルの作成が行なわれている。しかし、従来の方法では一つの発話内においては、ワーピング係数を固定とする制限が付けられていた。そこで今回、ワーピング係数を発話内においても可変とし、より精密な音響モデルの作成を試みた。その結果、ワーピング係数を発話内で固定として作成した音響モデルと比較した場合、学習データに対して常に高い尤度を示す、音響モデルが作成できた。

TR-IT-0233 :1997.9.12

杉村耕司,深田俊明

3次元ビタビアルゴリズムを用いた 話者正規化音響モデルの作成

3次元ビタビアルゴリズムを用いた話者正規化音響モデルの作成