TR-SLT-0060 :2003.10.23

武田晴登,松田繁樹,中村哲

直積混合分布を用いた音響モデルの検討

Abstract:隠れマルコフモデル(Hidden Markov Model)の状態出力確率分布として直積混合 分を用いた新しい音響モデルに関する定式化と評価実験について報告する.音声認識 に広く用いられているHMMは,パラメータ数を増加させることによりモデルを精密 化することができる.しかし,パラメータ数の増加によって個々のパラメータを推定 するために用いられる学習データ量が減少するため,いわゆる過学習によって音声認 識性能が低下する.本報告では,特徴量ベクトルの個々の成分における混合分布の直 積を状態出力確率分布として用いる新しい音響モデルについて検討を行う.このよう に表現された分布を本報告では「直積混合分布」と呼ぶこととする.直積混合分布を 用いることにより,従来の混合分布と比べて,パラメータ数が等しかったとしても, より広い音響空間を覆うことができると考えられる.従って,少ないパラメータ数で 大量の分布を推定することができ,従来よりもロバストな音声認識が可能となること が期待される.本報告では,EM(Expectation Maximization)アルゴリズムに基づく, 直積混合分布パラメータの推定方法及び,直積混合分布の構造である,個々の特徴 量に割り当てられる混合数の決定方法について述べる.切り出し音素の識別の評価 実験では,直積混合分布を用いた場合と,従来の混合分布を用いた場合の認識精 度は同程度であった.