TR-IT-0179

TR-IT-0179 :1996.8.30

Shinji fujioka, Jun Ishii

A Study on Speaker Adaptation Using Linear Regression

Abstract:連続分布型HMMを用いた話者適応の一つとして重回帰写像モデルに基づく方式があり、その有効性が報告されている。本稿では、最尤を基準に変換行列を推定する Maximum Likelihood Linear Regression(MLLR）について検討する。この方式では、適応データの量に応じて変換パラメータ数を最適に設定することが重要である。本稿では、適応データ数と変換パラメータ数の認識性能に与える影響を評価する。また、適応データ数により変換パラメータ数を決定する方法を検討し、音素認識実験で評価した結果を報告する。