Shinji fujioka, Jun Ishii
A Study on Speaker Adaptation Using
Linear Regression
Abstract:連続分布型HMMを用いた話者適応の一つとして重回帰写像モデルに基づく方式
があり、その有効性が報告されている。本稿では、最尤を基準に変換行列を推定する
Maximum Likelihood Linear Regression(MLLR)について検討する。この方式で
は、適応データの量に応じて変換パラメータ数を最適に設定することが重要である。本
稿では、適応データ数と変換パラメータ数の認識性能に与える影響を評価する。また、
適応データ数により変換パラメータ数を決定する方法を検討し、音素認識実験で評価
した結果を報告する。