TR-IT-0179 :1996.8.30

Shinji fujioka, Jun Ishii

A Study on Speaker Adaptation Using Linear Regression

Abstract:連続分布型HMMを用いた話者適応の一つとして重回帰写像モデルに基づく方式 があり、その有効性が報告されている。本稿では、最尤を基準に変換行列を推定する Maximum Likelihood Linear Regression(MLLR)について検討する。この方式で は、適応データの量に応じて変換パラメータ数を最適に設定することが重要である。本 稿では、適応データ数と変換パラメータ数の認識性能に与える影響を評価する。また、 適応データ数により変換パラメータ数を決定する方法を検討し、音素認識実験で評価 した結果を報告する。