Masaaki YAMAMOTO, Keiji FUKUZAWA, Masahide SUGIYAMA
Unsupervised Speaker Adaptation Using VQ Neural Network
Abstract:教師あり話者適応化は、教師信号に基づいて適応化の写像を構成するため強力であるが、あらかじめ決めら
れた発声を行なわなければならないと言う点で柔軟性に乏しい。これに対して、教師なし話者適応化は、任
意の発声を基に適応を行なえるため柔軟性に富みその用途が広い。本研究ではVQ
とニューラルネットが共に歪
み最小化の基準で動作している点に着目し、VQとニューラルネットを組み合わせた教師なし適応化方式の有効性
を評価した。5母音による評価実験の結果、72.0%であった適応化前の認識率が、適応化によ
りの認識率94.4%となり、本手法の有効性が確認された。