中村哲,鹿野清宏
ファジィベクトル量子化に基づく話者適応化
Abstract:ベクトル量子化が、スペクトル空間の離散表現になるということを利用して、未知話者のスペクトログラムを標準話者のスペクトログラムに写像する話者正規化方式について検討を行う。本論文では、ベクトル量子化を用いたスペクトログラムの話者間での正規化にファジィベクトル量子化の考えを導入する。ファジィベクトル量子化は、既存の各コードベクトルに対する帰属度を用いて入力ベクトルを表現するため、量子化歪を小さくできる。さらにファジィベクトル量子化にk近傍則を導入し高速化、高精度化を行い、スペクトログラムの話者間正規化に適用する。また、話者間の対応関係を示す変換コードブックの学習において、ファジィベクトル量子化の帰属度を確率として用い、変換コードブックの高精度化を行う。音韻バランス216単語、男女計3名分の音声データに対し、スペクトル歪、及び話者間正規化の正規化誤差を用いて評価を行い、ファジィベクトル量子化を用いたスペクトログラム正規化方式の有効性を示す。