Norio Sugita, Masaki Naito
Frequency Warping Based Speaker Normalization
Abstract:話者による音声の音響的特徴の広がりを正規化した後に音響モデルの学習を行い不特定話者音声認
識の性能向上を図るため、声道長に着目した周波数ワーピングによる話者正規化手法が提案されその有効
性が報告されている。本稿では、周波数ワーピング関数を決定する手段として一般に用いられる(1)
ゆう度に基づく周波数ワーピング関数の選択、(2)フォルマントに基づく周波数ワーピング関数の推定
の2つの手法について認識実験を通じてその性能の比較・検討を行う。