宮島千代美,渡辺秀行,徳田恵一,北村正,片桐滋
識別的特徴抽出に基づく最小誤り話者認識のための特徴抽出
Abstract:話者認識システムは特徴抽出器および分類器から構成されている.多くの場合,話者の特徴は
リニアスケールもしくはメルスケールに基づいて抽出される.また,高周波数領域に話者の特徴が
多く存在するという説もある.しかし,分類器の設計規準と異なる規準で選ばれたこれらの特徴は,
必ずしも最適な認識性能に結び付くとは限らない.そこで本研究では,最小分類誤り/一般化確率的
降下法(MCE/GPD)の拡張である識別的特徴抽出法(DFE)により,話者認識性能にとって最適な
特徴抽出器の設計を行う.ここでは,GMMに基づくテキスト独立型話者識別において,ある特定
の周波数域を強調することが可能な2次オールパス関数による周波数ワーピングを利用したメルケ
プストラム推定法を特徴抽出に適用し,最小誤り規準で周波数ワーピングと分類器の同時最適化を
行う.その結果,従来とは異なる周波数ワーピングが得られ,同時に,従来の特徴量を用いて分類
器のみを最適化した場合に比べて高い認識性能が得られることを示す.