Makoto Hashimoto, Satoshi Kitagawa, Norio Higuchi
Quantitative Analysis of Acoustic Features
Affecting Speaker Identification
Abstract:音響特徴の個人性知覚への寄与度と話者間の各音響特徴の差との関係を分析する
ために、基本周波数、スペクトル、音素継続時間に対して、ABX聴取実験により聴
覚的寄与度を求めると共に、寄与度の予測モデルを提案した。さらに、話者の既知
/未知、背景雑音の影響を、統計的手法により分析した。分析の結果、(1)スペクト
ル、基本周波数は個人性知覚に対する顕著な寄与が認められること、(2)寄与度は音
響特徴の差に依存すること、(3)既知話者の場合は、未知話者の場合に比べてスペクト
ルの影響が大きくなること、(4)雑音重畳音声の場合は、無雑音音声の場合に比べ
て基本周波数の影響が大きくなる領向があること、(5)予測モデルは、6.2~13.4%
(RMS)の誤差で推定が可能であること、などが明らかとなった。