Yasuhiro Arai, Jin'ichi Murakami, Tomohiko Beppu, Hideyuki Watanabe
Comparative Study of Acoustical Analysis
Methods for Speech Recognition
Abstract:本稿では、当研究所における音声認識実験およびシステムで用いる音声データのサンプリング周波数を12KHzから16KHzへ変換する際の、最適な音響分析手法について比較検討した結果を報告する。結果として、メルスケールFFTケプストラムが、同次数のリニアスケールLPCケプストラムより高い認識率を示すこと、およびメルスケールFFTケプストラムを分析手法として用いた場合に次数の高低による認識率への影響が小さいことが確認された。