TR-A-0161 :1993.3.1

升方幹雄,相川清明

順向逆向両マスキングを併用した動的ケプストラムによる音声認識

Abstract:聴覚系には、先行する音声が現時点の音声をマスクする順向マスキングと、後続する音声が 現時点の音声をマスクする逆向マスキングがある。これらのマスキングの時間周波数特性に基 づいて音声の動的特徴を強調したスペクトルパラメータを動的ケプストラムと呼ぶ。順向マス キングのみを用いた動的ケプストラムを連続型HMMのパラメータとして用いることの有効性 は既に報告されている。本報告では動的ケプストラムを用いる音声認識において、順向マスキ ングの他に逆向マスキングを考慮する各種の方法について検討した結果について述べる。その 結果、順向マスキングを考慮した動的ケプストラムと逆向マスキングを考慮した動的ケプスト ラムを併用することにより認識率を向上できることがわかった。なお、本研究ではケプストラ ムをより聴覚的な周波数軸であるメル尺度に変換したメルケプストラムを基本パラメータとし て検討を行なっている。