小原和昭,平原達也
固定Q型蝸牛フィルタを用いた単語認識
- 耐雑音性、耐残響性、話者変動の評価 -
Abstract:人間の聴覚系は音声認識装置として非常に優れた性能を持っている。例えば
代表的な音声認識装置はSN比が25[dB]以下のノイズ環境下ではその認
識性能は大きく劣化してしまう。一方我々はSNが5~10[dB]程度の悪
い環境下であっても話者の発声内容を容易に認識できる。この様な聴覚
系での信号処理機構を反映した特徴抽出を音声認識フロントエンドとして用い
音声認識の性能を改善しようとする試みがなされてきている。
本報告は聴覚固定Q型蝸牛フィルタを音声認識のフロントエンドとして用い
た場合の雑音、残響,話者変動に対する認識耐性をDTWによる単語認識を通して
DFTフロントエンドと比較したものである。第2章では聴覚モデルを音声認
識のフロントエンドとして用いた従来の認識実験結果をまとめるとともに、本
実験で用いた実験条件、音声データの作成方法について述べる。第3章では実
験内容とその結果について述べる。第4章では実験に用いたフロントエンドに
ついて考察する。第5章では本研究のまとめと今後の課題について整理する。