TR-I-0004 :1987.5

橋本泰秀,川端 豪

統計的手法による音韻認識

Abstract:音声認識における統計的な手法の利用は、識別関数の設計や距離尺度の構成などに、古くから多く行われているが、特にここ数年の間に隠れマルコフモデル(HMM)を用いる方法が注目されだしている。HMM手法の音声認識に対する利用法は、単語を認識対象とする場合と音素を認識対象とする場合に大別されるが、本報告では音素の中でも特に識別の難しい有声破裂音(/b/,/d/,/g/)を、ベクトル量子化及びHMMの手法を用いて認識することを試みる。音素のモデルとして3状態からなるレフト・トゥー・ライトマルコフモデルを用い、バーム・ウェルチ(Baum-Welch)のアルゴリズムによってモデルの学習を行う。また、トレリス(Trellis)のアルゴリズムを用いて認識実験を行う。学習に使用したデータを認識評価実験にも用いた場合(すなわちcloseの条件)における有声破裂音認識率は、平均93.5%であった。 なお本報告書は、豊橋技術科学大学情報工学過程4年次橋本泰秀が昭和62年1月8日~2月28日の期間にATR自動翻訳電話研究所において行った研究を、実務訓練報告書としてまとめたものである。