Satoshi AKI, Yoshinaga KATO and Masahide SUGIYAMA
Radial Basis Function-Based Fuzzy Partition Models
Aiming at Speech Recognition
Abstract:本研究ではFuzzy Partition Model(FPM)にRadial Basis Function(RBF)を適用し、日本語6子音と18子音の認識実験、および連続音声認識実験を行った。本論文で用いるRBFとは素子からの出力と結合重みとのユークリッド距離を求める関数である。また、RBFを用いた時にはニューラルネットワークの活性化関数にガウシアン関数を用いる。従ってこのネットワークによる空間は超球面上に形成される。一方、FPMは多入力多出力素子で構成されるニューラルネットワークで、連続音声認識認識においてTDNNより高い認識率が得られている。音素認識実験を行った結果、従来のFPMとRBFを適用したFPMとは同等の認識率であった。また、連続音声認識実験に対しては、従来のFPMに比較してRBFを適用したFPMの方は認識率が2.2ポイント低下したがTDNNより3.6ポイント高い認識率が得られた。さらに比較実験の結果、RBFを出力層に適用したFPMと、出力層、中間層共にRBFを適用したFPMとでは前者の方が認識率が高かった。