TR-A-0123

TR-A-0123 :1991.11.1

片桐滋

識別学習理論による音声認識

Abstract:本技術覚書は、我々が数年来研究を進めてきた2つの概念、1)一般化確率的降下法( GPD: Generalized Probabilistic Descent Method)と2)これを最も実際的な実現法として用いる最小分類誤り学習理論(MCE: Learning for Minimum Classification Error)、に関する要旨を講演用のスライド形式でまとめたものである。標題にある音声認識は我々の研究分野ではあるが、本覚書で紹介される概念は、音声認識のみならず多様なパタン認識に用いることができる。人工神経回路網や学習ベクトル量子化の到来によって、古典的識別学習が再び注目を集めるようになった。しかし、魅力あふれるこれらの新技術においてさえも、実際に行われている識別学習は極めて直観的である。実際、その多くは分類器構造固有の特殊な学習手続きとして経験的に構築されたものであり、学習結果の最適性等の学習性質もほとんど解析されていない。多様なパタン認識の応用に耐え得る普遍的識別学習法はいまだ存在しないと言っても過言ではないだろう。GPDは、こうした状況を解決するために、四半世紀も以前に開発された確率的降下法を現代向きに改編したものである。一般化の主たる貢献は、確率的降下法の数学的不備を補うことによって勾配法を用いるのに適した厳密な定式化を与えたことと、音声信号のような可変長パタンの分類を可能にする多種多様な分類器構造のための一群の新しい識別学習法を実現したことである。また、この研究の中で、学習ベクトル量子化のような従来の直観的学習アルゴリズムに理論的背景を与えたことや一般的多層ネットワークを用いた新しい識別ネットワークを開発したこともここで付言すべきであろう。 GPDの出現によって、学習手順に関する実際的問題は著しく改善される。パタン認識の究極の目的が誤分類の最小化、言い替えればベイズの最小誤分類確率の実現にあることは言うまでもない。しかし、新しい人工神経回路網の研究においてさえも最も一般的に行なわれているパーセプトロン損失価値や最小自乗誤差損失価値を用いた識別学習は、明らかにこの本来の目的を追う道筋から逸脱している。MCEは、こうした現状に対する極めて新しい研究方向を示している。即ちここでは、最も現実的かつ効果的な最適探索法である勾配法によって最小分類誤りの直接の近似を行えることが明確に示されている。上述の2つの概念の、理論的のみならず実際的な卓越性が一連の実験によって示されている。実験には、有名なフィッシャーの水仙分類課題や極めて認識困難な類似音節の分類課題を用いている。実験結果は、いずれも、紹介された新概念の優れた有効性を示している。