片桐滋
識別学習理論による音声認識
Abstract:本技術覚書は、我々が数年来研究を進めてきた2つの概念、1)一般化確率的降下法(
GPD: Generalized Probabilistic Descent Method)と2)これを最も実際的な実現法
として用いる最小分類誤り学習理論(MCE: Learning for Minimum Classification
Error)、に関する要旨を講演用のスライド形式でまとめたものである。標題にある音声
認識は我々の研究分野ではあるが、本覚書で紹介される概念は、音声認識のみならず多様
なパタン認識に用いることができる。
人工神経回路網や学習ベクトル量子化の到来によって、古典的識別学習が再び注目を集
めるようになった。しかし、魅力あふれるこれらの新技術においてさえも、実際に行われ
ている識別学習は極めて直観的である。実際、その多くは分類器構造固有の特殊な学習手
続きとして経験的に構築されたものであり、学習結果の最適性等の学習性質もほとんど解
析されていない。多様なパタン認識の応用に耐え得る普遍的識別学習法はいまだ存在しな
いと言っても過言ではないだろう。GPDは、こうした状況を解決するために、四半世紀
も以前に開発された確率的降下法を現代向きに改編したものである。一般化の主たる貢献
は、確率的降下法の数学的不備を補うことによって勾配法を用いるのに適した厳密な定式
化を与えたことと、音声信号のような可変長パタンの分類を可能にする多種多様な分類器
構造のための一群の新しい識別学習法を実現したことである。また、この研究の中で、学
習ベクトル量子化のような従来の直観的学習アルゴリズムに理論的背景を与えたことや一
般的多層ネットワークを用いた新しい識別ネットワークを開発したこともここで付言すべ
きであろう。
GPDの出現によって、学習手順に関する実際的問題は著しく改善される。パタン認識
の究極の目的が誤分類の最小化、言い替えればベイズの最小誤分類確率の実現にあること
は言うまでもない。しかし、新しい人工神経回路網の研究においてさえも最も一般的に行
なわれているパーセプトロン損失価値や最小自乗誤差損失価値を用いた識別学習は、明ら
かにこの本来の目的を追う道筋から逸脱している。MCEは、こうした現状に対する極め
て新しい研究方向を示している。即ちここでは、最も現実的かつ効果的な最適探索法であ
る勾配法によって最小分類誤りの直接の近似を行えることが明確に示されている。
上述の2つの概念の、理論的のみならず実際的な卓越性が一連の実験によって示されて
いる。実験には、有名なフィッシャーの水仙分類課題や極めて認識困難な類似音節の分類
課題を用いている。実験結果は、いずれも、紹介された新概念の優れた有効性を示してい
る。