TR-A-0071 :1990.2.28

森 吉弘

ニューラルネットワークを用いた手書き文字認識

Abstract:ヒューリスティックな特徴抽出手法の行き詰まり、統計的手法の識別関数の行き詰まりを打開するため、少ないデータから真の分布の推定を脳の記憶方式と関連があるとみて、ニューラルネットを調査した。 ニューラルネットの文字認識への応用の可能性を探る認識実験1では、手書き漢字(諭輸輪論)識別を試み、学習サンプルに対する認識率がほぼ100%となり、認識対象が学習サンプルであるような応用(印刷文字認識)には非常に適していることが確認された。未知サンプルに対する認識率も従来手法を上回った。類似漢字を識別するために、"へん"と"つくり"にわけて内部表現していた。これは、ニューラルネットが漢字が階層的に構成されるという概念を学習したともいえる。このことが、高認識率を可能としている。

認識実験2では、Toy-Problemからの脱出する大規模なニューラルネットの構築方法を検討し、手書きひらがな認識(71カテゴリ)を試み、小規模なネットワークを階層的に統合して大規模なネットワークを構成する方法を提案し、実験の結果、小規模なネットワークの平均認識率を大規模なネットワークが上回った(98.6>97.2学習サンプル)。また、小規模なネットワークでの情報の統合を容易にすることを目的として"その他セル"を考案し小規模なネットワークの出力層の一ユニットとして付加した。ただし、情報の統合に失敗したカテゴリも少数だが存在する。

JIS第1水準(約3000文字)手書き漢字を認識するシステムの構築を目指した認識実験3では、3000文字の中から選出した手書き漢字270文字の認識を試み、情報統合能力を上げるために、小規模なネットが担当するカテゴリをK-Meansクラスタリング手法で選出した。また、小規模なネットワークが自己の担当範囲外の入力に対して自己の出力を抑える機構を、学習効率を考慮して小規模なネットワークに持たせずにLVQを利用したフィルターを利用して行い、認識率がフィルターのない場合の55%から74%に向上した。