視聴覚機構の人間科学的研究




(株)エイ・ティ・アール視聴覚機構研究所 元 代表取締役社長 淀川 英司
(現 工学院大学大学院情報学専攻 教授)




1.研究成果総括

(1)試験研究の目的

 機械と人間の融合がさらに増大する今後の高度情報社会では、初心者・熟練者の区別無く、誰でも容易に使うことができる情報通信機器が求められます。このためには、機械に人間と同様の情報入出力機能をもたせることが必要であり、人間中心のマンマシン・インタフェースを開発することが必須の用件となります。
 本試験研究では、人間中心のマンマシン・インタフェースを開発するための基礎研究として、人間の情報通信機構として最も重要な視聴覚をとりあげ、その情報通信と処理のメカニズムを解明することを目的に研究を進めました。

(2)試験研究の概要
 人間の視聴覚情報処理の仕組みに学ぶということを基本方針として、「視覚機構の研究」、「認知・行動の研究」、「聴覚機構の研究」の3つのサブテーマのもとに3研究室(発足当初は2研究室)体制で進めました。
 紙面の都合上、得られた結果の中から主要なものを4つだけ選び、概要を述べたいと思います。
 まず、第一は「新しい眼球運動計測・解析技術の構築とその応用」です。これは、眼球運動を頭部運動と独立に計測することによって、視線の動きを精度良く求めることを可能としたものです。この技術は眼球運動特性についての新しい知見を得るのに貢献しただけでなく、アルツハイマー病の早期診断にも応用され、その波及性が期待されています。この研究の成果により取得した特許に対し、科学技術庁より、注目発明賞を受賞しました。
 第二は「ニューラルネットを用いた手書きひらがな文字認識法の考察」です。これは、ニューラルネットの構成法に独創性があり、90%を越える高い認識率を達成し、注目を集めました。この成果はニューラルネットを用いた文字認識の研究分野で先導的役割を果たしたものです。
 第三は「視覚認知系の計算理論と神経計算モデルの構築」です。これは、視覚系全体の処理を統一的に説明できる計算理論と神経回路を世界で初めて提案したもので、この成果に対し、関連学会から最優秀論文賞を受賞するなど、きわめて高い評価をいただきました。
 第四は「最小分類誤りを与える統計的パターン認識・学習理論の提案とその音声認識への応用」です。パターン認識に本質的である「分類の誤り確率を最小にする」という基準を満たす新しいパターン認識理論としての最小分類誤り/一般化確率的降下法(MCE/GPD)の構築に成功したものです。この成果に対し、IEEEから論文賞を受賞しています。

2.プロジェクトをふりかえって

 1986年4月、大坂城に近いツイン21ビルMIDタワー内にスタッフ6名という小グループでATR視聴覚機構研究所の研究活動がスタートしました。発足間もない時、大阪大学総長(当時)の熊谷信昭先生より「成功するかどうかは人で決まる」というお言葉を頂きました。幸いにもプロジェクト期間を通して、NTT始め多くの企業や他の機関から優秀な研究員を派遣していただいた結果、多くの成果を生み1993年3月にプロジェクトを終了することができました。研究者を派遣していただいた各企業や機関におかれましては、大所高所からのご理解・ご支援をいただきましてありがとうございました。ここに改めてお礼を申し上げます。
 研究所開設から2〜3年は、研究計画の遂行に必要な研究員を増員すべく奔走いたしました。視聴覚機構研究所の研究テーマは基礎的すぎて研究員を集め難いのではないかというご心配をいただきましたが、プロジェクトの重点課題として取り上げたニューラルネットワークの研究に対して世界的なニューロコンピュータブームが追い風となり、研究員をうまく集めることができました。NHK放送技術研究所からの三宅誠氏(現同ヒューマンサイエンス研究部長)、京都大学から乾敏郎氏(現京都大学大学院文学研究科教授)、大阪大学から川人光男氏(現ATR人間情報通信研究所第三研究室長)等のこの時期におけるプロジェクト参加が、その後の若手研究員の確保に非常にプラスとなりまし。
 基礎研究は、国際交流が特に必要とされる分野であります。そこで、外国にも開かれた国際的な研究所にしていかなければならないと考えました。まずは、研究スタッフの持つ国際的な人脈により、積極的に外国人研究員の招聘・採用を進めました。また、フランスの電気通信関係の大学であるENSTやINTからの実習生の受け入れも進め、プロジェクト期間(7年間)における外国からの研究員は延べ約30名(研究員の総数は延べ約120名)に達し、この数からも、国際的に開かれた研究所をめざしての基礎は作ることができたのではないかと思っております。
 研究成果の概要につきましては、研究成果総括のところで述べさせていただきましたので、ここでは研究成果を基に、現在、国際電気通信基礎技術研究所(ATR-I)により商品化され、販売されているものについて触れたいと思います。
 まず、一つは「日本人における英語/r, l/音の知覚特性の解明の研究」の具体的課題の一つとして行った/r, l/音の聞き取りに関する音声特徴の学習と訓練についての成果です。この成果は、現在「ATR Hearing School」という品名で販売されております。二つめは、「新しい眼球運動計測・解析技術に関する研究」に対して、アルツハイマー病の早期診断法の観点から札幌医科大学神経精神科の高畑直彦教授のグループが強い関心を示され、共同研究に近い形で効果的に進めたための成果です。この成果は「頭部・眼球運動分析システム」として販売の準備を進めております。
 これらの他に、プロジェクトの研究成果を、ATR先端テクノロジーシリーズ、「視聴覚情報科学−人間の認知の本質にせまる−」および「ニューラルネットワーク応用」の2冊にまとめて出版いたしました。
 プロジェクト終了間近の1993年2月、1985年につくばで開催された科学万博の政府テーマ館に一本で一万個以上の実をつけたトマトの木を出展された協和株式会社の野澤重雄会長の訪問を受けました。「ハイポニカ水気耕栽培により、トマトの生命力を大きく引き出すことに成功しましたが、今の科学では説明できないのです。ぜひ、ATR研究所で心や意識の研究を行って下さい」と野澤さんは言われました。ご本人から直接お話を伺い、ハイポニカ栽培法は、21世紀に向けての新しい生命思想を中心とした科学の誕生を明確に示していること、そして、「組織における理想的マネージメントのありかた」を教えてくれていることを直感いたしました。

3.主要な研究成果
 視覚機構の研究

人間の優れた視覚メカニズム、情報理解能力に学び、柔軟な適応力をもつ視覚情報処理の原理の解明とモデルの構築を図り、新しい眼球運動計測・解析技術とその医療診断への応用、ニューラルネットを用いた手書きひらがな文字認識法の考案、図形概念認識特性の解明とそれを利用した画像検索システムの開発などの成果を得た。

●新しい眼球運動計測・解析技術とその医療診断への応用(目を見て脳を知る)

自然な状態で様々な視覚行動および脳機能の分析を行うため、眼球と頭の動きを同時に独立に計測・解析できる新しい計測技術を開発、アルツハイマー病などの脳疾患の診断に応用。

●ニューラルネットを用いた手書きひらがな文字認識法の考案
多様な変形のため認識が難しい手書き文字に関して、ニューラルネットワークの学習能力に着目した手書き類似漢字、手書きひらがなの高性能認識モデル、さらには手書き漢字を対象とした大規模モデルを提案し、有効性を実証。

●図形概念認識特性の解明とそれを利用した画像検索手法の提案

図形を思い浮かべる、すなわち、脳内の図形概念形成の特性を利用し、気に入った顔を選ぶ課題を具体例にとった画像検索手法を提案、その有効性を実験的に検証。

 認知・行動の研究

人間の持つ優れた認知・学習・行動に関する情報処理メカニズムの原理解明とそれらのモデル化を進め、視覚認知系の計算理論と神経計算モデルの構築、ニューラルネットワークによる画像処理モデルの構築、運動制御メカニズムの神経計算モデルの構築などの成果を得た。

●視覚認知系の計算理論と神経計算モデルの構築

外界からの視覚情報である2次元網膜画像から物の形、動き、記憶像などの3次元画像を脳内に復元する神経計算機構のモデル化に成功。

3次元画像脳内復元における知識の働きを示す陰影パターン

●ニューラルネットワークによる画像処理デル
濃淡画像の特徴抽出、情報圧縮、復元などの処理をニューラルネットワークを用いた並列処理モデルと並列計算アルゴリズムで行う手法を提案、その有効性を検証。

●運動制御メカニズムの神経計算モデルの構築
人の腕などの運動軌道生成や運動制御における神経計算の解法をニューラルネットワークを用いて行う学習モデルを提案。

 聴覚機構の研究

聴覚・音声知覚機構を解明し、人間の優れた機能に学んだ音声自動認識、合成などの新手法を開発することを目的とし、聴覚末梢系における周波数分析機能のモデル化と音声認識への応用、日本人による英語/r, l/音の知覚に関する基本特性の解明、音声特徴の学習法、最小分類誤りを与える統計的パターン認識・学習理論の提案などの成果を得た。

●聴覚末梢系における周波数分析機能のモデル化と音声認識への応用
聴覚の音声信号分析機能として重要と考えられる内耳の周波数分析機能である適応Q型聴覚フィルタモデルを提案、音声認識への応用における有効性を実証。

●日本人による英語/r, l/音の知覚に関する基本特性の解明
日本語と外国語の知覚を比較するクロスランゲージ的な研究手法により、音素知覚の手がかり、知覚能力獲得訓練などの視点から研究を進め、日本人の英語/r, l/音の聞き取り訓練を効果的に行うための基本戦略を明示。

●音声特徴の学習法、最小分類誤りを与える統計的パターン認識・学習理論の提案

パターン認識・学習における新しい理論展開を行い、パターン分類に関する最適解を与える理論として、最小分類誤り/一般化確率的降下法(MCE/GPD)を確立、音声認識への応用における有効性を確認。


プロジェクト概要

試験研究期間:1986年4月〜1993年3月(7年間)
試験研究費総額:137億円
研究員:延べ120名


コラム