−人間情報通信研究所プロジェクト終了
プロジェクト終了にあたって

聴覚・音声言語知覚の研究




(株)ATR人間情報通信研究所 第一研究室長 片桐  滋



1.「耳」に迫るトランスディシプリナリな試み

 聴覚・音声言語知覚のメカニズムを解明するためには、解剖学的な分析に加えて、脳・神経活動としての「耳」の働きの包括的な理解が求められる。心理学や工学をトランスディシプリナリな形で組み合わせた3本の柱、即ち(1)「耳」を探る、(2)「耳」を鍛える、(3)「耳」を創る、から成るアプローチを採用し、「耳」に迫る研究を推進した。

2.「耳」を探る
 音信号は周期的な成分信号の集まりである。優れたコミュニケーションメディアである音声信号も例外ではない。
 音の周期的情報を知覚するメカニズムに焦点を合わせて、聴覚心理学的に「耳」を探る試みを行った。変換フィードバック法やSTRAIGHT法[1]などの新しい実験手法の開発も行い、(1)「耳」が「口〔発話能力〕」のサブシステムであること、即ち発話能力が聴覚能力に支配的であることや、(2)従来、ラウドネス〔音の知覚的な大きさ〕そのものに基づいて行われると考えられてきたタイミングの知覚がその変化量に基づくものであること[2]、さらには(3)重畳音からの成分音声の分離知覚が音声の基本的周期情報に基づいていること等を実証するに至った。

3.「耳」を鍛える
 音声は、音信号としての側面に加えてことばとしての側面を持つ。聞き慣れた母国語は容易に聴きとれるが、不慣れな外国語はなかなかわからない。ことばを処理する能力の分析は「耳」を知る重要なステップである。
 新たにことばを習得するメカニズムを調べるために、外国語、特に英語の聴き分け能力と発話能力との分析に着目した。
 分析実験は大量のデータを必要とする。聞き分け能力を向上させるための学習ソフトやインターネットを用いる学習実験の手法を独自に開発し、多数の学習者の「耳」を鍛え、系統だった大規模実験を実現した。
 実験の結果、(1)「耳」と「口」とが相互に影響し合うこと[3]や(2)高齢者も適切な学習によって「耳」を鍛え得ることなど、ことばを処理する「耳」の性質解明に向けた明確な進展を得るに至った。また、これらの成果 が新しい語学教材の開発につながり得ることも示されつつある(図1)。

4.「耳」を創る
 心理学等の観測のみを通して「耳」の全容を明らかにすることは困難である。この困難の克服を目指して、機能モデルの構築を通して真相に迫る“「耳」を創って学ぶ”方法論を採用した。
 「創る」試みにおける要点は、採用するモデルの形態とモデルの鍛え方、つまり学習法とにある。
 前者の形態として、特に、音信号の周期的情報の利用に基礎を置く聴覚情報の脳内表現モデルである、聴覚イメージモデル(AIM)に着目した。ガンマーチャープ型末梢フィルター[4]や安定化ウェーブレット‐メリン変換等の新たな数理的実装法を導入することによって、AIMモデルの合理性を高め、かつ発話者情報の正規化等への応用の可能性を示した。
 モデルを鍛える方法としては、視聴覚機構研究所の成果である「最小誤り学習法」に着目し、「識別的特徴抽出(DFE)法」と呼ぶ、包括的なモデル学習法を考案した。DFE法は、与えられたモデルの全体を最小誤り基準の下で統合的に最適化する。DFE法を中心とする設計法に関する研究成果は、さらに「一般化確率的降下法」としてまとめられ[5]、その一部はインテリジェント音響監視システムや音声認識ソフトウェアとして利用されるに至っている