運動を制御する脳の情報処理メカニズム
ATR視聴覚機構研究所 認知機構研究室 川人 光男
認知機構研究室で筆者等は随意運動を制御する脳の情報処理メカニズムを計算論的アプローチから明らかにするために研究を行っています。計算論的アプローチというのは、脳が何を計算しているかということや、何故その計算が可能かという点から研究する方法です。
私達はこれまでに目標物に腕を伸ばすような簡単な随意運動について図1に示すような計算論的モデルを提案してきました[1]。視覚情報処理により、1つの目標物が選ばれているとすれば、後は作業座標で目標軌道を決定する問題、軌道を作業座標から身体座標に変換する問題、目標軌道を実現するための運動司令を計算する制御の問題の3つの計算問題を解かねばなりません。動物の運動ではこれら3つの問題は解が一意に定まらないという意味で不良設定問題になっています。脳はこれらの問題を何らかの拘束条件を用いて苦もなく解いているわけですが、このメカニズムを明らかにすることに力を注いできました。
1.軌道生成の最適モデル
1985年にMITのFlashとHoganは、ヒト腕の多関節運動軌道を非常に良く再現、予測する躍度最小モデルを提案しました。これに対して宇野らは、環境と腕が相互作用するなどのより広い状況では、ダイナミクスを考慮にいれたトルク変化最小モデルがさらに良いことを示しました[2]。過去3年の間に筆者らはより進んだモデルとして筋張力変化最小モデルや運動司令変化最小モデルを提案しました[1,3]。これらのモデルでは運動司令や筋張力の時間的変化が小さいという意味で最も滑らかな軌道が選ばれていると考えます。
こういった滑らかさの基準が腕の運動だけでなく調音器官の運動にも使われていることは、調音結合として知られる運動の滑らかさや、脳が制御対象によらない計算原理を使っているだろうことから期待されます。平山らは聴覚研究室のBateson客員研究員や本多主幹研究員と共同で、調音器官のダイナミクスのモデリング、滑らかさの原理の解明、自然な音声合成、合成に基づく音声認識などを目標に研究を進めています。コネクションマシン上での学習によって筋電図波形から調音器官の運動を予測することにも成功しました[4](図2参照)。
最適軌道を生成する神経回路モデルとしてはカスケードモデルを提案し[5]、平山らはそれが心理学で良く知られた速さと精度のトレードオフに関するフィッツ則を再現することも示しました[6]。このモデルは繰り返し計算回数が長いことや、誤差逆伝播法が必要になるなど脳のモデルとしては不適切な点がいくつかありました。和田らは制御対象の順方向のモデルと逆方向のモデルの両方を使った新しい軌道生成のモデルを提案し(図3参照)、これが上の問題点を克服していることを示しました[7]。これは最適制御のアルゴリズムとしても全く新しい強力な方法になるのではないかと期待しています。
筋張力変化最小モデルや運動司令変化最小モデルをサルの筋骨格系の測定データに基づいて検証するためにMIT脳認知科学科のBizzi教授の研究室からDornay客員研究員を招いて研究を進めています[8]。
2.小脳、大脳連関モデル
筆者らは小脳外側部と大脳の連関ループのモデルとしてフィードバック誤差学習則を提案していました[9]。これはフィードバックコントローラの出力をシナプス可塑性の誤差信号として用いて、フィードフォワードコントローラを学習する方法です。ところが制御対象として産業用ロボットしか考慮に入れていなかったために、力制御などの外界との相互作用を研究することが困難でした。片山らは動物の筋骨格系と良く似た性質を持つラバチュエータソフトアームを用いました[10]。静的なつり合い関係(スタティクス)と動的力(ダイナミクス)の逆モデル(ISMとIDM)を並列に学習する新しいモデルを提案し、異なる軌道にも学習結果が適用できるという意味で汎化能力を示す、初めての学習制御実験に成功しています(図4参照)。汎化能力を最適にするためのモデルサイズの選択について、和田らは新しい数理的手法を提案しています[11]。
中枢神経系には運動制御のためのネガティブフィードバックループはありますが、ゲインは小さく、ループ時間が50ミリ秒から100ミリ秒と長いので、これだけでは速い運動を制御できず前向きの運動制御が必須です。私達は前向き制御が制御対象の逆モデルを学習で獲得することによって可能であることを示してきました。しかし同じ前向き制御でもFeldman,
Bizzi, Hogan, Mussa-Ivaldi, Flashといった研究者は、脳は仮想軌道を脊髄の運動制御中枢に送り、実際の軌道と仮想軌道の差に腕が持つ機械的な剛性行列がかけられて力が発生し運動が実現されていると考えました。これを仮想軌道制御仮説と呼び、深い関係のある制御対象の機械的インピーダンスを能動的に制御しようという方法とともに計算論的神経科学やロボティクスで主流の考え方になっていました。このモデルの魅力は逆ダイナミクスの複雑な計算が必要でない点です。
片山らは上記のモデルを用いてヒト腕の2関節6筋モデルを制御し、スティッフネスが運動中でも姿勢制御時の数倍程度であるならば、仮想軌道はまがりくねらないと直線的な軌跡を再現できないことを示しました(図5参照)[12]。これが正しいとすれば仮想軌道制御仮説に大きな疑いが生じます。運動中のスティッフネスについて、五味、小池らが計測を始めて予想された結果が得られつつあります。
フィードバック誤差学習則はすでに様々な制御対象への応用が試みられてきましたが、その安定性に関しての理論的な解析が不十分でした。まず前向きの制御系について、確率微分方程式の近似理論とリヤプノフの安定性理論を用いて、学習が収束し、軌道が目標に近づくという安定性の証明が試みられました[13]。
続いて五味らは閉ループ制御系について、フィードバック誤差学習則を適用すると、自然に非線形のモデル規範型適応制御系が得られることを示しました[14]。またこのシステムについても上と同様な方法で安定性を議論しています。
小脳は系統発生的にも解剖学的にも、前庭小脳、小脳虫部、小脳中間部、小脳外側部の4部位に分かれています。小脳半球は末梢からの直接のフィードバック情報を受け取らず、かなり純粋な形で前向き制御をしています。ところが、他の3部位はすべて末梢からフィードバック情報を受け取っているのです。伊藤正男先生らが発見した小脳皮質プルキンエ細胞の長期抑圧と前庭動眼反射の適応的修飾に関する知見などから、五味らは図6に示す小脳4部位の統一的モデルを提案しています[15]。
3.視覚と運動の統合
筆者らは対象物を手でつかむグラスピング運動のとき、対象物の3次元構造の表現は手の形にもとづいていると考えました。この基本的な考えにのっとって片山らは神経回路モデルを提案しています[16]。さらに東大計数工学科と共同で物体の形から手の形状を決めるプリシェイピング神経回路モデルの学習にも成功しています[17]。
筆者らが大脳皮質視覚野のモデルとして提案した神経回路モデル[18]は、軌道生成の新しいモデル[7]と酷似しています。ひょっとすると脳の構造の根本原理をとらえているかもしれないと期待するのはいきすぎでしょうか。
今後はいわゆる脳の高次機能についての研究を進めていく予定ですが、運動制御や視覚の計算論的研究の成果にのっとって足を地につけて行くというのが私達の基本的な姿勢です。
参考文献