サイバー・ローデント
−自己保存し自己複製するロボット−



人間情報科学研究所  銅谷 賢治
(科学技術振興事業団CREST「脳を創る」研究チーム代表)


1.ロボットにとって感情とは
 人の感情を理解し表現できるロボットをつくることはロボット研究の大きな夢です。その実現に向けて、人間の表情のパターン認識の研究や、まゆや口元を微妙に動かすロボットの開発も進んでいます。しかし人間の感情認知や表現の規則を同定し、それを忠実にプログラム化することによって、人と同じ感情を持つロボットができるでしょうか? 私たちは感情と言えば、まず人々の多彩な表情や声色、あるいは胸がジーンとするような主観的な体験を思い浮かべますが、感情とは人生を複雑でドラマティックなものにするために人間に与えられた特権なのでしょうか?
 より生物学的観点からは、感情というものは、生物の生物たるべき基本条件である、自己保存と自己複製という性質を満たすための適応機構として捉ることができます。飢え、渇き、痛みなどの強い感情を伴う感覚は個体の自己保存を促し、性欲、愛情や悲哀は遺伝子を共有する個体を増やし保護する結果を生みます。人間界には社会的認知や金銭欲、好奇心や冒険心など、より高次な欲求や感情が渦巻いていますが、これらも元をただせば自己保存と自己複製に根ざした基本的な欲求や感情から派生したものとみることができます。

2.ネズミ型ロボット群:サイバー・ローデント
 そこで私たちは、自己保存と自己複製という、生物と同じ普遍的な要請のもとで学習し進化するロボット群、Cyber Rodent(サイバー・ローデント)を開発しました(図1)。ローデントとはネズミなど齧歯類の総称であり、その情動行動と脳機構に関しては、実験心理学から神経回路、遺伝子まで多くの研究の蓄積があります。目標はラットやマウスと同じ環境での行動実験に使えるものでしたが、現モデルは技術的な理由で体長22cm、体重1.5kgほどで、ネズミとしてはちょっと大きめです。
 自己保存の条件は、電池パックを探索して自己充電することで実現されます。自己複製をハードウェアで実現することは難しいのですが、同一ハードウェアの個体間でプログラムをコピーし合うことにより、ソフト的な複製が可能です。
 サイバー・ローデントは、感覚系としては広視野カメラ、前方距離センサ、体の周囲の赤外近接センサ、ジャイロと加速度センサを持ち、運動系としては2輪のモーターと、電池パックを捉える電磁ラッチ機構を持っています(図2)。その脳にあたるCPUにはSH-4 RISCチップと画像処理用FPGAを備え、通信系としては3色LED、スピーカ、ステレオマイク、プログラム交配用の赤外通信ポートを持ち、オンボードでの行動制御と学習、進化が可能です。さらに開発用PCとの接続用の無線LANとUSBのポートを持ち、PC上では実際のセンサやモーターの特性を模したシミュレーションが可能です。

3.サイバー・ローデントの学習と進化
 人の行動や性格がどこまで遺伝的に支配され、どれだけ環境に応じた学習で変化するのかはよく議論される点です。しかし学習の可能性は遺伝的な特性に依存し、また遺伝子も学習の結果次第で選択を受けるという相互依存の関係にあります。サイバー・ローデントは、学習と進化の協調機構を調べるためにもうってつけの実験系です。もちろん、非常に多数の個体が長い年月をかけて行った進化を実験室で再現するのは容易ではありませんが、計算機シミュレーションをうまく組み合わせることにより、脳と行動の進化の片鱗をうかがうことは可能です。
 ここで、電池パックの捕獲行動の学習と、学習系の進化の実験について紹介しましよう。サイバー・ローデントは、フィールド内にランダムに置かれた電池パックを捕獲し充電すると報酬を受けます。各個体は、視覚センサや近接センサの入力に応じて、どういう出力指令をモーターに送るとより確実に報酬が得られるかを、初めはランダムにいろいろな出力を試しながら学習します。
 各個体の学習の性能は、探索のランダムさや、一回の経験でどれだけ記憶を書き換えるかという学習の速度係数に依存します。学習の進み方を決めるこうしたパラメータは、個体ごとに「遺伝子」によって決められています。一定の学習期間の後、各個体がどれだけ電池パックを獲得したかに応じて「適応度」を計り、適応度の高いものほど次の世代に多く遺伝子を残す、ということを繰り返すとどうなるでしょうか? 学習期間の長さや電池パックの分布密度を変えて学習と進化シミュレーションを行った結果、行動のランダムさや記憶の書き換えのスピードが、異なる環境の特性に応じて選択されていました。そして進化の結果得られた学習系の特性は、実際のハードウェア実験でも良好な学習特性を示しました(図3)

4.サイバー・ローデントから心の理解へ
 このようなロボットが近い将来、お掃除ロボットや介護ロボットとして役に立つ、という目算は特にありません。ロボットが自分で学習し進化する姿を、盆栽を育てるように楽しめるマニアは現れるかもしれませんが。サイバー・ローデントでわれわれが目指しているのは、人間を含む生物の「心」、「感情」といったものがいかに進化し機能しているのかを理解することです。それは長い目で見れば、人の心を理解するロボット開発の基盤を与えるものになるでしょう。
 単に人間にプログラムされた通りに正確に動くべきロボットには、感情のようなものを持つ可能性も必然性もありません。ロボットが自ら高度な学習機能を持ち、その成否によって自らの電源が切られるかどうか、あるいは同モデルの生産が打ち切られるかどうかという瀬戸際に立たされた時、初めてロボット自身に感情のようなものが芽生える可能性が現れるのではないでしょうか。
 今後、全ての知能ロボットが無線インターネット接続されるのは必至です。そのインターネット直結状態の脳では、テレパシー、脳移植、クローニングなど、生身の人間では技術的にも倫理的にも不可能なことが容易に可能になるでしょう。そのような条件下のロボットがどんな新しい可能性を持ち、また危険性を持ち得るのか、単にSF的思考実験ではなく現実的に評価することも、われわれ研究者の重要な使命でしょう。