
人工生命システムは様々な機能を進化させうるか?
1.DNA塩基配列 −正しい設計図と正しくない設計図−
現在の地球上の有機生命の“設計図”はDNAの中の塩基配列の並びに書かれています。生命の基本分子であるタンパク質は、この配列の一部分を読み取って、それに基づいて並べられたアミノ酸の“紐”であり、これらが特定の3次元形状に折れたたまれることによって機能を獲得し、それが生命システムの活動を支えています。ところで、ある適当な長さの塩基配列(設計図)には莫大な数のバリエーションがありえますが、それらが皆正しく生きた生物の設計図となりえるわけではありません。容易にわかるように、生きて自己複製ができる生物はどんどん増殖できる一方、生きることや自己の複製ができない生物は即座に淘汰されてしまいますから、生物の設計図はまず「生きて自己の複製を作りうる」ようになっていなければ“正しい”設計図とは言えません。
生物は進化の産物です。進化の原動力となるのは突然変異などの乱雑化の処理であり、それがこのDNAに書かれた設計図をでたらめに書き変えることにより有機生命は進化してきました。でたらめに書き変えるということはでたらめに設計図を生成するということであり、そうして生成された設計図のうちいったいどれぐらいの割合のものが“正しい”ものであるかによってシステムの進化能力は大きく異なってきます。
この様子をより定量的にみるために今、図1(a), (b)のような2つの場合を考えてみます。この図において黒い領域は正しい設計図が分布している領域、白い領域は正しくない設計図が分布している領域です。突然変異というのはあくまで設計図の微小な改変ですから、もし黒い領域が図(a)のようにまばらにしか分布していなかったとすると進化は新たな正しい設計図(種)を見つけることができず、すぐに止まってしまい、袋小路から抜け出せなくなるでしょう。一方、黒い領域が図(b)のように密度濃く分布している場合はどうでしょうか?進化はたとえひとつの設計図(種)から出発したとしても、変異によって次々と別の設計図(種)をつくることができ、従って長い時間の後には多様な生物種が進化によって創り出されるでしょう。このことから我々は次の一つの仮説にたどりつきます。すなわち、「システムの進化能力は設計図空間における正しい設計図の分布密度によって決まる」というものです。
2.有機生命の進化能力はなぜ高いのか
ではいったいこの分布密度は何によって決定されるのでしょうか?冒頭に述べましたように、生物の基本分子はタンパク質でありそれを構成するアミノ酸は全部で20種類あります。けれども化学的にありうるアミノ酸の種類は実際にはこれよりはるかに多く、それらのうちでどのアミノ酸をタンパク質の構成分子として使うかは実は原始の地球において生物システムが自由に決定できるものでした。その選択は、設計図(記号の並び)とそれが果たす機能の関係を決定づけるものですからその選択に応じて設計図空間における正しい設計図の分布も変わってきます。例えば、たった2〜3種類のアミノ酸だけを使ってタンパク質を構成した場合は、その2、3個のアミノ酸がうまく選ばれていると正しい設計図の領域を形式的に高くすることができるかもしれませんが、現れる機能のバリエーションは小さいものとなるでしょう。逆にタンパク質が数百種類の異なるアミノ酸で構成されている場合は、特殊な機能のアミノ酸が多数使われることになり、正しい設計図の分布密度はかなり低いものとなるでしょう。現在の20個のアミノ酸は「様々な機能を表現でき、しかも進化しやすい」という基準のもとに原始の地球において最適に選ばれたものと考えられ、そのようなアミノ酸を選ぶことによって生物は様々な機能の正しい設計図を高い密度で設計図空間に分布させることに成功し、爆発的な進化をすることができたと思われます。進化システムの進化能力は基本となる分子、もしくはそれら分子が行いうる反応規則の選び方しだいで大きくも小さくもなりえるのです。
3.人工生命システム進化能力最大化の試み
人工生命とはコンピュータの中の疑似的な空間で有機生命がしたような進化を起こさせて、機能をもったプログラムやエージェントを自然発生させようという試みです。現在そのようなシステムの基本となるデザインはほとんどの場合人手で設計されています。けれどももし有機生命が太古の地球で行ったアミノ酸セット最適化と同じことをコンピュータの中で行わせることができれば、我々は人工生命システムデザインの自動最適化という大きな夢に近づくことになります。以下では、この目標に向けた研究のひとつとして、文字列書き換え文法最適化の試みを御紹介します。
ある文字列をひと組のプロダクション文法(書き換え規則)で書き換えることを考えます。ここで「文字」は生物における「分子」に、「文字列」は「分子が並んだ空間」に、「プロダクション文法」は「分子と分子の間の反応則」にそれぞれたとえて考えられるものです。例えば、a?→abという書き換え則は「a分子はその右隣りの分子をb分子に変える」という働きを表しますし、a?*c→a*?cという書き換え則は「a分子はその右隣りの分子をその右側にある最も近いc分子の左に移す」という働きを表します(ここで‘?’や‘*’は正規表現に用いられるワイルドカードと同じもので、前者は任意の1文字に、後者は任意の長さの文字列に対応します)。このようなルール文をいくつか用意し、それらの間に優先順位をつけたものをひと組決めると、そのもとで我々は任意の文字列を決定論的に書き換えていくことができます。この書き換えの過程は、分子の集合体が、用意された反応規則(代謝ルール)にそって生化学反応を繰り返していく過程と考えることができ、初めの分子の並びを適切に選べば、書き換えによってそれが際限なく複製されるようにすることができます。こうして、すべての文字列(設計図)は複製可能なもの(正しいもの)と複製不能なもの(正しくないもの)に大別できますから、複製可能な文字列の割合(=図1における黒い領域の割合)を最大化するようにプロダクション文法を変更していけば我々は文字と文字(分子と分子)の間の反応ルールとして最適なものを得ることができます。図2にこのようにして得られた最適なルールの抜粋とその性能を示しました。ここで、基本文字としては{.,0,1,2,3,4,5}の7文字(‘.’は静止状態を表す特殊文字)を用い、最適化は長さ5の文字列だけで行いました。この実験で得られた結果をまとめると次のようになります。
・書き換え規則の中には文字列複製のための文法が自動的に出来上がっていました(この文法で、文字‘2’はあたかもDNAポリメラーゼのようにオリジナルの文字列を順番に読みながらそのコピーを両脇に作り出す働きをもっています)。
・この規則のもとでの文字列の複製は繰り返しパターンを無闇に生成するようなものではなく、オリジナルの文字列を逐次参照しながらコピーを作り出すという性質のものでした。
・得られた文法は様々な長さの文字列に対して複製を可能にしました(図2(b))。この割合は別に用意した人間(著者)がデザインした文法よりも数十倍高い値になっています。
ここに示した例は、まだ非常に短い文字列の書き換えシステムの基本デザインの最適化を行ったものにすぎません。けれども‘文字列’と‘それを書き換える文法’という表現形式は、他の様々な計算システムと等価な汎用性の高い表現形式であり、事実、文字列の長さを形式的に無限にもっていくと、文字列書き換えシステムは人工生命でよく使われるコアメモリと論理的に等価なものとなることがわかっています。上記の方法を発展させて、そのようなより複雑な人工生命システムのデザイン最適化につなげることがこの研究の延長線上に考えられます。
参考文献
http://www.isd.atr.co.jp/~hsuzuki
から関連する文献が入手できます。
Copyright(c)2002(株)国際電気通信基礎技術研究所

