TR-H-0049 :1994.2.3

田中真一,和田健之介

進化システムを用いた遺伝子のコーディング領域予測システムの開発

Abstract:生体の主要な構成要素であるタンパク質は、DNA上の遺伝情報によってコーディングされているが、実際にタンパク質が作り上げられるには、何段階もの過程が必要である。 ヒトなどの高等生物ではDNA上の遺伝情報は、タンパク質へ翻訳される領域であるエクソンと、そうでない領域であるイントロンとに大別される。まず、2本鎖DNAのうちの主鎖がmRNAに転写される。この時点でのmRNAはエクソン、イントロンの両方からなり、mRNA前駆体と呼ばれる。このmRNA前駆体から、タンパク質に翻訳されない領域であるイントロンを切り出す作業をスプライシングと呼ぶ。スプライシングを経ることにより、エクソンだけからなる(成熟)mRNAが作られる。mRNAをリボソームが翻訳することによりアミノ酸の鎖が作られ、さらにこの鎖が立体的に折り畳まれてタンパク質が形作られる。 以上の過程のうち、スプライシングが行なわれる機構に我々は注目した。mRNA前駆体が成熟mRNAとなるためには、スプライシングによってイントロンが除去される必要がある。スプライソゾーム(mRNA前駆体の5'スプライス部位,3'スプライス部位、分岐部位を認識するリポ核タンパク質の集合体)がスプライシングを行なうためには、スプライス部位の正確な識別が行なわれなくてはならない。なぜなら、間違った部位でスプライシングが起こると、それ以降のコドンの読み枠がずれてしまうため、全く違ったタンパク質を形成してしまうからである。 スプライソゾームがスプライス部位の識別のために認識している配列を、何らかの方法で特定することが出来れば、DNA上におけるコーディング領域の自動検出が可能となる。 これは将来、DNAシーケンスのフルオートスキャンが実用化された際、欠かすことのできない技術になると考えられる。 そこで、エクソン・イントロン、イントロン・エクソン間のスプライス部位(前者を5'スプライス部位、後者を3'スプライス部位と呼ぶ)を検出するための、ニューラルネットを用いた進化システムを作成した。このシステムを遺伝子データベースDDBJ(DNA Data Bank of Japan)に対して適用した結果についての報告を行なう。