第1章 わかるために


ゲノムはDNAであり、遺伝子もDNAだが、ゲノムを構成するDNAの全部が全部遺伝子ではない。ゲノムDNAは、核の中にあるDNAのすべてであり、遺伝子はその中のほんの一部にしかならないのだ。では残りは何か。

遺伝子DNAの最も基本的な部分には、生きる上で必要なタンパク質のアミノ酸配列を指令する情報が書き込まれている。しかし、その途中にはイントロンとよばれる余分なDNAがはさまっている。

ゲノムDNAには、それ以外に遺伝子を働かせるか働かせないかを決める調節スイッチの役割を果たすところや、DNAをきちんと増やしたり、細胞分裂の時に染色体をうまく分離させる仕組みとして働いているところもある。染色体という構造の中で、DNAの長い紐が絡んだり、壊れたりしないように保つ働きをするところもあるに違いない。遺伝子同士の相互の位置関係を保つためだけに存在する部分もあるだろう。

このように積極的に働いているDNA以外にも、実に多様な何かがある。文字配列が変化したために働けなくなってしまった偽遺伝子や、ゲノムの中をあちこち動き回る小さなDNA断片、過去に感染したウイルスの残骸、同じ配列が何回も繰り返し存在するものなどだ。

この中には、いったい何をしているのかわからないものもあるが、過去には何かの働きをしていたものや、組み換えなどでゲノムを作り替える際にできた継ぎ目らしきものもある。ゲノムがどのような作り替えを経てできてきたかという歴史が、この構造の中に記憶されているのだ。遺伝子でないところもこのような情報を持っているので分析する価値は十分ある。

こうしてゲノムに書き込まれている情報を読みとることにより、そのゲノムをもつ生物が、どうしてそのような構造をし、どうしてそのような働きをしているのかという仕組みを知ることができるとともに、ゲノムに記録されている歴史を読むことにより、そのゲノムがどのようにして現在の姿になってきたのかを知ることができる。

ヒトゲノムを知れば、医学や薬学にすぐに役立つ情報を得られるのと同時に、ヒトがどのようにしてヒトになったのか、生物学の中でそれはどのような存在であるかを知ることになるのである。そのためには、ゲノムのすべてを知ることが望ましい。

ゲノムDNAの中に10万個存在する遺伝子の位置は決まっている。DNAの文字配列の中のどこがどういう遺伝子であるかということが決まっているのである。凝縮した染色体では一方の端から他方の端までDNAがずっと通っており、染色体の決まったところに決まった遺伝子が存在する。そこで凝縮染色体のスイッチ上に遺伝子の位置を書き込み、地図を作ることができる。

ヒトゲノム解析の中で、染色体の中に遺伝子や目安となる特別のDNAの位置を書き込む地図づくりはゲノム解析の重要なステップである。これがないと、未知の、しかし重要な遺伝病の遺伝子やがん抑制遺伝子を追い求める遺伝子のハンターたちはまったく仕事ができないし、文字配列解析のための資料となるDNAの断片をとりそろえることもできない。

地図には遺伝子と遺伝子の間の距離を、組み換えの起こり易さで示した「遺伝子地図」と、ヌクレオチド(文字)の数で表した「物理的地図」がある。

DNAの分析技術が普及するにつれて、遺伝的地図や物理的地図を作るために遺伝子だけでなく、それ以外の部分の文字の並びも使うようになった。

文字にみられる父と母のDNAのわずかな違いで(たとえば一方がGAATTCで、他方がGAAATCとか、一方にCAという配列の繰り返しが10回あるのに他方には15回あるなどのちがい)に注目して、これも地図づくりに組み入れるのである。DNAの同じ部位にある文字配列の個体間の違いを「多型マーカー」とよんでいる。多型マーカーも遺伝子とまったく同様に、メンデルの法則に従って遺伝するので、地図づくりに使えるのである。

遺伝的地図と物理的地図とで、遺伝子や多型マーカーの並ぶ順番が変わることはない。しかし、遺伝子やマーカーのあいだの距離が物理的での離れているのに、交叉が起こりにくいために遺伝的地図では近くなるということもあり、二つの地図でマーカーや遺伝子のあいだの距離がどうして違うのかも分かってくるだろう。むしろ、そこから遺伝子でないところも含めてDNAの働き方の基本が解き明かされるにちがいない。

ここでわかっておいてのほしいのは、染色体には端から端まで一本のDNAが通っており、そこに遺伝子や多型マーカーが決まった順序で並んでいるという事だ。すでに、たくさんの遺伝子や多型マーカーが集められ大変精密なゲノムの地図が染色体ごとに作られている。さらに、遺伝的地図や物理的地図をまとめた統合地図も作られるようになった。

地球上の生き物は皆DNA生物だ。それはおそらく全生物がDNAを遺伝情報の担い手とする共通の祖先から進化した親戚だと言うことを示しているのだろう。みんなDNAという物質に頼っているだけでなく、DNAの情報の伝え方にも共通の仕組みがある。たとえば遺伝子の中でアミノ酸の並び方を指令するところは三文字ずつの配列「コドン」がずっと並んだ構造をしているが、この「コドン」は各生物に共通だ。それなのに、生命体がこれだけ多様なのは、遺伝子をどのような組み合わせでいくつもつか、それらをどう働かせるかが違うからだ。つまり、遺伝情報の総体であるゲノムが多様だからである。

ゲノムがになう全情報を解読するには、

1) まずゲノムDNAの構造を解析し(DNAのA,T,G,Cの文字配列を決めることが中心になる)

2) その構造解析データを既存の暗号解読表と照らしながら、そこにになわれた遺伝情報を解読してどんな遺伝子があるかを調べ、

3) さらにゲノム全体の機能に関するデータを集めなくてはならない。

こうして得られた結果をもとに大規模なデータベース作りをしなければならない。ヒトを例にとれば、各遺伝子は、体のどの細胞で、いつ、どれだけ働いているか、それが成長や病気など生理的条件の変動とどう関わっているかというデータを集めて整理することになる。

ゲノム解析計画を構造解析、とくに文字配列の決定をすることだと思っている人が少なくないようだが、文字配列の決定だけから得られる知見はごく限られたものに過ぎない。それはゲノム解析の、重要であるが一部に過ぎない。


ゲノムに書き込まれている最重要の情報は、いつ、どこで、どんなタンパク質を作るかという事だ。それから、それぞれのタンパク質はいかにしてはたらくかという事も知らなければならない。文字配列の分析がどれほど進んでも、それだけでこれらの情報を十分に読み解けるだけの暗号解読表が出来上がるとは思えない。

10万の遺伝子が作るタンパク質のおのおのはどんな働きをするのか、どのような調節を受けて働くのか、たくさんのタンパク質が絡み合い相互作用し合いながら、働いている様子を解いていく上で必要な生物情報を集めなくてはならない。これはなかなか大変なことだ。しかし、こうした情報の解読が生きているという現象の科学的側面の総合理解につながるのである。

繰り返しになるが、ヒトゲノムを読むとは、単に30億の文字配列を分析することではない。生きているとはどういうことなのか、人間とは何なのかという本質的な問いを考えるために膨大な情報を集めることなのである。

戻る


このホームページのホストは です。 無料ホームページをどうぞ!