研究室はオモシロイ

大学、専門学校や企業などの研究室を訪問し、研究テーマや実験の様子をレポート

第2回 Part.3

第2回 バイオインフォマティクスでゲノム創薬への道を切り開く(3)
Part.3
遺伝子を制御する部分を
コンピュータで探る

東京理科大学 薬学部
生命創薬科学科 宮崎 智研究室
※組織名称、施策、役職名などは原稿作成時のものです
公開:
 更新:

ATGC。この4文字が私たち人間(およびほかの生物)の生命現象を左右している…。といっても、もちろんオカルト的な話などではない。科学、それも最先端科学の話だ。ATGCは、DNAを構成する4つの塩基のこと。Aはアデニン、Tはチミン、Gはグアニン、Cはシトシン。このうちAとT、GとCが対(塩基対)になり、二重らせん構造の段の部分を形成している。そして、その文字(実態である塩基)の配列が遺伝情報であり、生命現象を決定しているのだ。
人間の場合、全遺伝情報(ゲノム)を解読するヒトゲノム計画が一通り完了し、遺伝情報の全体像がぼんやりと浮かび上がりつつある。そして、ヒトゲノム計画を通じてもう1つ浮かび上がってきたものがある。それはバイオインフォマティクス。ゲノムのような膨大な生物情報をコンピュータを駆使して解析する新しい学問領域だ。そこで今回は、日本ではまだそれほど多くないバイオインフォマティクス専門の研究室である東京理科大の宮崎研究室の宮崎智教授を訪ね、どのような研究が行われているのか教えていただくことにした。(Part.1/全4回)

▲宮崎 智 教授

次に、分子情報ネットワークの解明というテーマについて教えていただくことにした。これは一言でいうと遺伝子を制御する部分に関する研究だという。

「ヒトゲノム解読の成果として、人間には約2万3,000個ぐらいの遺伝子があることがわかりました。それぞれの遺伝子は1つで働くこともありますが、多くの場合、2つ以上の遺伝子が関連し合って働いている。その関連性を探りたいのですが、膨大な組み合わせになるので、実験ではできない。そこで、コンピュータを使って探れないかと考えたのです。

ヒトゲノムは30億塩基対から成っています。つまり30億個のATGCという文字がずらっと並んでいるようなイメージです。その30億個の文字のなかでタンパク質の情報に対応している遺伝子の部分は数%で、残りの90数%は遺伝子の制御に関わっているのだろうということがわかってきました。

要するに、タンパク質をどのタイミングで、どのくらいつくればいいか、ということが書かれているのだろうということです。ゲノム研究の分野では、それを解明しようという動きがいままさに始まったところで、制御の情報がどういうかたちで、どの部分に書かれているのかをコンピュータで予測することをめざしています」

遺伝子を読み取る「装置」のための
文字列パターンが存在する

宮崎先生は、ヒトゲノムと遺伝子についてさらに詳しく説明してくださったが、その話を要約すると大体次のような内容になる。

ヒトゲノム、つまり30億個の塩基対は、すべてが遺伝子ではない。遺伝子はところどころに分散して存在し、遺伝子と遺伝子の間隔もバラバラ。ただ、遺伝子は読み取れる方向が決まっていて、こちらが先頭、こちらが終わりというのはハッキリしている。そして、それぞれの遺伝子の前に『遺伝子を読み取りなさい』『いつ読み取りなさい』という制御の情報が存在する。その部分をコンピュータで解明しようということなのだ。では再び先生の話の続きに戻ろう。

「ある遺伝子が読み取られてタンパク質がつくられるときには、その遺伝子を読み取る装置のようなものがくっつきます。バーコードリーダーと思ってもらえばわかりやすいかもしれませんね。それがくっつくために『ここにくっつきなさい』というサインが出ている。それは、大体8~20塩基対ぐらいの長さの文字列パターンですが、そのパターンのいくつかが実験で明らかになってきました。

もし、ある遺伝子と別の遺伝子の前の部分に同じパターンがあれば、その2つの遺伝子は同じように働いている可能性がある。それをコンピュータで探り当てたい。もし、候補が出てくれば実験で確認してもらいます。実験で証明されれば、たとえば病気の関連遺伝子の1つがわかっている場合、それ以外に同じ病気に関わっている遺伝子を突き止めることにつながります。ですから、遺伝子ではない部分のゲノムの解明を大きなテーマの1つにして取り組んでいるのです」

遺伝子の制御部分を探るため
プログラム開発も進める

現在は「バーコードリーダー」を置くサインの共通ルールを見つけようとしている。しかし、そこは生命の神秘とでもいうべきなのか、なかなか一筋縄ではいかないようだ。

「いまは、実験で少しずつわかってきている非常に小さなパターンから共通ルールを見つけることに取り組んでいます。いったん共通ルールが見つかれば、それを踏まえてゲノムをスキャンすることで、どこにどういうパターンがあるかがわかるようになります。ところが、この辺が生物のいやらしいところなのですが、バーコードリーダーをここに置きなさいというサインが微妙に違うんです。

ATGCの文字列にすると、AAATというのもあればAAAAというのもある。だけど、そこに同じようにバーコードリーダーがくっつく。分子から見ると、AAATとAAAAは同じに見えているはずなんです。それをコンピュータで解析すると、別物だと認識してしまう。そこで、違うパターンだけれども同じものとみなして探すしくみをシステムに組み込まないといけないのです」

遺伝子の制御部分を探るためのプログラムも現在開発中だ。基本的なシステムは先生が設計し、研究室の学部生や大学院生が卒業論文や修士論文のテーマとして、プログラムづくりに取り組んでいる。

《つづく》

●次回は最終回「創薬のためのゲノム情報解析手法の創造について」です。

新着記事 New Articles