次世代スーパーコンピュータ・プロジェクトのグランドチャレンジアプリケーション開発におけるライフサイエンス分野の研究開発拠点として、理化学研究所は「次世代生命体統合シミュレーションソフトウェアの開発研究」に取り組み、新たな学問領域「バイオスーパーコンピューティング」を提唱。現在、理化学研究所とこれに参画する14機関の研究者らにより、ペタフロップス・スケールの次世代スーパーコンピュータの性能を最大限に活用するソフトウェア開発が進められている。ライフサイエンス分野に高度な計算科学に基づく新しい方法論を確立し、世界をリードしていこうとする「バイオスーパーコンピューティング」に大きな期待が寄せられている。
次世代計算科学研究開発プログラム
副プログラムディレクター
姫野 龍太郎
これまでライフサイエンス分野の王道は、何といっても実験でした。コンピュータは、主に実験データの整理などに使われるに過ぎませんでした。そして、ハイスループット実験機器、超高速シーケンサー、遺伝子組み換え技術、1分子イメージングなど、実験的な技術や手法は急速に進歩し、たくさんのことが分かってきました。しかしその一方では、細かく、いろいろな要素が見えてきたがゆえに、逆に生命現象を本質的に理解することから遠くなりつつあることを、実験的な研究に取り組む研究者たちは意識するようになりました。そこで、生命現象を理解するためにコンピュータを使えないだろうかという発想が生まれたわけです。
スーパーコンピュータの計算性能は、この20年ほどを見ると、およそ5年で10倍というスピードの向上を維持しています。性能の向上に伴い、実用化される研究の分野も変化しています。まずは建築物などの構造の問題が解けるようになり、次に流体の問題が解けるようになりました。ナノ材料の計算や、ヒトゲノムの解析など大量の実験データも処理できるようになっています。そして今、ペタフロップスという計算性能を持つ次世代スーパーコンピュータの登場によって、ようやく原子・分子の物理方程式に基づいて、生体内でおきているさまざまな現象を解明したり、説明できる、そうした時代がやって来ようとしています。
実験的な研究の発展によって分かったのは、生命現象は人間の頭では理解できないくらい複雑であるということでした。ならば、今までに観察され、理解してきた生命現象のルールをコンピュータに入れて整理整頓し、そこでいろいろなことを試してみればいい。そうすれば、さまざまな生命現象のどれが説明できて、どこが説明できないのかが分かります。それだけでなく、予測したり、予測に基づいて制御することだってできる──そうした生命現象に関する計算科学的なアプローチのツールとしてスーパーコンピュータを使っていこうという発想が出てきた、それが今なのです。「現象を記述する生物学」から「新たな現象を予測できる生物学」への発想の転換といってもいいでしょう。これまでのオーソドックスな工学や物理学などの分野で行われてきたスーパーコンピュータの使い方とは大きく異なる、新しいスーパーコンピュータの使い方の提案でもあります。
ライフ・グランドチャレンジ開発アプリケーション・ソフト"第一走者"
アプリケーション名 | 開発責任者 | 内容 | 狙い |
---|---|---|---|
大規模並列用MDコアプログラム(cppmd) | 泰地 真弘人 (理化学研究所) |
タンパク質の機能を高速で長時間シミュレーションするための計算技術 | 世界最速の分子動力学計算で「ゴードン・ベル賞」をめざす |
密度汎関数法に基づくタンパク質全電子波動関数計算(ProteinDF) | 佐藤 文俊 (東京大学) |
タンパク質の電子レベルでの反応を正確に解明するための計算科学技術 | 世界最大のタンパク質全電子計算をめざす |
マルチスケール・マルチフィジックス心臓シミュレーション | 久田 俊明 (東京大学) |
世界でも前例のないバーチャル心臓を世界最大規模でコンピュータ上に再現 | 心筋細胞レベルからの心臓全体シミュレーションをめざす |
全身ボクセルシミュレーション(ボクセル構造流体連成解析プログSPH3D) | 高木 周 (理化学研究所) |
医療応用に向け、やわらかな人体の解析・予測に適した計算科学技術 | 血栓の形成、輸送、梗塞の同時シミュレーションをめざす |
大脳皮質局所神経回路シミュレーター | Marcus Diesmann (理化学研究所) |
単純な神経細胞モデルから実際の脳の活動が説明できるかを解明 | 世界最大規模の大脳皮質神経回路の活動シミュレーションをめざす |
粗視化モデル計算(CafeMol) | 高田 彰二 (京都大学) |
細胞核内でのDNAのヒストンへの巻き付きと、ほどくメカニズムの解明 | 膨大な長さのDNAが核のなかに収納され、必要なときに読み出せる謎に挑む |
ハプロタイプ関連解析に於ける統計検定ソフトウェア(ParaHaplo) | 鎌谷 直之 (理化学研究所) |
個人の遺伝情報と疾病、薬物反応性の関連を明らかに | 47疾患に対し、遺伝子や環境要因によって決まる疾病や薬物の効き方などの関連を明らかにする |
今、私たちは次世代スーパーコンピュータを活用して、次の3つのことに挑戦しようとしています。一つは、これまでお話ししてきたように、生命現象をトータルに理解するために、私たちが手に入れた知識・情報を再構成して整理し、何が分かっていないのかを理解し、さらに予測し、制御できるようにしていくことへのチャレンジ。もう一つは、人間の身体のなかでおきているいろいろな現象を、原子や分子の物理法則によってどこまで説明できるかということへのチャレンジ、3つ目は、人体をコンピュータ上に再現して、自動車の衝突シミュレーションや地震波動シミュレーションと同様に、人体をその物性から見たり、心臓などの各器官そのものを取り扱えるようにして、手術の方法を考えるなど、医療に結び付けていくというチャレンジです。
生命現象の統合的な理解へのチャレンジは、21世紀のサイエンスにとって最も重要な課題の一つです。また、ライフサイエンス分野における計算科学的なアプローチの必要性が、世界中で叫ばれています。こうした状況のなか、今、私たちがやらなければいけないのは、これまでのライフサイエンス分野の研究の方法論を変えてしまうような、大きな転換を図ることです。これにいち早く取り組み、先端を走ることで、世界に大きな波及効果をもたらす研究ができると思っています。日本は次世代スーパーコンピュータという優れたツールを得ることによって、世界に先駆けてスタートを切ろうとしています。しかも、大きな目標に向かって、オールジャパン体制で研究者らが協力して取り組んでいます。「バイオスーパーコンピューティング」は、この分野で世界をリードできる大きな可能性を秘めています。少なくとも、新しい方向性のトレンドセッターの役割は果たせるに違いありません。
次世代スーパーコンピュータのフル稼働(2012年)に向けて、現在、ライフサイエンス分野で三十数課題のアプリケーション・ソフトウェア開発が進められています。さらに、そのなかから7課題を“第一走者”として絞り込み、フル稼働と同時に華々しい結果を出していきたいと考えています。そのため、“第一走者”は、次世代スーパーコンピュータの能力によって初めてできる計算であること、ライフサイエンス分野で科学的、あるいは応用として価値が高いこと、さらに稼働後直ちにインパクトのある結果が出せることといった観点から選ばれています。サイエンティフィックな意味の重さに順番をつけようというわけではありません。どちらかというと、プログラムの完成度であるとか、次世代スーパーコンピュータの性能をフルに活用する計算になっているかといったことが重要です。
例えば、「大規模並列用MDコアプログラム(cppmd)」は、タンパク質の機能を原子や分子の世界で成り立つ物理法則に従って、高速で長時間シミュレーションするための計算技術です。世界最速の分子動力学計算を実現して、ぜひ「ゴードン・ベル賞」を狙いたいと考えています。この「ゴードン・ベル賞」は、並列計算機を実用的な科学計算に利用して最も優れた成果を達成したものに与えられる賞です。
この他に6つの“第一走者”が選ばれています。このなかにも、やはり「ゴードン・ベル賞」を狙える可能性のあるものや、世界的に見て日本の研究が進んでおり、大きな成果が期待できるものが含まれています。“第一走者”には、次世代スーパーコンピュータ稼働とともに、その優れた計算性能を実証し、「バイオスーパーコンピューティング」によって得られる高い成果と今後の可能性をアピールしてもらいたいのです。そして、“第一走者”に続き、“第二走者”として12のアプリケーションが控えています。このなかには、医療医薬品の開発に大きな成果が期待できるものや、日本独自のユニークな研究が入っています。最後に“第三走者”が控えていて、さらに広い範囲で世界的な成果を目指めざしています。
BioSupercomputing Newsletter Vol.2