BioSupercomputing Newsletter Vol.2

Home -> Newsletter -> Vol.2

研究報告
次世代の分子動力学
シミュレーションプログラム開発

生命体基盤ソフトウェア開発・高度化チーム
(左から)小山 洋、大野 洋介、舛本 現、長谷川 亜樹、森本 元太郎

 生命体基盤ソフトウェア開発・高度化チームでは現在次世代スパコン用の基本アプリケーションとして分子動力学シミュレーションプログラムを開発しています。分子動力学とはたんぱく質などの分子の動きを古典力学におけるニュートンの運動方程式を解くことにより明らかにするための計算手法です。もちろん分子の振る舞いは原理的には量子力学に従うはずです。しかし多体量子力学の計算は次世代スパコンを持ってもまだまだ計算量が膨大であること、古典力学の問題に置き換えることで動的な性質を理解しやすいことから分子動力学はまだまだ現役として活躍しています。この分子動力学シミュレーションはライフサイエンスの中での基礎的な伝統的研究手法の一つと言えるでしょう。

それでは今なぜ新たにプログラム開発をする必要があるのでしょうか。その一つの理由はスケーラビリティの深刻さです。スケーラビリティとは一言で言うと「2台の計算機を使うと2分の1の計算時間に短縮される」ことです。当たり前のように聞こえるかもしれませんが、この2台が100台、1000台になっても性能を出し続けられることが大規模計算にとって必要不可欠なのです。これは安価なパソコンを繋いでもスパコンにはなりえないことを意味します。さらにここからが重要ですが、スケーラビリティを決めているのはハードウェアやソフトウェアの完成度だけではなく、究極的にはその計算アルゴリズムによって決定されることです。なぜなら科学計算は解を求めることが目的だからです。

図1に私たちの開発した分子動力学プログラムによる3つの異なる規模のシミュレーションの実行時間を示しました。この図から並列数と共に計算時間が減少していること、すなわちスケーラブルであることが見て取れます。一方で、どの線も並列数の増加によって下げ止まり(plateau)が見えています。これは通信時間が演算時間を超えていることが原因で、各々の計算規模でも共通しておおよそ1CPUコア辺り100原子で起きていることが分かります。この限界はCPUの演算性能とデータ通信ネットワークの性能のバランスを示しています。次世代スパコンの並列数は、同じ図中の矢印に示す通り、さらに100倍近く大きなものになります。100倍速く計算するためには、通信を100倍速くするか、通信量を100分の1にするか、問題の規模を100倍にしなければなりません。通信はハードウェアの性能によって決まるので、ソフトウェアの改良には限界があります。通信量を減らすのはプログラムの問題ではなくアルゴリズムとしての数学の問題ですので新しい方法を模索しなければなりません。これは困難を極めますが、逆にやりがいのある面白い挑戦と言えるでしょう。

ところで次世代スパコンでの大規模な分子動力学シミュレーションが可能になると何が出来るようになるのでしょうか。その応用例として創薬をあげてみたいと思います。薬は標的とするタンパク質の表面(鍵穴)にぴったりと結合して化学的な活性を発揮する物質(鍵)です。この候補を選び探すことを「創薬スクリーニング」と呼びます。従来のスクリーニングに使用されている化合物データは800万化合物程度が一般的な規模でした。既に新規の有望な骨格を見出しにくくなっていることが指摘されているのです。理論的な見積もりによると1063規模もの化合物が薬らしさ (Drug Likeness) を満たすといわれているため、そのごく一部しかスクリーニングされていないことになるのです。これがもし10億化合物数の新規骨格を多く含む仮想薬剤ライブラリになれば新しい薬の発見の可能性が飛躍的に向上するはずです。この作業を加速し可能にするのが次世代スパコンと次世代分子動力学プログラムです。新規ライブラリは多様性、新規性、Drug Likenessについての評価指標を算出し、既存のライブラリでの評価と比較し有用性の検証を行う必要があります。これに向けて現在は1千万から1億化合物規模のプロトタイピングを行っています(図2)。

最後に本発表における数値シミュレーションの実行は、理化学研究所情報基盤センターの RIKENIntegrated Cluster of Clusters (RICC) システムを用いて行われましたので、この場を借りてお礼申し上げます。

BioSupercomputing Newsletter Vol.2

SPECIAL INTERVIEW
次世代スーパーコンピュータの性能を最大限に活かし
ライフサイエンス分野で世界のトレンドセッターをめざす!

次世代計算科学研究開発プログラム 副プログラムディレクター 姫野 龍太郎
LEADER’S TALK
あるがままの生きた細胞を再現して細胞のシミュレーション実現をめざす
細胞スケール研究開発チーム チームリーダー  横田 秀夫
脳神経系の機能の解明をめざしてスーパーコンピュータ上に脳を創る
 脳神経系研究開発チーム チームリーダー  石井 信
次世代スパコンの可能性を最大限に引き出すため高性能計算環境のさらなる充実を図る
生命体基盤ソフトウェア開発・高度化チーム チームリーダー 泰地 真弘人
研究報告
全電子計算に基づくタンパク質反応シミュレーション
東京大学生産技術研究所(分子スケールWG) 佐藤 文俊/平野 敏行/上村 典子/恒川 直樹/松田 潤一
オイラー型流体・構造連成手法
東京大学大学院工学系研究科 杉山 和靖
大脳皮質局所神経回路網モデルの大規模シミュレーション Cortical Microcircuit Developed on NEST
脳神経系研究開発チーム 五十嵐 潤
次世代の分子動力学シミュレーションプログラム開発
生命体基盤ソフトウェア開発・高度化チーム  小山 洋/大野 洋介/舛本 現/長谷川 亜樹/森本 元太郎
参画機関map /研究開発体制
異分野研究者を横断 バイオスーパーコンピューティング研究会の誕生
イベント報告/イベント情報/ロゴマークについて