BioSupercomputing Newsletter Vol.2

Home -> Newsletter -> Vol.2

LEADER'S TALK
生命体基盤ソフトウェア開発・高度化チーム

次世代スパコンの可能性を最大限に
引き出すため高性能計算環境の
さらなる充実を図る

泰地 真弘人

生命体基盤ソフトウェア開発・高度化チーム
チームリーダー
泰地 真弘人

生命体基盤ソフトウェア開発・高度化チームの主要な機能は、高性能計算・数理工学の立場から、アプリケーションの高性能化と、産業利用に対応するための基盤整備に貢献していくことです。分かりやすく言えば、次世代生命体統合シミュレーションソフトウェアの研究開発を推進する各チームで開発されたアプリケーションを、次世代スーパーコンピュータ上でうまく走らせて、最大限の成果があがるようにすること、それが私たちの仕事です。

次世代スーパーコンピュータは、おそらくプロセッサ数が8万個以上、コア数でいうと64万個以上、演算器の数は500万演算器という、これまでにない大規模な並列計算機です。その可能性を最大限に引き出すには、できる限り効率よく動かしていくためのソフトウェア開発が欠かせません。これまでの100個とか1,000個の並列とはケタ違いのレベルが要求されます。並列コンピューティングで期待できる性能向上率を表わす最も単純なモデルとして、「アムダールの法則」が知られています。この法則では、プログラムを並列化できる部分とできない部分の2つに分け、その比率から性能向上率を推定します。当然、並列化できる部分の比率が少なければ、たくさんのプロセッサを使っても、計算性能を上げることはできません。1,000個のプロセッサであれば、並列化できない割合が0.1%を超えてしまうと性能が落ちてしまいます。これが1万になれば0.01%、10万では0.001%。次世代スーパーコンピュータではさらに1ケタ上の0.0001%。つまり、99.9999という完璧に近い並列化が要求されるわけです。これを達成するためには、コンピュータ科学の最先端知識を導入し、さらにアルゴリズム的なところまで踏み込むなど、あらゆることに取り組んでいかなければなりません。そこに、私たちのチームの存在意義があると考えています。

いちばん問題になるのは、計算するプロセッサ間でデータのやり取りをする通信部分でいかにして効率を高めるかということです。そのためには、ネットワーク構成などに合わせたプログラミングやアルゴリズムの開発が必要であり、細かいハードウェアの情報にまで遡って、最適なソフトウェアの開発を進めることを目指しています。具体的な課題としては、アプリケーションの高性能化を実現するために、大規模並列化への対応、コアソフトウェアの開発、共通基盤ライブラリの開発、可視化ソフトウェアの開発などに取り組んでいます(共通基盤ライブラリ、可視化については、Vol.1研究報告参照)。

現在、各チームの代表的なアプリケーション(第一走者)の評価作業を進めているところです。大規模並列に向けて、それぞれ課題も見えてきました。評価とともに、どうすれば性能を高めることができるかについてもレポートし、今後開発者と一緒に取り組んでいきたいと考えています。また、ライフサイエンス分野では、次世代スーパーコンピュータの性能を最大限活用することと実際の問題を解くこととの間に、まだ少し距離があるようにも感じます。単に並列化を高めるだけでなく、どうすれば計算資源を最も効果的に活用しながらサイエンスとして最大の成果が得られるかについても、プロジェクト全体で議論しながら考えていきたいと思っています。加えて、ハードウェアや運用上の制約についても、今後当チームで噛み砕いてわかりやすい形で開発者に伝えていくことも、私たちの大事な仕事であると考えています。特に、実際に次世代スーパーコンピュータが稼働してからは、どういう問題・解法であれば高い性能が得られるかをユーザー側にしっかりとフィードバックしながら、ターゲットをきちんと考えてもらうことも必要になってくるはずです。これくらい大規模な並列度になると、使ってみないと分からない部分も大きく、「使用感」のようなノウハウ的なものを伝えることも、私たちの役割のひとつと考えています。

各アプリケーションへの対応とともに、現在、私たちのチームでは「大規模並列用のMD(分子動力学)コアプログラム」を先行して開発しています。各チームのアプリケーションの高性能化はもちろん重要な課題ですが、その前に私たちもしっかりと大規模並列のノウハウを積み上げておかなければいけません。また、次世代スーパーコンピュータの並列性能を実証するという目的もあります。そうしたことから、タンパク質の機能を高速で長時間シミュレーションするための計算技術の確立をめざして、この課題に取り組んでいます。

ほかの研究開発チームは、アプリケーションソフトウェアの開発を進めている今が本番であるといえるでしょうが、私たちのチームは実際に次世代スーパーコンピュータが動き始めるこれからが本番なのだと思っています。想像したくはないですが、ここでお話したこと以外にも、やらなければならない課題・思っても見なかった課題がたくさん出てくるに違いありません。

BioSupercomputing Newsletter Vol.2

SPECIAL INTERVIEW
次世代スーパーコンピュータの性能を最大限に活かし
ライフサイエンス分野で世界のトレンドセッターをめざす!

次世代計算科学研究開発プログラム 副プログラムディレクター 姫野 龍太郎
LEADER’S TALK
あるがままの生きた細胞を再現して細胞のシミュレーション実現をめざす
細胞スケール研究開発チーム チームリーダー  横田 秀夫
脳神経系の機能の解明をめざしてスーパーコンピュータ上に脳を創る
 脳神経系研究開発チーム チームリーダー  石井 信
次世代スパコンの可能性を最大限に引き出すため高性能計算環境のさらなる充実を図る
生命体基盤ソフトウェア開発・高度化チーム チームリーダー 泰地 真弘人
研究報告
全電子計算に基づくタンパク質反応シミュレーション
東京大学生産技術研究所(分子スケールWG) 佐藤 文俊/平野 敏行/上村 典子/恒川 直樹/松田 潤一
オイラー型流体・構造連成手法
東京大学大学院工学系研究科 杉山 和靖
大脳皮質局所神経回路網モデルの大規模シミュレーション Cortical Microcircuit Developed on NEST
脳神経系研究開発チーム 五十嵐 潤
次世代の分子動力学シミュレーションプログラム開発
生命体基盤ソフトウェア開発・高度化チーム  小山 洋/大野 洋介/舛本 現/長谷川 亜樹/森本 元太郎
参画機関map /研究開発体制
異分野研究者を横断 バイオスーパーコンピューティング研究会の誕生
イベント報告/イベント情報/ロゴマークについて