BioSupercomputing Newsletter Vol.3

Home -> Newsletter -> Vol.3

研究報告
データ解析融合WG
MEGADOCKによる網羅的タンパク質間相互作用予測

東京工業大学大学院情報理工学研究科
(左から)秋山 泰、松崎 由理、内古閑 伸之、大上 雅史

秋山 泰、松崎 由理、内古閑 伸之、大上 雅史

 我々はバイオインフォマティクスと並列処理の手法により、システム生物学の重要な課題の一つであるタンパク質間相互作用(Protein-Protein Interaction:PPI)の予測に取り組んでいます(図1)。従来は計算機に期待される役割は、既知の1対1のタンパク質間相互作用について結合の姿勢と強度の詳細な検討を行うことでした。しかし我々は大規模並列計算を前提としたPPI予測システム「MEGADOCK」を開発し、大量のタンパク質群から網羅的にPPIの候補ペアを予測することを初めて可能としました。実験との協調により、今後新たなPPIの発見に寄与することが期待されます。

図1:PPI予測に基づくタンパク質相互作用ネットワーク推定

 MEGADOCKは、各タンパク質の立体構造情報を利用し、剛体モデルによるドッキング計算から得る種々の評価値に基づき、相互作用の有無を予測するシステムです。この計算ではタンパク質の構造変化は考慮せず、主に分子表面の形状相補性に基づく高速な評価を行います。形状相補性の項と静電的相互作用の項を用いて分子構造をボクセル空間上に表現するrPSCスコアを考案しました。従来のツールZDOCKでは三つの作用を三つの複素数で計算するのに対し、rPSCでは形状相補性を実数部で表現し、静電的相互作用を虚数部に導入することで、二つの作用を一つの複素数で計算します。スコアの積和計算に要する三次元高速フーリエ変換(FFT)の回数が減り、単一CPUの実行でもZDOCKと同等の精度で約4倍の計算速度向上を実現しました。

 MEGADOCKはMPIライブラリで並列化されています。あるプロセッサが複数のレセプタータンパク質と複数のリガンドタンパク質を担当するとき、担当するリガンドから一つを順に取り出し、指定された角度刻みごとにFFT化し、最内ループとして全ての担当するレセプターと比較します。既知タンパク質について予めFFT化したライブラリを作成し、ディスクから読み出して積和計算を行う機能も実装し、さらに最大3倍程度の高速化が達成できました。負荷分散を工夫すれば、数百プロセッサ以上でも効率的な実行が可能です。

 MEGADOCKの性能評価として、まず当分野で用いるベンチマークの44組のタンパク質複合体を対象に、44×44=1,936通りの組合せのPPI予測を行いました。予測構造(赤)と天然構造(緑)がよく一致し (図2左)、PPI候補対の予測では図2右の対角線上の暖色が示すように、多くの正しい複合体が予測され、類似研究と同等以上の予測精度(F値=0.415)が得られました。システム生物学への実応用としては、細菌走化性系のシグナル伝達パスウェイ(89×89=7,921)、肺ガンと関連するヒトEGFRシグナル伝達系(497×497=247,009)のPPI予測を実施しました。1,000×1,000(メガ)級の計算が日常的に実施できることが我々の目標です。

図2:PPI予測結果(44x44ベンチマーク)

参考文献
[1] Matsuzaki Y., Matsuzaki Y., Sato T. and Akiyama Y., J Bioinform Comput Biol, 7:991-1012 (2009).
[2] 大上, 松崎, 松崎, 佐藤, 秋山, 情報処理学会論文誌 数理モデル化と応用(TOM), 3(3):91-106 (2010).

BioSupercomputing Newsletter Vol.3

SPECIAL INTERVIEW
さまざまな最先端研究基盤を統合して活かすためにも
スーパーコンピュータの果たす役割は大きい

持田製薬株式会社 医薬開発本部 専任主事 東北大学 客員教授 西島 和三
超音波治療の推進および治療機器開発に欠かせない生体の音響的シミュレーション研究
東京大学大学院 工学系研究科 機械工学専攻 特任研究員 佐々木 明
研究報告
QM/MD/CGMのマルチスケール分子シミュレーションの実現(分子スケールWG)
大阪大学蛋白質研究所  米澤康滋/山中秀介/下山紘充/山﨑秀樹/中村春木
理化学研究所 次世代計算科学研究開発プログラム 福田育夫
細胞レベルの精緻な代謝モデルを用いた
肝臓シミュレータの開発と実証に向けて(細胞スケールWG)

慶應義塾大学医学部 谷内江 綾子
MEGADOCKによる網羅的タンパク質間相互作用予測(データ解析融合WG)
東京工業大学大学院情報理工学研究科 秋山 泰/松崎 由理/内古閑 伸之/大上 雅史
昆虫嗅覚系全脳シミュレーション(脳神経系WG)
東京大学先端科学技術研究センター 加沢 知毅
報告
生命体統合シミュレーションサマースクール2010を開催
理化学研究所次世代計算科学研究開発プログラム 石峯 康浩(臓器全身スケールWG)
東京大学医科学研究所 島村 徹平(データ解析WG)
理化学研究所次世代計算科学研究開発プログラム 須永 泰弘(細胞スケールWG)
京都大学大学院情報学研究科 本田 直樹(脳神経系WG)
理化学研究所次世代計算科学研究開発プログラム 舛本 現(開発・高度化T)
理化学研究所次世代計算科学研究開発プログラム 松永 康佑(分子スケールWG)
生命体統合シミュレーション・サマースクール2010へ参加して
東京大学大学院理学系研究科博士課程1年 齊藤 健
ISLiM参画機関map/イベント情報/トピックス