画像のクリックで拡大表示
理研のスパコン「富岳」と松本紘理事長(提供:理研)
画像のクリックで拡大表示
農研機構のスパコン「紫峰」と久間和生理事長(提供:農研機構)

 富士通のスーパーコンピューター(スパコン)が相次ぎ稼働し、バイオテクノロジーの研究開発にも寄与している。

 京都大学大学院医学研究科人間健康科学系専攻ビッグデータ医科学分野の奥野恭史教授(理化学研究所科学技術ハブ推進本部医科学イノベーションハブ推進プログラム副プログラムディレクターを兼任)らは、世界最高性能のスパコン「富岳」を用いた10日間の計算により、新型コロナウイルスのメインプロテアーゼ(Nsp5)の反応ポケットに結合しやすい薬剤を、既存医薬品2128種の中から選び出した。

MDシミュレーションによる2000超の薬剤結合評価は世界初

 この成果は2020年7月3日に理研が開催した記者勉強会にて奥野教授が「『富岳』による新型コロナウイルスの治療薬候補同定中間報告」と題する発表で紹介した。薬剤が蛋白質にどのように結合するかを蛋白質を動かしながら計算する分子動力学(MD)シミュレーションを、2000種類余りの薬剤(承認済み医薬品)について行った。これだけ多くの薬剤についてMDシミュレーションを行ったのはこれが世界で初めてという。2012年度から本格稼働した前代のスパコン「京」(2019年8月16日で運用終了)では薬剤が結合したところから計算を開始して正確な結合の強さを見積もることは可能(予測正答率は50%以上)だったが、薬剤が蛋白質にどのように結合するのかを計算するのは難しかった。

 今回、富岳を用いた計算の所要時間が10日間だったのは、最長100n秒分の結合過程を観察することが好ましいと奥野教授らが判断したからだ。1日当たり10n秒分の計算を10日間直列で行うことにより100n秒分の反応の計算を行った。この10日間直列のセットを10セット並列で行うことにより、合計で1μ秒分の計算を薬剤1つ1つについて行った。10n秒の計算を100セット並列で行っても合計で1μ秒を計算できるが、最長10n秒の評価時間では細切れ過ぎるという。

 2000余りの薬剤の評価に用いた富岳の容量は、全体の6分の1程度だったようだ。富岳全部を使えば、1万2000を超える薬剤を10日間で評価できるという計算になる。医薬品として承認されている薬剤は3000程度なので、1万2000超なら未承認薬剤や化合物ライブラリーも評価できることになる。

 世界最高峰のスパコンを用いても、MDシミュレーションを10日間という短時間で実行するために特別な工夫が必要だった。計算における薬剤の濃度を通常の数百倍に高めることにより、薬剤と蛋白質との衝突頻度を向上させ、結合過程を短時間で解析できるようにしたのだ。スウェーデンが開発した分子動力学ソフトウエア「GROMACS」では、この薬剤の濃度を数百倍に高めることにより計算時間が短縮できることが先に報告されていたので、これを活用した。

 奥野教授らは、GROMACSを富岳に最適化するチューニングを行えば、この所要時間を5分の1に短縮できると考えている。実は、理研が開発している超並列分子動力学ソフトウエア「GENESIS」については、京で利用していたものを富岳向けに最適化(コデザイン)したところ、計算時間を5分の1ほどに短縮できたという実績がある。GENESISを用いて新型コロナウイルス表面の蛋白質の動的構造を予測した成果は、理研開拓研究本部杉田理論分子科学研究室の杉田有治主任研究員(理研計算科学研究センターと理研生命機能科学研究センターそれぞれのチームリーダーを兼任)が5月15日の富岳記者勉強会で解説した。しかし、このGENESISについては薬剤の濃度を数百倍に高めることによって計算時間を短縮できる手法が確立されていないため、今回は用いられなかった。

 スウェーデン発のGROMACSについては富岳向けの最適化はこれから。GROMACSはスウェーデンの研究チームが開発した。他人の開発したコードであるため、理研がすぐにチューンナップするのは技術的に困難。できる範囲のチューンを試行錯誤している状況という。スウェーデンの研究チームにも直接、富岳用にチューンナップしてもらうことを理研が依頼している。

 そもそも富岳の本格稼働は2021年度の予定だったが、新型コロナウイルス対策に貢献するため、1年早めて2020年春から試験稼働させたという経緯がある。新型コロナ対策を目的として優先的に試行的利用することは理研が2020年4月7日に発表した。最初に決まった4課題のうちの1つ「富岳による新型コロナウイルスの治療薬候補同定」の課題代表者を奥野教授が務めている。先に紹介した理研のMDソフトウェアGENESISを用いている杉田主任研究員は「富岳を用いた新型コロナウィルス表面の蛋白質動的構造予測」の課題代表者を務めている。

富岳はスパコン性能世界トップを8年半ぶりに奪還

 富岳については、高性能計算(HPC)のベンチマーク実行結果によりスパコンの性能をランキングするTOP500(年に2回発表)において世界1位との評価結果が6月23日に発表された。日本のスパコンが世界1位になったのは「京」以来、8年半ぶり。HPCのベンチマーク事項結果による「富岳」の世界1位の数値は、科学技術計算や産業アプリケーションで用いられる演算能力を基に計算されるHPL(狭義のTOP500)が415.5PFLOPS(浮動小数点数演算の計算回数が1秒間に41.55京回、Pは10の15乗=1000兆=0.1京)。また、スパコンでアプリケーションを稼働させたときの性能に近い評価指標とされるHPCGが13.4PFLOPS、深層学習など人工知能(AI)処理の性能を評価する新指標HPL-AIが1421PFLOPSで、これらも富岳が世界1位になった。理研と富士通が共同開発した富岳のプロジェクト予算は1100億円だ。

 富岳は“富士山”の異名。富士山の標高の高さがスパコン富岳の性能の高さを表し、また富士山の裾野の広がりがスパコン富岳のユーザーの広がりを意味する。この意味を込めた富岳のロゴを理研は2019年8月27日に発表した。富岳の標準文字商標は理研が2019年5月22日に出願し、2020年3月26日に登録された。富岳ロゴの商標は2019年8月13日に理研が出願した。

農研機構のAI研究用スパコン「紫峰」は5月稼働

 富士通のスパコンは農業・食品産業技術総合研究機構(農研機構)や宇宙航空研究開発機構(JAXA)にも設置された。

 農研機構は、AI研究用のスパコン「紫峰」を2020年5月に稼働させたと6月に発表した。画像処理装置(GPU)「NVIDIA Tesla V100」を128基搭載したシステムで、計算速度(理論ピーク性能)は1PFLOPS。併せて、データ容量3PB(3000兆バイト)の大規模データベース「NARO Linked DB」を稼働させた。スパコンと統合データベースの構築支援を富士通が行った。1FLOPSと3PBは、研究者100人が同時にAI用の計算を行うのに必要な能力・規模という。2018年10月に農業情報研究センターを設立した農研機構は、AI研究者を数年以内に400人に増やす。

 農研機構は紫峰の費用を公開していない。紫峰の2019年12月13日の落札価格は8億9892万円と公示されているが、この金額には、コンサルや設計、その他の周辺開発の費用、人件費等は含まれていない。

 紫峰は農業・食料という分野へのスパコンの応用を目指したスパコンのため、多大なコストのかかる性能テストは行っていないという。

 紫峰は、農研機構の本部がある茨城県つくば市の筑波山の雅名(物の風流な呼び名)。農研機構の多くの職員の意向により決定された。農研機構は「紫峰」の商標登録を出願していない。紫峰は、農研機構が開発して1994年に品種登録されたクリ品種の名称でもある。このクリ品種は、9月中下旬に収穫される多収性の中生品種で、中国から侵入した害虫であるクリタマバチに対して強い抵抗性を示すことなどを主要特性としている。

JAXAの3代目スパコン「TOKI」は10月稼働予定

 一方、JAXAは、3代目のスパコンJSS3システムを2020年10月から稼働予定と2020年4月に発表した。理論演算性能は現行の2代目スパコンJSS2システム「宙(SORA)」の約5.5倍に相当する19.4PFLOPSの見込み。2020年3月25日には富士通が61億7200万円で落札した(「FUJITSU Supercomputer PRIMEHPC FX1000」)。この19.4PFLOPSは、富岳のカタログ性能値513.5PFLOPSに対応した数値で、TOP500に近い数値とされる。JAXAは7月31日に、このJSS3システムの名称を「TOKI」に決定したと発表した。

 新スパコンの正式運用開始までに幾つかの性能値を計測する予定で、TOP500とHPCGは測定して公表する予定。HPL-AIは測定するか否かを検討中だ。

理研はMD専用計算機の開発を2019年11月に発表

 なお、理研ではMDシミュレーション専用計算機「MDGRAPE-4A」の開発成功を2019年11月に発表した。システム全体として約1.3PFLOPSの計算能力を持つ。MD専用計算機のため、HPLやHPCGなどのベンチマークは実行できない。このME専用計算機のLSI開発の一部は、アルチップ・テクノロジーズ、ディー・クルー・テクノロジーズ、東京エレクトロンデバイス、クロスアビリティへの委託の下で行われた。システムの設計・製造は、東京エレクトロンデバイスへの委託の下、ホックス、インテグラン、フジクラの協力を得た。開発費は約7億円(研究者の人件費は除く)。