MM総研大賞2020 大賞 兼 ものづくり優秀賞スーパーコンピュータ「富岳」
国立研究開発法人理化学研究所/富士通株式会社

2020年09月15日

アプリケーション性能を追求した世界最速のスーパーコンピュータ

 

スーパーコンピュータ「富岳」は、世界のスーパーコンピュータの性能ランキングである第55回TOP500リストで第1位を獲得。2011年の「京」以来8年ぶりに日本のスーパーコンピュータが世界一になった。同時にビッグデータの処理速度を競う「Graph500」など3つのランキングにおいても1位を獲得し、世界初の同時4冠を達成した。利用者視点に立った設計・開発思想が特徴という。新型コロナウイルス感染症の対策に貢献する研究にも活用されるなど、今後の活躍にも期待が集まっている。日本発のものづくり技術が世界一を獲得した点が高く評価され大賞およびものづくり優秀賞を受賞した。

性能ランキングで世界初の同時4冠達成

スーパーコンピュータ「富岳」は2019年8月に運用を停止した「京」の後継機として、理化学研究所(以下、理研)と富士通が共同で開発し、2020年4月に新型コロナウイルス対策を目的とした優先的な試行的利用が開始された。2020年6月に、世界のスーパーコンピュータの性能ランキングである「TOP500(1秒間の計算速度)」で第1位を獲得。計算速度は毎秒41.5京回(京は1兆の1万倍)で、2位のSummit(米国)と約2.8倍の差をつけた。同時に、「HPCG(実際に分析に使うソフトに近い計算の速度)」「HPL-AI(AI で多用される計算の処理速度)」「Graph500(ビッグデータの処理速度)」でも1位を獲得し、世界初の同時4冠を達成した。「京」は2011年に「TOP500」、2014年に「Graph500」、2016年に「HPCG」とそれぞれの年で1位を獲得した。

「京」の100倍超の性能めざす

2014年度から開始された文部科学省のスーパーコンピュータ「富岳」開発事業(フラッグシップ2020プロジェクト)は①富岳の開発・整備、②富岳を用いて取り組む重点課題に向けたアプリケーション開発―の2つの目標を掲げた。アプリケーション実効性能において最大で「京」の100倍以上の達成をめざした。

従来のスーパーコンピュータの開発は高い計算能力を重視していたが、富岳は利用者目線に立った設計思想として、アプリケーションの性能を高めることを重視した。この開発事業は理研に委託され、理研は開発企業を公募し、富士通を開発パートナーに選び、また、文部科学省が選定した9つの重点課題実施機関と共にハードウェアとソフトウェアのコデザイン(協調設計)を進めた。コデザインにおいては、各重点課題実施機関からアプリケーションを選定してもらい、それらターゲットアプリケーションの実行効率を高めるべく、ハードウェア、ソフトウェアの設計を進めた。富士通の80年にわたり磨いてきたハードウェアとソフトウェアの開発技術とのシナジー効果によりチャレンジングな目標を達成することができた。


「富岳」のスペックとベンチマーク達成性能

CPUはArmを初採用

その結果、富岳の目標であるアプリケーション性能を高めるためには、ハードウェアのコアとなるCPUの計算能力の高さが求められるが、同時に大量のデータ参照が必要になることも判明した。そのため、システムの総メモリバンド幅を「京」の約30倍に向上させるとともに、科学系のアプリケーションを実行する性能を高めるためデータロードのチューニングを施すこととした。CPUの命令セットアーキテクチャー選定に関しては、汎用性やアプリケーションの将来の広がりを重視し、「Arm」採用に踏み切った。この結果、設計段階からハードウェア、ソフトウェアの両面において改善を進めることができた。

開発における3つの新機軸

富士通が開発した富岳のための技術的な新機軸は3つある。

①アプリケーションの高速化Armアーキテクチャによるスパコン向けCPUを独自に開発した。また、CPUへの大量なデータアクセスを実現するため、データ供給できる積層メモリ「HBM2」を汎用CPUでは世界で初めて使用。加えて、大規模での同時並列処理を効率良く実現するために、「京」で開発した技術である「Tofuインターコネクト」を強化した「TofuインターコネクトD」を採用した。

②自社開発による省電力・高信頼性の実現CPU/システム/ソフトウェアの一体開発により、巨大システムの安定稼働・稼働率向上を実現した。また、電力抑制機能のハードウェア実装とソフトウェアによる効率的な制御技術を開発した。加えて、富士通のCPU設計技術を最先端半導体テクノロジーに適用することで、世界トップクラスの優れた電力性能を実現した。

③業界標準の採用で使いやすさと普及しやすさを追求CPUはスマートフォンやIoT機器で広く使われているArmアーキテクチャを採用したCPU「A64FX」を自社で設計・開発した。同一コア数の最新CPUであるx86CPUと比較して、計算速度で最大1.8倍、省電力性で最大4.7倍も性能が高い。OSに関しても、サーバなどで広く使われているRed Hat Enterprise Linux(RHEL8)を採用した。

コロナ禍の中で出荷開始

システムを構成する富岳の筐体ごとの工場出荷は2019年12月から順次始まったが、1カ月ほどで新型コロナの世界的流行が始まり、継続的な出荷が一時危ぶまれた。このため、サプライヤとの作業分担チェックによる納期や製造・組み立てなど一連の工程を見直し、出荷ペースを守った結果、2020年5月に計画通りの筐体搬入を完了した。

筐体設置などに当たってもリモート作業を大前提とし、現地作業は検温記録・手指消毒・マスク着用などのルールを徹底、作業者の通勤は徒歩を推奨、使用する居室やトイレも分離して動線も分けるなどの感染リスク低減策を徹底した。万が一の感染による影響を最小化するため2班以上に分けバックアップできる体制を構築した。
性能評価のベンチマーク測定も理研と富士通がそれぞれ結成した3チームがリモート連携した。


x86CPU × 2 に対するA64FX × 1 の性能倍率

新型コロナ対策に先行活用し、マスク着用の効果を実証

文科省は2020年度に富岳を用いて成果を早期に創出する「成果創出加速プログラム」を設置したが、このプログラムが緒に就く中で、世界的な緊急課題になったのが新型コロナウイルスの感染対策だ。理研も新型コロナ対策に富岳の優先的な試行的利用に踏み切った。計算資源の約6分の1を占めるリソースがこの研究につぎ込まれたことになる。室内環境におけるウイルス飛沫感染のシミュレーションの実施では、マスクの着用で飛沫による感染リスクを抑える効果があることがわかり、シミュレーションの映像も各種報道メディアで取り上げられた。

既存医薬品を用いた治療薬候補の探索も実施し、10日間で2,000種類超の既存医薬品を評価した結果、いくつかの有望な候補薬が発見されている。運用開始前の“緊急案件”ではあるが、いくつかの成果が出たことで富岳プロジェクトの有用性が一般国民にも広く認識された。2020年度の富岳運用は引き続き新型コロナ対策や「成果創出加速プログラム」に活用される。創薬をはじめとするさまざまなプロジェクトにおいて研究の加速に期待がかかる。

現在、2021年度からの本格運用に向けて、利用者目線に立ったアプリケーションの実行環境の性能向上に向けた整備・チューニングを行っている。「富岳」の高い計算性能とそのアプリケーションの高速化との相乗効果で、「京」の後継機として最大で100倍超えのアプリケーション実効性能を持つ、誰もが使いやすいスーパーコンピュータだ。これからの活用で真価が発揮されるに違いない。

MM総研大賞について

「MM総研大賞」は、ICT分野の市場、産業の発展を促すきっかけとなることを目的に、MM総研が2004年に創設した表彰制度です。2020年度の今回が17回目になります。優れたICT技術で積極的に新商品、新市場の開拓に取り組んでいる企業を表彰するものです。

詳細はこちら

 


■MM総研について
株式会社MM総研は、ICT分野専門の市場調査コンサルティング会社です。日本におけるデジタル産業の健全な発展と市場拡大を支援することを目的として1996年に設立し、四半世紀にわたって経験と実績を重ねてきました。ICT市場の現状と先行きを的確に把握する調査データに加えて、新製品・新サービスを開発するためのコンサルティングサービスも提供しています。