ピックワールド(PIC World)

インフォメーション

この記事は 2022年06月04日 に以下のカテゴリに投稿されました Others (その他).

この記事のタグ

, , , , , ,


スーパーコンピュータ「富岳」がGraph500のBFS部門において5期連続で世界第1位を獲得

米オークリッジ国立研究所にある最新鋭機「フロンティア」というマシンが1位になったと言う話もあるみたいだけど?

あぁ。こちらは TOP 500ってベンチマークの結果なのね。でも、かなり速いみたい。

富岳が世界一なのは、Graph 500ってベンチマークの結果。

まぁ、速いことには変わりないと思うけど。総合力では勝るとか。

最近はいろいろなところで使われていることが前面に出されていますよね。

スーパーコンピュータ「富岳」がGraph500のBFS部門において5期連続で世界第1位を獲得
-ビッグデータの処理で重要となるグラフ解析で最高レベルの評価-
株式会社フィックスターズ

理化学研究所(理研)、九州大学、株式会社フィックスターズ、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]のフルスペックを用いた測定結果で、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS部門において、世界第1位を5期連続で獲得しました。
このランキングは、現在ドイツ ハンブルクのコングレス・センター・ハンブルクおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC2022」に合わせて、Graph500 Committeeから5月30日(日本時間5月30日)に発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。

スーパーコンピュータ「富岳」

スーパーコンピュータ「富岳」

スーパーコンピュータ「富岳」

※共同研究グループ
理化学研究所 計算科学研究センター プログラミング環境研究チーム
佐藤 三久(さとう みつひさ)
児玉 祐悦(こだま ゆうえつ)
中尾 昌広(なかお まさひろ)
九州大学 マス・フォア・インダストリ研究所
藤澤 克樹(ふじさわ かつき)
株式会社フィックスターズ
上野 晃司(うえの こうじ)

1.「富岳」測定結果
共同研究グループは、「富岳」のフルスペックである158,976ノード[2](432筐体)を用いて、通信性能の最適化などを行うことにより、約2.2兆個の頂点と35.2兆個の枝から構成される超大規模グラフに対する幅優先探索問題を調和平均0.34秒で解きました。「Graph500」のスコアは、102,955.5GTEPS(ギガテップス)[3]です。
なお、2022年5月時点の「Graph500」のランキング第2位は、中国の「Sunway TaihuLight」で、測定結果は23,755.7GTEPSです。すなわち、今回「富岳」は第2位と約4倍以上の性能差をつけたことになります。

<関連リンク>
Graph500ランキング
https://graph500.org

2.Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービスなどでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」には、BFS(Breadth-First Search:幅優先探索)部門とSSSP(Single-Source Shortest Path:単一始点最短路)部門があり、2010年に始まり(SSSP部門は2017年11月から)、そのランキングは年に2回(6月と11月)更新されます。BFS部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱います。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(3)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。

(1)複数のノード間におけるグラフデータの効率的な分割方法
(2)冗長なグラフ探索を削減するアルゴリズム
(3)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化

「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。今後、共同研究グループは、さらなる通信性能の最適化に加えて、冗長な探索の削減や各ノードにおけるメモリ使用量の均一化などに取り組む予定です。

<関連リンク>
理研 計算科学研究センター
https://www.r-ccs.riken.jp/jp/

注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3: 大規模グラフ解析プログラムの GitHubレポジトリ
https://github.com/suzumura/graph500/

参考文献
1.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, ”Efficient Breadth-First Search
on Massively Parallel and Distributed Memory Machines”, Data Science and Engineering, Springer, March 2017, Volume
2, Issue 1, pp 22-35, 2017.
2.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka , “Extreme scale breadth-first search on supercomputers”. 2016 IEEE International Conference on Big Data (Big Data): 1040–1047. 2016.

3.補足説明
[1] スーパーコンピュータ「富岳(ふがく)」
スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用を開始した。
現在「富岳」は我が国が目指すSociety 5.0を実現するために不可欠なHPCインフラとして活用されている。

[2] ノード
スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、一つのCPU(中央演算装置)と32GiB(ギビバイト)のメモリから構成される。

[3] GTEPS(ギガテップス)
TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間あたりに処理した枝の数として定義されている。GTEPSのGは10の9乗を表し、GTEPSは1秒あたりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。

[4] Society 5.0
狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において我が国が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指すこととしている。

[5] 持続可能な開発目標(SDGs)
2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴールと169のターゲットで構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本も積極的に取り組んでいる。(外務省ホームページから一部改変して転載)

以上

すごいとは思うのですが、その裏側ではいろいろなことが行われていたりするのね。

古くは、専用のコンパイラを使って性能を出していたり、最近は、ホントはもっと速いのだけれど、発熱の問題から、意図的に性能を落とす必要があり、高性能を謳うために、そのベンチマークだけ発熱の影響を考慮しないで実行したりと・・

別に世界一速くはなくてよいのかもしれないが、お金をかけたそのモノが、有効に利用されているということを示すのも重要だ。

それがなされないと、昔のようにど素人に批判されたりしちゃうからね。

アピールも重要ってことだよね。


コメントを残す

最近の投稿

最近のコメント

アーカイブ