CUDA 支援 ARM 是達成百萬兆級超級電腦的新途徑,還是 Nvidia 和 ARM 的好機會?

作者 | 發布日期 2019 年 06 月 21 日 7:45 | 分類 GPU , 處理器 , 電腦 follow us in feedly


超級電腦(Supercomputer)在科學界常視為國家技術領軍能力的指標,因能為 AI、空氣動力、大氣科學、能源科學等重要技術的研究提供算力支撐。如今強國競爭已進入百萬兆級時代,就需要更強大的處理器。目前 x86、Power 為超級電腦 CPU 計算節點的主要架構,那麼 Nvidia 宣布 CUDA 支援 Arm,誰將是最大贏家?

超算競爭進入百萬兆級時代

去年 6 月,美國能源部公布了世界最快的超級電腦 Summit,反超中國超算太湖之光重奪超算 TOP500 第一的位置,美國並表示,他們預計在 2021 年建造一台每秒運算數十億億次的電腦「極光」(Aurora),甚至打造更高效能的電腦。

▲ 2019 超級電腦 Top 500。

當然,中國也在建立百萬兆級超級電腦系統,有消息稱基於已構建的 3 種原型系統:曙光、天河和神威。日本和歐洲也不甘落後,日本希望在 2021 年有一台百萬兆級的超級電腦,歐洲人則在希望在 2023 年達成這目標。顯然,超級電腦的競賽跨入了 Exascale 計算(百萬兆級計算,也稱 E 級超級電腦)時代。

用不精確的說法解釋百萬兆級計算,一個百萬兆級電腦瞬間進行的計算,相當於地球所有人每天每秒不停計算 4 年。這樣強大的計算能力需要更複雜的系統。與普通電腦一樣,超級電腦同樣由硬體和軟體系統組成,但超級電腦僅硬體部分就由高速運算系統、高速互連通訊網路系統、儲存系統、維護監控系統、電源系統、冷卻系統和架構組裝設計等部分組成。

其中,高速運算系統負責邏輯複雜的排程和串列工作和並列度高的工作,可採用同構計算(純 CPU 組成計算節點),也可以採用異構計算(CPU+加速器組成計算節點)方式。

實現百萬兆級超算的新途徑

根據國際組織 TOP500 編制的超級電腦榜單,從 2019 年度 ISC 國際超級電腦大會公布的超算效能 500 強榜單,不難發現 IBM Power、Nvidia Volta / Tesla、Intel Xeon 顯然是超級電腦計算節點的重要組成。

▲ 2019 年度 ISC 國際超級電腦大會公布的 Green500。

但是,隨著算力進一步增強,超算產生的熱量不僅會造成更多資源消耗,冷卻系統設計同樣面臨更大的挑戰,因此沒瓦特徴能也十分重要。TOP500 也編制了 Green500 的超級電腦排行榜,這個排行榜比的不是效能,而是比每瓦效能,所以,即便某個超級電腦在 TOP500 榜單墊底,在 Green500 卻可能獲得好名次。

根據最新 Green500 排行榜,全球最節能的 25 款超級電腦中,22 款都得益於 Nvidia 的支援。

關鍵之一就是採用異構計算方式,讓 x86 或 Power 架構的 CPU 與 Nvidia GPU 合作,將繁重的處理作業卸載至更節能的並列處理 CUDA GPU。不過在 CPU 市場,Arm 架構也不能捨棄,那麼在超級電腦的百萬兆級競爭,Arm CPU 是否也能發揮優勢?

現在下結論還為時尚早,但 Nvidia 並不打算錯過可能的機會。6 月 17 日,2019 年度 ISC 國際超級電腦大會,Nvidia 宣布將於年底前提供 Arm 生態系統全堆疊 AI 和 HPC 軟體,此堆疊為 600 多個 HPC 應用程式和所有 AI 框架提供加速,包括所有 Nvidia CUDA-X AI 和 HPC 程式庫、GPU 加速的 AI 框架和軟體開發工具,如支援 OpenACC 的 PGI 編譯器和效能分析器。

這也就意味著,Nvidia 的堆疊最佳化完成後,將為所有主要 CPU 架構提供加速,包括 x86、Power 和 Arm。

Nvidia 創始人兼首席執行長黃仁勳表示:「超級電腦是促進科學發現的重要工具,建立百萬兆級超級計算將能極大延伸人類知識的邊界。隨著傳統計算規模延伸步伐停止,功率也將成為所有超級電腦的限制因素。Nvidia CUDA 加速計算和 Arm 的高能效 CPU 架構結合,將助力 HPC 社群大幅提升,達到百萬兆級。」

Nvidia 的好生意

從百萬兆級超算建造者的角度看,Arm CPU+Nvidia GPU 是個新選擇,但從 Nvidia 的角度看,CUDA 支援 ARM 不只簡單宣布,而是資源投入。讓 Nvidia 有動力投入,是各國和巨頭公司的需求和熱忱。

僅美國方面,下一代超級電腦技術研發總投入將達 4.3 億餘美元,美國能源部部長里克‧佩里就表示,這些資金劍指「下階段研發百億億次系統的全球競賽」。顯然,百萬兆級超級電腦構建少不了 Nvidia 的 GPU,特別是 AI 技術蓬勃發展且越來越重要的當下。此時 Nvidia 又聯合 ARM 為構建百萬兆級超級電腦提供新途徑,自然能讓其從超級電腦市場獲得更多營收。

Nvidia 在超級電腦市場的努力不只 CUDA 支援 ARM,2019 年度 ISC 國際超級電腦大會還宣布全球速度排名第 22 位的超級電腦 DGX SuperPOD。根據 Nvidia 的說法,此超級電腦系統採用 96 台 NvidiaDGX-2H 超級電腦,內含 1,536 顆 Nvidia V100 Tensor Core GPU,由 Nvidia NVSwitch 及 Mellanox 網路架構聯結。處理能力高達 9.4petaflops,能用於訓練安全自駕車所需的海量深度神經網路。

對比來看,具備同等效能的其他 TOP500 超級電腦系統需要由數千台伺服器構建,而 DGX SuperPOD 占地面積更少,體積比同等系統小 400 倍左右。部署方面,其他同等規模的系統通常需要 6~9 個月才能完成,DGX SuperPOD 在工程師採用經驗證的規範性方法下,僅需 3 星期。

Nvidia DGX 系統已服務眾多對大規模計算有需求的企業機構,例如 BMW 、Continental、福特與 Zenuity 等汽車公司,還有 Facebook、微軟與富士軟片等公司,還有研究領域的日本理化學研究所與美國能源部實驗室等。

Nvidia 希望還沒有部署人工智慧資料中心的企業機構使用 Nvidia SuperPOD 架構,可讓雙方都獲益,不只如此,Nvidia 還能透過構建超級電腦,學會如何設計針對大規模人工智慧機器的系統。

顯然,超級電腦特別是百萬兆超級電腦,對 Nvidia 是多贏的好生意。

ARM 的好機會

對 ARM 而言,百萬兆級超級電腦市場則是個好機會。在行動市場占據領導地位的 ARM 遇到市場增長放緩時,同樣也希望拓展到新市場,近年來也在努力聯合夥伴推動 ARM 伺服器發展,不過情況並不理想。

但在超級電腦市場,特別是 CUDA 支援 ARM 後,ARM 迎來了好機會。Atos 進階執行副總裁、大數據和網路安全部門負責人 Pierre Barnabé 表示:「憑著萬寶龍專案,以及為百萬兆級超級電腦 BullSequana X 所做的 ARM 計算刀片設計,Atos 成為 ARM 生態系統的先驅者。」

全球重要超級電腦提供商 Cray 總裁兼首席執行長 Peter Ungaro 表示:「我們的 Cray 系統管理和程式設計環境(編譯器、程式庫和工具)已能在 XC 和未來的 Shasta 超級電腦支援 ARM 處理器,將 CUDA 和 CUDA-X HPC、AI 軟體堆疊用於 ARM 平台,並將之與 Cray 系統管理和程式設計環境緊密整合,助力超級電腦實現願景。」

另外,Ampere Computing、CSC、EPI、HPE、Jülich 超級電腦中心、Marvell 等都表達對 CUDA 支援 ARM 的期待。同時還會看到,CUDA 支援 ARM 能建造百萬兆級超級電腦,同樣也能讓伺服器廠商更方便製造 ARM 伺服器,所以 ARM 的好機會是更能拓展架構優勢。

小結

百萬兆級超級電腦是各國努力打造的新一代超級電腦,此時 Nvidia CUDA 支援 ARM,給正在打造新一代超級電腦的國家及對算力有更高需求的企業一個新選擇,這既是 Nvidia 能多贏的好生意,更是 ARM 進入超級電腦市場的好機會。現在有眾多支援者表態支持新路徑,雖然對此保持積極態度,但結果仍需透過實際百萬兆級超級電腦系統得出。創新雖不會百分之百成功,但是推動革新的最大動力。

(本文由 雷鋒網 授權轉載;首圖為目前超級電腦第一名 Summit,來源:ORNL

延伸閱讀: