超級電腦排名洗牌,架構差異下其實各有擅長的運算領域

作者 | 發布日期 2018 年 11 月 26 日 7:45 | 分類 尖端科技 , 電腦 follow us in feedly

在今年的超級電腦排行榜 Top500,台灣的高速科學計算中心的新超級電腦──台灣杉 號,採用和第一名 Summit 一樣的 CPU+GPU 的異質計算架構,以 9 PetaFLOPS 獲得第 20 名,為台灣的基礎科學研究添增助力。然而除了 CPU+GPU 的異質計算架構外,還有哪些不同的計算架構呢?不妨以過往世界第一的超級電腦說起吧。



如果有讀者還不認識 Top500 排行榜,以及他們排名的衡量標準可以先看這篇文章

在過去十年裡,美中日世界前三大經濟體,都曾擁有世界第一超級電腦的頭銜。此外,這三國的世界第一超級電腦,都曾採用該國開發的處理器以及系統。證明各自的晶片系統設計能力,也象徵著國家科學研究技術的能力。

那麼,這 3 個國家的處理器有什麼差異?不妨從 2011 年,日本以自主的系統奪得世界超級電腦第一開始說起。

曾經的世界第一超級電腦──京

▲ Fujitsu SPARC64 VIIIfx 中,CPU 核心的架構圖。

2011 年,日本的超級電腦──京。採用 Fujitsu 的 SPARC64 VIIIfx。此 CPU 採用 45nm 製程,每一顆 CPU 內有 顆核心,並可帶來 128 GFLOPS 的雙精度浮點數計算效能。

從圖中可以發現每一顆核心有 個浮點數計算單元,也就是 FLAFLBFLCFLD。藉由這一個方法,可以帶來更多的計算效能。

由於每一顆 CPU 的大小都一樣,沒有大小 Core 之分,這台超級電腦就像是將數萬顆 Intel CPU 組合起來一樣,清晰明瞭。

去年世界第一的超級電腦──神威太湖之光

2016 年,中國的神威太湖之光發表,為整個超級電腦社群投下一顆震撼彈。做為中國第一台自主發展的超級電腦,他接替了中國的天河二號從 2013 年寫下的世界第一紀錄,同時也宣告中國終於有辦法發展自己的超級電腦。

下圖便是神威太湖之光的處理器 SW26010 架構圖。在一顆 SW26010 中,它的核心設計概念比較像是 GPGPU 以及 big.LITTLE 技術的結合,由一個較大的 Master core 完成較複雜的功能。小的核心則處理單純負責計算的功能,為簡單的計算核心。

▲ 神威太湖之光一顆 CPU 內,CPU 核心以及連結方式。

藉由工作的區分,一顆 CPU 便可以帶來 3.0642 TFLOPS,和當年的主流計算 GPU Tesla K80 相比,沒有太大的差距。不過由於此 CPU 為計算特化的 CPU,在日常應用中不會有更佳的使用體驗。

由於小的計算核心功能較簡單,為了讓小核心可以跟大核心協同運算,它採用 OpenACC 這一套開源軟體的標準,讓 master core 可以將工作分配給 slave cores。藉由 MPIOpenMP 以及 OpenACC,讓開發者可以輕易地撰寫程式並在神威太湖之光內執行。

新的世界第一──Summit

今年,美國終於發表了他們新的超級電腦 Summit,從中國手中奪回超級電腦的榜首,結束從 2013 年至 2017 年由中國稱霸的日子。此外,台灣杉 號的運行架構跟 Summit 一樣,採用CPU+GPU異質計算的方式,帶來龐大的計算效能。

Summit 和神威太湖之光不同的地方在於 SW26010 的異質計算核心是結合在 CPU 內部,Summit 的 CPU-GPU 異質計算則是以 CPU 將獨立 GPU 連結在一起運算,經由額外的傳輸介面將資料做交換。如圖所示。藉由 CUDA 以及 MPI,讓開發者得以撰寫平行程式。

3 台超級電腦,3 種架構

美中日的自主開發超級電腦,分別代表了 3 種不同超級電腦的解決方案。從京的以一顆 CPU 到太湖之光的異質整合 CPU,至 Summit 的 CPU+GPU 異質計算的模式。這 3 種不同的技術皆曾占據過榜首,也因此沒辦法明確判斷不同技術的優勝劣敗。

但是在 Machine Learning 領域中,由於大部分的計算都是矩陣運算且運算的工作也是高度獨立的,CPU+GPU 的異質模式可以滿足其需求。然而,當使用其他相對不好平行的演算法時,京的運行架構較為通用,較不會被應用領域侷限住。至於太湖之光則處於京以及 Summit 中間,擁有兩者的優點,但一般使用者無法使用,為客製化晶片,研發成本較高。

近期,美中日三國也都提出了 Exascale 超級電腦的計畫,欲將現在的超級電腦往 1,000 PetaFLOPS 推進。在近幾年 ,我們將看到精采的超級電腦榜首爭霸戰。

(首圖為 Summit;來源:ORNL

延伸閱讀: