挑戰神威太湖之光,日本超級電腦有什麼獨到之處?

作者 | 發布日期 2016 年 12 月 15 日 9:09 | 分類 尖端科技 , 記憶體 , 電腦 follow us in feedly

在中國神威太湖之光率先將性能衝到 100P 後,日本也按捺不住了,日本富士通發表了要建 1000P 超級電腦的 PPT,而且還引 ARM 為外援。也許有人會問,能成嗎?



其實,日本在超級電腦上的技術實力並不差,而且還曾經有過京這樣曾經雄踞 TOP500 榜首的大機器,雖然在 TOP500 上被後來者超越,但在 Graph500 上依舊雄踞榜首。只是日本經濟持續低迷和時運不濟,日本超算逐步被中國和美國拉出了距離。

日本超算京才是世界第一?

就在神威太湖之光在 TOP500 榮登榜首之際,日本經濟新聞報導,「神威太湖之光雖然排名比較靠前,但其適合的領域有限,對於用戶而言是比較難用的機器」,日本很多相關人士表示,「超級電腦要有用才行」。

日本東京工業大學教授松岡聰說:「京與神威背後的設計思想有很大的不同,京是透過擴充大量記憶體,可廣泛應對各種現實運算的超級電腦。在 500 強中速度雖然僅為神威的九分之一,但京即使面對複雜的運算也不容易減速。神威雖然排名比較前面,但被認為其適合的領域有限。」

松岡表示神威對於用戶而言是比較難用的機器,這點不可否認。

為此,筆者諮詢了業內專家,他認為松岡說的有一定道理,並表態:

「客觀地說,如果我自己出錢買的話,我選擇京。」

也有業內專家表示:

「畢竟異構眾核是大趨勢……從計算性能上看,神威太湖之光依然是世界第一。」

京有什麼獨到之處?

雖然京在 Linpack 性能上大約是神威太湖之光的九分之一,儘管日本目前並沒有建設出能與天河 2 號、神威太湖之光相匹敵的超級電腦,但就京本身而言,還是有其獨到之處的。

2016 年 7 月,在 Graph500 排行榜上,京連續第三次奪得冠軍──

在測試中京用 0.45 秒時間成功解開了由大約 1 萬億個根節點及 16 萬億個分支節點組成的大規模圖表廣度優先搜尋問題。基準測試得分為 38621GTEPS。排名第二的是中國的神威太湖之光,成績為 23756GTEPS;排名第三的是美國的紅杉,為 23751GTEPS,排名第四的是美國米拉,14982GTEPS。什麼是 Graph500 呢?其實,除了強調 Linpack 性能的 TOP500,還有強調記憶體頻寬和延遲的 Graph500,和強調節能環保的 Green500。

Graph500 對全系統的記憶體頻寬和記憶體延遲有很高的要求,而計算能力本身已經不影響測試結果了,這種測試偏向於訪存密集型運算,在大數據分析以及大規模圖表分析等場景下比較有意義。

近年來,有觀點認為 Linpack 測試已經過時了,TOP500 創始人之一的田納西大學教授 Jack Dongarra 就提出了 HPCG 測試,與 Linpack 關注線性方程的計算性能不同,HPCG 更加看中整體性能的平衡,能代表了共軛梯度迭代法的一類應用的計算和通訊特徵,但也僅僅代表了某一個方面的特徵,並不能涵蓋超級電腦的特徵。如果計算性能和通訊不是一個量級的,即便兩項指標分開看都很強,但也會導致 HPCG 偏低的結果。截至目前,HPCG 還沒有被業界廣泛接受。

在 HPCG 測試中,京的表現也不錯,僅次於天河 2 號,成績為 554.4TFLOPS,天河 2 號的成績為 580TLFOPS,名列第三的神威太湖之光 HPCG 性能是 371.2TFLOPS。如果用代表運算實際效率的 HPCG/HPL 這項指標看,天河 2 號的 HPCG/HPL 參數為 1.1%,神威太湖之光的 HPCG/HPL 參數為 0.4%,而京的 HPCG/HPL 參數為 4.9% 。HPCG 更看重綜合性能,要求計算性能、記憶體頻寬、延遲等指標兼顧,一旦出現某項性能特別強的情況,也就是出現偏科的情況,即便幾項指標都不差,也會出現 HPCG 運算速度偏低的情況。

計算和通訊的不平衡導致 HPCG/HPL 偏低

神威太湖之光 HPCG/HPL 偏低的原因,就在於計算性能和通訊等要素之間的不平衡程度較高──神威太湖之光之所以能在 TOP500 排名第一、Green500 排名第三、在 Linpack 浮點性能 93PFLOPS、Linpack 效率高達 74.16% 的情況下,性能功耗比達到 6G/W,做到了兼顧計算性能和節能環保,而且這還是在處理器的製程落後 Intel 兩代,採用 28nm 製程的情況下做到的,原因就在於藉助大量處理器並行來提高運算速度,同時透過降低耗電極大的儲存器性能來削減能耗,這會加重綜合性能上的不平衡──這種不平衡並非是計算性能差,或者網路差──在計算性能上神威太湖之光是頂級的,在網路方面,神威太湖之光只是主流水平,還稱不上頂級的網路正是因為計算和通訊上的不平衡,導致神威太湖之光 HPCG/HPL 參數偏低。

而京在這項參數上之所以高,就是因為雖然在計算性能和通訊並非頂級水平,但因為計算性能和通訊屬於一個量級,加上屬於同構超級電腦的因素,所以 HPCG/HPL 參數會比較高。

這兩個測試的意義在於說明了京的易用性較好,而且透過擴充大量記憶體,可廣泛應對各種現實運算,具有較廣的應用面,而且在計算性能和通訊上做的非常均衡。相比之下,神威太湖之光就屬於各方面性能都不錯,但計算性能特別強悍的類型,在均衡性上是不如京的。但這並不意味著神威太湖之光就不如一台幾年前的大機器,實際上,在絕對性能和在神威太湖之光所擅長的應用上,京是無法企及的。

日本下一代超級電腦會是什麼樣?

在德國法蘭克福舉辦的國際超級電腦大會上,日本富士通公司透露它的下一代超級電腦 Post-K 將使用 ARMv8 架構,根據富士通公布的計畫 Post-K 計劃在 2020 年推出,計劃應用性能是 K 的 100 倍,也就是性能將達到 1000 PFLOPS,換言之就是神威太湖之光性能的 10 倍。

另外,富士通還公布了可以用於建設 100P 超級電腦的技術儲備──SPARC64 XIfx 處理器,該款處理器有 32 個核心用於計算,2 核心用於運行 OS 服務,有點類似於 BlueGene/Q,採用 20nm 製程,雙精浮點性能超過 1TFlops。至於日本能不能將技術圖紙變成現實,只能有時間來檢驗了。

(本文由 雷鋒網 授權轉載;首圖來源:By Haruhiko Okumura from Tsu, Japan (京の全貌) [CC BY 2.0], via Wikimedia Commons

延伸閱讀:

發表迴響