技嘉伺服器扮演強力後盾!2024 ISC 歐洲超級電腦大賽清華學生團隊獲亞軍肯定

作者 | 發布日期 2024 年 11 月 08 日 9:00 | 分類 GPU , 伺服器 , 處理器 line share Linkedin share follow us in feedly line share
技嘉伺服器扮演強力後盾!2024 ISC 歐洲超級電腦大賽清華學生團隊獲亞軍肯定


高效能運算(High Performance Computing,HPC)向來是解決複雜科學問題的重要方法,也帶動各界長期投入相關技術研究。為鼓勵學生對超級計算領域進行深入學習,歐洲 ISC、美國 SCC、亞洲 ASC 等三大超級電腦大賽,每年都吸引眾多學生團隊與會,彼此之間的競爭非常激烈。在 2024 ISC 歐洲超級電腦大賽中,清華大學周志遠教授帶領的學生團隊,以技嘉伺服器打造一套超級電腦系統,最終獲得亞軍肯定。

清華大學資工系教授周志遠說,長期以來,我們一直希望讓學生透過參加比賽方式,接觸不同領域的高效能運算、AI 等題目挑戰,進而提升學習的廣度,而非僅限於書本中學習,達到培育高速運算人才的目的。本次競賽團隊不僅由資工系的學生所組成,更有來自理學院、工學院及藝術學院跨領域專長的學生,能從更多元角度解析問題與解決,也成為我們獲獎的關鍵。我們很感謝技嘉與技鋼科技提供 2024 ISC 歐洲超級電腦大賽所需的超級電腦設備與經費贊助,讓與會學生能在世界舞臺上與其他國家團隊較勁,展現臺灣在高速運算領域的軟硬體實力。

深入了解實際需求,助學生規劃超級電腦架構

周志遠教授的研究領域涵蓋分散式系統、雲端計算、系統資源管理、高效計算與儲存系統,鑑於全球對高效能運算非常重視,在開設分散式系統設計、基礎高效能計算叢集電腦實務、進階高效能計算叢集電腦實務等課程之外,也帶領清華大學的大型分散式系統架構實驗室,期盼從多元角度出發培育跨領域的 HPC 人才。

周志遠指出,早期高效能運算著重在架構設計、資源調配,乃至於 AI 模型訓練。近年由於 AI 發展快速、大語言模型參數量愈來愈大,早已超過一般研究單位的負荷能力,現階段則著重在AI模型推論等部分。國際間的超級電腦競賽方向與規範大致相同,2024 ISC 歐洲超級電腦大賽重點在於限制比賽電腦的用電量,最高不能超過 6000W,團隊必須根據比賽題目找出 CPU、GPU 之間的最佳組合。

2024 ISC 歐洲超級電腦大賽題目涵蓋分子電場模擬、流體力學、氣象模型等,在為期3天賽程中,競賽團隊需使用自己配置的超級電腦系統完成數個科學應用程式計算。技鋼科技工程師團隊與學生團隊進行討論之後,最終根據需求提供技嘉 R183-S90 機架式伺服器,以及預先安裝 10 張 NVIDIA H100 Tensor Core GPU的技嘉 G493-SB1 伺服器;與 CPU 與 GPU 效能最直接相關的記憶體與硬碟部分,技嘉採用 MICRON 的 DDR5 RDIMM 4800GHz 與 7450 PRO 系列 NVMe 固態硬碟;在跨截點溝通的上,選擇了 BROADCOM 的 P1200G 作為指定高速網路卡;網路交換器則採用 Ufispace 的 S9300-32D 32x400G switch。

G493-SB1 伺服器的顯著特色在於其可支援多達 10 張 GPU 卡,其中 8 張 GPU 卡可通過 NVIDIA NVLINK™ 技術分成四組進行溝通,資料傳輸速度顯著高於傳統 PCIe。相比其他比賽隊伍僅依賴 PCIe 介面,這項技術優勢對提升競賽表現產生正面作用。此外,技鋼科技提供的全面技術支援,尤其是在賽前準備階段,充分滿足了隊伍的需求,成為此次比賽中取得優異成績的關鍵因素之一。

在本次比賽擔任學生教練的牟展佑認為,當 GPU 運算能力集中在在單一節點時,可減少資料交換的時間,縮短應用程式的計算時間,在 HPL Benchmark 項目的成績很不錯技嘉伺服器解決方案非常多元,針對比賽題目能預先因應比賽中各種突發事件與挑戰做好準備。

本次比賽的流體力學模擬題中,團隊借助 NVIDIA NVLINK™ 技術和 10 張 NVIDIA H100 Tensor Core GPU,運算速度顯著提升。正式比賽的最終結果與先前模擬一致,對提升比賽成績有顯著幫助。

▲ 周志遠教授帶領清華大學的大型分散式系統架構實驗室培育跨領域的 HPC 人才。(Source:科技新報)

技嘉伺服器內建管理工具,助學生即時掌握設備運作狀況

因應 2024 ISC 歐洲超級電腦大賽的題目範疇,清大分別使用 3 台技嘉 R183-S90 機架式伺服器,以及預先安裝 10 張 NVIDIA H100 Tensor Core GPU 的技嘉 G493-SB1 伺服器。其中,技嘉 G493-SB1 是款專為 AI、深度學習及高效能運算設計的高效能 GPU 協同運算伺服器,支援兩顆 第五代 Intel® Xeon® 可擴充處理器,最多可安裝 10 張雙插槽 GPU 卡,能提供絕佳的 AI 運算能力。具備 32 道記憶體插槽,每通道兩個記憶體插槽,也就是所謂的 2DPC,並可容納 12 個 2.5 吋/3.5 吋的 Gen5 NVMe/SATA/SAS-4 硬碟。這款產品採用先進的散熱和電源解決方案,可確保伺服器運算過程中的穩定性,能夠滿足資料分析、科學模擬等複雜運算需求。

至於技嘉 R183-S90 伺服器則專為資料中心及企業應用設計,支援第五代 Intel® Xeon® 可擴充處理器,同樣內建多達 32 個 2DPC 的記憶體插槽,在記憶體容量和速度表現十分搶眼,適用於各種運算工作,如資料分析、雲端運算及虛擬化等應用。前述兩款伺服器均內建功能完善的管理工具,讓管理人員可即時監控伺服器的運作狀態。

技嘉伺服器管理工具支援標準 IPMI 通訊介面,清大團隊自行撰寫工具與其串連後,即能掌握 CPU、GPU 的溫度與運作狀況。由於 2024 ISC 歐洲超級電腦大賽規定整體耗電量不能超過 6000W,團隊更進一步控制散熱風扇轉速,進而達到 CPU、GPU 晶片溫度與電力耗費的平衡,同時成為團隊能取得好成績的重要關鍵之一。

HPC 過程無法進行硬體調整,應對突發狀況成為一大挑戰。比賽最後一天,某應用程式無法執行,團隊迅速分析發現外購件故障導致 CPU 效能受限,透過修改運算流程,成功解決問題。此外,團隊在測試軟體版本時,意外發現 Intel 版本的效能超越了原先預期的 GCC 版本,進一步提升了運算速度。這些寶貴經驗不僅強化了團隊的應變能力,也為未來教學提供了實際範例。

最後,能與世界首屈一指的對手交流也是競賽中的一大收穫。透過與其他隊伍的互動與知識交換,參賽者能突破自身思維限制,優化系統參數,進一步提升 HPC 領域的技術與能力。

▲ 周志遠教授帶領學生團隊使用技嘉伺服器參與 2024 ISC 歐洲超級電腦大賽。(Source:科技新報)

助清華大學打造 HPC 實驗室,對全球展現臺灣技術能量

在 2024 ISC 歐洲超級電腦大賽中全力支援清華大學學生團隊的技嘉與技鋼科技,讓全球看到臺灣在高效能運算的軟硬體實力,預計將與周志遠老師攜手合作,建立高效能運算實驗室。技嘉與技鋼科技將進一步提供與真實比賽環境相仿的各種設備,如伺服器、交換器等等,滿足團隊的平時練習需求,以便能在比賽時能獲得更好的成績。

周志遠指出,技嘉伺服器因其卓越品質,已成為全球各地實驗室的首選,並在國際競賽中展示了臺灣的技術實力。周志遠更強調,這不僅能讓更多學子參與高效能運算的研究,也將培育出具備跨產業應用能力的人才。清華大學碩士生郭品毅指出,長期參與高效能運算的研究讓他對 GPU 資源共享和跨品牌整合產生濃厚興趣,並期望未來的研究能在此領域取得更佳成果,為技術發展帶來新突破。

(首圖來源:科技新報;首圖圖說:清華周志遠教授(左四)與學生團隊(左至右分別為郭品毅、林展毅、魏士勛、翁君牧、牟展佑、俞昊天與白宸安)奪得 2024 ISC 歐洲超級電腦大賽亞軍)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》