近期市場關注 NVIDIA GB200 整櫃式方案(rack)各項供應進度,TrendForce 最新調查指出,由於 GB200 Rack 高速互通介面、熱設計功耗(TDP)等設計規格皆明顯高於市場主流,供應鏈業者需要更多時間持續調校、最佳化,最快 2025 年第二季後才有機會放量。
NVIDIA GB Rack方案(包括GB200、GB300等)因導入技術層次更複雜、高成本等特性,主力客群將為大型CSP,其餘Tier-2資料中心、國家主權雲及學研單位等HPC / AI應用專案。NVIDIA大力推動下,GB200 NVL72機櫃2025年成為主要採用方案,占比可望接近80%。
TrendForce表示,為提升AI / HPC伺服器系統整體運算效能,NVIDIA開發NVLink提供GPU晶片高速互連,如GB200採第五代NVLink,總頻寬大幅優於市場主流PCIe 5.0,今年主導市場的HGX AI伺服器每櫃TDP動輒達60KW~80KW,GB200 NVL72每櫃更達140KW,TDP再提升一倍,故業者嘗試擴大採用液冷散熱解決方案。
GB200 Rack系統的更高規格,市場頻傳可能因部分零組件未達要求,有遞延出貨風險。TrendForce調查,Blackwell GPU晶片出貨情形大致如預期,第四季僅少量出貨,2025年第一季後逐季放量。AI伺服器系統方面,因尚待供應鏈各環節持續調整,至今年底的出貨量恐低於業者預期,2025年GB200整機櫃出貨高峰將略為延後。
傳統氣冷散熱解決方案已無法應對GB200 NVL72的TDP值,液冷技術成為必須。隨著GB200 Rack方案於2024年底開始小量出貨,相關業者也加大液冷散熱零組件研發能量,如冷卻分配系統(CDU)供應商擴大機櫃尺寸,和採用更高效冷卻板(Cold Plate)提高散熱效能。TrendForce表示,目前Sidecar CDU的散熱能力主要集中60KW~80KW,未來可望雙倍甚至逾三倍散熱表現。至於更高效液對液(L2L)型in-row CDU方案,散熱力超過1.3MW,也將繼續提升以因應算力增長。
(首圖來源:NVIDIA)