
知情人士透露,華為已接洽部分中國科技公司,測試新晶片「昇騰 910D」(Ascend 910D)的技術可行性,據悉最快 5 月底收到第一批樣品。不過,華為號稱上一款 910C 晶片的性能可與 H100 媲美,但實際使用過仍有人表示不及 NVIDIA,華為該如何突圍?
知情人士表示,昇騰 910D 開發仍處於早期階段,還需要一系列測試來評估晶片性能,之後準備好推向客戶市場。另一位人士指出,華為希望最新昇騰系列 AI 處理器能超越 NVIDIA H100,而昇騰先前版本是 910B 和 910C。
華為昇騰 910C 傳能提供 NVIDIA H100 約 60% 的推理性能,該晶片採用 6 奈米製程節點,由中芯國際代工,預計每張卡的運算能力將超過 900 TFLOP(每秒浮點運算次數),並搭載 HBM3(第四代高頻寬記憶體)模組。
據悉,今年華為準備出貨超過 80 萬顆昇騰 910B 和 910C 晶片給客戶,而在川普限制 H20 出口後,部分買家已經在與華為洽談增加 910C 的訂單。
晶片實際性能無法超過 NVIDIA,華為靠系統突圍
不過,雖然華為曾向客戶宣稱 910C 晶片的性能可與 H100 媲美,但實際使用過兩款晶片的工程師表示,華為晶片的表現仍不及 NVIDIA。此外,華為在大規模生產這類晶片上也面臨挑戰。目前中芯國際因無法購買最先進的晶片製造設備而受限,加上華盛頓禁止中國直接取得 HBM 等 AI 晶片關鍵元件。
對此,華為高層表示,將重點放在打造更高效、更快速的系統,以充分發揮旗下晶片的效能,而不是單純追求個別晶片的性能提升。例如,華為 4 月推出 CloudMatrix 384 運算系統,該系統將 384 顆昇騰 910C 晶片互聯。
分析師指出,在某些情況下,該系統的性能甚至超越了輝達的旗艦機櫃系統,後者搭載 72 顆輝達最新的 Blackwell 晶片,但中國系統耗電量也較高。
業內人士指出,將大量晶片連接在一起並非易事,這需要穩定的網路連線,以及完善的軟體與工程技術來防止網路故障。研究機構 SemiAnalysis 在報告中指出,將五倍數量的昇騰晶片串聯,可彌補單顆 GPU 性能僅為輝達 Blackwell 晶片 1/3 的劣勢。儘管功耗不足值得注意,但在中國市場上並不構成真正的限制因素。
SemiAnalysis 認為,CM384 在多項關鍵指標上實現了對 NVIDIA 旗艦產品 GB200 NVL72 的超越,整體算力接近後者的兩倍。
事實上,華為已近六年前被列入美國貿易黑名單,該公司於 2023 年推出一款搭載國產處理器的高階智慧型手機 Mate 60,震撼外界。目前華為已成為中國 AI 代表企業,開發 NVIDIA AI 晶片的中國替代品,北京也努力培育自主半導體產業的一部分。
美國政府先前要求 NVIDIA 須獲得批准,才能將 H20 晶片銷售至中國,使 NVIDIA 第一季認列高達 55 億美元的相關費用。
(首圖來源:shutterstock)
延伸閱讀: