
Tom′s Hardware 報導,華為準備測試下代人工智慧處理器昇騰 Ascend 910D,目標是美國出口限制下,超越輝達 (Nvidia) H100 效能,提供國產替代方案。華為與多家中國企業接洽,評估昇騰 910D 效能和需求,首批 910D 樣品 5 月下旬送樣。
從晶片效能看,昇騰 910D 比輝達 Blackwell B200、Blackwell Ultra B300 及 2026 年推出 Rubin GPU 運算速度低。但華為策略並非只靠單晶片效能,而是構建含數百個處理器的叢集(pods),以系統等級與輝達叢集競爭。
要超越 H100(約 BF16 達 2,000TFLOPS)效能,對華為來說並不容易。華為最新雙晶片昇騰 910C 約 BF16 的 780TFLOPS 效能,昇騰 910D 要超越 H100,華為可能需重新設計架構,並增加計算模組量。華為 5 月開始將大規模送樣中國客戶昇騰 910C,多由台積電為第三方企業代工。
報導表示,對於昇騰 910D 的生產,因為美國政府限制華為取得領先製程技術的能力,這是一大挑戰。尚不確定昇騰 910D 是中芯國際 (SMIC) 製造,還是華為找到方法再次繞過制裁。輝達 2026 年將推出 Rubin GPU 採台積電 N3 或更先進製程,比 Blackwell 能效比更高,BF16 效能達 4,150TFLOPS,約 B200 兩倍。沒有先進製程支援的華為 2026 年要維持競爭力更困難。
華為想的方法,就是透過搭載 384 顆昇騰 910C 處理器的 CloudMatrix 384 機架系統,以叢集提升運算效能。系統某些工作能擊敗輝達 GB200 NVL72,但代價是更高功耗,以及超過五倍的處理器。且互連技術能否持續連結所有處理器,還有待觀察。理論上搭載 384 顆昇騰 910D 處理器的 CloudMatrix 機架系統,有望提供具競爭力的 AI 效能。
輝達 Rubin GPU 因受限很難在中國市場銷售,華為其實不會直接與輝達對打。無論昇騰 910D 效能能耗如何,解決方案都可能是幾年內中國 AI 訓練的主力。考量到人工智慧的戰略重要性,即使昇騰 910D 或其他國產 AI 處理器功耗較高,也不會限制中國市場需求。中國 AI 發展主要限制在需生產足夠處理器,不論在中國或透過代理公司海外生產,都備受關注。
(首圖來源:華為)