雖然輝達(NVIDIA)的 AI GPU 和機櫃級解決方案仍是最熱門的 AI 加速器,但美中先後對其處理器祭出出口管制,恐使輝達在中國布局造成重大衝擊。
根據日經引述伯恩斯坦(Bernstein)分析指出,中國本土供應商逐步滿足當地需求,預期至少可滿足約 80%,使得輝達未來在中國市占率可能下滑至 8%。
摩爾線程上個月發表全新 GPU 架構「花港」,並推出專為 AI 訓練設計的「華山」晶片。創辦人、董事長兼執行長張建中指出,新產品已能滿足國內開發者需求,「不再需要等待海外的先進產品」。
根據中媒引述伯恩斯坦近期的一份報告指出,輝達在中國 AI 處理器市場的市占率,預計將從 2024 年的 66% 降至今年約 8%,而華為、寒武紀等本土獨立硬體供應商(IHV)合計市占將接近 80%。
中國硬體加速器之所以崛起,主要是因為地緣政治對輝達硬體的限制,以及中國本土廠商如華為、寒武紀、摩爾線程與沐曦(MetaX)的硬體進展。
根據介紹,摩爾線程聲稱「華山」記憶體存取頻寬已與輝達 Blackwell 持平,記憶體存取容量甚至超過 Blackwell 與 Hopper 架構。這款晶片支援從FP4至FP64的全精度運算,能為萬卡級算力叢集提供穩定支撐,試圖在高效能運算市場爭奪主導權。
另一方面,華為 AI 算力集群解決方案 CloudMatrix 384 在 AI 訓練常用的 BF16 浮點運算上,可勝過 GB200 NVL72 與 GB300 NVL72 系統,但其耗電量約為後者的四倍;公司下一代 Atlas 950 超級叢集,將基於 524,288 顆 Ascend 950DT AI 加速器,預計在 2026 至 2027 年間可提供最高 524 FP8 ExaFLOPS 的訓練效能,以及最高 1 FP4 ZettaFLOPS 的推論效能,並於 2028 年底達到 4 ZettaFLOPS。
目前中國主要的關鍵問題在於,如何從長期以輝達為核心的生態系,轉向完全本土化的硬體與軟體堆疊,目前有大量 AI 部署仰賴輝達硬體與 CUDA 軟體,移植至中國平台成本高且難度大,因此轉向本土 AI 硬體是中國長期目標。
不過,中國 AI 產業很大程度仍受限於中芯國際(SMIC)能否以 7 奈米製程量產晶片;若未來數年其產能無法顯著提升,中國 AI 產業不是落後美國,就是須設法取得輝達的高效能 GPU 以維持競爭力。
- Moore Threads and peers bring China AI chip independence closer
- Nvidia China market share to drastically decrease from 66% to 8%, analysts claim — export curbs and homegrown success to blame
(首圖來源:shutterstock)






