華為挑戰成功?DeepSeek 測試:昇騰 910C 推理性能可達 H100 六成

作者 | 發布日期 2025 年 02 月 05 日 10:57 | 分類 AI 人工智慧 , 半導體 , 晶片 line share Linkedin share follow us in feedly line share
華為挑戰成功?DeepSeek 測試:昇騰 910C 推理性能可達 H100 六成

華為最新的 AI 處理器「昇騰 910C」(Ascend 910C)號稱表現可媲美 Nvidia H100 GPU。根據 DeepSeek 研究人員的測試,在推理任務中,昇騰 910C 效能可達 H100 的 60%。雖然昇騰 910C 並非當前最強 AI 晶片,但它的推出有助於降低中國對 NVIDIA GPU 的依賴。

微信公眾號 AGIHunt 指出,DeepSeek 團隊的實測數據顯示,華為 910C 處理器的推理效能表現超乎預期。若透過手動優化 CUNN 核心,性能還可進一步提升。此外,DeepSeek 對昇騰處理器的原生支援,以及其 PyTorch 儲存庫可讓 CUDA 到 CUNN 無縫轉換,讓華為硬體更容易整合到 AI 工作流程中。

這顯示儘管受美國政府制裁,及無法獲得台積電的先進製程技術,華為 AI 處理器的能力仍在快速進步。

華為和中芯國際在 2019-2020 年間已成功追上台積電的能力,並生產出可與 A100 和 H100 處理器相媲美的晶片,但昇騰 910C 並非 AI 訓練的最佳選擇,主要仍以 NVIDIA 的 GPU 占據領先地位。

DeepSeek 的 Yuchen Jin 表示,「長週期訓練的穩定性是中國晶片最大難關」。這涉及 NVIDIA 軟硬體生態系統的深度整合,CUDA 護城河已經發展二十多年。雖然推理性能可繼續改善,但持續的訓練工作負載需要華為進一步改進軟硬體堆疊。

昇騰 910C 採用 chiplet 封裝,整合約 530 億個電晶體。過去昇騰 910 運算晶片採用台積電 N7+ 製程,而昇騰910C 運算晶片則由中芯國際採用第二代 7 奈米級(N+2)製程製造。

有專家預測,隨著 AI 模型向「Transformer 架構」(如 GPT、BERT 等)靠攏,CUDA 和 PyTorch 編譯器的重要性將降低。此外,DeepSeek 團隊在軟硬體優化方面的專長,也可能大幅降低對 NVIDIA 的依賴,大幅節省成本。然而,要在全球競爭,中國必須克服長期訓練穩定性的挑戰,進一步完善其人工智慧運算基礎設施。

(首圖來源:華為)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》