英特爾推中國降規版 Gaudi 3,市場反應值得關切

作者 | 發布日期 2024 年 04 月 15 日 9:20 | 分類 AI 人工智慧 , GPU , 中國觀察 line share follow us in feedly line share
英特爾推中國降規版 Gaudi 3,市場反應值得關切


輝達幾乎獨攬 AI 加速晶片,英特爾日前也推出新 AI 加速晶片 Gaudi 3 以競爭。然面對美國政府加速限制出口中國 AI 晶片,英特爾也準備為中國市場推出降規版 Gaudi 3,以期進入中國市場。

英特爾日前白皮書顯示,英特爾 Gaudi 3 準備推出編號 HL-328 的 OAM 相容夾層卡(Mezzanine Card)和編號 HL-388 的 PCle 加速卡兩種規格,上市為 6 月 24 日及 9 月 24 日。

因美國政府規定,AI 加速晶片綜合運算性(TPP)必須低於 4,800 才能出口中國,英特爾 Gaudi 3 降規版 16bit 性能不能超過 150TFLOPS,勢必大幅減少核心量,也就是較標準版八個矩陣數學引擎和 64 個張量核心減少,還需降低時脈。

降規版雖然同樣有 96MB SRAM 暫存記憶體,也採 128GB HBM2e 高頻寬記憶體、PCIe 5.0 x16 介面和解碼標準,但 16bit 性能受限,無法較輝達 H100 大型語言模型訓練提高 40%、推理增加 50% 效能,又中國市場還是全力推自研晶片,市場是否感興趣有待觀察。

(首圖來源:英特爾)