代理式 CPU 沒有唯一解:輝達、AMD、英特爾與亞馬遜各出奇招

作者 | 發布日期 2026 年 06 月 22 日 7:20 | 分類 AI 人工智慧 , IC 設計 , 半導體 line share Linkedin share follow us in feedly line share
Loading...
代理式 CPU 沒有唯一解:輝達、AMD、英特爾與亞馬遜各出奇招

近年圍繞「代理式 AI」的運算需求,晶片業者掀起一波重新包裝伺服器處理器的熱潮,但市場是否真有專門對應 AI 代理工作負載的「代理式 CPU」,外界看法並不一致。

報導指出,Arm、Nvidia 與多家晶片設計業者近來都把旗下產品與代理性 AI 連結,像 Arm 將首款資料中心晶片命名為「AGI CPU」,Nvidia 執行長黃仁勳則把 Vera 稱為「給代理使用的 CPU」,AWS 的 Graviton 5 行銷資料也大量使用相關字眼。不過,文章認為這些產品本質上仍是通用型處理器,並非能帶來所謂「AI 晶片革命」的新類別。

文章分析,AI 代理並不是單一工作負載,而是介於模型與既有應用間的橋梁,因此真正需要的運算特性差異很大。有些情境重視記憶體頻寬,有些偏好大型快取或壓縮引擎,也有些更吃高時脈或高核心數,這也解釋了為何英特爾、AMD 與各家雲端與晶片商對「最佳代理式 CPU」的定義都不相同。

以 Nvidia Vera 為例,這顆 88 核心 CPU 主打高單執行緒效能、龐大記憶體頻寬與互連頻寬。黃仁勳在 GTC 台北主題演講表示,低延遲是關鍵,因為未來會有數十億個代理,且它們不會願意等太久。不過文章指出,Vera 設計重點仍是讓 CPU 與 GPU 資料傳輸更順暢,與其說是專用 AI 晶片,不如說是為了加速資料搬移。

Arm 的 AGI CPU 則形容成去除多餘功能、以降低功耗為目標的 Neoverse V3 伺服器處理器,有 136 核心,但沒有同時多執行緒(SMT)、沒有專用加速器,向量擴充也相對精簡,重點放在記憶體頻寬。亞馬遜 192 核心 Graviton 5 也視為類似架構的放大版,甚至更偏向通用用途。

英特爾與 AMD 同樣試圖把 Xeon 與 Epyc 定位成代理式 AI 的理想平台。英特爾於 COMPUTEX 展出可將高達 36,864 個 x86 核心塞進 100 kW 機架的參考設計;AMD 則在 Vera 初步基準出爐後反擊,強調大規模代理工作負載時,並發力比延遲更重要。AMD 還估算,若以 100kW 功耗預算計算,今年稍晚推出的 256 核心 Venice Epyc 機架吞吐量可比 Vera 高 3.3 倍。

至於早期測試方面,Phoronix 取得 Vera 早期樣機並跑了部分測試項目,結果顯示整體幾何平均分數比 AMD 128 核心 Epyc 9575F 高 10%,也比英特爾 128 核心 Xeon 6980P 高 55%。但文章也提醒,Vera 並非每種應用都占優勢,這再次印證資料中心工作負載沒有單一最佳解。面對代理式 AI 的熱潮,晶片廠都在尋找自己的說法,但文章最後強調:沒有哪顆 CPU 能通吃所有場景。

(首圖來源:Magnific

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》