近年圍繞「代理式 AI」的運算需求,晶片業者掀起一波重新包裝伺服器處理器的熱潮,但市場是否真有專門對應 AI 代理工作負載的「代理式 CPU」,外界看法並不一致。
報導指出,Arm、Nvidia 與多家晶片設計業者近來都把旗下產品與代理性 AI 連結,像 Arm 將首款資料中心晶片命名為「AGI CPU」,Nvidia 執行長黃仁勳則把 Vera 稱為「給代理使用的 CPU」,AWS 的 Graviton 5 行銷資料也大量使用相關字眼。不過,文章認為這些產品本質上仍是通用型處理器,並非能帶來所謂「AI 晶片革命」的新類別。
文章分析,AI 代理並不是單一工作負載,而是介於模型與既有應用間的橋梁,因此真正需要的運算特性差異很大。有些情境重視記憶體頻寬,有些偏好大型快取或壓縮引擎,也有些更吃高時脈或高核心數,這也解釋了為何英特爾、AMD 與各家雲端與晶片商對「最佳代理式 CPU」的定義都不相同。
以 Nvidia Vera 為例,這顆 88 核心 CPU 主打高單執行緒效能、龐大記憶體頻寬與互連頻寬。黃仁勳在 GTC 台北主題演講表示,低延遲是關鍵,因為未來會有數十億個代理,且它們不會願意等太久。不過文章指出,Vera 設計重點仍是讓 CPU 與 GPU 資料傳輸更順暢,與其說是專用 AI 晶片,不如說是為了加速資料搬移。
Arm 的 AGI CPU 則形容成去除多餘功能、以降低功耗為目標的 Neoverse V3 伺服器處理器,有 136 核心,但沒有同時多執行緒(SMT)、沒有專用加速器,向量擴充也相對精簡,重點放在記憶體頻寬。亞馬遜 192 核心 Graviton 5 也視為類似架構的放大版,甚至更偏向通用用途。
英特爾與 AMD 同樣試圖把 Xeon 與 Epyc 定位成代理式 AI 的理想平台。英特爾於 COMPUTEX 展出可將高達 36,864 個 x86 核心塞進 100 kW 機架的參考設計;AMD 則在 Vera 初步基準出爐後反擊,強調大規模代理工作負載時,並發力比延遲更重要。AMD 還估算,若以 100kW 功耗預算計算,今年稍晚推出的 256 核心 Venice Epyc 機架吞吐量可比 Vera 高 3.3 倍。
至於早期測試方面,Phoronix 取得 Vera 早期樣機並跑了部分測試項目,結果顯示整體幾何平均分數比 AMD 128 核心 Epyc 9575F 高 10%,也比英特爾 128 核心 Xeon 6980P 高 55%。但文章也提醒,Vera 並非每種應用都占優勢,這再次印證資料中心工作負載沒有單一最佳解。面對代理式 AI 的熱潮,晶片廠都在尋找自己的說法,但文章最後強調:沒有哪顆 CPU 能通吃所有場景。
- There’s no such thing as an agentic CPU
- HPE’s Big Nvidia Vera CPU Bet: What You Need To Know
- Nvidia Aktie & China-Umschwung: Neue Vera CPUs umgehen US-Sanktionen
(首圖來源:Magnific)






