即使大摩認為輝達 GPU 物有所值,但 AI ASIC 發展仍是不可忽視勢力

作者 | 發布日期 2026 年 05 月 19 日 12:15 | 分類 AI 人工智慧 , IC 設計 , 半導體 line share Linkedin share follow us in feedly line share
Loading...
即使大摩認為輝達 GPU 物有所值,但 AI ASIC 發展仍是不可忽視勢力

外資摩根士丹利(Morgan Stanley,大摩)近期發布最新分析報告指出,儘管使用輝達(NVIDIA)Blackwell 架構 GPU 建置資料中心的成本,是採用客製化 AI 特殊應用晶片(ASIC)的兩倍,但輝達晶片的算力效率顯著超越這些科技大廠的自研晶片。此結論也呼應了輝達執行長黃仁勳,就是其晶片價格雖然高昂,但長期來看能為客戶帶來更高的投資回報的說法。

大摩在報告中深入比較了輝達 AI GPU 與亞馬遜(Amazon)、Google 客製化晶片的「每瓦兆次浮點運算(TFLOPS per Watt)」效能。報告估計,大型雲端服務商(Hyperscalers)若要建置一座1 GW 的資料中心,採用輝達 Blackwell AI GPU 的資本支出,將是使用 Google TPU 或亞馬遜 Trainium 晶片的兩倍。

然而,大摩強調,這筆高昂的投資是值得的。數據顯示,輝達晶片的每瓦效能領先客製化 ASIC 達「2 至 8 倍」之多。在具體的評分上,輝達未來的 Vera Rubin (FP4) 晶片展現了極高水準,得分高達 19.5;其他如 Vera Rubin (FP8) 為 6.8,GB300 (FP8) 為 6.0,現有的 H100 (FP8) 則為 3.1。相較之下,Google 的 TPUv7 (FP8) 得分為 4.3,亞馬遜的 Trn3 (FP8) 則為 2.5。這代表著這些科技大廠的自研晶片效能,大約落在輝達 Blackwell 與上一代 Hopper 架構之間,甚至部分還低於 Hopper 晶片。

儘管輝達在每瓦效能上占據絕對優勢,但市場使用者也開始關注其他評估指標。AI 基礎設施供應商 Nebius 的專家指出,業界正逐漸以「每百萬 Token 的生成成本」及「每秒生成 Token 數」來評估 AI 晶片的綜合效益。所以,根據 Nebius 的預估數據,競爭對手 Groq 的 AI 晶片每生成百萬 Token 的成本僅需 5 至 10 美分,且每秒可生成高達 800 個 Token。反觀輝達 Blackwell 晶片,每生成百萬 Token 的成本約為 25 美分,每秒生成速度則約為 450 個T oken。

綜合來看,輝達憑藉強大的算力與極致的每瓦能效,目前在資料中心硬體競賽中仍保持技術領先地位。但隨著企業對 AI 推論成本的敏感度增加,諸如 Groq 這樣在特定成本與速度指標上表現優異的替代方案,也正成為市場上不可忽視的新勢力。

(首圖來源:輝達提供)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》