外資摩根士丹利(Morgan Stanley,大摩)近期發布最新分析報告指出,儘管使用輝達(NVIDIA)Blackwell 架構 GPU 建置資料中心的成本,是採用客製化 AI 特殊應用晶片(ASIC)的兩倍,但輝達晶片的算力效率顯著超越這些科技大廠的自研晶片。此結論也呼應了輝達執行長黃仁勳,就是其晶片價格雖然高昂,但長期來看能為客戶帶來更高的投資回報的說法。
大摩在報告中深入比較了輝達 AI GPU 與亞馬遜(Amazon)、Google 客製化晶片的「每瓦兆次浮點運算(TFLOPS per Watt)」效能。報告估計,大型雲端服務商(Hyperscalers)若要建置一座1 GW 的資料中心,採用輝達 Blackwell AI GPU 的資本支出,將是使用 Google TPU 或亞馬遜 Trainium 晶片的兩倍。
然而,大摩強調,這筆高昂的投資是值得的。數據顯示,輝達晶片的每瓦效能領先客製化 ASIC 達「2 至 8 倍」之多。在具體的評分上,輝達未來的 Vera Rubin (FP4) 晶片展現了極高水準,得分高達 19.5;其他如 Vera Rubin (FP8) 為 6.8,GB300 (FP8) 為 6.0,現有的 H100 (FP8) 則為 3.1。相較之下,Google 的 TPUv7 (FP8) 得分為 4.3,亞馬遜的 Trn3 (FP8) 則為 2.5。這代表著這些科技大廠的自研晶片效能,大約落在輝達 Blackwell 與上一代 Hopper 架構之間,甚至部分還低於 Hopper 晶片。
儘管輝達在每瓦效能上占據絕對優勢,但市場使用者也開始關注其他評估指標。AI 基礎設施供應商 Nebius 的專家指出,業界正逐漸以「每百萬 Token 的生成成本」及「每秒生成 Token 數」來評估 AI 晶片的綜合效益。所以,根據 Nebius 的預估數據,競爭對手 Groq 的 AI 晶片每生成百萬 Token 的成本僅需 5 至 10 美分,且每秒可生成高達 800 個 Token。反觀輝達 Blackwell 晶片,每生成百萬 Token 的成本約為 25 美分,每秒生成速度則約為 450 個T oken。
綜合來看,輝達憑藉強大的算力與極致的每瓦能效,目前在資料中心硬體競賽中仍保持技術領先地位。但隨著企業對 AI 推論成本的敏感度增加,諸如 Groq 這樣在特定成本與速度指標上表現優異的替代方案,也正成為市場上不可忽視的新勢力。
(首圖來源:輝達提供)






