即使大摩認為輝達 GPU 物有所值，但 AI ASIC 發展仍是不可忽視勢力

外資摩根士丹利（Morgan Stanley，大摩）近期發布最新分析報告指出，儘管使用輝達（NVIDIA）Blackwell 架構 GPU 建置資料中心的成本，是採用客製化 AI 特殊應用晶片（ASIC）的兩倍，但輝達晶片的算力效率顯著超越這些科技大廠的自研晶片。此結論也呼應了輝達執行長黃仁勳，就是其晶片價格雖然高昂，但長期來看能為客戶帶來更高的投資回報的說法。

大摩在報告中深入比較了輝達 AI GPU 與亞馬遜（Amazon）、Google 客製化晶片的「每瓦兆次浮點運算（TFLOPS per Watt）」效能。報告估計，大型雲端服務商（Hyperscalers）若要建置一座1 GW 的資料中心，採用輝達 Blackwell AI GPU 的資本支出，將是使用 Google TPU 或亞馬遜 Trainium 晶片的兩倍。

然而，大摩強調，這筆高昂的投資是值得的。數據顯示，輝達晶片的每瓦效能領先客製化 ASIC 達「2 至 8 倍」之多。在具體的評分上，輝達未來的 Vera Rubin (FP4) 晶片展現了極高水準，得分高達 19.5；其他如 Vera Rubin (FP8) 為 6.8，GB300 (FP8) 為 6.0，現有的 H100 (FP8) 則為 3.1。相較之下，Google 的 TPUv7 (FP8) 得分為 4.3，亞馬遜的 Trn3 (FP8) 則為 2.5。這代表著這些科技大廠的自研晶片效能，大約落在輝達 Blackwell 與上一代 Hopper 架構之間，甚至部分還低於 Hopper 晶片。

儘管輝達在每瓦效能上占據絕對優勢，但市場使用者也開始關注其他評估指標。AI 基礎設施供應商 Nebius 的專家指出，業界正逐漸以「每百萬 Token 的生成成本」及「每秒生成 Token 數」來評估 AI 晶片的綜合效益。所以，根據 Nebius 的預估數據，競爭對手 Groq 的 AI 晶片每生成百萬 Token 的成本僅需 5 至 10 美分，且每秒可生成高達 800 個 Token。反觀輝達 Blackwell 晶片，每生成百萬 Token 的成本約為 25 美分，每秒生成速度則約為 450 個T oken。

綜合來看，輝達憑藉強大的算力與極致的每瓦能效，目前在資料中心硬體競賽中仍保持技術領先地位。但隨著企業對 AI 推論成本的敏感度增加，諸如 Groq 這樣在特定成本與速度指標上表現優異的替代方案，也正成為市場上不可忽視的新勢力。

(首圖來源：輝達提供)