北美 CSP 大舉購置 NVIDIA GB / Rubin 整櫃式方案,2026 年 AI 推論算力將躍升 1.2 倍

作者 | 發布日期 2026 年 05 月 20 日 15:00 | 分類 AI 人工智慧 , GPU , Nvidia line share Linkedin share follow us in feedly line share
Loading...
北美 CSP 大舉購置 NVIDIA GB / Rubin 整櫃式方案,2026 年 AI 推論算力將躍升 1.2 倍

根據 TrendForce 最新 AI 產業研究, 北美五大雲端服務供應商(CSP)為擴大 AI 訓練和推論應用部署,2026 年對整櫃式(rack- scale)AI server 的採購意願明顯提高,不僅有望占據全球 60% 以上的NVIDIA GB/VR 需求量, 更將同步帶動五大業者總 AI 訓練算力年增逾 56%、 總 AI 推論算力年成長高達 122% 左右。

TrendForce預估,2026年AI server出貨將年增28%以上, 仍以高階AI訓練機種為主力,占比約55%。 然中長期內將改由AI推論機種主導, 主因是CSP將積極推展AI應用以加速實現AI雲端服務商用化, 另像是NVIDIA也將拓展更多AI推論方案或使用情境, 包括推動今年主力AI server方案GB/VR系統除AI訓練用途外, 也特別強調該方案可支援AI推論相關工作負載。

據TrendForce估計,2026年Google、 Amazon、Microsoft、Meta、 Oracle的合計資本支出將逾7,700億美元,年增近87% 。分析北美五大CSP購置NVIDIA GB/VR系列獲得的運算能力,針對AI訓練部分, 若以FP16/BF16為估算基礎, 2025年五大業者的總算力達逾9 ExaFLOPS,2026年另將成長56%以上。

針對AI推論,若以FP4/NVFP4運算效能為估算基礎, 2025年五大CSP的總算力逾37 ExaFLOPS,預計2026年將大幅成長近122%, 顯著高於AI訓練, 反映出NVIDIA此次軟硬體系統調校特別著重AI推論效能, 並落實在新一代的GB300、VR200整櫃式方案中。

除GPU方案外,CSP業者同步推進自研ASIC整櫃產品, 以Google布局最積極。TrendForce預估, 2026年Google對自家TPU晶片需求量將年增近80%, 並於下半年後將從v7逐漸升級至v8世代。 Amazon自研ASIC的力道僅次於Google, 預計2026年其Trainium系列於自家AI server占比將達40%以上。

TrendForce表示,NVIDIA、 AMD和CSP自研ASIC的新世代機櫃皆整合液冷散熱系統, 有助降低AI server的U數(server機架單位), 提高單一機櫃可容納的加速器數量。在單顆AI GPU或ASIC的熱設計功耗(TDP)同步提高的情況下,AI server系統功耗呈結構性放大。

據TrendForce估算, 2023年北美五大CSP的server功耗合計年增2. 8GW,至2026年躍升至18GW, 2025至2026年的年成長率高達116%, 主因即AI競賽白熱化,NVIDIA GB300、AMD Helios和CSP自研ASIC平台將同步放量。

(首圖來源:AI生成)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》