
AI 雲端新創公司 TensorWave 日前宣布,正式啟用一套超大規模 AI 訓練叢集,由 8,192 顆 AMD Instinct MI325X 組成,是目前北美地區規模最大的全液冷 AMD GPU 系統。
TensorWave 於 X 公開現場機房照片,可見標誌性橘色液冷管路與密集機櫃布局,強調自研液冷技術的辨識度與成熟度。每個機櫃內含 8 台伺服器、單台搭載 8 顆 MI325X,加總每櫃 64 顆 GPU,功耗達 100-120 千瓦,並由 Supermicro 提供整套液冷解決方案。
8,192 liquid-cooled MI325X GPUs. The largest @AMD GPU training cluster in North America.
Built by TensorWave. Ready for what’s next 🌊 pic.twitter.com/qSGaiPBMM8
— TensorWave (@TensorWaveCloud) July 15, 2025
根據 TensorWave 執行長 Derek Horton 在 AMD Advancing AI Day 活動上的說明,該叢集在成本與效率上具備顯著優勢,相較傳統架構可節省約 40% 成本,並提升約 25% AI 訓練效率,展現 AMD GPU 在雲端大規模部署中的潛力。
MI325X 為 AMD 去年底發表的旗艦級 AI 加速器,採用 chiplet 架構,內建 19,456 個串流處理器(SP)、256GB HBM3e 記憶體與 6TB/s 頻寬,具備 2.6 PFLOPS 的 FP8 運算能力。
面對目前市場對 NVIDIA CUDA 架構的高度依賴,TensorWave 希望能提供另一種選擇,打造非 NVIDIA 陣營的主流 AI 訓練基礎設施,並打破單一生態系壟斷局勢。
該公司也預告,下一階段將啟動更大規模的 MI355X 部署計畫,並持續擴大在 AMD GPU 雲端市場的布局,搶攻未來 AI 計算需求的成長商機。
(首圖來源:影片截圖)