
隨著摩爾定律進走向極限、數據中心功耗越來越受關注,AMD 著手準備雄心勃勃的新目標,預計 2030 年前將 AI 晶片能效提高 20 倍,機架式架構是實現此目標的關鍵。
AMD 在 2021 年宣布 30×25 目標,計劃 2025 年前將用於人工智慧(AI)訓練與高效能運算(HPC)應用的處理器能源效率提升 30 倍,如今 AMD 已超越 30×25 目標,將 AI 訓練與 HPC 處理器能效提高 38 倍,與 5 年前系統相比,相當於同性能產品能耗降低 97%。
現在 AMD 宣布設立更大膽的 2030 年新目標,預期到 2030 年機架級能效提高 20 倍,將目前需要超過 275 個機架訓練的典型 AI 模型縮減至 1 個機架,從而減少 95% 電力消耗,再結合軟體與演算法,新目標能將整體能源效率提高 100 倍。
AMD 不是第一家朝此方向邁進的公司,Nvidia 在去年 GTC 大會展示首款機架級系統 GB200 NVL72,該系統利用高效 NVLink 互連技術將多個 GPU 整合為強大計算單元,使 4 個或 8 個加速器作為一個大型加速器運行。
隨著 MI400 亮相,AMD 第一個機架級運算平台預計明年推出,使用 UALink 互連技術,未來設計可能引入光互連技術取代傳統銅線,進一步提升頻寬和傳輸距離。
- AMD bets on rack-scale compute to boost AI efficiency 20x by 2030
- AMD Surpasses 30×25 Goal, Sets Ambitious New 20x Efficiency Target
(首圖來源:AMD)