高效能運算(HPC)精準度路線立場再次確定。外界近期熱議「FP8 搭配 Ozaki 模擬是否足以取代 FP64」論點,AMD AI 與超級運算業務主管 Joseph George 表示,公司短期不會放棄 FP64,因科學計算、模擬等多個關鍵產業,精準度仍是不可妥協的要求。
這場討論源自 RIKEN 主任 Satoshi Matsuoka 在 TPC26 期間提出的新論文,主張以 FP8 硬體結合 Ozaki II 模擬,當成 FP64 的可行替代方案。George 強調,AMD 客戶目前並未要求移除 GPU 的 FP64 核心,反而希望保留更多彈性:可依工作負載選擇 FP4、FP6、FP8、Ozaki 模擬,或直接使用原生 FP64,重點是讓科學計算得出最接近正確的答案。
George 也坦言,AMD 對低精準度計算的準確性仍持審慎態度,尤其是 INT8 搭配 Ozaki I 或 FP8 搭配 Ozaki II 的結果,尚未看到足以證明全面等同傳統 FP64 的定論。他指出,若工作負載本質偏向矩陣運算,Ozaki 可能很適合;但若是其他類型的科學程式,正確性仍必須先經過驗證,這也是 AMD 堅持的底線。
從產品規劃看,AMD 仍在加碼 FP64。公司即將推出 MI430X GPU 可提升 FP64,並用於 DOE 的 Discovery 超級電腦,為 Oak Ridge National Laboratory 的 Frontier 後繼系統。雖然 AMD 未確認數字,但外界估算 FP64 效能可能落在約 192~204teraflops,明顯高於 MI355 的 77teraflops。
George 表示,從客戶與科學家回饋看,近中期最重要的仍是「做出正確答案」而不是單純追求更低精準度、更高速度。他預估未來 HPC 環境將走向混合精準度:部分工作負載可借力 AI 世代的低精準度硬體,部分則仍必須依賴 FP64 才能滿足科學與準確性需求。AMD 態度也很清楚:不排斥 Ozaki,但也不會放棄 FP64,選擇標準始終是科學需求本身。
- Covering the Fastest Computers in the World and the People Who Run Them
- Technical Dive into AMD’s MLPerf Training v6.0 Submission
- AMD | TechInsights
(首圖來源:ROCm Blogs)






