「訓練」就像是漫長的學習與深造,投入大量資料與運算資源,目的是為了打造一個知識淵博、判斷精準的大腦。而「推論」,則是這位專家步入社會、解決真實問題的實戰時刻。它追求的不再是窮盡知識,而是在毫秒之間做出反應,以最高的效率與速度,展現 AI 的真正價值。隨著模型能力發強大,AI 運算重心已從訓練轉向推論。
黃仁勳表示,AI 計算主由過去的單一成長模式,擴展為三大定律,包括預訓練、後訓練與推理。
隨著 AI 運算需求重心從一次性的訓練階段,慢慢轉向持續性且高頻發生的推論(Inference)階段。這場轉變不僅催生了專為 AI 推論設計的新晶片,更在記憶體與儲存領域,帶來一場以「總體擁有成本」(TCO)為核心的異構與分層架構革命。
AI 應用百花齊放,AI Inference 成為下一個主戰場,與 AI Training 相比,推論更貼近終端應用。面對推論市場的龐大商機,NVIDIA 宣布推出 Rubin CPX GPU,專為大規模情境推論打造新一代 GPU,將與 Rubin GPU 和 Vera CPU 協同工作,以加速特定的工作負載,預期 2026 年底上市。