企業棄「最強」投「最省」，高達 80% 算力將轉向平價小模型

人工智慧產業近來正出現一項值得關注的變化：企業不再只追求最強模型，反而開始重新評估更便宜、規模更小的模型是否足以應付多數工作。這場轉向，可能改寫 AI 服務的成本結構，也將影響大型模型供應商未來的營收模式。

Coinbase 共同創辦人布萊恩·阿姆斯壯（Brian Armstrong）近日在 X 上預測，未來 12 到 18 個月內，高達 80% 的 AI 工作負載，可能會轉向成本便宜約 99% 的模型，只有約 20% 仍會留在最新一代的高階模型上，特別是那些對準確度要求極高的工作。這代表過去「模型越大、能力越強、就越值得優先使用」的慣性，可能開始鬆動。

Good take

My guess is
– demand for intelligence is near infinite
– but 80% of workloads will be running on 99% cheaper models within 12-18 months
– 20% of workloads will still run on latest gen models where IQ maxing is important (scientific breakthroughs, higher level… https://t.co/gAFtYjorRh

— Brian Armstrong (@brian_armstrong) June 8, 2026

這種趨勢已經在部分實測中浮現。法律 AI 工具 Harvey 與推論平台 Fireworks AI 合作的測試，結合了 Claude Opus 與 Fireworks 的 GLM 5.1，並在系統安排下將最密集的工作交由 Opus 處理、將其他流程改由較小或成本更低的模型承接，結果在不降低品質的前提下，整體推論成本降為原來的三分之一（成本降低約三倍），伺服器使用時間與總成本顯著下降。Harvey 共同創辦人 Gabe Pereyra 表示，法律服務最重視品質，但「品質」的定義正從單純使用最強模型，轉向以最有效率的方式得到正確答案。

報導指出，企業若開始普遍採用較便宜的模型，受衝擊最大的將是像 OpenAI 與 Anthropic 等大型實驗室，因為它們原本可望從高階模型的用量中獲得可觀收入。另一方面，隨著 token 價格上升、補貼退場，企業也可能選擇減少呼叫次數、縮短上下文，甚至停止部分 AI 專案，而不一定只是單純改用更小的模型。

在這股成本壓力之下，業界的競爭焦點也逐漸從「誰的模型最強」轉向「誰能以最低成本完成足夠好的工作」。若多數部署最後都能由較小模型承接，AI 推論需求的成長速度可能放緩，連帶讓訓練前沿模型的高額投入，面臨更大的商業化考驗。

（首圖來源：shutterstock）