企業棄「最強」投「最省」,高達 80% 算力將轉向平價小模型

作者 | 發布日期 2026 年 06 月 10 日 12:10 | 分類 AI 人工智慧 , 國際觀察 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
企業棄「最強」投「最省」,高達 80% 算力將轉向平價小模型

人工智慧產業近來正出現一項值得關注的變化:企業不再只追求最強模型,反而開始重新評估更便宜、規模更小的模型是否足以應付多數工作。這場轉向,可能改寫 AI 服務的成本結構,也將影響大型模型供應商未來的營收模式。

Coinbase 共同創辦人布萊恩·阿姆斯壯(Brian Armstrong)近日在 X 上預測,未來 12 到 18 個月內,高達 80% 的 AI 工作負載,可能會轉向成本便宜約 99% 的模型,只有約 20% 仍會留在最新一代的高階模型上,特別是那些對準確度要求極高的工作。這代表過去「模型越大、能力越強、就越值得優先使用」的慣性,可能開始鬆動。

這種趨勢已經在部分實測中浮現。法律 AI 工具 Harvey 與推論平台 Fireworks AI 合作的測試,結合了 Claude Opus 與 Fireworks 的 GLM 5.1,並在系統安排下將最密集的工作交由 Opus 處理、將其他流程改由較小或成本更低的模型承接,結果在不降低品質的前提下,整體推論成本降為原來的三分之一(成本降低約三倍),伺服器使用時間與總成本顯著下降。Harvey 共同創辦人 Gabe Pereyra 表示,法律服務最重視品質,但「品質」的定義正從單純使用最強模型,轉向以最有效率的方式得到正確答案。

報導指出,企業若開始普遍採用較便宜的模型,受衝擊最大的將是像 OpenAI 與 Anthropic 等大型實驗室,因為它們原本可望從高階模型的用量中獲得可觀收入。另一方面,隨著 token 價格上升、補貼退場,企業也可能選擇減少呼叫次數、縮短上下文,甚至停止部分 AI 專案,而不一定只是單純改用更小的模型。

在這股成本壓力之下,業界的競爭焦點也逐漸從「誰的模型最強」轉向「誰能以最低成本完成足夠好的工作」。若多數部署最後都能由較小模型承接,AI 推論需求的成長速度可能放緩,連帶讓訓練前沿模型的高額投入,面臨更大的商業化考驗。

(首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》