「越聰明越燒錢」主動式代理 AI 時代來臨,Token 消耗量翻 30 倍的殘酷現實

作者 | 發布日期 2026 年 04 月 20 日 8:10 | 分類 AI 人工智慧 , 公司治理 , 新創 line share Linkedin share follow us in feedly line share
Loading...
「越聰明越燒錢」主動式代理 AI 時代來臨,Token 消耗量翻 30 倍的殘酷現實

「這季看了我們被投的帳單,真是兩眼一黑又一黑。2026 年不打算再投軟體了,準備轉投硬體。」一位投過多家明星應用企業的投資人,在與筆者交流時說出了這句話。他投過視訊生成、Agent、C 端應用。問他看完帳單最深的感受是什麼,他想了想,說了一句話:「軟體有一個算一個,商業模式都跑不通。」

事實上,這不是一個人的孤立判斷。過去一年半,AI軟體賽道經歷了最瘋狂的融資、最快的產品迭代和最殘酷的現實檢驗。2025年,新創公司還能融到錢,燒錢換成長的遊戲還在轉。但進入2026年,當投資人真正打開帳單,逐行看清後端的成本結構時,他們發現了一件事:

在現行的算力成本結構下,無論軟體應用是什麼方向,都跑不出良性的經營模式。

更麻煩的是,帳單上能看到的,還不是最難看的部分。筆者跟多位產業裡的投資人和創業家聊了聊他們真實經歷的數字。

帳單到底有多難看?

影片生成公司的錢,主要燒在訓練上。一位正在做影片生成模型的技術負責人告訴我們,他們日常做模型迭代,哪怕只是測試一個細節改動:跑一天下來大概要10萬人民幣(約台幣46萬元)。所以我們現在壓力很大,稍微動一動大量的錢就出去了。

外界看到的是能力在躍升,帳單上對應的是一次次成本的累積跳漲。

Agent公司不同,他們自己不訓模型,錢主要花在打電話給別人的API。目前做Agent產品,繞不開Claude系列──在複雜推理和工具調用這件事上,它是市場公認表現最好的模型之一。

但呼叫價格擺在那裡:Claude Opus 4.6的API,每百萬輸入Token 5美元,每百萬輸出Token 25美元。開啟高速推理模式,輸出價格直接跳到每百萬Token 150美元,是標準模式的六倍。

一家正在內測的Agent公司,單用戶日成本已經到了100到200美元。算下來,一個用戶一個月的後端成本,在3,000到6,000美元之間。

他們告訴筆者:不是不想公測,是實在cover不住成本。「在公測前,我們想盡可能把成本打到現在的五分之一,從Claude開始往下調模型,盡可能把單用戶日成本能壓到25美元左右。」

(Source:shutterstock)

不過他們測試了之後發現效果差距十分明顯:「換了之後任務完成率掉得很明顯,用戶半個小時之內就會感受到降智,現在的情況就是用貴的撐不住成本,用便宜的留不住用戶。」

而進入2026年,整條賽道又朝著一個更耗錢的方向邁了一步。外界看到的是:Agent越來越主動,越來越智慧,產品能力在躍升。但每一次這樣的進步,在帳單上對應的是一次成本的階躍。

過去的Agent是被動回應──你下指令,它執行,一問一答,Token消耗是可控的。主動式Agent不一樣,它不等你開口,自己去抓資訊、判斷優先順序、在後台完成一串決策動作。示範起來令人印象深刻,但你在台上看到的每一個「更聰明」,在帳單上對應的是Token消耗又跳了一個量級:Agentic應用的消耗,大約是普通對話的5到30倍。

一家做TikTok影片創意分析的Agent公司的內部數據也是如此。他們的產品會主動抓取影片、逐條分析創意方向。光是瀏覽和分析一條影片,成本就接近5美元,一天處理50條,單這一動作就燒掉250美元──還沒算後續的創意生成和優化。

一位了解該公司內部狀況的人說:最大的問題不是功能做不出來,是產品每往前推一步,成本就翻幾倍,找不到平衡點。

這很可能不是單一公司的處境。科技在進化,趨勢在推進,背後這筆帳卻越來越算不過來。

錢花出去了,怎麼賺回來?

帳單的問題,本質上是反映出另一問題:這些公司還沒想清楚怎麼賺錢。

目前市場上大多數AI應用公司,商業模式不外乎兩種:訂閱制和按需付費。訂閱制提供公司可預測的收入,但用戶付了錢不一定用,用多了公司就虧;按需付費看起來公平,用多少收多少,但成本端也是用多少燒多少,規模越大虧得越多。

a16z最近的一篇報告裡,一位受訪企業講到了他們對這兩種收費模式的判斷:供應商應該同時提供兩種方案,讓客戶自己選擇要可預測性還是要按效果付費的彈性。道理不難理解,但做到很難。

買家要的是花了錢就能看到結果,新創公司要的是收了錢能負擔成本。雙方的基本訴求無法同時滿足,只能有一方啞巴吃黃連。

更殘酷的是,在商業模式還沒想清楚之前,價格戰已經打起來了。

隨著AI的技術迭代的越來越快,新玩家每週湧入市場,用投資人的錢補貼低價獲客;老玩家就被迫跟進,「匹配所有競爭對手的價格」已經悄悄成了很多AI銷售手冊裡的標準動作。

一旦有人開始降價,跟跌就會像骨牌一樣傳承下去。Lovable的成長負責人Elena Verna說了一句很坦誠的話:免費計畫讓我們付出了很大代價,但我們把它當作行銷費用來看,而不是成本中心。

價格戰之所以這麼容易打起來,根源在於產品之間的差異沒有大到讓用戶願意為此多付錢。當兩個產品功能高度相似,價格就成了唯一可以比較的東西。沒有差異就打價格,打價格就更沒有資源去建立差異,產生死循環。

而價格打到哪裡才到底?筆者做了一些用戶調查,結論是:絕大多數用戶能接受的月付費上限,在100美元以下。這個數字,是許多Agent產品單用戶月成本的幾十分之一。

2026年:斷血後

回到開頭那位投資人說的話:他不再投軟體了。

這句話在2025年說出來,還會有人反駁。那時候錢還在湧入,數據還能做好看,故事還能說下去。AI軟體公司的標準生存方式,是拿投資人的錢燒在訓練和推理上,燒在行銷獲客上,把用戶數和調用量推上去,再去融下一輪。

但2026年,當資本面對「天價帳單」,看清了成本結構,選擇不再跟進,融資續命的窗口就開始關閉。後端成本降不下來,前端收入收不上去,商業模式在訂閱和按需付費之間反覆橫跳,價格戰把本就薄的毛利又壓了一層。

a16z也提出了一個更嚴峻的假設,用戶和企業會選擇「Build not Buy」,隨著模型Coding能力的增強,已經開始有企業用戶明確表示:計劃逐步放棄第三方AI工具,自己做。到那時,AI SaaS連存在的理由都可能沒有了。

這幾件事同時發生,那些已經蒙眼狂奔了一段時間的AI軟體公司可能會有一大批要倒在2026年。

(本文由 品玩 授權轉載;首圖來源:Image on Freepik

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》