Claude Code 使用者近來面臨 token 用量過早用盡的問題,恐怕擾亂開發工作。
「每週一就會到達用量上限,要到週六才會重置,而且這種情況已經持續數週了,30 天當中我用 Claude 大概只能用 12 天」,一名付費訂閱 Claude Pro 的使用者在官方 Discord 表示。
Reddit 上的 Anthropic 論壇也充滿抱怨,「我在 1 小時內用完 Claude Max 5x 的配額,以前可以用 8 小時」,一名開發者表示。
「人們在 Claude Code 達到用量上限的速度遠超預期,我們正在積極調查⋯⋯這是團隊目前最高優先事項」,Anthropic 在 Reddit 承認這樣的問題正在發生。
外媒 The Register 報導,造成這種變化可能有許多因素,首先是 Anthropic 上週宣告將在尖峰時段降低配額。「我們已經在效率上取得不少進展來彌補這個影響,但仍有約 7% 使用者會比以往更快達到使用限制,尤其是 Claude Pro 訂閱用戶更為明顯」,在 Anthropic 負責 Claude Code 業務的 Thariq Shihipar 表示。
再來,3 月 28 日剛好是一項 Claude 推廣活動的最後一天,6 小時尖峰時段以外的用量限制翻倍。
第三個可能因素,是 Claude Code 本身存在導致 token 用量增加的錯誤。有使用者聲稱,逆向分析 Claude Code 程式碼,「發現 2 個獨立的 bug 會導致提示快取失效,讓成本悄悄膨脹 10 倍至 20 倍。」一名使用者表示降級至舊版本有所改善,「降到 2.1.34 版本後差異非常明顯。」
相關文件指出,提示快取可以大幅降低重複任務或具有一致元素的提示處理時間與成本。然而提示快取只有 5 分鐘有效期限,意味著只要稍作休息或幾分鐘未用 Claude Code,恢復使用時成本就會上升。
開發者可將快取有效時間延長至 1 小時,但文件也說明「1 小時快取寫入的 token 成本,是基礎輸入 token 價格的 2 倍。」相較之下,快取讀取 token 僅基礎價格的 0.1 倍,因此成為工作流程最佳化的重要環節。
Anthropic 並未明確說明各種訂閱方案的使用上限,例如 Claude Pro 方案僅承諾「每個工作階段至少是免費方案的 5 倍用量」,標準團隊方案「每個工作階段比 Claude Pro 方案多 1.25 倍用量」。這使得開發者難以掌握實際配額,只能透過系統儀表板查看用量並推測。
事實上,本月稍早 Google Antigravity 的使用者曾對類似問題表達不滿。
撇開 bug 不談,目前可見使用者與服務商之間,彷彿正在進行一場關於 AI 開發「合理價格與使用模式」的協商,使用者希望能控制成本,而服務商需要盈利,兩者之間則要取得平衡才能雙贏。
(首圖來源:pixabay)






