三只貓
Rich Mindset Zone
richmindsetzone.com
← All posts

Claude 愈用愈貴愈笨?降智 + 超額收費雙重夾擊

Claude 愈用愈貴愈笨?降智 + 超額收費雙重夾擊

發佈日期:2026-05-22 標籤:Claude, AI 工具, 開發者工具, 成本控制, DeepSeek, OpenCode


你唔係一個人覺得 Claude 變蠢咗

「你說這是為什麼呀為呀么為什麼?」

V2EX 用戶 @zhwguest 係 2026 年 5 月 19 日貼咗一條帖,題目係《續 claude 降智嚴重後,codex 也在步其後塵》。就係呢句歌詞式的靈魂發問,精準概括了無數 Claude 重度用戶最近幾個月的心情。

Claude 降智、帳單爆炸——兩件事同時夾擊。用慣咗 Claude 嘅開發者,正在面對一個殘酷的現實:你依賴的工具開始變差,同時你的錢包還在不斷失血。

本文梳理降智現象的來龍去脈、計費問題的具體案例,以及現實可行的替代方案。


一、降智事件:三個 Bug 搞垮一個 AI

事情係點發生的

2026 年 3 月至 4 月,大量 Claude Code 用戶開始反映助手「明顯變蠢」:原本能搞定複雜任務的 Opus 開始中途放棄,思考深度下降,寫程式前不讀代碼就動手亂改。

GitHub 上有開發者專門開了 Issue「Opus model quality regression」,附帶詳細的 session 日誌,記錄 Claude 如何在複雜工程任務中一步步失去狀態。

Reddit 上的 Claude Pro 訂戶更慘:「我的配額每個星期一就用完,星期六才重置」;Max 5x 訂戶說「一小時就把 Max 5 用光,以前可以工作八個鐘」。

Anthropic 自己承認的三個 Bug

2026 年 4 月 23 日,Anthropic 發了一份詳細的 post-mortem,承認連環踩中三個 bug:

Bug 1(3 月 4 日):把 Claude Code 的預設思考強度從「高」改成「中」,美其名曰降低延遲。Anthropic 後來承認「這個取捨是錯的」,4 月 7 日回滾。

Bug 2(3 月 26 日):一個本來只清理閒置 session 緩存的優化,意外地變成每一輪對話都清空歷史推理緩存,等於讓模型每次都從零開始思考。

Bug 3(4 月 16 日):系統 prompt 限制了回應長度,進一步壓縮了 coding 質量,拖低約 3%。

三個 bug 疊加,效果如何?AMD AI 總監 Stella Laurenzo 做了量化分析,數據觸目驚心:

  • 思考深度下跌 67%
  • 修改程式前先讀代碼的比率跌 70%
  • 「異常行為觸發」急升 173%

Anthropic 官方說 4 月 20 日已全面修復。不過很多用戶的感受是:修了,但信心沒回來。

Codex 也跟著中招

用戶從 Claude 逃到 Codex,本以為找到出路,結果發現 Codex 也開始「步其後塵」。V2EX 上《Codex 疑似降智》的帖子在 2026 年 5 月中旬引發討論,有人留意到 Codex 不同版本知識截止日期不一致(網頁版係 2025 年 8 月,App 和 CLI 版卻是 2024 年 6 月),暗示背後可能在悄悄切換服務的模型版本。

社群的最大恐懼,就是這並非技術失誤,而是平台為降低計算成本而有意為之——即使沒有直接證據,但這種懷疑一旦種下,要消除極難。


二、帳單問題:你以為付了訂閱費,其實還在被 API 收費

降智是質量問題,帳單是現金問題。後者更直接,更讓人憤怒。

HERMES.md 事件:一個檔名引爆 $200 超額收費

2026 年 4 月,一位 Claude Code Max 訂戶發現一個荒誕的 bug:Git commit history 裡只要出現「HERMES.md」這個字符串,就會觸發計費 bug,繞過每月 $200 的訂閱上限,改用按量收費的 API 計費。

該用戶被多收了超過 $200,同時 86% 的預付訂閱額度依然躺著沒被用掉。這條帖子在 Hacker News 獲得 828 個 upvotes,輿論大譁,Anthropic 才被迫承認、退款並補贈 $200 credits。

試想想:你以為自己在用包月計劃,其實有個隱藏條件觸發了一個影子計費系統,而你完全不知情。

Subagent 偷走你的 Max Plan 額度

Claude Code 的 Subagent 功能同樣暗藏地雷。有用戶發現,當 subagents 被觸發時,請求會悄悄繞過 Max Plan 訂閱,改用綁定的 API key 計費,產生意料之外的 $152 額外收費。

這條 GitHub issue (#39903) 的標題已經說明一切:「Max Plan subscribers billed through API key when subagents dispatch」。

雙重計費的惡夢

更離譜的是 Double Billing 問題:每個請求同時被收一次 API 費用、再從預付 credits 扣一次。即係俾錢兩次,用一次。

帳號被停仍在計費

最慘的案例發生在一家 110 人公司:Anthropic 在毫無警告的情況下封鎖了全公司帳號,但 API key 繼續計費,錢照扣,服務卻完全無法使用。

計費陷阱的共同特點

縱觀這些事件,幾個共同模式顯而易見:

  1. 問題只在帳單出現時才被發現,用戶沒有預警機制
  2. 申訴程序繁瑣,Anthropic 客服通常先拒絕退款,要到輿論施壓才妥協
  3. 訂閱制與 API 計費混用,邊界模糊,容易出現意外跨界計費
  4. 用量上限設計不透明,用戶不清楚觸發超額收費的確切條件

三、替代方案:唔一定要死忠 Claude

好消息是,2026 年的 AI 市場已經是買方市場。你有真實可用的替代選項,而且部分在某些場景下已經超越 Claude。

OpenCode:免費 + 靈活的 BYOK 方案

OpenCode 是一個終端介面的 AI 編程助手,支援 75+ LLM 提供商,包括 Claude、GPT、DeepSeek、Gemini 等。關鍵優勢是 BYOK(Bring Your Own Key)——你直接用自己的 API key,完全透明,沒有平台層的計費黑盒。

OpenCode + DeepSeek V3 API 的組合每月成本大約 $5-15,已經可以完成大多數日常編程任務。

DeepSeek V3:性價比之王

DeepSeek V3 目前 API 報價約 $0.35/百萬 token,約為 Claude API 的 1/10。多項評測顯示 DeepSeek V3 在常規 coding 任務上達到 Claude Sonnet 95% 左右的水準。

對大多數不需要「大模型最前沿能力」的開發者來說,這個差距在實際使用中幾乎感受不到,但費用可以差十倍。

Gemini 2.5 Pro:免費額度可觀

Google Gemini 2.5 Pro 目前在 AI Studio 提供相當可觀的免費配額,在長上下文處理上表現突出,適合需要讀大量代碼庫的任務。

本地模型:零雲依賴

如果你有足夠的硬件(RTX 4090 或以上),Ollama + OpenCode 方案可以讓你完全在本地跑 Qwen3、Llama 4 等開源模型。一次性硬件投資換取長期零 API 費用,適合重度用戶。

多模型混用策略

最務實的做法不是「完全取代 Claude」,而是分層使用:

任務類型推薦方案月費估算
日常 coding、autocompleteDeepSeek V3 API$5-15
複雜架構決策、需要深度推理Claude Opus(限量)按量付費
長文件分析、代碼庫閱讀Gemini 2.5 Pro免費額度內
離線工作、私密代碼本地 Qwen3/Llama 4零成本

四、成本控制的實際操作

不管你決定繼續用 Claude 還是轉換,以下幾點操作建議可以立即執行:

1. 設置 Anthropic API spending limits 登入 console.anthropic.com,在 Billing 設置每月硬上限。沒有上限等於裸奔。

2. 開啟用量提醒 設置 80% 和 100% 用量警報,讓你在超支前有時間反應。

3. 用量監控腳本 用 Anthropic 的 Usage API 每日導出用量數據,追蹤哪些 agent/workflow 在燒錢。

4. Max Plan 與 API 不要混用同一帳號 目前已知多個計費 bug 都跟訂閱制與 API key 混用有關。如果同時使用兩種計費方式,最好用不同帳號隔離。

5. 記錄帳單截圖 遇到異常收費,第一步是截圖記錄,發 GitHub issue 比發 support ticket 有效——公開曝光往往才是促使 Anthropic 處理的真正驅動力。


結語:理性對待工具,而非信仰

Claude 仍然是目前最強的 coding 助手之一。降智事件有具體的技術原因,Anthropic 也已修復。但這一輪事件揭示了一個更深層的問題:當你的開發流程高度依賴一個商業 API,你就把業務風險外包給了對方的系統穩定性和計費誠信。

合理的做法是:

  • 不要把 Claude 當成唯一工具,建立多模型備用方案
  • 控制每月 API 上限,防止意外帳單
  • 定期評估替代方案的性價比
  • 公開分享帳單異常,幫助整個社群施壓

AI 工具市場競爭正在加劇。DeepSeek、Gemini、開源社群都在快速追趕。Claude 的地位不是理所當然的,Anthropic 需要用質量和誠信來維持用戶信任,而不是靠鎖定效應。

用你的訂閱費投票。


參考來源