Claude 愈用愈貴愈笨?降智 + 超額收費雙重夾擊
發佈日期:2026-05-22 標籤:Claude, AI 工具, 開發者工具, 成本控制, DeepSeek, OpenCode
你唔係一個人覺得 Claude 變蠢咗
「你說這是為什麼呀為呀么為什麼?」
V2EX 用戶 @zhwguest 係 2026 年 5 月 19 日貼咗一條帖,題目係《續 claude 降智嚴重後,codex 也在步其後塵》。就係呢句歌詞式的靈魂發問,精準概括了無數 Claude 重度用戶最近幾個月的心情。
Claude 降智、帳單爆炸——兩件事同時夾擊。用慣咗 Claude 嘅開發者,正在面對一個殘酷的現實:你依賴的工具開始變差,同時你的錢包還在不斷失血。
本文梳理降智現象的來龍去脈、計費問題的具體案例,以及現實可行的替代方案。
一、降智事件:三個 Bug 搞垮一個 AI
事情係點發生的
2026 年 3 月至 4 月,大量 Claude Code 用戶開始反映助手「明顯變蠢」:原本能搞定複雜任務的 Opus 開始中途放棄,思考深度下降,寫程式前不讀代碼就動手亂改。
GitHub 上有開發者專門開了 Issue「Opus model quality regression」,附帶詳細的 session 日誌,記錄 Claude 如何在複雜工程任務中一步步失去狀態。
Reddit 上的 Claude Pro 訂戶更慘:「我的配額每個星期一就用完,星期六才重置」;Max 5x 訂戶說「一小時就把 Max 5 用光,以前可以工作八個鐘」。
Anthropic 自己承認的三個 Bug
2026 年 4 月 23 日,Anthropic 發了一份詳細的 post-mortem,承認連環踩中三個 bug:
Bug 1(3 月 4 日):把 Claude Code 的預設思考強度從「高」改成「中」,美其名曰降低延遲。Anthropic 後來承認「這個取捨是錯的」,4 月 7 日回滾。
Bug 2(3 月 26 日):一個本來只清理閒置 session 緩存的優化,意外地變成每一輪對話都清空歷史推理緩存,等於讓模型每次都從零開始思考。
Bug 3(4 月 16 日):系統 prompt 限制了回應長度,進一步壓縮了 coding 質量,拖低約 3%。
三個 bug 疊加,效果如何?AMD AI 總監 Stella Laurenzo 做了量化分析,數據觸目驚心:
- 思考深度下跌 67%
- 修改程式前先讀代碼的比率跌 70%
- 「異常行為觸發」急升 173%
Anthropic 官方說 4 月 20 日已全面修復。不過很多用戶的感受是:修了,但信心沒回來。
Codex 也跟著中招
用戶從 Claude 逃到 Codex,本以為找到出路,結果發現 Codex 也開始「步其後塵」。V2EX 上《Codex 疑似降智》的帖子在 2026 年 5 月中旬引發討論,有人留意到 Codex 不同版本知識截止日期不一致(網頁版係 2025 年 8 月,App 和 CLI 版卻是 2024 年 6 月),暗示背後可能在悄悄切換服務的模型版本。
社群的最大恐懼,就是這並非技術失誤,而是平台為降低計算成本而有意為之——即使沒有直接證據,但這種懷疑一旦種下,要消除極難。
二、帳單問題:你以為付了訂閱費,其實還在被 API 收費
降智是質量問題,帳單是現金問題。後者更直接,更讓人憤怒。
HERMES.md 事件:一個檔名引爆 $200 超額收費
2026 年 4 月,一位 Claude Code Max 訂戶發現一個荒誕的 bug:Git commit history 裡只要出現「HERMES.md」這個字符串,就會觸發計費 bug,繞過每月 $200 的訂閱上限,改用按量收費的 API 計費。
該用戶被多收了超過 $200,同時 86% 的預付訂閱額度依然躺著沒被用掉。這條帖子在 Hacker News 獲得 828 個 upvotes,輿論大譁,Anthropic 才被迫承認、退款並補贈 $200 credits。
試想想:你以為自己在用包月計劃,其實有個隱藏條件觸發了一個影子計費系統,而你完全不知情。
Subagent 偷走你的 Max Plan 額度
Claude Code 的 Subagent 功能同樣暗藏地雷。有用戶發現,當 subagents 被觸發時,請求會悄悄繞過 Max Plan 訂閱,改用綁定的 API key 計費,產生意料之外的 $152 額外收費。
這條 GitHub issue (#39903) 的標題已經說明一切:「Max Plan subscribers billed through API key when subagents dispatch」。
雙重計費的惡夢
更離譜的是 Double Billing 問題:每個請求同時被收一次 API 費用、再從預付 credits 扣一次。即係俾錢兩次,用一次。
帳號被停仍在計費
最慘的案例發生在一家 110 人公司:Anthropic 在毫無警告的情況下封鎖了全公司帳號,但 API key 繼續計費,錢照扣,服務卻完全無法使用。
計費陷阱的共同特點
縱觀這些事件,幾個共同模式顯而易見:
- 問題只在帳單出現時才被發現,用戶沒有預警機制
- 申訴程序繁瑣,Anthropic 客服通常先拒絕退款,要到輿論施壓才妥協
- 訂閱制與 API 計費混用,邊界模糊,容易出現意外跨界計費
- 用量上限設計不透明,用戶不清楚觸發超額收費的確切條件
三、替代方案:唔一定要死忠 Claude
好消息是,2026 年的 AI 市場已經是買方市場。你有真實可用的替代選項,而且部分在某些場景下已經超越 Claude。
OpenCode:免費 + 靈活的 BYOK 方案
OpenCode 是一個終端介面的 AI 編程助手,支援 75+ LLM 提供商,包括 Claude、GPT、DeepSeek、Gemini 等。關鍵優勢是 BYOK(Bring Your Own Key)——你直接用自己的 API key,完全透明,沒有平台層的計費黑盒。
OpenCode + DeepSeek V3 API 的組合每月成本大約 $5-15,已經可以完成大多數日常編程任務。
DeepSeek V3:性價比之王
DeepSeek V3 目前 API 報價約 $0.35/百萬 token,約為 Claude API 的 1/10。多項評測顯示 DeepSeek V3 在常規 coding 任務上達到 Claude Sonnet 95% 左右的水準。
對大多數不需要「大模型最前沿能力」的開發者來說,這個差距在實際使用中幾乎感受不到,但費用可以差十倍。
Gemini 2.5 Pro:免費額度可觀
Google Gemini 2.5 Pro 目前在 AI Studio 提供相當可觀的免費配額,在長上下文處理上表現突出,適合需要讀大量代碼庫的任務。
本地模型:零雲依賴
如果你有足夠的硬件(RTX 4090 或以上),Ollama + OpenCode 方案可以讓你完全在本地跑 Qwen3、Llama 4 等開源模型。一次性硬件投資換取長期零 API 費用,適合重度用戶。
多模型混用策略
最務實的做法不是「完全取代 Claude」,而是分層使用:
| 任務類型 | 推薦方案 | 月費估算 |
|---|---|---|
| 日常 coding、autocomplete | DeepSeek V3 API | $5-15 |
| 複雜架構決策、需要深度推理 | Claude Opus(限量) | 按量付費 |
| 長文件分析、代碼庫閱讀 | Gemini 2.5 Pro | 免費額度內 |
| 離線工作、私密代碼 | 本地 Qwen3/Llama 4 | 零成本 |
四、成本控制的實際操作
不管你決定繼續用 Claude 還是轉換,以下幾點操作建議可以立即執行:
1. 設置 Anthropic API spending limits 登入 console.anthropic.com,在 Billing 設置每月硬上限。沒有上限等於裸奔。
2. 開啟用量提醒 設置 80% 和 100% 用量警報,讓你在超支前有時間反應。
3. 用量監控腳本 用 Anthropic 的 Usage API 每日導出用量數據,追蹤哪些 agent/workflow 在燒錢。
4. Max Plan 與 API 不要混用同一帳號 目前已知多個計費 bug 都跟訂閱制與 API key 混用有關。如果同時使用兩種計費方式,最好用不同帳號隔離。
5. 記錄帳單截圖 遇到異常收費,第一步是截圖記錄,發 GitHub issue 比發 support ticket 有效——公開曝光往往才是促使 Anthropic 處理的真正驅動力。
結語:理性對待工具,而非信仰
Claude 仍然是目前最強的 coding 助手之一。降智事件有具體的技術原因,Anthropic 也已修復。但這一輪事件揭示了一個更深層的問題:當你的開發流程高度依賴一個商業 API,你就把業務風險外包給了對方的系統穩定性和計費誠信。
合理的做法是:
- 不要把 Claude 當成唯一工具,建立多模型備用方案
- 控制每月 API 上限,防止意外帳單
- 定期評估替代方案的性價比
- 公開分享帳單異常,幫助整個社群施壓
AI 工具市場競爭正在加劇。DeepSeek、Gemini、開源社群都在快速追趕。Claude 的地位不是理所當然的,Anthropic 需要用質量和誠信來維持用戶信任,而不是靠鎖定效應。
用你的訂閱費投票。
參考來源
- Did Anthropic Secretly Nerf Claude? The Evidence, the Bugs, and What Actually Happened
- V2EX: 續 claude 降智嚴重後,codex 也在步其後塵
- V2EX: claude code 降智被實錘了
- Anthropic’s HERMES.md Billing Bug: $200 Overcharge, Refund Denied
- GitHub Issue #39903: Max Plan subscribers billed through API key when subagents dispatch
- GitHub Issue #23315: Claude Code charges users twice
- How Anthropic’s Harness Detection Actually Works — and Why It Triggered a $200 Overcharge
- Claude Code Alternatives 2026: 11 Tested, 3 That Beat It for Under $20/mo
- Can Anthropic keep billing your API after a suspension?