Claude 愈用愈貴愈笨？降智 + 超額收費雙重夾擊

發佈日期：2026-05-22 標籤：Claude, AI 工具, 開發者工具, 成本控制, DeepSeek, OpenCode

你唔係一個人覺得 Claude 變蠢咗

「你說這是為什麼呀為呀么為什麼？」

V2EX 用戶 @zhwguest 係 2026 年 5 月 19 日貼咗一條帖，題目係《續 claude 降智嚴重後，codex 也在步其後塵》。就係呢句歌詞式的靈魂發問，精準概括了無數 Claude 重度用戶最近幾個月的心情。

Claude 降智、帳單爆炸——兩件事同時夾擊。用慣咗 Claude 嘅開發者，正在面對一個殘酷的現實：你依賴的工具開始變差，同時你的錢包還在不斷失血。

本文梳理降智現象的來龍去脈、計費問題的具體案例，以及現實可行的替代方案。

一、降智事件：三個 Bug 搞垮一個 AI

事情係點發生的

2026 年 3 月至 4 月，大量 Claude Code 用戶開始反映助手「明顯變蠢」：原本能搞定複雜任務的 Opus 開始中途放棄，思考深度下降，寫程式前不讀代碼就動手亂改。

GitHub 上有開發者專門開了 Issue「Opus model quality regression」，附帶詳細的 session 日誌，記錄 Claude 如何在複雜工程任務中一步步失去狀態。

Reddit 上的 Claude Pro 訂戶更慘：「我的配額每個星期一就用完，星期六才重置」；Max 5x 訂戶說「一小時就把 Max 5 用光，以前可以工作八個鐘」。

Anthropic 自己承認的三個 Bug

2026 年 4 月 23 日，Anthropic 發了一份詳細的 post-mortem，承認連環踩中三個 bug：

Bug 1（3 月 4 日）：把 Claude Code 的預設思考強度從「高」改成「中」，美其名曰降低延遲。Anthropic 後來承認「這個取捨是錯的」，4 月 7 日回滾。

Bug 2（3 月 26 日）：一個本來只清理閒置 session 緩存的優化，意外地變成每一輪對話都清空歷史推理緩存，等於讓模型每次都從零開始思考。

Bug 3（4 月 16 日）：系統 prompt 限制了回應長度，進一步壓縮了 coding 質量，拖低約 3%。

三個 bug 疊加，效果如何？AMD AI 總監 Stella Laurenzo 做了量化分析，數據觸目驚心：

思考深度下跌 67%
修改程式前先讀代碼的比率跌 70%
「異常行為觸發」急升 173%

Anthropic 官方說 4 月 20 日已全面修復。不過很多用戶的感受是：修了，但信心沒回來。

Codex 也跟著中招

用戶從 Claude 逃到 Codex，本以為找到出路，結果發現 Codex 也開始「步其後塵」。V2EX 上《Codex 疑似降智》的帖子在 2026 年 5 月中旬引發討論，有人留意到 Codex 不同版本知識截止日期不一致（網頁版係 2025 年 8 月，App 和 CLI 版卻是 2024 年 6 月），暗示背後可能在悄悄切換服務的模型版本。

社群的最大恐懼，就是這並非技術失誤，而是平台為降低計算成本而有意為之——即使沒有直接證據，但這種懷疑一旦種下，要消除極難。

二、帳單問題：你以為付了訂閱費，其實還在被 API 收費

降智是質量問題，帳單是現金問題。後者更直接，更讓人憤怒。

HERMES.md 事件：一個檔名引爆 $200 超額收費

2026 年 4 月，一位 Claude Code Max 訂戶發現一個荒誕的 bug：Git commit history 裡只要出現「HERMES.md」這個字符串，就會觸發計費 bug，繞過每月 $200 的訂閱上限，改用按量收費的 API 計費。

該用戶被多收了超過 $200，同時 86% 的預付訂閱額度依然躺著沒被用掉。這條帖子在 Hacker News 獲得 828 個 upvotes，輿論大譁，Anthropic 才被迫承認、退款並補贈 $200 credits。

試想想：你以為自己在用包月計劃，其實有個隱藏條件觸發了一個影子計費系統，而你完全不知情。

Subagent 偷走你的 Max Plan 額度

Claude Code 的 Subagent 功能同樣暗藏地雷。有用戶發現，當 subagents 被觸發時，請求會悄悄繞過 Max Plan 訂閱，改用綁定的 API key 計費，產生意料之外的 $152 額外收費。

這條 GitHub issue (#39903) 的標題已經說明一切：「Max Plan subscribers billed through API key when subagents dispatch」。

雙重計費的惡夢

更離譜的是 Double Billing 問題：每個請求同時被收一次 API 費用、再從預付 credits 扣一次。即係俾錢兩次，用一次。

帳號被停仍在計費

最慘的案例發生在一家 110 人公司：Anthropic 在毫無警告的情況下封鎖了全公司帳號，但 API key 繼續計費，錢照扣，服務卻完全無法使用。

計費陷阱的共同特點

縱觀這些事件，幾個共同模式顯而易見：

問題只在帳單出現時才被發現，用戶沒有預警機制
申訴程序繁瑣，Anthropic 客服通常先拒絕退款，要到輿論施壓才妥協
訂閱制與 API 計費混用，邊界模糊，容易出現意外跨界計費
用量上限設計不透明，用戶不清楚觸發超額收費的確切條件

三、替代方案：唔一定要死忠 Claude

好消息是，2026 年的 AI 市場已經是買方市場。你有真實可用的替代選項，而且部分在某些場景下已經超越 Claude。

OpenCode：免費 + 靈活的 BYOK 方案

OpenCode 是一個終端介面的 AI 編程助手，支援 75+ LLM 提供商，包括 Claude、GPT、DeepSeek、Gemini 等。關鍵優勢是 BYOK（Bring Your Own Key）——你直接用自己的 API key，完全透明，沒有平台層的計費黑盒。

OpenCode + DeepSeek V3 API 的組合每月成本大約 $5-15，已經可以完成大多數日常編程任務。

DeepSeek V3：性價比之王

DeepSeek V3 目前 API 報價約 $0.35/百萬 token，約為 Claude API 的 1/10。多項評測顯示 DeepSeek V3 在常規 coding 任務上達到 Claude Sonnet 95% 左右的水準。

對大多數不需要「大模型最前沿能力」的開發者來說，這個差距在實際使用中幾乎感受不到，但費用可以差十倍。

Gemini 2.5 Pro：免費額度可觀

Google Gemini 2.5 Pro 目前在 AI Studio 提供相當可觀的免費配額，在長上下文處理上表現突出，適合需要讀大量代碼庫的任務。

本地模型：零雲依賴

如果你有足夠的硬件（RTX 4090 或以上），Ollama + OpenCode 方案可以讓你完全在本地跑 Qwen3、Llama 4 等開源模型。一次性硬件投資換取長期零 API 費用，適合重度用戶。

多模型混用策略

最務實的做法不是「完全取代 Claude」，而是分層使用：

任務類型	推薦方案	月費估算
日常 coding、autocomplete	DeepSeek V3 API	$5-15
複雜架構決策、需要深度推理	Claude Opus（限量）	按量付費
長文件分析、代碼庫閱讀	Gemini 2.5 Pro	免費額度內
離線工作、私密代碼	本地 Qwen3/Llama 4	零成本

四、成本控制的實際操作

不管你決定繼續用 Claude 還是轉換，以下幾點操作建議可以立即執行：

1. 設置 Anthropic API spending limits 登入 console.anthropic.com，在 Billing 設置每月硬上限。沒有上限等於裸奔。

2. 開啟用量提醒 設置 80% 和 100% 用量警報，讓你在超支前有時間反應。

3. 用量監控腳本 用 Anthropic 的 Usage API 每日導出用量數據，追蹤哪些 agent/workflow 在燒錢。

4. Max Plan 與 API 不要混用同一帳號 目前已知多個計費 bug 都跟訂閱制與 API key 混用有關。如果同時使用兩種計費方式，最好用不同帳號隔離。

5. 記錄帳單截圖 遇到異常收費，第一步是截圖記錄，發 GitHub issue 比發 support ticket 有效——公開曝光往往才是促使 Anthropic 處理的真正驅動力。

結語：理性對待工具，而非信仰

Claude 仍然是目前最強的 coding 助手之一。降智事件有具體的技術原因，Anthropic 也已修復。但這一輪事件揭示了一個更深層的問題：當你的開發流程高度依賴一個商業 API，你就把業務風險外包給了對方的系統穩定性和計費誠信。

合理的做法是：

不要把 Claude 當成唯一工具，建立多模型備用方案
控制每月 API 上限，防止意外帳單
定期評估替代方案的性價比
公開分享帳單異常，幫助整個社群施壓

AI 工具市場競爭正在加劇。DeepSeek、Gemini、開源社群都在快速追趕。Claude 的地位不是理所當然的，Anthropic 需要用質量和誠信來維持用戶信任，而不是靠鎖定效應。

用你的訂閱費投票。