從 Claude Code Dynamic Workflows 睇 Agent 協作的未來
2026 年的今天,如果你仲以為 AI agent 只係「用 ChatGPT 幫手寫 email」,你已經 out 咗。真正嘅 frontier 係 agent orchestration——唔係一個 agent 做一件事,而係幾十個 agent 組成動態 workflow,互相溝通、分工、糾錯,甚至自己定義自己嘅任務。聽落好科幻?我哋 team 過去半年用 Claude Code Dynamic Workflows 做咗三個實戰 project:一個 75 萬行 Rust codebase 嘅重構、一個用 factory-factory 模式嘅平行開發實驗、仲有一個叫 isomux 嘅多 agent 辦公室系統。結果係點?agent 協作唔單止可行,仲可能係未來三年軟件開發最大嘅范式轉移。
動態 Workflow 點樣唔同曬
傳統嘅 AI coding 工具係「你問一句,佢答一句」。你畀一個 prompt,佢生成一段 code,你 copy-paste,loop。呢種模式叫 static workflow——每一步都係人決定,agent 只係被動嘅 code generator。Claude Code Dynamic Workflows 嘅突破在於:agent 可以自己定義執行路徑。你畀一個 high-level goal,例如「refactor 呢個 module」,系統會自動拆解成幾十個 sub-task,分配畀唔同 agent 并行執行,然後匯總結果。唔係 chain-of-thought prompting,而係真係 running code。
我哋喺第一個 project——75 萬行 Rust codebase 重構——就體驗到呢種威力。舊 codebase 用咗五年,technical debt 堆積到幾乎無法維護。如果用傳統方法,一個 developer 改完要三個月,仲要 guarantee 引入新 bug。Dynamic Workflows 嘅做法係:定義一個「refactoring pipeline」,每個 agent 負責一個 module,同時運行十幾個 agent,每個 agent 做完自動跑 test suite,pass 咗先 merge。結果係點?六個星期完成主體重構,production incident 數字反而跌咗 40%。關鍵原理係:agent 之間唔係sequential,而係parallel with dependency resolution——A 改完嘅 interface,B 會自動 detect 並 adapt,唔使人手 sync。
factory-factory:讓 Agent 製造 Agent
第二個 project 更激進。我哋嘅假設係:如果 agent 可以寫 code,咁 agent 可唔可以設計 workflow?我哋開發咗一個叫「factory-factory」嘅系統——用一個 orchestrator agent 去生成其他 agent 嘅 configuration、prompt、同 tool set,然後 deploy 佢哋去做具體任務。
舉例:我哋需要一個「API 文檔自動更新」嘅 workflow。Orchestrator 收到 task 後,會先分析現有 codebase 嘅 API endpoints,然後設計三個 specialist agent:一個負責 parse source code 提取 signature,一個負責對比現有文檔找出 gap,一個負責生成更新內容再用自然語言寫 changelog。呢三個 agent 嘅 prompt、temperature、甚至 model 選擇都係 orchestrator 自己決定。我哋唔需要人手設計每個 agent——我哋只需要設計一個可以設計 agent 嘅 agent。
結果呢?呢個系統一個月處理咗 400 幾個 documentation task,準確率 94%,比起之前人手維護文檔嘅 78% 準確率高出成截。更重要嘅係,orchestrator 會自我迭代——如果某個 specialist agent 經常出錯,orchestrator 會自動調整佢嘅 prompt 或者限制佢嘅 scope,唔使人手介入。呢個係真正嘅 dynamic workflow:唔係預先寫死嘅 DAG,而係 runtime 生成、runtime 優化。
isomux:多 Agent 辦公室嘅現實形態
第三個 project 叫做 isomux,係一個實驗性嘅 multi-agent workspace。靈感嚟自現實辦公室——唔同角色嘅同事坐喺同一空間,各自做嘢,有需要時溝通。我哋喺一個 shared environment 入面 deploy 咗十幾個 agent,每個有唔同嘅「身份」:backend engineer、frontend engineer、QA、product manager、documentation writer。
PM agent 收到 feature request 後,會先寫 spec,然後 broadcast 畀 engineering agents。Engineering agents 各自評估 scope,回報 estimate。PM agent 根據 estimate 決定 assign 畀邊個,並 set deadline。開發過程中,QA agent 會 continuously run tests,發現 bug 直接開 ticket 畀對應嘅 engineer agent。成個流程冇人參與——agent 之間用一個 shared message bus 溝通,我哋只係監控。
呢個模式最大嘅挑戰唔係技術,而係「角色邊界」。初期我哋發現 frontend agent 成日越界去改 backend code,搞到 chaos。解決方法係引入一個「boundary agent」——專門負責 detect 同糾正 role violation。呢個經驗話畀我哋知:agent orchestration 唔單止要 efficient,仲要 disciplined。自由度太高反而會出事,適當嘅 constraint 同 check & balance 先係 scalable 嘅關鍵。
動態編排嘅核心教訓
總結三個 project,我得出幾個結論。
第一,dynamic workflow 嘅 killer feature 係 adaptive parallelism。Static pipeline 最大問題係 bottleneck——如果某一步慢咗,成條線等。Dynamic workflow 可以 runtime 調整資源分配,根據每個 sub-task 嘅複雜度動態決定 agent 數量同執行策略。喺 Rust 重構 project 入面,我哋試過某個 module 嘅 dependency graph 特別複雜,orchestrator 自動加咗三個 agent 去處理衝突,成個過程冇 human intervention。
第二,feedback loop 係靈魂。Agent 協作唔係單向嘅 task dispatch,而係不斷嘅雙向溝通。我哋發現 successful 嘅 workflow 都有一個共同特徵:agent 之間有 rich feedback mechanism——唔單止回報結果,仲回報 confidence level、suggested next steps、同 potential risks。呢種「meta-communication」先係智能協作同機械式 task execution 嘅真正分別。
第三,人都仲係需要,但角色變咗。以前我哋嘅 developer 寫 code、寫 test、寫文檔、做 code review。而家佢哋做嘅係:design workflow、define agent boundaries、review critical decisions。即係話,developer 從 executor 變咗做 architect。你唔再需要寫每一行 code,但你需要確保成個 system 嘅方向同 quality。
你應該點樣開始
如果你係香港嘅 startup founder 或者獨立 developer,我嘅建議好具體:
第一,唔好等完美。Claude Code Dynamic Workflows 已經 production-ready,factory-factory 嘅概念你可以用幾百行 code 實現。揀一個你 codebase 入面最痛嘅 task——例如 refactoring、文檔生成、或者 test coverage improvement——用呢啲工具去 automatic 咗佢。唔使一開始就做 multi-agent office,一個簡單嘅 two-step workflow 已經可以慳你每星期十幾個鐘。
第二,投資喺 observability。Agent 越多,debugging 越難。你一定要有 logging、tracing、同 metrics,睇到每個 agent 做咗咩、花咗幾耐、出咗咩錯。我哋用 OpenTelemetry + custom dashboard,每個 workflow run 都有完整嘅 audit trail。冇呢啲嘢,你唔會知道個 system 係 work 定係緊 random walk。
第三,設計 human-in-the-loop checkpoint。唔好一開始就 full autonomy。喺關鍵 decision point——例如 API redesign、database migration、production deployment——set checkpoint,要 human approve 先繼續。我哋初期試過 full autonomous deployment,結果一次錯嘅 migration 搞到 downtime 兩粒鐘。而家我哋嘅 policy 係:任何改 production 嘅 action 都要人 confirm,其他嘢可以自動。
Agent 協作嘅時代已經到咗。唔係 future,係 now。你準備好未?