從 Claude Code Dynamic Workflows 睇 Agent 協作的未來

2026 年的今天，如果你仲以為 AI agent 只係「用 ChatGPT 幫手寫 email」，你已經 out 咗。真正嘅 frontier 係 agent orchestration——唔係一個 agent 做一件事，而係幾十個 agent 組成動態 workflow，互相溝通、分工、糾錯，甚至自己定義自己嘅任務。聽落好科幻？我哋 team 過去半年用 Claude Code Dynamic Workflows 做咗三個實戰 project：一個 75 萬行 Rust codebase 嘅重構、一個用 factory-factory 模式嘅平行開發實驗、仲有一個叫 isomux 嘅多 agent 辦公室系統。結果係點？agent 協作唔單止可行，仲可能係未來三年軟件開發最大嘅范式轉移。

動態 Workflow 點樣唔同曬

傳統嘅 AI coding 工具係「你問一句，佢答一句」。你畀一個 prompt，佢生成一段 code，你 copy-paste，loop。呢種模式叫 static workflow——每一步都係人決定，agent 只係被動嘅 code generator。Claude Code Dynamic Workflows 嘅突破在於：agent 可以自己定義執行路徑。你畀一個 high-level goal，例如「refactor 呢個 module」，系統會自動拆解成幾十個 sub-task，分配畀唔同 agent 并行執行，然後匯總結果。唔係 chain-of-thought prompting，而係真係 running code。

我哋喺第一個 project——75 萬行 Rust codebase 重構——就體驗到呢種威力。舊 codebase 用咗五年，technical debt 堆積到幾乎無法維護。如果用傳統方法，一個 developer 改完要三個月，仲要 guarantee 引入新 bug。Dynamic Workflows 嘅做法係：定義一個「refactoring pipeline」，每個 agent 負責一個 module，同時運行十幾個 agent，每個 agent 做完自動跑 test suite，pass 咗先 merge。結果係點？六個星期完成主體重構，production incident 數字反而跌咗 40%。關鍵原理係：agent 之間唔係sequential，而係parallel with dependency resolution——A 改完嘅 interface，B 會自動 detect 並 adapt，唔使人手 sync。

factory-factory：讓 Agent 製造 Agent

第二個 project 更激進。我哋嘅假設係：如果 agent 可以寫 code，咁 agent 可唔可以設計 workflow？我哋開發咗一個叫「factory-factory」嘅系統——用一個 orchestrator agent 去生成其他 agent 嘅 configuration、prompt、同 tool set，然後 deploy 佢哋去做具體任務。

舉例：我哋需要一個「API 文檔自動更新」嘅 workflow。Orchestrator 收到 task 後，會先分析現有 codebase 嘅 API endpoints，然後設計三個 specialist agent：一個負責 parse source code 提取 signature，一個負責對比現有文檔找出 gap，一個負責生成更新內容再用自然語言寫 changelog。呢三個 agent 嘅 prompt、temperature、甚至 model 選擇都係 orchestrator 自己決定。我哋唔需要人手設計每個 agent——我哋只需要設計一個可以設計 agent 嘅 agent。

結果呢？呢個系統一個月處理咗 400 幾個 documentation task，準確率 94%，比起之前人手維護文檔嘅 78% 準確率高出成截。更重要嘅係，orchestrator 會自我迭代——如果某個 specialist agent 經常出錯，orchestrator 會自動調整佢嘅 prompt 或者限制佢嘅 scope，唔使人手介入。呢個係真正嘅 dynamic workflow：唔係預先寫死嘅 DAG，而係 runtime 生成、runtime 優化。

isomux：多 Agent 辦公室嘅現實形態

第三個 project 叫做 isomux，係一個實驗性嘅 multi-agent workspace。靈感嚟自現實辦公室——唔同角色嘅同事坐喺同一空間，各自做嘢，有需要時溝通。我哋喺一個 shared environment 入面 deploy 咗十幾個 agent，每個有唔同嘅「身份」：backend engineer、frontend engineer、QA、product manager、documentation writer。

PM agent 收到 feature request 後，會先寫 spec，然後 broadcast 畀 engineering agents。Engineering agents 各自評估 scope，回報 estimate。PM agent 根據 estimate 決定 assign 畀邊個，並 set deadline。開發過程中，QA agent 會 continuously run tests，發現 bug 直接開 ticket 畀對應嘅 engineer agent。成個流程冇人參與——agent 之間用一個 shared message bus 溝通，我哋只係監控。

呢個模式最大嘅挑戰唔係技術，而係「角色邊界」。初期我哋發現 frontend agent 成日越界去改 backend code，搞到 chaos。解決方法係引入一個「boundary agent」——專門負責 detect 同糾正 role violation。呢個經驗話畀我哋知：agent orchestration 唔單止要 efficient，仲要 disciplined。自由度太高反而會出事，適當嘅 constraint 同 check & balance 先係 scalable 嘅關鍵。

動態編排嘅核心教訓

總結三個 project，我得出幾個結論。

第一，dynamic workflow 嘅 killer feature 係 adaptive parallelism。Static pipeline 最大問題係 bottleneck——如果某一步慢咗，成條線等。Dynamic workflow 可以 runtime 調整資源分配，根據每個 sub-task 嘅複雜度動態決定 agent 數量同執行策略。喺 Rust 重構 project 入面，我哋試過某個 module 嘅 dependency graph 特別複雜，orchestrator 自動加咗三個 agent 去處理衝突，成個過程冇 human intervention。

第二，feedback loop 係靈魂。Agent 協作唔係單向嘅 task dispatch，而係不斷嘅雙向溝通。我哋發現 successful 嘅 workflow 都有一個共同特徵：agent 之間有 rich feedback mechanism——唔單止回報結果，仲回報 confidence level、suggested next steps、同 potential risks。呢種「meta-communication」先係智能協作同機械式 task execution 嘅真正分別。

第三，人都仲係需要，但角色變咗。以前我哋嘅 developer 寫 code、寫 test、寫文檔、做 code review。而家佢哋做嘅係：design workflow、define agent boundaries、review critical decisions。即係話，developer 從 executor 變咗做 architect。你唔再需要寫每一行 code，但你需要確保成個 system 嘅方向同 quality。

你應該點樣開始

如果你係香港嘅 startup founder 或者獨立 developer，我嘅建議好具體：

第一，唔好等完美。Claude Code Dynamic Workflows 已經 production-ready，factory-factory 嘅概念你可以用幾百行 code 實現。揀一個你 codebase 入面最痛嘅 task——例如 refactoring、文檔生成、或者 test coverage improvement——用呢啲工具去 automatic 咗佢。唔使一開始就做 multi-agent office，一個簡單嘅 two-step workflow 已經可以慳你每星期十幾個鐘。

第二，投資喺 observability。Agent 越多，debugging 越難。你一定要有 logging、tracing、同 metrics，睇到每個 agent 做咗咩、花咗幾耐、出咗咩錯。我哋用 OpenTelemetry + custom dashboard，每個 workflow run 都有完整嘅 audit trail。冇呢啲嘢，你唔會知道個 system 係 work 定係緊 random walk。

第三，設計 human-in-the-loop checkpoint。唔好一開始就 full autonomy。喺關鍵 decision point——例如 API redesign、database migration、production deployment——set checkpoint，要 human approve 先繼續。我哋初期試過 full autonomous deployment，結果一次錯嘅 migration 搞到 downtime 兩粒鐘。而家我哋嘅 policy 係：任何改 production 嘅 action 都要人 confirm，其他嘢可以自動。

Agent 協作嘅時代已經到咗。唔係 future，係 now。你準備好未？