从 Agent 到代码:Claude Code 编排模型的演进
本文灵感来自 riba2534 的这篇推文,文章对 Claude Code 的 Dynamic Workflows 做了详细的分析。本文在此基础上补充两点:一是用一条清晰的演进线把 Agent / Subagent / Skill / Agent Teams / Workflow 串起来,二是用开源项目 bmad-automator 作为"中间态"的活样本来对比。
一句话总结整篇文章
Dynamic Workflows 做的事情,就是把原来主会话里 Claude 的决策逻辑,从"脑子里想的"变成"写在文件里的",最后变成"机器跑的"。 每一步都是把 Claude 从循环里多退出一层。
Claude Code 编排能力的四层演进
在理解 Workflow 之前,得先看清 Claude Code 现有的几层协作能力是怎么一步步叠加的。
第一层:单会话(Session)
最底层。一个 Claude 实例从头干到尾,串行处理所有任务。你问一句它答一句,工具调用也是排队的。
Claude 的角色:唯一的执行者 + 决策者。
第二层:Subagent
主 Agent 派生出若干小弟去搜文件、读代码、跑命令,干完把结果汇报回来。小弟的生命周期很短,任务结束就消失。
Claude 的角色:决策者 + 调度者。每一步"派谁去干什么"都由 Claude 实时决定,小弟的结果要回到 Claude 的上下文窗口,它读完才能决定下一步。
第三层:Agent Teams
多个独立的 Claude Code 实例像团队一样并行协作,队员之间还能互相通信。适合"开会讨论"式的任务,比如前端和后端同时开工。
Claude 的角色:团队中的一员,但每个成员都有自己的上下文。协调成本随人数上升。
第四层:Dynamic Workflows
这一次 Claude 不再亲自逐轮调度。它先把整个编排过程写成一段 JavaScript 脚本——循环、分支、中间结果的收集全都固化在代码里——再交给一个独立的运行时去执行。
Claude 的角色:脚本作者。写完就"去睡觉"了,只有最终结果才把它叫醒。
这四层的共同瓶颈,以及 Workflow 怎么突破它
前三层有一个共同的瓶颈:编排者始终是 Claude 本身。
它逐轮决策下一步派谁去干什么,每一个 subagent 的返回结果都要回到 Claude 的上下文窗口里。这套机制在任务规模不大时很灵活,可一旦要协调几十上百个并行任务:
- 上下文窗口装不下那么多中间结果
- Claude 的注意力被海量过程信息稀释
- 编排逻辑是临时的,下次还得重新来
Workflow 换了个思路:脚本自己持有循环、分支和中间结果,Claude 的上下文里只剩下最后那个答案。
用一句话概括这个分工:
JavaScript 运行时当指挥(无脑、确定性),在
agent()点临时雇 LLM 干活,主 Agent 全程在睡觉,只在最后被叫醒读结果。
bmad-automator:第二层的"标准化版本"
在理解了这条演进线之后,开源项目 bmad-automator 提供了一个"中间态"样本。
它是什么
bmad-automator 是一个 BMAD(AI 驱动的敏捷开发方法论)的编排工具,自动化了 story 的完整开发循环:
创建故事 → 实现故事 → (可选) 测试生成 → 对抗性代码审查 → 提交验证 → 触发回顾
它的编排模型
核心循环是:
Claude (编排者) → spawn tmux 子会话 (subagent) → 读回监控结果 → 决定下一步 → 再 spawn
具体来说:
- 编排者:Claude 自身,按预定义的 step 文件(markdown)逐步执行
- 子任务:通过
tmuxspawn 独立的 Claude 或 Codex 会话 - 状态管理:markdown state doc +
sprint-status.yaml - 验证门控:review 完成不靠子任务退出判断,而是验证 sprint-status 的实际状态
它在演进线上的位置
bmad-automator 停在第二层——subagent 的标准化封装。它做了两件有价值的事:
- 把 subagent 的使用方式标准化:不是每次临场让 Claude 现想怎么派活,而是预定义好了步骤、状态格式、监控协议
- 做成可复用的 skill 插件:安装后一条命令就能跑整个 BMAD story 循环
但它本质上还是 Claude 自己在当运行时——读 step 文件、spawn tmux、等结果、更新状态,每一步 Claude 都"醒着"。
三种编排模型的直接对比
把 bmad-automator 放进对比表格里,三种模型放在一起比较:
| 维度 | bmad-automator (Subagent+) | Dynamic Workflows | 纯 Agent Teams |
|---|---|---|---|
| 编排者 | Claude 自身(按 step 文件执行) | JS 运行时(无脑确定性执行) | 多个 Claude 实例协作 |
| 控制流载体 | Markdown step 文件 + Python CLI | 图灵完备的 JavaScript | Claude 的实时决策 |
| 子任务执行 | tmux 独立会话 | agent() spawn subagent |
团队成员各自工作 |
| 中间结果 | 回到编排者上下文 | 留在脚本变量里,不回主上下文 | 各成员各自持有 |
| 可跨会话恢复 | 支持(state doc 持久化) | 不支持(退出后从头跑) | 不支持 |
| 可复用性 | 安装为 skill 插件 | 存为 /slash-command |
无 |
| 适用场景 | 标准化的固定流水线 | 一次性大规模并行任务 | 需要讨论协作的任务 |
| 混合 agent | 同一编排里混用 Claude/Codex | 所有 subagent 同模型 | 每个成员独立配置 |
关键洞察:Dynamic Workflows 的本质
看到这里,结论已经很清楚了:
Dynamic Workflows 不是什么新发明,它是把主会话里 Claude 本来就在做的事,变成了代码。
演进路径:
- 纯 agent:Claude 临场发挥,每轮自己决定怎么走
- 标准化 subagent(bmad-automator):把流程写成 step 文件,Claude 按步骤执行——还是 Claude 当运行时,只是不再临场发挥
- Dynamic Workflow:把同样的流程写成 JS——换 JS 运行时执行,Claude 彻底退出
每一步做的事情都一样:编排任务、派发子任务、收集结果、决定下一步。区别只在于谁来干这件事。
- 第 1 步:Claude 的脑子
- 第 2 步:Claude 的脑子 + step 文件当指南
- 第 3 步:JS 运行时,Claude 只在节点内部干活
那 bmad-automator 还有价值吗?
当然有。它解决的是 Dynamic Workflows 还没解决的问题:
- 跨会话持久化:state doc 写在磁盘上,退出 Claude Code 后下次能 resume。Workflow 目前做不到。
- 领域专用优化:不需要每次让 Claude 现编编排脚本,BMAD 的流程已经固化和测试过了。
- 混合 agent 支持:同一个编排里可以根据任务复杂度混用 Claude 和 Codex,Workflow 目前所有 subagent 用同一个模型。
- 验证门控:review 完成不是靠子任务退出判断,而是验证
sprint-status.yaml的实际状态——这种领域知识不容易被通用编排引擎自动处理。
但它也面临一个天然的扩展性问题:所有中间结果都回到编排者上下文。当 story 数量多、子任务输出大时,编排者 Claude 的上下文会被撑满——这正是 Dynamic Workflows 要解决的问题。
两个绕不开的问题
把编排逻辑从 Claude 脑子里搬到代码里,换来的是可扩展性和上下文效率。但这个 tradeoff 有两面,两个问题必须直面。
问题一:脚本是 agent 写的,会不会有 bug?
当然会。 riba2534 在自己的实践案例里就踩了——第一次跑直接报 TypeError: undefined is not an object,路径没传对。
Workflow 目前的应对手段都是"事后补救":
- 脚本可见可编辑:跑之前能审,跑的时候
Ctrl+G能打开改 - journal 缓存 + resumeFromRunId:改完重跑,前面跑对的部分不重跑,不重复花钱
- schema 自动校验:
agent()可以配 schema,输出不匹配会自动重试
但这些手段本质上都是靠人来兜底。脚本写得对不对,取决于 Claude 那一次生成的质量。在复杂流程里,循环条件写错、分支遗漏、schema 定义不精确——这些都是真实的 bug 来源。
相比之下,bmad-automator 的 step 文件不存在这个问题。Step 文件是人写好、测试过、固化下来的,Claude 只是机械执行,不负责发明编排逻辑。你不会因为"Claude 今天状态不好"就拿到一个有 bug 的编排流程。
问题二:流程写死了,agent 执行报错怎么办?
这是更根本的问题。
在原来的主会话模式里,Claude 是个实时决策者:
- 子任务失败了 → Claude 看报错 → 调整方案 → 换个思路重试
- 发现预料之外的情况 → Claude 临时改计划
- 某个环节走不通 → Claude 可以回退、换路、甚至放弃
这种"临场应变"能力,在 Workflow 里被 JS 运行时的确定性替代了。脚本只能执行预定义的逻辑。
当然,JS 本身能写 retry、try-catch、while 循环,比如那个"一直找 bug 直到连续两轮没有新增"的循环模式。但这只能处理你预见到的失败模式。没预见到的呢?脚本就卡住了,要么挂掉,要么等你人工介入。
这是"确定性编排"和"灵活应变"之间的根本 tradeoff:
| Subagent 模式 | Dynamic Workflow | bmad-automator | |
|---|---|---|---|
| 编排灵活性 | 高(Claude 实时调整) | 低(只能跑预定义逻辑) | 中(固定流程 + Claude 有限应变) |
| 可扩展性 | 低(上下文会爆) | 高(中间结果不回主上下文) | 中(受编排者上下文限制) |
| 适应未知失败 | 能 | 不能 | 有限度能 |
| 脚本 bug 风险 | 无(没有脚本) | 有(agent 现写) | 无(人写且固化) |
这也是为什么 bmad-automator 对 BMAD 这种流程高度标准化的场景特别合适——不需要太多临场应变,step 文件已经覆盖了所有正常和异常路径。
最后的判断
riba2534 在文章末尾有一段判断我很认同:
一年之内,这套"模型现写编排脚本、再调度一支 agent 舰队"的打法,会从某一家的研究预览,长成几乎所有 coding agent 的标配。
但我补充一点:标准化的领域流水线(像 bmad-automator)不会消失,它会迁移到 Workflow 的载体上。当 Workflow 支持跨会话恢复和更灵活的 agent 配置时,BMAD 的 step 文件自然会变成一段 JS 脚本——编排逻辑不变,只是运行时从 Claude 换成了 JS。
到那时候,演进就完成了:从 agent 到代码,从临时决策到持久化程序。
原文地址: https://www.cveoy.top/t/topic/qGLV 著作权归作者所有。请勿转载和采集!