本章主题是 “计划模式(Plan Mode) — 从‘先做后看’到‘先看后做’”。本章深入分析了 Claude Code 如何通过一套完整的**“先规划、后执行”状态机**,解决 AI Agent 最大的风险——“写对了错误的东西”。
以下是该章节的核心内容总结:
1. 核心定位:意图对齐(Intent Alignment)
Plan Mode 的核心价值在于意图对齐:在 Agent 动手修改代码前,先让其探索代码库、制定计划并获得用户审批。这不仅是简单的提问,而是一套涉及权限切换、计划持久化和工作流管理的复杂系统。
2. 三个关键设计决策
权限作为行为约束:进入计划模式后,工具集被限制为只读。这并非仅靠提示词,而是通过权限系统在工具调用前进行拦截。
计划文件作为对齐载体:计划被写入磁盘(Markdown 文件),而非仅停留在对话中。这使得计划在上下文压缩后不会丢失,且支持用户在外部编辑器中直接修改。
状态机而非布尔开关:它包含进入、探索、审批、退出、恢复的完整转换链,并具备保存/恢复权限模式的能力。
3. 5阶段工作流与提示词注入
系统通过“附件消息”向模型注入行动指南,并采用 Full/Sparse 节流模式 优化 Token 成本:
Full 附件:包含完整的 5 阶段工作流指令(约 2000+ 字符),每 N 轮人类消息注入一次。
Sparse 附件:在非注入轮次仅提供一行提醒,节省空间。
不同工作流:外部用户通常使用标准的 5 阶段模式(先探索完再提交),而内部用户(Anthropic 员工)则使用 Interview 模式(边探索边提问,迭代完善)。
4. 计划文件的工程细节
命名机制:使用人类可读的词组 Slug(如 brave-fox.md)而非 UUID,并存放在全局目录中以防污染项目仓库。
路径防御:具备路径穿越防御,防止配置路径逃逸到项目根目录之外。
子 Agent 隔离:每个子 Agent 拥有独立的计划文件,避免相互覆盖。
5. 审批与安全防护
权限模式恢复:退出 Plan Mode 时会恢复进入前的权限(如 Auto 或 Default)。如果 Plan 期间触发了熔断器(如连续拒绝次数超限),系统会降级到安全默认值而非恢复 Auto 模式。
内外有别的行为校准:系统对内部和外部用户有不同的触发阈值。外部版本更倾向于“如果不确定就先计划”,而内部版则鼓励直接执行并针对性提问。
6. 核心设计模式提炼
本章总结了 5 种可复用的模式:
保存/恢复权限模式:确保受限操作结束后能精确回归原态。
计划文件作为载体:提升计划的持久性与外部协作性。
Full/Sparse 节流:在指令引导与 Token 成本之间取得平衡。
内外差异的行为校准:根据用户成熟度调整 Agent 的自主性。
状态转换防抖:通过单次消费标志处理快速切换模式产生的冲突。
总结: 展示了如何通过物理约束(权限)、持久化媒介(文件)和精细的状态转换逻辑,构建一个既高效又安全的人机对齐机制。

第五章 ClaudeCode先计划再执行
25分钟 ·
171·
0