给 AI 智能体套上工程缰绳

欢迎收听关于 Claude Harness（约束工程）架构设计的深度综述。本内容基于《Claude Code Book 1》与《Book 2 Comparing》两份核心技术文献，旨在为您解析如何通过严密的工程秩序将不稳定的模型驯化为可靠执行体的设计蓝图。

以下是为您整理的音频介绍文字，涵盖了 Claude 设计的核心要点与架构逻辑：

1. 核心设计哲学：系统优先，模型第二 (System First, Model Second)

Claude 的设计始于一个清醒的工程前提：模型是本质上不稳定的部件。因此，系统的重心不在于“包装人设”，而在于构建一套名为 Harness（束缚/装具） 的约束结构。Harness 的第一职责不是放大模型能力，而是确保模型在真实的终端和文件系统环境中“不乱来”，并在出故障时有能力接住残局。

2. 控制平面 (Control Plane)：Prompt 即协议

在 Claude 的架构中，Prompt 被定义为控制平面的一部分，而非简单的人格化文案。它像是一套运行时协议或“宪法”，通过分层拼装（托管、用户、项目、本地）来规定执行边界、失败行为和报告责任。这种设计确保了系统在处理复杂任务时，始终遵循既定的权力分配方式和工程约束。

3. 系统心跳：Query Loop 状态机

真正定义 Claude 作为“代理（Agent）”而非“问答接口”的核心，在于其 Query Loop（查询循环）。

连续性治理： 系统通过 queryLoop() 维护跨迭代的状态，包括消息序列、工具上下文和预算跟踪。

治理先于推理： 在调用模型之前，系统会执行大段的输入治理逻辑（如微压缩、上下文折叠、预算检查），确保输入环境的整洁。

4. 执行边界：受管工具与权限治理

Claude 不允许模型直接伸手去碰外部世界，所有工具都被视为受管执行接口。

调度纪律： 根据工具的并发安全性进行分组调度，确保上下文因果顺序的确定性。

权限语义化： 权限判定被拆分为 allow（允许）、deny（拒绝）与 ask（询问），明确了“意图理解”并不等于“获得授权”。

高风险治理： 对 Bash 等通用且危险的工具采取高密度约束，防止其滥用 Git 或修改关键配置。

5. 系统韧性：错误即主路径 (Error as Main Path)

Claude 将 Prompt Too Long 或 Token 截断等视为必然发生的系统周期，而非偶发异常。其恢复路径是分层的：

续写优于道歉： 截断后的最佳恢复通常是不道歉、不复述，直接利用 meta message 引导模型续写任务。

熔断机制： 自动压缩（Compact）等恢复动作具备计数与熔断机制，防止系统陷入无效重试的死循环。

6. 设计模式对比：运行时共和制 vs. 控制面立宪制

通过对比，Claude 代表了一种运行时优先的驯化路线（运行时共和制），强调“秩序住在运行时”，擅长现场救火与动态自愈。与之相对的 Codex 则更偏向显式控制层优先（控制面立宪制），强调规矩住在系统外沿的 Policy 与 Schema 中。

总结： 学习 Claude 的 Harness 工程，本质上是学习如何构建一个有克制、可预测且具备自愈能力的自动化系统。它告诉我们：在智能体时代，制度比聪明更重要，验证比自信更重要。