Harness Engineering：AI智能体约束工程指南

当 AI 可以无限生成代码，软件开发的稀缺资源不再是实现，而是人类的时间、注意力，以及模型的上下文窗口。OpenAI 的 Ryan Lopopolo 提出了一种新范式——“底座工程”（Harness Engineering）：工程师从“键盘上的双手”转变为系统设计师和委派者，为AI智能体搭建环境、规则和工具集，让智能体独立完成从编码、测试到部署的全链路。

本期内容将带你走进这场软件工程革命。你会看到，为什么代码不再是瓶颈；如何通过技能封装、垃圾回收日和 ADRs 显性化规则，让 AI 智能体产出稳定高质量的结果；以及为何工程师应该追求“挂机”开发——让智能体在通勤时自动跑通测试。这不仅是效率提升，更是对开发者角色的根本重塑。

底座工程不是让 AI 写更多代码，而是通过构建高度结构化、可预测且具备自愈能力的开发环境，将 AI 从一个需要手把手教的初级程序员，变成一个可以委派复杂任务的全职软件工程师。代码免费的时代，你的真正价值在于设计那个“底座”。

参考：

以下为主要内容的图文介绍：

🧠 核心哲学：代码免费，实现不再是稀缺资源

范式转移：随着 GPT-5.2 等大模型能力的飞跃，实现（Implementation）的成本已趋近于零。代码可以自由生成、重构、删除。
工程师角色的转变：从“敲代码的双手”变为系统思想家、设计者和委派者。你的核心工作是消除智能体的阻碍，建立能让它高效运作的结构。
真正稀缺的资源：变成了人类的时间与注意力，以及模型的上下文窗口。

🔧 底座工程的三大策略

上下文管理：上下文会逐渐被“调出”，因此需要通过评审员智能体（reviewer agent）或自动化机制持续刷新上下文，确保模型始终拥有正确的信息。
非功能性需求的显性化：智能体需要明确的指令来理解“高质量”。通过编写 ADRs（架构决策记录）、Persona 文档和详细的 QA 计划，将人类专业知识固化为智能体可执行的准则。
通过 Lint 和测试实施约束：使用定制化Lint规则（如限制文件行数、强制网络请求重试）来约束智能体的输出，保证交付质量的一致性。

⚙️ 操作实践：从技能封装到垃圾回收

技能（Skills）驱动：不提供数十个琐碎工具，而是封装成5-10个高质量“技能”，隐藏底层复杂性。例如一个“添加新API端点”的技能，内部自动处理路由、验证、测试等。
垃圾回收日：每周固定时间（如周五）分析智能体在 PR 中产生的“废料”（slop），通过改进文档或Lint规则，从制度上彻底消除此类错误，形成自我修复循环。
标准化代码库：统一的编程语言、工具库和结构，使 Token 消耗更可预测，提升智能体执行效率。
并行与自动化：利用智能体无限并行的能力，处理低优先级任务或大规模代码迁移（例如将整个代码库从 A 框架迁移到 B 框架）。

🚀 未来愿景：全自动化工作流

挂机开发：工程师只需设定 Token 预算、优先级和成功指标，智能体便能独立、持续地推进产品开发。
摆脱同步驱动：Ryan 展示了在通勤时通过笔记本挂载，让智能体自动迭代代码直到测试通过。人类不再需要实时监控。
终极目标：让代码生产无限且高效，将人类从繁琐的开发循环中彻底解脱出来。