EP107：顶尖智能体工程师正通过Harness Engineering拉开差距

继“上下文工程”之后，AI领域正迎来下一个热词——“驾驭工程”（Harness Engineering）。这不仅仅是又一个技术流行语，在本期节目中，嘉宾 Cole Medin 将为你揭示，它为何是顶级AI工程师必须掌握的新思维，以及如何通过构建外部框架，彻底改变你与AI智能体的协作方式。

当AI编程助手犯错时，你的第一反应是抱怨模型不够智能，然后无奈等待下一个版本吗？Cole Medin 指出，这正是普通工程师与顶尖工程师的分水岭。他认为，“驾驭工程”的核心是一种主动夺权的思维模式：将每一次失误都视为改进系统的机会。通过构建一个包含规则、技能和钩子（hooks）的“AI层”，你可以为AI智能体打造一个不断进化的外部框架，让它在你的调教下越用越聪明，最终实现将复杂任务拆解，让多个AI智能体自动化协作的终极目标。

您将了解到：

“上下文工程”已经过时？为什么说“驾驭工程”才是顶级AI工程师必须掌握的新思维？
当AI编程助手犯错时，除了等待下一个模型版本，你还能做什么来夺回主动权，让它越用越聪明？
如何将复杂的开发需求拆解，让多个AI智能体分工协作，并自动化地完成从规划、编码到审查的全过程？

💡时点内容 | Key Topics

* [01:35] Harness Engineering定义：Cole Medin将Harness Engineering定义为给大模型构建一个外部框架（wrapper），并指出这是对“context engineering”的直接演进。他认为，任何AI智能体都是底层模型与此框架的结合，该框架为模型提供了必要的工作流程，是理解和应用AI智能体的核心。

* [02:10] Harness的双重层次：Cole Medin阐述了Harness Engineering的两个层面。他指出，第一层是工具自带的预设框架，而第二层“AI层”才是用户可以构建的。他强调，构建这个包含规则、技能、钩子等组件的AI层比选择工具更重要，因为它定义了智能体的核心上下文和流程。

* [05:06] 从上下文到驾驭的演进：Cole Medin分析了Harness Engineering从Context Engineering的演进，并指出其核心区别。他认为，真正的进化在于“控制”，即编排多个代理会话，以及思维模式的转变：不再将智能体犯错归咎于模型，而是将其视为改进整个驾驭系统的机会。

* [08:36] 系统演进的思维模式：Cole Medin强调Harness Engineering的核心是一种“系统演进”的思维模式。他指出，工程师不应在智能体犯错时等待模型更新，而应主动夺回主导权。他认为，关键在于将每次失误都视为改进驾驭系统的机会，通过更新钩子或技能，让系统不断迭代。

* [12:07] AI层的实践应用：Cole Medin分享了构建AI层的具体实践，重点介绍了技能和钩子。他建议将规划、实施和验证拆分为独立技能以提高效率。同时，他展示了如何使用钩子增强安全性，如在工具调用前检查，或在任务完成后自动运行测试，强制智能体迭代。

* [15:38] 驾驭工程的终极形态：Cole Medin揭示了Harness Engineering的终极形态：编排多个代码智能体任务。他指出，将巨大任务丢给单个智能体会失败。他认为，关键在于将大任务拆解，为每个智能体分配高度专注的子任务，如规划、执行、审查等，并通过自动化工作流串联它们。

* [19:08] 自动化编排：RALPH循环：Cole Medin以“RALPH Loop”为例，展示了如何自动化编排多个智能体。他介绍称，该系统能接收复杂需求，自动拆分为小任务，然后依次启动编码智能体处理。他强调，系统会持续迭代直到所有需求都实现并通过验证，这代表了智能体工程的未来。

本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来怪怪的。如想了解更多信息，请关注微信公众号"AI西经东译"获取AI最新资讯。如有后续想要听的其他外文播客，也欢迎联系微信：mayday2303。