EP107:顶尖智能体工程师正通过Harness Engineering拉开差距AI西经东译

EP107:顶尖智能体工程师正通过Harness Engineering拉开差距

23分钟 ·
播放数251
·
评论数0

继“上下文工程”之后,AI领域正迎来下一个热词——“驾驭工程”(Harness Engineering)。这不仅仅是又一个技术流行语,在本期节目中,嘉宾 Cole Medin 将为你揭示,它为何是顶级AI工程师必须掌握的新思维,以及如何通过构建外部框架,彻底改变你与AI智能体的协作方式。

当AI编程助手犯错时,你的第一反应是抱怨模型不够智能,然后无奈等待下一个版本吗?Cole Medin 指出,这正是普通工程师与顶尖工程师的分水岭。他认为,“驾驭工程”的核心是一种主动夺权的思维模式:将每一次失误都视为改进系统的机会。通过构建一个包含规则、技能和钩子(hooks)的“AI层”,你可以为AI智能体打造一个不断进化的外部框架,让它在你的调教下越用越聪明,最终实现将复杂任务拆解,让多个AI智能体自动化协作的终极目标。

您将了解到:

  • “上下文工程”已经过时?为什么说“驾驭工程”才是顶级AI工程师必须掌握的新思维?

  • 当AI编程助手犯错时,除了等待下一个模型版本,你还能做什么来夺回主动权,让它越用越聪明?

  • 如何将复杂的开发需求拆解,让多个AI智能体分工协作,并自动化地完成从规划、编码到审查的全过程?

💡时点内容 | Key Topics

* [01:35] Harness Engineering定义:Cole Medin将Harness Engineering定义为给大模型构建一个外部框架(wrapper),并指出这是对“context engineering”的直接演进。他认为,任何AI智能体都是底层模型与此框架的结合,该框架为模型提供了必要的工作流程,是理解和应用AI智能体的核心。

* [02:10] Harness的双重层次:Cole Medin阐述了Harness Engineering的两个层面。他指出,第一层是工具自带的预设框架,而第二层“AI层”才是用户可以构建的。他强调,构建这个包含规则、技能、钩子等组件的AI层比选择工具更重要,因为它定义了智能体的核心上下文和流程。

* [05:06] 从上下文到驾驭的演进:Cole Medin分析了Harness Engineering从Context Engineering的演进,并指出其核心区别。他认为,真正的进化在于“控制”,即编排多个代理会话,以及思维模式的转变:不再将智能体犯错归咎于模型,而是将其视为改进整个驾驭系统的机会。

* [08:36] 系统演进的思维模式:Cole Medin强调Harness Engineering的核心是一种“系统演进”的思维模式。他指出,工程师不应在智能体犯错时等待模型更新,而应主动夺回主导权。他认为,关键在于将每次失误都视为改进驾驭系统的机会,通过更新钩子或技能,让系统不断迭代。

* [12:07] AI层的实践应用:Cole Medin分享了构建AI层的具体实践,重点介绍了技能和钩子。他建议将规划、实施和验证拆分为独立技能以提高效率。同时,他展示了如何使用钩子增强安全性,如在工具调用前检查,或在任务完成后自动运行测试,强制智能体迭代。

* [15:38] 驾驭工程的终极形态:Cole Medin揭示了Harness Engineering的终极形态:编排多个代码智能体任务。他指出,将巨大任务丢给单个智能体会失败。他认为,关键在于将大任务拆解,为每个智能体分配高度专注的子任务,如规划、执行、审查等,并通过自动化工作流串联它们。

* [19:08] 自动化编排:RALPH循环:Cole Medin以“RALPH Loop”为例,展示了如何自动化编排多个智能体。他介绍称,该系统能接收复杂需求,自动拆分为小任务,然后依次启动编码智能体处理。他强调,系统会持续迭代直到所有需求都实现并通过验证,这代表了智能体工程的未来。

📺相关链接与资源

[视频来源]《Harness Engineering: What Separates Top Agentic Engineers Right Now》

本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来怪怪的。如想了解更多信息,请关注微信公众号"AI西经东译"获取AI最新资讯。如有后续想要听的其他外文播客,也欢迎联系微信:mayday2303。