EP126 Agent Harness 🏇

EP126 Agent Harness 🏇

50分钟 ·
播放数2901
·
评论数12

同一个模型,为什么放在聊天框里只是“给建议”,放进 Claude Code / Codex / OpenCode 里却能读文件、改代码、跑测试,甚至完成真实任务?

这期我们聊 Agent Harness:模型之外那套决定 AI 能不能真正干活的工程系统。它像大模型的马具和操作系统,负责工具、权限、上下文、执行环境和结果验证。

别再只看模型了,真正让 Agent 变成产品的,可能是 Harness。

本shownotes由 castwise.ai 制作

Podwise - Podcast Knowledge at 10x Speed!

podwise.ai

Apple Store 下载👉🏻 apps.apple.com

硬地笔记

00:48 Agent Harness 的概念定义与核心作用

12:12 Harness 在工程实践中的管理范畴

23:36 AI Coding 作为大模型工程化的练兵场

33:42 模型能力与 Harness 生态的未来演进

欢迎关注我们

  • 知识星球:t.zsxq.com

  • 官网: hardhacker.com

  • 小手册: book.hardhacker.com

  • 用爱发电不容易,请我们喝咖啡☕️: afdian.net

  • 公众号/小红书: 硬地骇客

  • 商务合作: hardhackerlabs@gmail.com

  • 另外,现在加入「硬地骇客」会员服务,即可在会员专属的微信群与其他朋友一起畅所欲言,成为会员也是对我们持续更新最大的鼓励!

展开Show Notes
stay_ffxG
stay_ffxG
4天前
听完了 收获好多!!! 感觉harness+大模型有点像F1,大模型是核心动力单元,harness是发动机之外的东西,比如悬挂,空气动力学,策略团队这些。harness做好了,换个更强的模型就能直接提速(想要发挥更好,针对性的调教也是必要的)
閏秋
閏秋
2天前
不好意思纠正下Hermes中文是赫尔墨斯,使用的是神话故事https://baike.baidu.com/item/赫尔墨斯/2477152 不是爱马仕
0xSaito
:
巧合,名字起的挺好的
34:17 最近看到一个评测,Cursor+Opus最牛,其次是Claudecode+Opus,和Codex+GPT5.5
接下来Claudecode+GLM5.1
ningm03
ningm03
3天前
llm 是四驱车,herness 是曲棍,目的是按人的想法到达终点
张云锋
张云锋
1 天前
普通话不标准,听着真的好难受,儿化音好多呀
就躺平
就躺平
3天前
刚用上claw,harness又来了。大人,要累死了
钱新春
钱新春
2天前
把Claude Code源码不小心放出来的人就是所谓前AI时代的程序员,而不是训练模型的的算法研究员。 所以没必要太区分开来,只跟做事靠谱不靠谱有关系。
stay_ffxG
stay_ffxG
4天前
前排 哈哈哈
Dwight
Dwight
3天前
也是听了罗福莉那期才知道,原来insider是这么考虑问题的。因此什么是热点,什么是新高,什么是老概念,什么新能力,大致有个数。
晓琴Gin
晓琴Gin
4天前
感谢分享
Harness的定制化已经是不可避免的了