E03 Harness Engineering:驯服全知全能的AI,让它更靠谱After Prompt 码后炮

E03 Harness Engineering:驯服全知全能的AI,让它更靠谱

41分钟 ·
播放数308
·
评论数0

-本期简介-

大家好,欢迎收听和关注播客《Afterprompt 码后炮》,这是我们的第三期节目《Harness Engineering:驯服全知全能的AI,让它更靠谱》。从"AI全知全能但不可靠"的困境出发,四位主播深入探讨了Harness Engineering这个硅谷最新概念在营销领域的实战应用。这一期没有虚的理论,全是可以今晚就上手的实操方法——从15分钟搭建一个术语库,到用Skills让小红书再也不限流。

-人物介绍-

| Claire | 品牌和市场策略 | 品牌叙事、组织变革、全球化视野(WPP和甲方市场部leader) |

| Craig | 爆款内容操盘手 | AI 社区前沿、内容算法、用户增长、AI 审美(内容平台爆款内容) |

| Gaudi | 营销实操派 | 科研支撑、执行链路优化、营销管理和运营|

| 大脑呆 | 商业化与变现 | 流量变现、商业投资逻辑、广告逻辑 |

-时间轴-

00:0209:12 什么是Harness Engineering?从Prompt到Context到Harness的进化

Craig的核心观点:Harness是给AI套上的"可靠运行系统",不是新概念,而是新瓶装旧酒

技术演进路径:Prompt(教AI怎么说)→ Context(让AI看到什么)→ Harness(给AI一个可靠的运行系统)

LangChain案例:仅优化Harness,就把coding agent性能从TOP30提升到TOP5,大模型底层未变

OpenAI用Codec + Harness,五个月写了百万行代码,没有手打任何一行

Claude Code的泄露代码揭示:Harness在其中的核心作用——系统化注入、Skills体系、多层次上下文管理

09:1222:01 Harness的威力:行业前沿案例与营销人的困境

Loop Rough案例:辛普森一家里"永不放弃"的角色,让coding agent自主长时间运行、自己迭代验证。Y Combinator Hackathon,一夜生成6个GitHub仓库,只花290美元API费用。有人用它交付了价值5万美元的项目,TOKEN费用仅几百美元

Auto Research案例:Karpathy的项目,设定固定预算+固定指标,让AI永不停止地自我优化。Shopify CEO用37次迭代,让0.8B参数模型性能超过手动调优的1.6B模型

营销应用场景:数据追踪、数据报表、数据中台等都可以通过coding来解决

Gaudi的麦当劳类比:Harness就像快餐后厨的SOP系统——油锅、操作手册、监测表,确保每个人炸出的薯条都是标准的

22:0131:29 营销人的Harness实战:从概念到落地

隐性知识理论:波兰尼的"人知道的比说出来的多"——骑自行车会做但描述不出来

Craig的应对方法:

  • 通过成功案例而非语言描述来训练AI——"既然说不清楚,就把别人成功的案例给它"

  • 用数据和竞品结果反馈给AI,让AI自己发现规律

  • Skills作为核心工具:输入行业顶尖案例+实际数据,让AI自己计算什么样的标题/封面会有更好的数据

大脑呆的正反案例库方法:建立50个好案例+50个坏案例,告诉AI"这个网感太重""这图太丑",让AI自己学习边界

Stable Diffusion的Prompt + Unprompt机制:生图时告诉AI要出现什么和不出现什么

31:2940:16 如何开始:15分钟上手Harness

  • 最简单的起点 - 大脑呆的术语库案例

  • 背景:ToB客户比稿,50多页方案中"挖掘机"每次AI翻译都不同

  • 解决方案:15-20分钟建立MD文档术语库,统一所有专业术语的标准翻译

  • 操作步骤: 1. 让AI列出所有重复中文术语及其翻译 2. 对照客户官网、新闻、社交媒体选定标准词汇 3. 建立一层架构的MD文档(无需复杂格式)

Craig的Skills升级案例:

  • 用Claude的"create a skills"功能,2分钟创建基础skills

  • 将小红书社区规范全篇复制到skills中

  • 结果:小红书再也没有限流

  • 核心:持续迭代反馈,skills才会真正好用

可迁移vs不可迁移的知识:

  • 可迁移:底层逻辑、转化漏斗模型、通识性文案规律

  • 不可迁移:具体话术、情感性表达、品类特点

  • Skills.md(总述)+ Reference.md(不同行业参考)的工程化解决方案

40:16 ‒ 结尾 核心建议与未来展望

何时需要Harness:一天重复三次以上、特别占时间、特别烦的工作

时间成本:15分钟建术语库,2分钟创建Skills(+5-6分钟AI计算时间)

关键挑战:

  • 营销的标准制定者多元:客户、老板、用户、总部、平台

  • 隐性知识的显性化:不能再把锅甩给AI,沟通不清楚责任在人

  • 把心里知道的规则说出来:以前可以说对方不理解,现在面对"全知全能"的AI必须说清楚

Craig的阶级论:用了Harness的人产出量会远超只用DeepSeek的人——"富人恒富,穷人恒穷"

1.01的365次方 vs 0.99的365次方:不要纠结概念,从自己的需求出发,让AI做得更多

核心资产转变:未来每个公司最宝贵的资产是上下文和上下文的记忆

-节目中提到的工具 & 资源-

Harness相关技术与工具

LangChain — AI框架公司,通过优化Harness将编码agent性能从TOP30提升至TOP5

Claude Code — Anthropic产品,代码泄露后显示了Harness的核心应用(系统化注入、Skills、上下文管理)

Loop Rough — 辛普森一家角色命名的技术,让coding agent自主长时间运行、自我迭代验证

Auto Research — Karpathy项目,设定固定预算和指标让AI永不停止地自我优化

Skills — Claude内置功能,渐进式披露机制,可创建垂直领域知识库

Create a Skill — Claude新功能,帮助用户创建Skills的Skills,2分钟可生成基础版本

AI模型与平台

Claude / Claude Code — 主力推荐模型,内置Harness机制

Codec — OpenAI研发的代码模型,配合Harness五个月写百万行代码

DeepSeek — 国内低成本模型选项

Stable Diffusion — 早期生图工具,使用Prompt + Unprompt机制

文档与格式

Markdown.md — AI友好的文档格式,省TOKEN且结构化,用于建立术语库、Skills等

Skills.md — 记载通识性内容的总述文档

Reference.md — 记载不同行业参考资料的文档

-概念速查-

Harness Engineering — 给AI套上的可靠运行系统,是Prompt和Context的进阶版。通过设定边界、反馈机制、运行规则,让AI在约束下产生更可靠、更符合预期的结果。本质是"新瓶装旧酒",将软件工程中的约束机制应用于AI

Context Engineering — 让AI看到什么,给AI提供框架式内容,让AI在知道框架后给出更确切的答案

Skills — Claude中的垂直领域知识库系统,属于Harness的一种。采用渐进式披露机制,用到什么才披露相应规则。可以包含行业案例、数据反馈、执行标准等

Loop Rough — 以《辛普森一家》角色命名的Harness技术,让AI coding agent能够自主长时间运行、自我迭代、自我验证,直到任务完成。可在睡觉时持续工作

Auto Research — Karpathy开发的Harness项目,设定固定预算和指标后,让AI永不停止地自我优化实验。Shopify CEO用37次迭代让0.8B参数模型性能超过1.6B手动调优模型

渐进式披露 — Skills的核心机制,只在用到某个规则时才披露该规则,避免一次性加载所有信息。类似于"If-Then"逻辑

隐性知识(Tacit Knowledge)— 波兰尼提出的概念:人知道的比能说出来的多得多。例如会骑自行车但无法描述如何保持平衡。Harness的核心挑战之一就是将隐性知识显性化

Markdown(.md)— AI阅读友好的文档格式,用符号代替格式(如***代表一级标题),省TOKEN且结构化。相当于"AI版的操作指南"

上下文记忆 — 个人工作经验和skills的总和,是公司未来最宝贵的资产。Harness帮助将个人经验沉淀为组织经验

品牌营销 vs 效果营销的Harness差异 — 效果营销有确定性结果和数据反馈,适合建立反馈循环;品牌营销有明确的"错误"(如事实不正确),但评判标准更多元

可迁移 vs 不可迁移知识 — 可迁移:底层逻辑、转化模型、通识性文案规律;不可迁移:具体话术、情感表达、品类特点。Harness需要用Skills.md(总述)+ Reference.md(行业参考)来分别管理

1.01的365次方 vs 0.99的365次方 — Craig的核心理念:每天进步一点点(1.01)和退步一点点(0.99),一年后差距巨大。强调持续使用和优化Harness的复利效应

「本期节目由声湃提供录音场地」,感谢大力支持。

欢迎各位扫码加入我们的飞书社群

(社群中将分享大脑袋的Markdown术语库文档和Craig的"set your skills"的skills链接)