-本期简介-
大家好,欢迎收听和关注播客《Afterprompt 码后炮》,这是我们的第三期节目《Harness Engineering:驯服全知全能的AI,让它更靠谱》。从"AI全知全能但不可靠"的困境出发,四位主播深入探讨了Harness Engineering这个硅谷最新概念在营销领域的实战应用。这一期没有虚的理论,全是可以今晚就上手的实操方法——从15分钟搭建一个术语库,到用Skills让小红书再也不限流。
-人物介绍-
| Claire | 品牌和市场策略 | 品牌叙事、组织变革、全球化视野(WPP和甲方市场部leader) |
| Craig | 爆款内容操盘手 | AI 社区前沿、内容算法、用户增长、AI 审美(内容平台爆款内容) |
| Gaudi | 营销实操派 | 科研支撑、执行链路优化、营销管理和运营|
| 大脑呆 | 商业化与变现 | 流量变现、商业投资逻辑、广告逻辑 |
-时间轴-
‒ 什么是Harness Engineering?从Prompt到Context到Harness的进化
Craig的核心观点:Harness是给AI套上的"可靠运行系统",不是新概念,而是新瓶装旧酒
技术演进路径:Prompt(教AI怎么说)→ Context(让AI看到什么)→ Harness(给AI一个可靠的运行系统)
LangChain案例:仅优化Harness,就把coding agent性能从TOP30提升到TOP5,大模型底层未变
OpenAI用Codec + Harness,五个月写了百万行代码,没有手打任何一行
Claude Code的泄露代码揭示:Harness在其中的核心作用——系统化注入、Skills体系、多层次上下文管理
‒ Harness的威力:行业前沿案例与营销人的困境
Loop Rough案例:辛普森一家里"永不放弃"的角色,让coding agent自主长时间运行、自己迭代验证。Y Combinator Hackathon,一夜生成6个GitHub仓库,只花290美元API费用。有人用它交付了价值5万美元的项目,TOKEN费用仅几百美元
Auto Research案例:Karpathy的项目,设定固定预算+固定指标,让AI永不停止地自我优化。Shopify CEO用37次迭代,让0.8B参数模型性能超过手动调优的1.6B模型
营销应用场景:数据追踪、数据报表、数据中台等都可以通过coding来解决
Gaudi的麦当劳类比:Harness就像快餐后厨的SOP系统——油锅、操作手册、监测表,确保每个人炸出的薯条都是标准的
‒ 营销人的Harness实战:从概念到落地
隐性知识理论:波兰尼的"人知道的比说出来的多"——骑自行车会做但描述不出来
Craig的应对方法:
通过成功案例而非语言描述来训练AI——"既然说不清楚,就把别人成功的案例给它"
用数据和竞品结果反馈给AI,让AI自己发现规律
Skills作为核心工具:输入行业顶尖案例+实际数据,让AI自己计算什么样的标题/封面会有更好的数据
大脑呆的正反案例库方法:建立50个好案例+50个坏案例,告诉AI"这个网感太重""这图太丑",让AI自己学习边界
Stable Diffusion的Prompt + Unprompt机制:生图时告诉AI要出现什么和不出现什么
‒ 如何开始:15分钟上手Harness
最简单的起点 - 大脑呆的术语库案例
背景:ToB客户比稿,50多页方案中"挖掘机"每次AI翻译都不同
解决方案:15-20分钟建立MD文档术语库,统一所有专业术语的标准翻译
操作步骤: 1. 让AI列出所有重复中文术语及其翻译 2. 对照客户官网、新闻、社交媒体选定标准词汇 3. 建立一层架构的MD文档(无需复杂格式)
Craig的Skills升级案例:
用Claude的"create a skills"功能,2分钟创建基础skills
将小红书社区规范全篇复制到skills中
结果:小红书再也没有限流
核心:持续迭代反馈,skills才会真正好用
可迁移vs不可迁移的知识:
可迁移:底层逻辑、转化漏斗模型、通识性文案规律
不可迁移:具体话术、情感性表达、品类特点
Skills.md(总述)+ Reference.md(不同行业参考)的工程化解决方案
‒ 结尾 核心建议与未来展望
何时需要Harness:一天重复三次以上、特别占时间、特别烦的工作
时间成本:15分钟建术语库,2分钟创建Skills(+5-6分钟AI计算时间)
关键挑战:
营销的标准制定者多元:客户、老板、用户、总部、平台
隐性知识的显性化:不能再把锅甩给AI,沟通不清楚责任在人
把心里知道的规则说出来:以前可以说对方不理解,现在面对"全知全能"的AI必须说清楚
Craig的阶级论:用了Harness的人产出量会远超只用DeepSeek的人——"富人恒富,穷人恒穷"
1.01的365次方 vs 0.99的365次方:不要纠结概念,从自己的需求出发,让AI做得更多
核心资产转变:未来每个公司最宝贵的资产是上下文和上下文的记忆
-节目中提到的工具 & 资源-
Harness相关技术与工具
LangChain — AI框架公司,通过优化Harness将编码agent性能从TOP30提升至TOP5
Claude Code — Anthropic产品,代码泄露后显示了Harness的核心应用(系统化注入、Skills、上下文管理)
Loop Rough — 辛普森一家角色命名的技术,让coding agent自主长时间运行、自我迭代验证
Auto Research — Karpathy项目,设定固定预算和指标让AI永不停止地自我优化
Skills — Claude内置功能,渐进式披露机制,可创建垂直领域知识库
Create a Skill — Claude新功能,帮助用户创建Skills的Skills,2分钟可生成基础版本
AI模型与平台
Claude / Claude Code — 主力推荐模型,内置Harness机制
Codec — OpenAI研发的代码模型,配合Harness五个月写百万行代码
DeepSeek — 国内低成本模型选项
Stable Diffusion — 早期生图工具,使用Prompt + Unprompt机制
文档与格式
Markdown.md — AI友好的文档格式,省TOKEN且结构化,用于建立术语库、Skills等
Skills.md — 记载通识性内容的总述文档
Reference.md — 记载不同行业参考资料的文档
-概念速查-
Harness Engineering — 给AI套上的可靠运行系统,是Prompt和Context的进阶版。通过设定边界、反馈机制、运行规则,让AI在约束下产生更可靠、更符合预期的结果。本质是"新瓶装旧酒",将软件工程中的约束机制应用于AI
Context Engineering — 让AI看到什么,给AI提供框架式内容,让AI在知道框架后给出更确切的答案
Skills — Claude中的垂直领域知识库系统,属于Harness的一种。采用渐进式披露机制,用到什么才披露相应规则。可以包含行业案例、数据反馈、执行标准等
Loop Rough — 以《辛普森一家》角色命名的Harness技术,让AI coding agent能够自主长时间运行、自我迭代、自我验证,直到任务完成。可在睡觉时持续工作
Auto Research — Karpathy开发的Harness项目,设定固定预算和指标后,让AI永不停止地自我优化实验。Shopify CEO用37次迭代让0.8B参数模型性能超过1.6B手动调优模型
渐进式披露 — Skills的核心机制,只在用到某个规则时才披露该规则,避免一次性加载所有信息。类似于"If-Then"逻辑
隐性知识(Tacit Knowledge)— 波兰尼提出的概念:人知道的比能说出来的多得多。例如会骑自行车但无法描述如何保持平衡。Harness的核心挑战之一就是将隐性知识显性化
Markdown(.md)— AI阅读友好的文档格式,用符号代替格式(如***代表一级标题),省TOKEN且结构化。相当于"AI版的操作指南"
上下文记忆 — 个人工作经验和skills的总和,是公司未来最宝贵的资产。Harness帮助将个人经验沉淀为组织经验
品牌营销 vs 效果营销的Harness差异 — 效果营销有确定性结果和数据反馈,适合建立反馈循环;品牌营销有明确的"错误"(如事实不正确),但评判标准更多元
可迁移 vs 不可迁移知识 — 可迁移:底层逻辑、转化模型、通识性文案规律;不可迁移:具体话术、情感表达、品类特点。Harness需要用Skills.md(总述)+ Reference.md(行业参考)来分别管理
1.01的365次方 vs 0.99的365次方 — Craig的核心理念:每天进步一点点(1.01)和退步一点点(0.99),一年后差距巨大。强调持续使用和优化Harness的复利效应
「本期节目由声湃提供录音场地」,感谢大力支持。
欢迎各位扫码加入我们的飞书社群
(社群中将分享大脑袋的Markdown术语库文档和Craig的"set your skills"的skills链接)

