-本期简介-

大家好，欢迎收听和关注播客《Afterprompt 码后炮》，这是我们的第三期节目《Harness Engineering：驯服全知全能的AI，让它更靠谱》。从"AI全知全能但不可靠"的困境出发，四位主播深入探讨了Harness Engineering这个硅谷最新概念在营销领域的实战应用。这一期没有虚的理论，全是可以今晚就上手的实操方法——从15分钟搭建一个术语库，到用Skills让小红书再也不限流。

-人物介绍-

| Claire | 品牌和市场策略 | 品牌叙事、组织变革、全球化视野（WPP和甲方市场部leader） |

| Craig | 爆款内容操盘手 | AI 社区前沿、内容算法、用户增长、AI 审美（内容平台爆款内容） |

| Gaudi | 营销实操派 | 科研支撑、执行链路优化、营销管理和运营|

| 大脑呆 | 商业化与变现 | 流量变现、商业投资逻辑、广告逻辑 |

-时间轴-

00:02 ‒ 09:12 什么是Harness Engineering？从Prompt到Context到Harness的进化

Craig的核心观点：Harness是给AI套上的"可靠运行系统"，不是新概念，而是新瓶装旧酒

技术演进路径：Prompt（教AI怎么说）→ Context（让AI看到什么）→ Harness（给AI一个可靠的运行系统）

LangChain案例：仅优化Harness，就把coding agent性能从TOP30提升到TOP5，大模型底层未变

OpenAI用Codec + Harness，五个月写了百万行代码，没有手打任何一行

Claude Code的泄露代码揭示：Harness在其中的核心作用——系统化注入、Skills体系、多层次上下文管理

09:12 ‒ 22:01 Harness的威力：行业前沿案例与营销人的困境

Loop Rough案例：辛普森一家里"永不放弃"的角色，让coding agent自主长时间运行、自己迭代验证。Y Combinator Hackathon，一夜生成6个GitHub仓库，只花290美元API费用。有人用它交付了价值5万美元的项目，TOKEN费用仅几百美元

Auto Research案例：Karpathy的项目，设定固定预算+固定指标，让AI永不停止地自我优化。Shopify CEO用37次迭代，让0.8B参数模型性能超过手动调优的1.6B模型

营销应用场景：数据追踪、数据报表、数据中台等都可以通过coding来解决

Gaudi的麦当劳类比：Harness就像快餐后厨的SOP系统——油锅、操作手册、监测表，确保每个人炸出的薯条都是标准的

22:01 ‒ 31:29 营销人的Harness实战：从概念到落地

隐性知识理论：波兰尼的"人知道的比说出来的多"——骑自行车会做但描述不出来

Craig的应对方法：

通过成功案例而非语言描述来训练AI——"既然说不清楚，就把别人成功的案例给它"
用数据和竞品结果反馈给AI，让AI自己发现规律
Skills作为核心工具：输入行业顶尖案例+实际数据，让AI自己计算什么样的标题/封面会有更好的数据

大脑呆的正反案例库方法：建立50个好案例+50个坏案例，告诉AI"这个网感太重""这图太丑"，让AI自己学习边界

Stable Diffusion的Prompt + Unprompt机制：生图时告诉AI要出现什么和不出现什么

31:29 ‒ 40:16 如何开始：15分钟上手Harness

最简单的起点 - 大脑呆的术语库案例
背景：ToB客户比稿，50多页方案中"挖掘机"每次AI翻译都不同
解决方案：15-20分钟建立MD文档术语库，统一所有专业术语的标准翻译
操作步骤： 1. 让AI列出所有重复中文术语及其翻译 2. 对照客户官网、新闻、社交媒体选定标准词汇 3. 建立一层架构的MD文档（无需复杂格式）

Craig的Skills升级案例：

用Claude的"create a skills"功能，2分钟创建基础skills
将小红书社区规范全篇复制到skills中
结果：小红书再也没有限流
核心：持续迭代反馈，skills才会真正好用

可迁移vs不可迁移的知识：

可迁移：底层逻辑、转化漏斗模型、通识性文案规律
不可迁移：具体话术、情感性表达、品类特点
Skills.md（总述）+ Reference.md（不同行业参考）的工程化解决方案

40:16 ‒ 结尾核心建议与未来展望

何时需要Harness：一天重复三次以上、特别占时间、特别烦的工作

时间成本：15分钟建术语库，2分钟创建Skills（+5-6分钟AI计算时间）

关键挑战：

营销的标准制定者多元：客户、老板、用户、总部、平台
隐性知识的显性化：不能再把锅甩给AI，沟通不清楚责任在人
把心里知道的规则说出来：以前可以说对方不理解，现在面对"全知全能"的AI必须说清楚

Craig的阶级论：用了Harness的人产出量会远超只用DeepSeek的人——"富人恒富，穷人恒穷"

1.01的365次方 vs 0.99的365次方：不要纠结概念，从自己的需求出发，让AI做得更多

核心资产转变：未来每个公司最宝贵的资产是上下文和上下文的记忆

-节目中提到的工具 & 资源-

Harness相关技术与工具

LangChain — AI框架公司，通过优化Harness将编码agent性能从TOP30提升至TOP5

Claude Code — Anthropic产品，代码泄露后显示了Harness的核心应用（系统化注入、Skills、上下文管理）

Loop Rough — 辛普森一家角色命名的技术，让coding agent自主长时间运行、自我迭代验证

Auto Research — Karpathy项目，设定固定预算和指标让AI永不停止地自我优化

Skills — Claude内置功能，渐进式披露机制，可创建垂直领域知识库

Create a Skill — Claude新功能，帮助用户创建Skills的Skills，2分钟可生成基础版本

AI模型与平台

Claude / Claude Code — 主力推荐模型，内置Harness机制

Codec — OpenAI研发的代码模型，配合Harness五个月写百万行代码

DeepSeek — 国内低成本模型选项

Stable Diffusion — 早期生图工具，使用Prompt + Unprompt机制

文档与格式

Markdown.md — AI友好的文档格式，省TOKEN且结构化，用于建立术语库、Skills等

Skills.md — 记载通识性内容的总述文档

Reference.md — 记载不同行业参考资料的文档

-概念速查-

Harness Engineering — 给AI套上的可靠运行系统，是Prompt和Context的进阶版。通过设定边界、反馈机制、运行规则，让AI在约束下产生更可靠、更符合预期的结果。本质是"新瓶装旧酒"，将软件工程中的约束机制应用于AI

Context Engineering — 让AI看到什么，给AI提供框架式内容，让AI在知道框架后给出更确切的答案

Skills — Claude中的垂直领域知识库系统，属于Harness的一种。采用渐进式披露机制，用到什么才披露相应规则。可以包含行业案例、数据反馈、执行标准等

Loop Rough — 以《辛普森一家》角色命名的Harness技术，让AI coding agent能够自主长时间运行、自我迭代、自我验证，直到任务完成。可在睡觉时持续工作

Auto Research — Karpathy开发的Harness项目，设定固定预算和指标后，让AI永不停止地自我优化实验。Shopify CEO用37次迭代让0.8B参数模型性能超过1.6B手动调优模型

渐进式披露 — Skills的核心机制，只在用到某个规则时才披露该规则，避免一次性加载所有信息。类似于"If-Then"逻辑

隐性知识（Tacit Knowledge）— 波兰尼提出的概念：人知道的比能说出来的多得多。例如会骑自行车但无法描述如何保持平衡。Harness的核心挑战之一就是将隐性知识显性化

Markdown（.md）— AI阅读友好的文档格式，用符号代替格式（如***代表一级标题），省TOKEN且结构化。相当于"AI版的操作指南"

上下文记忆 — 个人工作经验和skills的总和，是公司未来最宝贵的资产。Harness帮助将个人经验沉淀为组织经验

品牌营销 vs 效果营销的Harness差异 — 效果营销有确定性结果和数据反馈，适合建立反馈循环；品牌营销有明确的"错误"（如事实不正确），但评判标准更多元

可迁移 vs 不可迁移知识 — 可迁移：底层逻辑、转化模型、通识性文案规律；不可迁移：具体话术、情感表达、品类特点。Harness需要用Skills.md（总述）+ Reference.md（行业参考）来分别管理

1.01的365次方 vs 0.99的365次方 — Craig的核心理念：每天进步一点点（1.01）和退步一点点（0.99），一年后差距巨大。强调持续使用和优化Harness的复利效应

「本期节目由声湃提供录音场地」，感谢大力支持。

欢迎各位扫码加入我们的飞书社群

（社群中将分享大脑袋的Markdown术语库文档和Craig的"set your skills"的skills链接）