E238|聊聊Harness时代AI-First的组织架构:从信任人到信任AI硅谷101

E238|聊聊Harness时代AI-First的组织架构:从信任人到信任AI

65分钟 ·
播放数9649
·
评论数52

“Harness Engineering”(挽具工程)正在成为硅谷的新共识,Anthropic、OpenAI等公司都在探索这一工程范式。但真正理解Harness的人还不多。前不久,一篇题为《Why Your “AI-First” Strategy Is Probably Wrong》的文章在X上获得百万级阅读和热议,作者是来自硅谷CreaoAI的Peter Pang。在这篇文章里,Peter展示了Harness Agent系统激发出的极致效率:99%的代码由AI完成,每天平均3到8次生产部署,过去六周的产品流程,现在一天就能跑完。
本期播客,主播泓君邀请到Creao的三位创始人,聊聊这家公司对Harness的实践,以及在组织AI-First转型上的深度思考。嘉宾们指出,AI-First不等于“使用AI”,想要把效率提升100倍、1000倍,就不能只把AI当成工具,而要让AI成为所有生产力的主导。组织转型最难跨出的一步在于——是否能让所有员工都能做到信任AI。
这场对话中有一些有趣的观察,比如在Creao,市场不用再追着开发提需求,因为开发速度已经远超市场消化能力;当大量对齐工作被AI接管之后,拿掉产品经理,反而让团队效率大幅提升;初级工程师比资深工程师更适应AI时代的转型;尽管过去十年积累的专长正在快速贬值,但资深工程师仍然有竞争力,因为未来的核心竞争力不再是写代码,而是“找到AI Planning的缺陷”和“判断什么是有价值的”。

【主播】
泓君,硅谷101创始人,播客主理人
【嘉宾】
Kai,Creao联合创始人/CEO
Peter,Creao联合创始人/CTO
Clark,Creao联合创始人/CPO,clark@creao.ai

【你将听到】
AI 主导的效率革命
02:32 什么是Harness(挽具)?
03:09 Harness范围远大于prompt/context engineering,榨干大模型能力
04:52 Harness成败在于,设计好系统自身的feedback loop
07:11 传统软件静态人主导,Harness动态AI主导迭代
08:10 一篇X爆文,揭秘CreaoAI的Harness实战
09:53 AI-first第一步:重构流程,降低对齐成本
13:19 思维转变:AI不是工具,是所有生产力的AI主导者
14:01 放弃传统开会讨论,让AI主导对齐,沟通成本大幅降低
19:12 Agent主导排查bug,50%以上问题由AutoFixing自动修复
23:48 搭建整个Agent系统,只需要1个Architect用一周定框架
25:47 Harness观念:AI是动态系统,出错要弥补系统而非简单纠错
27:13 你的内容和产品,受众可能是Agent

Harness时代的组织转型
31:09 组织转型挑战:只要有人觉得“不如人做”,改造就会被拉长
32:02 AI能力已达,CreaoAI 2026年1月用两周完成全部架构重构
36:00 “2026年我没有写过一行代码”,架构师的价值是找出AI planning的缺陷
38:22 产品开发超前于市场,市场尚不了解Harness Agent的工作方式
43:05 大企业难转型的原因:合规问题,人员过多

Harness时代人的价值
47:47 信任从人转向AI需要guardrails,产品经理角色被拿掉,对齐成本反而更低
52:00 交流成本>落地成本,AI环境下复合型人才更重要
53:21 “资深悖论”:初级工程师更适应AI,资深专家转变难度大
01:00:30 人类未来最核心的能力和价值:定义需求,review结果

【延伸阅读和相关术语】
《Why Your “AI-First” Strategy Is Probably Wrong》
《The Self-Healing Agent Harness》
CI/CD(持续集成/持续部署),软件开发中的自动化流程。CI(Continuous Integration,持续集成) 指开发者频繁地将代码合并到主干,并自动运行测试,以便尽早发现集成错误。CD(Continuous Delivery/Deployment,持续部署/持续交付) 指通过自动化流水线将通过测试的代码自动发布到生产环境。
Agent Behavior(智能体行为),指AI Agent在执行任务时的行为模式,包括它如何理解指令、调用工具、做出决策、处理错误等。

【监制】
泓君
【后期】
Amei
【运营】
朱婕
【BGM】
Radar Focus - Blue Saga
Rumors About Us - T. Morri
Easily Served - Gerhard Feng
Poisson d'Avril - Ludvig Moulin

【在这里找到我们】
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|荔枝FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:podcast@sv101.net

Special Guests: Clark Gao, Peter Pang, and 程凯.

展开Show Notes
东美丽
东美丽
15小时前
这中英混的实在难受
HD647192y:确实有同感
NiCO酱和她的小布:•` · ヽ蒸 嘚·•`w o一般 很少 卟能 忍的·•` 但 蔗柿 蒸 嘚•`忍 卟了, '•😂 😂😂 😂😂蒸嘚` ·一般 只有 硕博才 过去的 仁·•` ヽ或著 自诩比较高 知·´才 过去的仁` •才荟 蔗漾说 话` • 呆嘚 特别久 的• ´都 卟荟 蔗 漾` ',·Lmao😂 😂 😮‍💨泰 楠受 l e` ,• [裂开][裂开]
泡面少年
泡面少年
11小时前
说句扎心的话,当他们开始吹嘘ai能力进化有多快的时候,现实第一个毙掉的方向就是这种saas业务,你有什么护城河?你的机会窗口只有在openai和claude入场前的一刹那罢了
AIToBox
AIToBox
15小时前
如果是每天都在用ai 工具和流程完成工作的人听起来很流畅,但是估计没有完整的用ai工具组合流程完成一次工作的人,有点儿理解困难。
Liiiiam:👍
我觉得啊,如果受访者的汉语表达有些障碍的话,主播可以考虑做成纯英语播客。
倒不如上期的幾位大學生講的實在
aabbcc_4NHM
aabbcc_4NHM
15小时前
这期节目基于自己的经验和背景几乎没有障碍,但估计很多人都会云里雾里的,不仅仅是中英文夹杂的问题,更多是交流沟通习惯和方式,还有专业知识和名词的差异。
Mochas
Mochas
8小时前
Cost、task、focus 这种词真的没办法用中文表述吗?又不是什么特别专业的术语
NiCO酱和她的小布:, •'反而 凸显 l e語言掌握能力的 缺失· • ´😂 😂😂 😂😮‍💨
Gululi
Gululi
15小时前
09:06 半天的ab testing是认真的吗
泡面少年:反正就那么点人用,半天都算多了哈哈哈
金星uuel
金星uuel
7小时前
主播一直在强调嘉宾很超前 没觉得超前 都在这么干😂
这一期听得很痛快👍
认怂日志
认怂日志
6小时前
含英量太高了 很多词素真的没必要
NiCO酱和她的小布:, •'泰 作了· •´凸显 語言滑 坡•' 、😂 😂😂
HD497051s
HD497051s
4小时前
14:29 老实说这一期,听到这里就听不下去了,我们自己在做AI方面一些研究的工作,也在做些企业级的产品,把harness这个东西说的太过神话的感觉,特别是self- improvement,现在让AI自己去做一些self- improvement的工作,完全无人的参与,你会发现堆出来的就是一坨大便。让AI去管理人,发布任务,这个说法,我也不认同,AI本身会通过Context知道你在干什么,基于你的目标,帮助你进行执行,但是还远远达不到理解的标准,那么给人去定义任务就会有很大的噪音。
干货满满
李涴涴
李涴涴
14小时前
主持人声音像小珺 😛
rteeeeee
rteeeeee
14小时前
19:11 开发比市场部门跑得快,这不就叫“产能过剩”吗?🤣🤣🤣😭😭😭
小猫咪没有坏心思:首先,他举例的这个场景,只是处于某种特定的时间窗口或者说就不是一个合理的市场部运转状态。
CARSEN_SxBC
CARSEN_SxBC
3小时前
好无语,不是吐槽嘉宾专业能力, 某个嘉宾是这个中英夹杂有点过了,中文是有多不好连这种单词都译不过来,要么就全英吧
杨秋实_h9sO
杨秋实_h9sO
4小时前
能不能用AI把中间的英文全换成中文?
这期的思路绝了
羅嚴塔爾
羅嚴塔爾
5小时前
56:04 不如直接就讲英文吧
干货噢很多! 已经在听第二遍, 认真做笔记ing