管 Vibe Coding 项目,就像管公共厕所AI炼金术

管 Vibe Coding 项目,就像管公共厕所

66分钟 ·
播放数9638
·
评论数42

徐文浩说,管一个 vibe coding 项目,跟管一个公共厕所差不多。

以前三五年才堆得出来的“屎山”,现在一个月就堆完了。但产品才刚跑没多久,还不能放弃,还想继续高速迭代——这就是这一期想聊的“治理深水区”。

这一期都是徐文浩在自己公司里趟出来的实操,不是网上抄的二手梳理。如果你也在被 vibe coding 的烂摊子困扰、或者你正在搭一个 AI Agent 编排系统、或者你的老板最近问过你“AI 都用上了为什么没提效”——这一期值得听完。


亮点

屎山一个月就堆完了 徐文浩说,以前三五年才堆得起来的屎山,现在一个月就堆完。但产品才刚跑没多久,你还想继续高速迭代——管一个 vibe coding 项目的难度,跟管一个公共厕所差不多。


摩擦消失了,但摩擦本来在打磨产品 以前写代码有很多层摩擦,看似拖慢交付,其实像水流冲刷石头一样,把棱角打磨成了鹅卵石。今天 vibe 一下就上线了,摩擦消失了——结果各种小问题非常多。


重启大法和“我可能知道你叫 Mars” 我抱怨自己的 openclaw 活不过三天,徐文浩给了几招:让 AI 治理 AI、自动扫描挂了的进程、把核心配置锁死。我说重启完它就开始失忆,一边失忆一边告诉我“我想不起来你是谁,但我可能知道你叫 Mars”——徐文浩说重启确实有副作用,但能修掉那个最大的问题。


Discord 才是 Claude Code 最好的 IM 入口 不是套两层 harness,而是开很多个 Agent。Discord 一个 Bot 多个 channel,每个 channel 拉一个不同分工的 Agent;还能开 thread,上下文隔离。再加一句心法:非必要不升级——openclaw 一有新版本就跟,大概率会被坑。


Codex 找 bug,Claude Code 写代码 Codex 严谨度更高但容易钻牛角尖,Claude Code 美感更好。实操是 Claude 写完之后让两个同时 review,两个都说没问题就基本不用看了;Codex 说“这里有 bug”,再让 Claude 修——Claude 通常会承认。


代码是事实,prompt 才是真正的产出 不是存最初那段 prompt,而是做完之后,根据实际产出,重新写一段 prompt——这段重写的 prompt 才是这次工作真正的产出物,因为最初的 prompt 和实际做的事中间一定会漂移。


400 个 SVG 和 10MB 图片:治理人的具体活 徐文浩在自己代码库里发现了 400 多个 SVG,80% 都是 AI 把开源库背出来吐进自己代码里的——同一个对勾图标抄了 300 多遍。设计师直接改 UI 又交了张 10MB 的高清图。解法都是同一种:加自动钩子,不让有问题的东西进代码库


单次提交不超过两千行 2000 行不是 AI 的限制,是人的极限——超过两千行人就懒得看了。所以任务必须被拆成依赖图,每一步可追溯、可回退,而且计划在执行过程中要能自动 refine。这是项目管理层级的 harness 机会,国内还没人做。


200 美元订阅,8000 美元 API 徐文浩用 CC Usage 统计了一下:200 美元 Claude Code 订阅,实际两个月烧掉 8000-9000 美元 API,Anthropic 在亏 40 倍卖。最猛一天用了 2000 美元 API、33 亿 cache read token。对真正在写代码的工程师来说,这是这个时代最划算的杠杆。


Harness 是缰绳,还是喂料斗? 同一套 harness 工具有两套讲法:激进派(Block 那种)觉得人类卡在中间是瓶颈;但换个角度,人类的反馈是 AI 的草料,这套机制是喂养系统。给激进型创业公司卖“复利工程”,给国央企外企卖“合规护栏”——同一个东西,两种话术,两个预算池。


复利工程:同一套东西换个名字就性感了 Skill 单卖卖不掉,因为它是经验主义、用一次就结束;但 Every 那家公司把 engineering harness 包装成“复利工程”——这次的错下次自动不犯——听起来就成了“坐着不干、明天钱就变多”的税后收入。需求是真的,但需求自己不会长出能卖的产品。


个人提效不等于组织提效 为什么大量公司个人都用上 AI 了,公司效能纹丝不动?徐文浩三层回答:第一,这个人真的提效了吗(output ≠ outcome);第二,研发团队的瓶颈从来不在写代码——是联调、查 bug、开会;第三,AI 让最佳实践变得可执行了,但大部分公司做事的方法和原来一模一样。这就是早期 CAD 普及时,很多人画完图打印出来开会的同一个故事。


时间轴

03:05 屎山堆积速度,从三五年压缩到一个月

04:14 真正消失的不是工作量,是摩擦

06:05 互联网时代的“先污染后治理”逻辑彻底崩了

07:46 用魔法打败魔法:让 AI 治理 AI

08:46 重启完它失忆了:Claude Code 修起来比想象中麻烦

09:36 多 Agent + Discord:为什么这是个人 harness 的解

11:42 Discord 的两个隐藏特性,刚好对得上 Claude Code

12:09 非必要不升级:实验田 vs 商业化品控

13:25 开发和使用要分开:打磨场和生产场不能混

15:11 Codex 找 bug,Claude Code 写代码

16:33 美感差距:为什么 Codex 到现在还追不上

20:43 代码是事实,prompt 才是真正的产出

22:26 把责任全部丢给“公共厕所管理员”

23:51 真实案例:同一个对勾图标,在代码库里被抄了 300 多遍

26:40 设计师交了一张 10MB 的图怎么办

27:31 Skill 的产品化困境:好用,但很难变现

29:00 单次提交超过两千行,人就懒得看了

31:24 中间结果可保存、可回退,不要从头开始

33:13 任务越长,AI 越容易偷偷“漂移”

42:37 Harness 是缰绳,还是 AI 的喂料斗

45:53 卖给激进派 vs 卖给国企外企:同一套东西两种话术

48:56 复利工程:Every 那家公司换了个名字就性感了

49:36 200 美元订阅,8000 美元 API:这是这个时代最划算的杠杆

52:24 真正的硬问题:个人提效 ≠ 公司赚钱

54:47 研发团队的瓶颈,从来不在写代码

56:59 历史段子:早期用 CAD 的人把图打印出来开会

58:20 一个外包公司朋友为什么不用 AI Coding

01:02:01 约了两周后再录一期,徐文浩完整输出方法论



欢迎订阅「AI 炼金术」的播客,以及同名公众号、视频号 

「AI 炼金术」是一档由徐文浩和任鑫——两位多年老友、AI 领域的资深从业者——打造的播客。这里是探讨 AI 和创业的理想聚集地,我们会邀请一线创业者、产品产品和科研学者,深入探讨 AI 如何重塑行业、变革生活,以及如何从 0 到 1 打造 AI 原生产品。 

我们的讨论会涵盖多个话题:从 AI 如何改变世界的未来,到如何找到 AI 创业的 PMF;从如何利用 AI 降本增效,到怎样将 AI 技术融入日常生活……如果你对 AI、产品、创业感兴趣,这里有满满的干货和一线实战经验,欢迎关注并推荐给你的朋友,共同探索未来的无限可能!

商务合作:公众号 「AI炼金术 」菜单栏中【商务】获取联系方式 


节目主理人: 

徐文浩:某AI创业公司联合创始人,正在面向全球市场开发AI应用。连续创业者,参与过多家创业公司,拼多多早期员工。广告科技公司MediaV的算法和数据负责人,后被360收购。离开后加入成立不到1个月的拼多多。后创办了基于AI的海外客服聊天机器人公司 BotHub.AI 和 海外社交电商平台 Bukito 都宣告失败。2023年再次下场创业。 


任鑫:美元基金合伙人,主要在投资和孵化面向全球市场的 AI 应用。之前是连续创业者,曾经打造“今夜酒店特价”用移动互联网应用特价销售酒店尾房;被京东并购后内部创业“京东到家”开展本地即时零售业务;2015 年再次创业 Get 探索对话式人工智能助理成为先烈;2021 年出售公司,2023 年重新回到 AI 世界。


播客剪辑:十六颗糖



BGM:

片头:Shortwire - Reconfig

片尾:Ollie - Distance



展开Show Notes
艾艾艾菲
艾艾艾菲
2026.5.18
1:05:00 好期待两周后 搓搓手
Mars任鑫
:
呃,忘了抓他录了:p。。。我下周找他
lupyli:同期待
16:56 这里其实有一个想要请教的点,因为我是作为产品经理,从我的角度来看,用Claude Code的Terminal模式。给我的感觉其实并不是那么好使用,因为一直看所谓的终端,感觉很不舒服。相比之下呢,CodeX或者说其他的Solo模型,是可以用交互式的效果来呈现,感觉体感更好,或者说交互效果感觉更好。

我最近完全是依赖CodeX的5.5模型来进行开发编程,但是听到博主大大的话,打算再用回Claude OPUS,不知道博主大大有没有什么比较推荐的操作工具,或者可视化工具还是直接就是用终端来写嘞?
Summer_SzWL:可以试下vs code的cc插件,感觉比直接在终端运行好用点~
Mars任鑫
:
Claude 也有App呀
6条回复
王乐_t5uv
王乐_t5uv
14小时前
期待2周后
王乐_t5uv:时间应该到了😁
weiview
weiview
7天前
编程范式应该变了
weiview:很有启发,可能因为我当年就是从传统软件开发过渡到互联网公司开发的。传统软件开发是从下到上构建,将需求“翻译”成uml,再到构建,而互联网则是从上到下,主张的就是快速验证(当时适应了很长时间,试图和大家讲TDD,发现根本无人问津)。现在的开发,可能更要面向智能体了,可能一个应用的UI就是一个可视化的Dashboard 和一个语音输入,而底层更多的是工程师将定义各种基础capability,然后通过ai拼装起来,形成各种graph(或者数据信息流图),有点像已经不太有人提的UML 。
很想听听做企业应用的产品经理,很落地的思路,使用场景,问题点等等
Mars任鑫
:
之前聊过两期bisheng的覃睿就是这个画像和话题
Leeeeeeo
Leeeeeeo
3天前
又水了一起,你家厕所该冲水了
weiview
weiview
6天前
1:01:03 UML要回归了
智能饭
智能饭
7天前
56:46 这里讲的太好了 生产力提高了,生产关系跟不上
智能饭
智能饭
7天前
38:07 之前是瀑布流开发,对每一步交付质量把控很严格,互联网变成了敏捷开发,迭代速度成了第一优先级
14:09 先在Claude code跑通,满意了再给openclaw,也是我最近的感受
大正_YfOT
大正_YfOT
2026.5.16
1:04:41 干货满满,先mark下,回头再码
宅_oz9N
宅_oz9N
2026.5.14
AI真的提效了吗?这个问题很真实,在大厂工作就能感觉到,代码产出提高了,但是效率实际上并没有提升很多。(有提升,但没有那么夸张的几十倍)
英子英子
英子英子
2026.5.12
Junior工程师做应用开发,senior 做治理
56:43 展开讲一下怎么提升体系?
HD683769z
HD683769z
2026.5.11
35:03 Hermes进化
Ayano_83su
Ayano_83su
2026.5.11
个人提效≠组织提效,前一个时代,软件工程的瓶颈本来也不在写代码,尤其是大厂,时间都花在想清楚要做什么以及沟通协调上。
个人提效的结果组织也不一定最终受益,目前只是做得快了,产出和质量并没有提升。
组织提效的关键也不在于找到若干个人提效的超级个体带着大家干几个月就能搞定了。
边玩边跑
边玩边跑
2026.5.08
还没听,看了一下文字稿,用Slack channel把信息流分开,每个channel 一个agent,包括邮件、日历、播客预处理、Strava和运动时间强度管理、HuggingFace和GitHub热点追踪,这些每天处理的事情已经完全cover,打开Slack对话就可以
边玩边跑:说到代码成山,infra维护也是问题,部署在Cloudflare和使用Gemini,如果不稳定,什么都干不成
OldWhitE24
OldWhitE24
2026.5.09
/goal 用更少的行数,实现同样的功能,直到删掉任意一行都会影响完整性
54:05 最后15分钟的思考特别有价值,提效方向从来不在写代码上,而是应该解决各流程之间的摩擦成本
OldWhitE24
OldWhitE24
2026.5.09
21:10 commit message