E191|小而美的机会来了,聊聊这轮AI Agent进化新范式硅谷101

E191|小而美的机会来了,聊聊这轮AI Agent进化新范式

64分钟 ·
播放数55281
·
评论数65

进入2025年,AI Agent仿佛按下了加速键:从OpenAI推出自助浏览器Operator,到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮?
代码能力的提升为AI Agent的奠定了基础,RFT(强化学习微调)带来了大模型的“AlphaGo”时刻,嘉宾甚至都感叹“时代变了,开发产品成本低得有点恐怖”。但通用AI Agent是否真的是未来?数据壁垒、用户认知成本以及网络效应的缺失,都可能成为其发展的桎梏。 或许,更具前景的是那些深耕垂直领域的“小而美”的Agent?本期节目,我们将一同探讨AI Agent的核心技术、热门产品体验、创业机会与挑战,以及AI Agent的未来将走向何方?

【主播】
泓君Jane,硅谷101创始人,播客主理人

【嘉宾】
陶芳波,MindVerse心识宇宙创始人
侯泰羽(Kolento Hou),纽约大学本科应用心理学,AI产品经理

【你将听到】
RFT推动的Agent热潮
00:05 AI Agent进展大事件以及爆发三大核心原因
04:55 机器学习视角下的Agent进化
06:36 RFT(强化学习微调)技术促使Agent在2025年具有智能
08:10 大语言模型的AlphaGo时刻:不仅具有思考能力,还根据环境反馈调整学习
11:04 过去半年新趋势:Agent在环境中完成任务
14:27 OpenAI Operator买菜的体验:速度慢、准确率不高
17:32 内化工作流:新一代Agent能做出临场反应
20:55 创造虚拟环境:Scrapybara帮我买秋裤
22:39 Cursor与Windsurf编程Agent为何出圈?
26:11 AI创业门槛降低,可以做平台上那些小而美的Agent

Manus
32:53 Manus擅长广度,Deep Research擅长深度
38:05 Agent爆火背后的秘密:Sonnet 3.5代码质量的提升
40:57 比训练更重要?Evaluation的三代进化
44:02 SFT更便宜,RFT效果更优,行业会如何选择?
45:41 通用型Agent的双刃剑

垂类AI Agent推荐
48:45 在关键场景请求人类对齐:Replit和Fellou的优秀交互体验
50:13 最看好Cursor,有成为通用Agent的潜力
52:25 Vantel:每周帮保险经纪人省10小时的保险垂类Agent
53:29 Sweetspot:换了八九个邮箱也要用的,辅助申请资助类Agent
54:23 Gamma:秒杀Canva的PPT设计类Agent

行业快与慢
57:48 做的200多个Agent中,商业化成功的案例
59:20 “越做发现问题越多”:离普通人每天使用Agent仍有距离
1:00:39 MCP的生态建设需以年为单位

【相关名词解释】
RFT:Reinforcement Fine-Tuning,强化学习微调
SFT:Supervised Fine-Tuning,监督学习微调
MCP:Model Context Protocol,模型上下文协议

【监制】
泓君
【后期】
AMEI
【运营】
孙泽平、Meisi、王梓沁

【BGM】
Anticipating a New Day - Stationary Sign
City Phases STEMS INSTRUMENTS - John Abbot
Hidden Agenda
Clockmaker's Daydream - 369

【在这里找到我们】
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:podcast@sv101.net

Special Guests: Kolento and 陶芳波.

展开Show Notes
DeepFM_小Y
DeepFM_小Y
2025.5.16
Gamma 特别符合我对 AI 产品的评价标准 拿掉 AI 的部分依然是好产品 另外陶博真是想的清楚说的清楚啊~~
泓君Jane
:
拿掉AI的部分依然是好产品,这句话很受启发
persever曾:为什么我搜索不到 App
4条回复
潤林lgnd
潤林lgnd
2025.5.17
女主声音太好听了
Shopppp
Shopppp
2025.5.16
21:19 https://scrapybara.com/
Gamma不小众吧,超级明星了🤣
泓君Jane
:
我后知后觉今年才用上,太喜欢了!
HD眸目:快更新小泓
56:51 很喜欢这里的观点,对于提高个人行动力也很有帮助
“所有事情都在加速
要加快做事的速度,而不是沉迷拆解很多东西
关键是对任务的执行,打通更快的链路
执行>计划”
贷夫小熊
贷夫小熊
2025.5.20
小宇宙应该出一个字幕功能
LunaFei
LunaFei
2025.5.18
kolento确实好标准的AI男声!(褒义)
JoyZhang
JoyZhang
2025.5.18
陶博对 AI 的理解好深,这个阶段要求团队对技术理解要足够深,才能更好地做业务预判
不可达鸭
不可达鸭
2025.5.20
非常喜欢女主持的提问,感觉每次都问在普通人的疑惑点上
HD898717z
HD898717z
2025.5.22
但是现在这些大模型挖来的信息越来越经不起深究了,好多都是大模型杜撰的,尤其是和数据相关的。(大模型厂商都以“以上信息由人工智能生产,请仔细甄别”)
中外商学
中外商学
2025.5.19
现在的Cursor,利用好rules和mcp,基本上已经可以执行相当复杂的开发任务了。
逍驭舟
逍驭舟
2025.5.18
由保险垂类Agent想到,有报税agent么?另外飞书很像google wave
AI瑞哥那
AI瑞哥那
2025.5.18
55:04 这个广告植入的有点生硬了…这段朗读真的像甲方过审后的逐字稿
LeonYo
LeonYo
2025.5.20
现在没有真的agent 好吧,都是 软件进化的下一步,程序自动化好吗? 也需永远不会有真的堪比人类这种的所谓人工智能;
LeonYo:现在都觉得这些 程序自动化 是人工智能;那是因为咱们本身 被培养成了 机器人;
老李_YgxM
老李_YgxM
2025.5.19
23:49 什么软件
老李_YgxM:是不是windsurf
泓君真的好会提问啊都是我想知道的
SalieriMe
SalieriMe
2025.5.17
1:03:10 说的非常好:“我把数据给你,我的商业化怎么保证”。我想这也是我们国内很多企业卷 AI 智能一体机的原因。保障数据隐私,又能提高办公效率。
Undefined_k
Undefined_k
2025.5.20
09:49 和环境互动 而非与人交流 前者是立体的 多方位的 后者是线性的
Undefined_k:16:01 o1模型的思考过程:思考 执行 反馈 继续思考 革新的主要点在于“执行” 外显/执行是创造实际“效益”的关键
HD599018x
HD599018x
2025.5.16
很有意思的讨论!!
1:01:50 多智能体协议是A2A