E191|小而美的机会来了,聊聊这轮AI Agent进化新范式硅谷101

E191|小而美的机会来了,聊聊这轮AI Agent进化新范式

64分钟 ·
播放数58489
·
评论数68

进入2025年,AI Agent仿佛按下了加速键:从OpenAI推出自助浏览器Operator,到Manus爆火出圈并获7500万美元融资。究竟是什么引爆了这轮AI Agent的热潮?
代码能力的提升为AI Agent的奠定了基础,RFT(强化学习微调)带来了大模型的“AlphaGo”时刻,嘉宾甚至都感叹“时代变了,开发产品成本低得有点恐怖”。但通用AI Agent是否真的是未来?数据壁垒、用户认知成本以及网络效应的缺失,都可能成为其发展的桎梏。 或许,更具前景的是那些深耕垂直领域的“小而美”的Agent?本期节目,我们将一同探讨AI Agent的核心技术、热门产品体验、创业机会与挑战,以及AI Agent的未来将走向何方?

【主播】
泓君Jane,硅谷101创始人,播客主理人

【嘉宾】
陶芳波,MindVerse心识宇宙创始人
侯泰羽(Kolento Hou),纽约大学本科应用心理学,AI产品经理

【你将听到】
RFT推动的Agent热潮
00:05 AI Agent进展大事件以及爆发三大核心原因
04:55 机器学习视角下的Agent进化
06:36 RFT(强化学习微调)技术促使Agent在2025年具有智能
08:10 大语言模型的AlphaGo时刻:不仅具有思考能力,还根据环境反馈调整学习
11:04 过去半年新趋势:Agent在环境中完成任务
14:27 OpenAI Operator买菜的体验:速度慢、准确率不高
17:32 内化工作流:新一代Agent能做出临场反应
20:55 创造虚拟环境:Scrapybara帮我买秋裤
22:39 Cursor与Windsurf编程Agent为何出圈?
26:11 AI创业门槛降低,可以做平台上那些小而美的Agent

Manus
32:53 Manus擅长广度,Deep Research擅长深度
38:05 Agent爆火背后的秘密:Sonnet 3.5代码质量的提升
40:57 比训练更重要?Evaluation的三代进化
44:02 SFT更便宜,RFT效果更优,行业会如何选择?
45:41 通用型Agent的双刃剑

垂类AI Agent推荐
48:45 在关键场景请求人类对齐:Replit和Fellou的优秀交互体验
50:13 最看好Cursor,有成为通用Agent的潜力
52:25 Vantel:每周帮保险经纪人省10小时的保险垂类Agent
53:29 Sweetspot:换了八九个邮箱也要用的,辅助申请资助类Agent
54:23 Gamma:秒杀Canva的PPT设计类Agent

行业快与慢
57:48 做的200多个Agent中,商业化成功的案例
59:20 “越做发现问题越多”:离普通人每天使用Agent仍有距离
1:00:39 MCP的生态建设需以年为单位

【相关名词解释】
RFT:Reinforcement Fine-Tuning,强化学习微调
SFT:Supervised Fine-Tuning,监督学习微调
MCP:Model Context Protocol,模型上下文协议

【监制】
泓君
【后期】
AMEI
【运营】
孙泽平、Meisi、王梓沁

【BGM】
Anticipating a New Day - Stationary Sign
City Phases STEMS INSTRUMENTS - John Abbot
Hidden Agenda
Clockmaker's Daydream - 369

【在这里找到我们】
公众号:硅谷101
收听渠道:Apple Podcast|Spotify|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐
其他平台:YouTube|Bilibili 搜索「硅谷101播客」
联系我们:podcast@sv101.net

Special Guests: Kolento and 陶芳波.

展开Show Notes
DeepFM_小Y
DeepFM_小Y
2025.5.16
Gamma 特别符合我对 AI 产品的评价标准 拿掉 AI 的部分依然是好产品 另外陶博真是想的清楚说的清楚啊~~
泓君Jane
:
拿掉AI的部分依然是好产品,这句话很受启发
persever曾:为什么我搜索不到 App
4条回复
潤林lgnd
潤林lgnd
2025.5.17
女主声音太好听了
Shopppp
Shopppp
2025.5.16
21:19 https://scrapybara.com/
Gamma不小众吧,超级明星了🤣
泓君Jane
:
我后知后觉今年才用上,太喜欢了!
HD眸目:快更新小泓
56:51 很喜欢这里的观点,对于提高个人行动力也很有帮助
“所有事情都在加速
要加快做事的速度,而不是沉迷拆解很多东西
关键是对任务的执行,打通更快的链路
执行>计划”
贷夫小熊
贷夫小熊
2025.5.20
小宇宙应该出一个字幕功能
LunaFei
LunaFei
2025.5.18
kolento确实好标准的AI男声!(褒义)
JoyZhang
JoyZhang
2025.5.18
陶博对 AI 的理解好深,这个阶段要求团队对技术理解要足够深,才能更好地做业务预判
不可达鸭
不可达鸭
2025.5.20
非常喜欢女主持的提问,感觉每次都问在普通人的疑惑点上
中外商学
中外商学
2025.5.19
现在的Cursor,利用好rules和mcp,基本上已经可以执行相当复杂的开发任务了。
逍驭舟
逍驭舟
2025.5.18
由保险垂类Agent想到,有报税agent么?另外飞书很像google wave
HD898717z
HD898717z
2025.5.22
但是现在这些大模型挖来的信息越来越经不起深究了,好多都是大模型杜撰的,尤其是和数据相关的。(大模型厂商都以“以上信息由人工智能生产,请仔细甄别”)
LeonYo
LeonYo
2025.5.20
现在没有真的agent 好吧,都是 软件进化的下一步,程序自动化好吗? 也需永远不会有真的堪比人类这种的所谓人工智能;
LeonYo:现在都觉得这些 程序自动化 是人工智能;那是因为咱们本身 被培养成了 机器人;
老李_YgxM
老李_YgxM
2025.5.19
23:49 什么软件
老李_YgxM:是不是windsurf
0x2077
0x2077
2025.5.23
08:32 学习是建立系统的过程 机器学习的优势在于试错成本极低且可控 试图穷尽所有可能
泓君真的好会提问啊都是我想知道的
SalieriMe
SalieriMe
2025.5.17
1:03:10 说的非常好:“我把数据给你,我的商业化怎么保证”。我想这也是我们国内很多企业卷 AI 智能一体机的原因。保障数据隐私,又能提高办公效率。
Undefined_k
Undefined_k
2025.5.20
09:49 和环境互动 而非与人交流 前者是立体的 多方位的 后者是线性的
Undefined_k:16:01 o1模型的思考过程:思考 执行 反馈 继续思考 革新的主要点在于“执行” 外显/执行是创造实际“效益”的关键
HD599018x
HD599018x
2025.5.16
很有意思的讨论!!
47:00 不知道说什么