Vol.176 产业观察31|从模型“军备竞赛”到“万物皆可Agent”:2025年AI agent半年回顾高能量

Vol.176 产业观察31|从模型“军备竞赛”到“万物皆可Agent”:2025年AI agent半年回顾

56分钟 ·
播放数16705
·
评论数20

【本期课题】

AI agent半年回顾。

【栏目介绍】

在《产业观察》这档专栏里,我们会为你厘清不同产业的历史沿革,希望能够从中找到一些底层的规律。虽然当下变化迭起,但是所有新风口都有迹可循,不同产业的发展其实也有很多相似之处。

【免责声明】

本节目的所有内容并非旨在提供任何形式的建议,包括但不限于投资、税收、会计或者法律上的建议。

【本期嘉宾】

刘鹏琦,峰瑞资本执行董事。

颜黔杭,峰瑞资本副总裁。

【内容索引】

01:55 从年初DeepSeek的爆火到如今AI智能体(AI Agent)的涌现,这半年AI领域有哪些超预期的热点事件?

07:43 在模型领域,大厂的介入将竞争推向“全民军备竞赛”,国内“六小龙”与大厂间的竞争也愈发白热化。在应用侧,部分垂直场景已初步实现产品市场匹配(Product Market Fit,PMF),但通用场景的长期商业化前景仍需观察。

10:48 AI Agent概念怎么理解?这个赛道有哪些共识和分歧?

11:23 自2022年底OpenAI推出ChatGPT以来,AI应用已从基于提示词(prompt)的直接对话交互模式,发展到AI 工作流(Workflow),再到今天的AI agent阶段。与前两者不同,AI agent的特点在于能够自主感知环境、做出决策并执行任务。

14:05 Tool use(工具使用)和强化学习,如何赋能AI Agent?

17:41 为什么AI编程能率先实现PMF?

20:40 基于强化学习迭代的Agent,是AI应用迈向“终极智能”的路径吗?

26:13 目前,Agent的技术路径大致分为两种:第一种是完全端到端、基于强化学习(RL)的agent,以OpenAI的Deep Research、Kimi近期发布的Researcher为代表;第二种是在工程框架下,将Agent按照不同的能力类型拆分,然后分别提升单点能力。

33:03 听说“The Bitter Lesson”是OpenAI工程师必背的经典,它对AI Agent来说意味着什么?

39:24 具身智能的垂直小模型与通用大模型之争。

43:48 未来的AI agent会是什么样?大家的壁垒是什么?商业模式会如何演化?

50:27 AI Agent赛道有哪些创业和投资机会?

53:45 从一些C端智能硬件的发展来看,大多是从某一垂直场景切入并逐步成长,很少有人一开始就尝试在C端打造高度通用化的产品。毕竟,C端市场体量庞大,只要在垂直场景中把新品类做好、做深,就有机会把“蛋糕”做大,就像大疆、Insta360等。

【相关文章】

文字版内容,可在峰瑞资本公众号查看。

【本期相关】

本期提到的AI相关模型和产品:OpenAI的o3-pro、Anthropic的Claude 4系列、Google的Gemini 2.5 Pro、DeepSeek-R1-0528、Qwen3、豆包1.6、OpenAI的Operator与Deep Research、Cursor、Windsurf、Lovable、Replit、Bolt、Manus、Genspark、Grok-3、Fellou、Dify、Coze、LangFlow。

“AI六小龙”公司:智谱、MiniMax、月之暗面、阶跃星辰、百川智能、零一万物。

21:16 Reinforcement Learning: An Introduction

33:03 The Bitter Lesson

【往期链接】

Vol.156 产业观察27|关于DeepSeek的七个核心问题和DeepSeek关键技术拆解

【制作团队】

主理人:李翔 、李丰

制作及统筹:张英海  (13514156656)、峰小瑞(pr@freesvc.com)

如果你喜欢我们的节目,欢迎你分享到更多的地方,也欢迎你在我们的评论区留言交流。

展开Show Notes
哄哄_q4uo
哄哄_q4uo
2025.7.06
提一个小建议吧 两位投资人还是比较懂agent的 但是作为一个播客 受众其实更想听到一些更加深入浅出的看法、判断 现在有点自己讲着讲着就进去了 各种技术词语的堆叠 太过抽象化导致信息量过渡被压缩 因为有了技术A所以更好实现 因为选了技术B所以更有挑战 这个约等于没有信息量 现在的效果更像是在跟做agent的创始人聊天 大家互相试探对方懂不懂行
AICRI:还好吧 有些不用专业术语 很难表达清楚 没有共识
M73-阿拉
M73-阿拉
2025.7.06
作为后端开发工程师,目前已经习惯了边写代码边跟AI交流,AI写代码能力进步还是挺明显的,个人最喜欢的是阿里的插件。AI类agent数量越多,我们把任务转向“自动化”的可能路径就越多。期待未来会有更多便捷的agent出现。
东北爱好者:阿里的哪个插件?通义灵码?
M73-阿拉:是的
峰小瑞
峰小瑞
2025.7.11
本期内容已在峰瑞资本公众号同步上线,欢迎点击链接关注文字版本~
https://mp.weixin.qq.com/s/Vi6jtGVzXAZGEN0oClTTVg
欧老板
欧老板
2025.7.07
从投资人角度已经很专业分析。专业名词都是比较基础的,毕竟不是科普的总结。还是有自己判断的。从我个人使用来说,cursor今年进步非常大,现在写非业务逻辑代码很强了
NLD之王
NLD之王
8天前
做投资的朋友居然对reasoning/agent的技术性细节这么懂 确实厉害了
HD937550z
HD937550z
2025.7.18
宏观漫谈更新的速度越来越慢了 说明市场真的好起来了 😄
52:33 密度确实高
催更催更
Baca
Baca
2025.7.13
行业观察类节目可以多来几期 两个月更新一次还是有点太少了…Agent现在还只是停在代码和search两个方向 其他让人眼前一亮的新应用还不多
立善
立善
2025.7.06
哇这期干货满满😯

🔥 AI Agent元年:从技术狂欢到产业落地
2025年上半年,AI领域上演了一场惊心动魄的"军备竞赛"!从DeepSeek横空出世引爆推理模型热潮,到OpenAI发布Operator正式开启Agent赛道,整个行业以前所未有的速度迭代进化。这不再是实验室里的概念游戏,而是真真切切的产业变革——AI终于从"能说会道"的语言模型,进化成了"动手做事"的智能体!

🧠 模型技术突破:推理能力的革命
今年最震撼的变化,是整个行业从追求"大"转向追求"聪明"。R1为代表的推理模型横空出世,把强化学习推理能力推到台前。OpenAI的O3 Pro、Claude 4、Google的Gemini 2.5 Pro轮番打榜,模型迭代速度不仅没放缓,反而更快了!国内玩家同样不甘示弱。DeepSeek的R1在5月发布的0528版本编程能力大幅提升,要知道这还只是基于上一代V3模型!Qwen3、豆包1.6以及"六小龙"公司都在持续演进。最戏剧性的是Meta,被开源浪潮冲击后宣布重组AI部门,并豪掷150亿美元投资Skill AI,巨头的每一个动作都牵动着整个行业的神经。

🤖 AI Agent是什么?为什么现在火了?
简单说,AI Agent就是能自己感知环境、做决策、执行任务的智能体。它经历了三个进化阶段:Prompt阶段:直接对话,问啥答啥(现在80%应用还停在这)Workflow阶段:预设流程,按步骤执行(商业化最好的阶段)
Agent阶段:自主决策,灵活应变(今年爆发的新阶段)最大的突破在于工具使用能力!就像人类学会使用工具是进化的里程碑,AI掌握工具后能力提升不止一个数量级。它能调用浏览器、编程环境、API接口,甚至操作电脑——这已经不是"纸上谈兵",而是真真切切的"动手能力"!

💻 编程赛道率先破局:AI Agent的试验田
为什么编程成了第一个验证PMF(产品市场匹配)的赛道?因为编程有完美的闭环:代码生成→验证→编译→结果反馈,这套流程在虚拟环境里就能完成。Cursor火得出圈,Windsurf被OpenAI收购又被Cloud断供API,还有Loveable、Replit、Bolt...整个赛道热闹非凡!但这只是开始。现在连大模型厂商都亲自下场做Agent产品,MiniMax和Kimi相继发布Agent产品,OpenAI更是被业内戏称"披着语言模型外衣的Agent公司"。边界越来越模糊,竞争也越来越激烈!
🔄 强化学习:AI Agent的终极进化路径?
强化学习可不是什么新技术,但今年它和Agent的结合产生了奇妙的化学反应。《Reinforcement Learning: An Introduction》这本经典教科书的作者刚拿了2024年图灵奖,而OpenAI的研究员每天开工前都要朗读"The Bitter Lesson"这篇论文——这篇被奉为AI圣经的文章告诉我们:人工智能的长期进步应当依赖于算力和通用方法的进步,而不是人类知识的直接嵌入。现在Agent有两条技术路线:端到端RL:OpenAI和Kimi代表,一个模型搞定推理、记忆、工具调用模块化组合:拆分能力模块,分别优化再工程整合(如Manna)短期内Workflow Agent因为可视化、可解释、可控性强,可能更适合商业化;但长期来看,能自我迭代的RL Agent才可能达到"终极智能"。

🤔 产业思考:通用vs垂直,泡沫vs未来现在的AI Agent领域有点"万物皆可Agent"的味道,各种"全球第一"层出不穷。但冷静下来看:垂直场景已看到曙光:编程就是最好例子,金融服务也有突破

通用Agent仍需观察:长期商业化路径和交付标准尚不清晰具身智能(机器人)更是早期中的早期,连基础模型的scaling law都还没找到。有人认为会是垂直小模型的天下,也有人坚信通用大模型会胜出——这场争论,像极了当年大模型爆发前的景象!

💼 商业模式:AI时代的"钱"景何在
?现在大家都在摸着石头过河:
订阅制:每月20刀,但用户会为每个Agent付费吗?

Token计费:智能的Agent用更少Token完成任务,该收更少钱吗?
结果付费:价值如何衡量?主观任务怎么定价?
更复杂的是未来多Agent协同工作时,它们之间如何结算?这不仅是技术问题,更是生产关系的重构!

🚀 投资机遇:垂直深耕者胜早期投资机构更看好这些方向:
垂直领域Agent:结合行业Know-how,离用户更近垂直个性化To C:不一定要平台化,小众需求也能撑起

大市场AI+硬件:像大疆、Insta360那样从垂直场景切入的智能硬件创业者不必一步到位做纯Agent,从Prompt到Workflow再到Agent的演进路径更现实。关键是发挥原有经验积累,把服务链条做长!
HD265852w
HD265852w
2025.7.07
LLM 和 Agent 的 RL基础概念和框架可以看看这篇公众号:https://mp.weixin.qq.com/s/7Mj7nNunWErgKsDJZV_-Jw
HD668865w
HD668865w
2025.7.17
作为 agent 相关从业者,本期内容还是蛮有感受的。的确未来开发都会走轻量化➕workflow➕提示词路线
coreyzz
coreyzz
2025.7.13
让agent生成旅行计划这个场景,有点像在车里提供一流的开会环境一样,没什么x用,有红书了,谁愿意跟你这些文本去打勾呢,出去是为了玩,做计划的不多😄
alphabetyz
alphabetyz
2025.7.06
挺有意思的分享,感觉今年agent行业很热闹,但其实共识不太多~
momomai
momomai
2025.7.06
完全不了解的小白竟然也听懂了现在到处是热点的agent 是什么 感谢主播科普!
主播说话的腔调和丰叔很像,不愧是峰瑞的
朗读论文并祈祷?真的吗?