走向强化学习:Agent还是应用公司的机会吗?对话Pokee.ai创始人朱哲清

走向强化学习:Agent还是应用公司的机会吗?对话Pokee.ai创始人朱哲清

69分钟 ·
播放数2297
·
评论数4

hi,这里是硅基觉醒。

这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们!

随着对Agent的讨论进入深水区,强化学习(RL)成为绕不过去的一个话题。尤其以OpenAI的Deep Research开启的基于强化学习的Agent,正成为新的Agent范式。但是Agent的强化学习怎么做,技术门槛有多高,普通创业公司能否参与,围绕Agent的强化学习有太多待解的问题。尤其随着近期基座模型能力的提升,“模型即产品”的论调卷土重来,大模型公司将如何参与Agent的竞争,又将带来哪些行业变革机会?

本期我们邀请了Pokee.ai创始人朱哲清共同讨论,他正在做基于强化学习的通用Agent产品,具备丰富的强化学习经验和一手的Agent的实践经验。

【主持人】

Harry,7年一级市场投资经验,2年互联网战略经验,AGI信徒。

【本期嘉宾】

朱哲清Bill,Pokee.ai创始人,斯坦福博士,前Meta应用强化学习负责人。

史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。

小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。

【本期内容】

🟢 Part 1 Pokee.ai:瞄准下一代的AI Agent

00:02:05 Pokee.ai的愿景:下一代的Foundation AI Agent

00:04:36 Agent需要能对真实世界产生影响

00:06:36 Manus属于下一代Agent吗?

00:08:54 Pokee.ai从0开始训练RL模型,可调用上千个工具

00:09:27 与OpenAI Deep Research的差异化

00:11:06 Deep Research的实现方法

00:12:37 通用Agent  vs  垂直Agent

00:18:27 垂直Agent可能长在通用Agent上面

00:24:44 通用Agent什么时候能落地?

🟢 Part 2 技术深入:Agent强化学习的实现细节

00:27:38 Agent的强化学习是如何实现的?

00:32:01 实现强化学习的成本有多高?

00:37:10 技术层面,Agent的强化学习与LLM训练过程中的RL有啥区别?

00:44:57 实现Agent的强化学习最难的技术部分是什么?

00:48:06 为什么过去强化学习不具备泛化性,而现在能解决通用问题?

🟢 Part 3 商业变革:模型即产品论调卷土重来?

00:52:37 重提模型即产品

00:54:28 OpenAI不可能做出一个供应链领域的Agent

00:56:30 Agent领域大模型公司和应用公司的边界划分

01:04:03 未来SaaS行业会被Agent取代吗?

01:06:23 如何招募Agent的强化学习人才

欢迎订阅「硅基觉醒」播客

🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。

欢迎加入「硅基觉醒」部落,成为首批村民

🔮 与资深AI学者、创业者、投资人深入交流

🤖 寻觅你的技术与商业化伙伴,共商AI创业大计

📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】

展开Show Notes
Jeremy_YbiQ
Jeremy_YbiQ
2025.5.09
强行中英夹杂真别扭
显摆英语😂
1:08:58 RL agent人才画像:理论基础深厚,有自己的thinking structure,有足够的知识广度,不要有技术执念,flexible 泛化性好。
哄哄_IOuG
哄哄_IOuG
2025.4.25
30:24 推测是DQN的训练方法