走向强化学习：Agent还是应用公司的机会吗？对话Pokee.ai创始人朱哲清

hi，这里是硅基觉醒。

这是一档围绕AI前沿技术与商业变革的节目，汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来，迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们！

随着对Agent的讨论进入深水区，强化学习（RL）成为绕不过去的一个话题。尤其以OpenAI的Deep Research开启的基于强化学习的Agent，正成为新的Agent范式。但是Agent的强化学习怎么做，技术门槛有多高，普通创业公司能否参与，围绕Agent的强化学习有太多待解的问题。尤其随着近期基座模型能力的提升，“模型即产品”的论调卷土重来，大模型公司将如何参与Agent的竞争，又将带来哪些行业变革机会？

本期我们邀请了Pokee.ai创始人朱哲清共同讨论，他正在做基于强化学习的通用Agent产品，具备丰富的强化学习经验和一手的Agent的实践经验。

【主持人】

Harry，7年一级市场投资经验，2年互联网战略经验，AGI信徒。

【本期嘉宾】

朱哲清Bill，Pokee.ai创始人，斯坦福博士，前Meta应用强化学习负责人。

史业民，北大博士，前智源研究院研究员，研究方向为实时多模态模型、Multi-agent框架。

小苏，互联网大厂工作多年，丰富的投融资、出海以及产品运营经验，目前在做AI Agent产品的内部孵化。

【本期内容】

🟢 Part 1 Pokee.ai：瞄准下一代的AI Agent

00:02:05 Pokee.ai的愿景：下一代的Foundation AI Agent

00:04:36 Agent需要能对真实世界产生影响

00:06:36 Manus属于下一代Agent吗？

00:08:54 Pokee.ai从0开始训练RL模型，可调用上千个工具

00:09:27 与OpenAI Deep Research的差异化

00:11:06 Deep Research的实现方法

00:12:37 通用Agent vs 垂直Agent

00:18:27 垂直Agent可能长在通用Agent上面

00:24:44 通用Agent什么时候能落地？

🟢 Part 2 技术深入：Agent强化学习的实现细节

00:27:38 Agent的强化学习是如何实现的？

00:32:01 实现强化学习的成本有多高？

00:37:10 技术层面，Agent的强化学习与LLM训练过程中的RL有啥区别？

00:44:57 实现Agent的强化学习最难的技术部分是什么？

00:48:06 为什么过去强化学习不具备泛化性，而现在能解决通用问题？

🟢 Part 3 商业变革：模型即产品论调卷土重来？

00:52:37 重提模型即产品

00:54:28 OpenAI不可能做出一个供应链领域的Agent

00:56:30 Agent领域大模型公司和应用公司的边界划分

01:04:03 未来SaaS行业会被Agent取代吗？

01:06:23 如何招募Agent的强化学习人才

欢迎订阅「硅基觉醒」播客

🚦我们希望一起见证超级智能的到来，迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察，在最前沿直击AI的技术与商业演变。

欢迎加入「硅基觉醒」部落，成为首批村民

🔮 与资深AI学者、创业者、投资人深入交流

🤖 寻觅你的技术与商业化伙伴，共商AI创业大计

📩 添加小助理微信【silicon_era】获取入群通道，或者扫描下方二维码，备注【硅基觉醒入群】