hi,这里是硅基觉醒。
这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们!
随着对Agent的讨论进入深水区,强化学习(RL)成为绕不过去的一个话题。尤其以OpenAI的Deep Research开启的基于强化学习的Agent,正成为新的Agent范式。但是Agent的强化学习怎么做,技术门槛有多高,普通创业公司能否参与,围绕Agent的强化学习有太多待解的问题。尤其随着近期基座模型能力的提升,“模型即产品”的论调卷土重来,大模型公司将如何参与Agent的竞争,又将带来哪些行业变革机会?
本期我们邀请了Pokee.ai创始人朱哲清共同讨论,他正在做基于强化学习的通用Agent产品,具备丰富的强化学习经验和一手的Agent的实践经验。
【主持人】
Harry,7年一级市场投资经验,2年互联网战略经验,AGI信徒。
【本期嘉宾】
朱哲清Bill,Pokee.ai创始人,斯坦福博士,前Meta应用强化学习负责人。
史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。
小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。
【本期内容】
🟢 Part 1 Pokee.ai:瞄准下一代的AI Agent
00:02:05 Pokee.ai的愿景:下一代的Foundation AI Agent
00:04:36 Agent需要能对真实世界产生影响
00:06:36 Manus属于下一代Agent吗?
00:08:54 Pokee.ai从0开始训练RL模型,可调用上千个工具
00:09:27 与OpenAI Deep Research的差异化
00:11:06 Deep Research的实现方法
00:12:37 通用Agent vs 垂直Agent
00:18:27 垂直Agent可能长在通用Agent上面
00:24:44 通用Agent什么时候能落地?
🟢 Part 2 技术深入:Agent强化学习的实现细节
00:27:38 Agent的强化学习是如何实现的?
00:32:01 实现强化学习的成本有多高?
00:37:10 技术层面,Agent的强化学习与LLM训练过程中的RL有啥区别?
00:44:57 实现Agent的强化学习最难的技术部分是什么?
00:48:06 为什么过去强化学习不具备泛化性,而现在能解决通用问题?
🟢 Part 3 商业变革:模型即产品论调卷土重来?
00:52:37 重提模型即产品
00:54:28 OpenAI不可能做出一个供应链领域的Agent
00:56:30 Agent领域大模型公司和应用公司的边界划分
01:04:03 未来SaaS行业会被Agent取代吗?
01:06:23 如何招募Agent的强化学习人才
欢迎订阅「硅基觉醒」播客
🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。
欢迎加入「硅基觉醒」部落,成为首批村民
🔮 与资深AI学者、创业者、投资人深入交流
🤖 寻觅你的技术与商业化伙伴,共商AI创业大计
📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】
