ChatGPT变身Agent：解读o3的进化与OpenAI的Agent野心

hi，这里是硅基觉醒。

这是一档围绕AI前沿技术与商业变革的节目，汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来，迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们！

OpenAI发布了其推理系列最新模型o3及o4-mini，毫无疑问，它在各类榜单里再次刷新高度。然而，我们认为最新的模型发布里隐藏了OpenAI的重要发展线索和对Agent方向的巨大野心。o3系列模型开始引入一系列的工具调用能力，朝向一个通用的Agent Model迈出重要一步。其视觉推理能力，则解锁了更多的多模态的应用场景。OpenAI的能力进化将怎样影响AI应用生态？本期我们将围绕OpenAI的最新模型进化一起聊聊。

【主持人】

Harry，7年一级市场投资经验，2年互联网战略经验，AGI信徒。

【本期嘉宾】

小晨，北大博士，互联网大厂工作多年，关注RAG/Agent等大模型应用落地、大模型数据处理以及模型评测。

史业民，北大博士，前智源研究院研究员，研究方向为实时多模态模型、Multi-agent框架。

小苏，互联网大厂工作多年，丰富的投融资、出海以及产品运营经验，目前在做AI Agent产品的内部孵化。

【本期内容】

🟢 Part 1 openAI喵向通用Agent Model

00:01:46 o3及o4-mini发布，最大的亮点是什么？

00:05:40 怎么看待o系列推理模型在各种测试集上的进步？

00:08:49 普通人很难感知o系列推理模型的进步

00:11:04 模型评估的范式需要变革，可能需要瞄准解决新问题的能力

00:13:56 openAI要将o系列模型发展成通用Agent模型？

00:16:45 内嵌工具调用能力的o3可能是更好的Agent范式

00:22:31 Agent的未来可能是自己发现并调用工具

00:26:35 o系列模型还将怎么进化？

00:31:28 o3相比于o1的进步是如何实现的？

00:37:23 Agent的生态将会怎么变化，openAI的边界在哪里？

00:40:22 通用Agent可能很快出现，垂直Agent更容易做了

00:45:24 openAI为何要进军AI编程赛道？

🟢 Part 2 视觉推理：解锁多样应用

00:49:59 本次发布的视觉推理能力有什么厉害之处？

00:53:43 视觉推理将解锁哪些应用？

00:55:43 图像识别是不是被颠覆了？

00:57:18 具备视觉推理能力的机器，可能就更懂人了

🟢 Part 3 推理模型的未来进化

01:02:14 o系列模型什么时间会遇到瓶颈？

01:05:00 Agent可利用的数据范围比LLM更广

01:07:28 AI发展的下半场，从解决问题转到定义问题

欢迎订阅「硅基觉醒」播客

🚦我们希望一起见证超级智能的到来，迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察，在最前沿直击AI的技术与商业演变。

欢迎加入「硅基觉醒」部落，成为首批村民

🔮 与资深AI学者、创业者、投资人深入交流

🤖 寻觅你的技术与商业化伙伴，共商AI创业大计