ChatGPT变身Agent:解读o3的进化与OpenAI的Agent野心

ChatGPT变身Agent:解读o3的进化与OpenAI的Agent野心

73分钟 ·
播放数4965
·
评论数13

hi,这里是硅基觉醒。

这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们!

OpenAI发布了其推理系列最新模型o3及o4-mini,毫无疑问,它在各类榜单里再次刷新高度。然而,我们认为最新的模型发布里隐藏了OpenAI的重要发展线索和对Agent方向的巨大野心。o3系列模型开始引入一系列的工具调用能力,朝向一个通用的Agent Model迈出重要一步。其视觉推理能力,则解锁了更多的多模态的应用场景。OpenAI的能力进化将怎样影响AI应用生态?本期我们将围绕OpenAI的最新模型进化一起聊聊。

【主持人】

Harry,7年一级市场投资经验,2年互联网战略经验,AGI信徒。

【本期嘉宾】

小晨,北大博士,互联网大厂工作多年,关注RAG/Agent等大模型应用落地、大模型数据处理以及模型评测。

史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。

小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。

【本期内容】

🟢 Part 1 openAI喵向通用Agent Model

00:01:46 o3及o4-mini发布,最大的亮点是什么?

00:05:40 怎么看待o系列推理模型在各种测试集上的进步?

00:08:49 普通人很难感知o系列推理模型的进步

00:11:04 模型评估的范式需要变革,可能需要瞄准解决新问题的能力

00:13:56 openAI要将o系列模型发展成通用Agent模型?

00:16:45 内嵌工具调用能力的o3可能是更好的Agent范式

00:22:31 Agent的未来可能是自己发现并调用工具

00:26:35 o系列模型还将怎么进化?

00:31:28 o3相比于o1的进步是如何实现的?

00:37:23 Agent的生态将会怎么变化,openAI的边界在哪里?

00:40:22 通用Agent可能很快出现,垂直Agent更容易做了

00:45:24 openAI为何要进军AI编程赛道?

🟢 Part 2 视觉推理:解锁多样应用

00:49:59 本次发布的视觉推理能力有什么厉害之处?

00:53:43 视觉推理将解锁哪些应用?

00:55:43 图像识别是不是被颠覆了?

00:57:18 具备视觉推理能力的机器,可能就更懂人了

🟢 Part 3 推理模型的未来进化

01:02:14 o系列模型什么时间会遇到瓶颈?

01:05:00 Agent可利用的数据范围比LLM更广

01:07:28 AI发展的下半场,从解决问题转到定义问题

欢迎订阅「硅基觉醒」播客

🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。

欢迎加入「硅基觉醒」部落,成为首批村民

🔮 与资深AI学者、创业者、投资人深入交流

🤖 寻觅你的技术与商业化伙伴,共商AI创业大计

📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】

展开Show Notes
像repeat discover 这些日常基础词汇就没必要用英语了吧😂
maybe😅
适之安之:连续maybe把你击碎
HD735184w
HD735184w
2025.5.02
太装了,听不下去(以及很空洞地简单对比不同的模型
li3huo:把那姑娘说的都快进掉还能听
HD212821d
HD212821d
2025.5.06
1:00:06 她说话时的发音方式把人听得憋死了。
li3huo
li3huo
2025.5.05
35:39 这姑娘废话真多,不知所云
鹏pubk
鹏pubk
2025.5.22
那个中英间夹真的挺受。关键是没讲到要点。
li3huo
li3huo
2025.5.05
19:56 agent = llm + planning + memory + tool use
li3huo
li3huo
2025.5.05
1:12:07 evaluation 的困境
假樊家豪
假樊家豪
2025.5.02
非常认可跟现实世界的连接才是AI革命生产力的奇点,时代各类机器人在生活中落地开花
HoneChin
HoneChin
2025.5.01
小苏的声音好性感
谢谢。