hi,这里是硅基觉醒。
这是一档围绕AI前沿技术与商业变革的节目,汇聚AI创业者、投资人以及大厂一线的实践与观察。我们期待与您共同见证超级智能的到来,迎接硅基觉醒的年代。欢迎在小宇宙平台和微信公众号搜索「硅基觉醒」订阅我们!
OpenAI发布了其推理系列最新模型o3及o4-mini,毫无疑问,它在各类榜单里再次刷新高度。然而,我们认为最新的模型发布里隐藏了OpenAI的重要发展线索和对Agent方向的巨大野心。o3系列模型开始引入一系列的工具调用能力,朝向一个通用的Agent Model迈出重要一步。其视觉推理能力,则解锁了更多的多模态的应用场景。OpenAI的能力进化将怎样影响AI应用生态?本期我们将围绕OpenAI的最新模型进化一起聊聊。
【主持人】
Harry,7年一级市场投资经验,2年互联网战略经验,AGI信徒。
【本期嘉宾】
小晨,北大博士,互联网大厂工作多年,关注RAG/Agent等大模型应用落地、大模型数据处理以及模型评测。
史业民,北大博士,前智源研究院研究员,研究方向为实时多模态模型、Multi-agent框架。
小苏,互联网大厂工作多年,丰富的投融资、出海以及产品运营经验,目前在做AI Agent产品的内部孵化。
【本期内容】
🟢 Part 1 openAI喵向通用Agent Model
00:01:46 o3及o4-mini发布,最大的亮点是什么?
00:05:40 怎么看待o系列推理模型在各种测试集上的进步?
00:08:49 普通人很难感知o系列推理模型的进步
00:11:04 模型评估的范式需要变革,可能需要瞄准解决新问题的能力
00:13:56 openAI要将o系列模型发展成通用Agent模型?
00:16:45 内嵌工具调用能力的o3可能是更好的Agent范式
00:22:31 Agent的未来可能是自己发现并调用工具
00:26:35 o系列模型还将怎么进化?
00:31:28 o3相比于o1的进步是如何实现的?
00:37:23 Agent的生态将会怎么变化,openAI的边界在哪里?
00:40:22 通用Agent可能很快出现,垂直Agent更容易做了
00:45:24 openAI为何要进军AI编程赛道?
🟢 Part 2 视觉推理:解锁多样应用
00:49:59 本次发布的视觉推理能力有什么厉害之处?
00:53:43 视觉推理将解锁哪些应用?
00:55:43 图像识别是不是被颠覆了?
00:57:18 具备视觉推理能力的机器,可能就更懂人了
🟢 Part 3 推理模型的未来进化
01:02:14 o系列模型什么时间会遇到瓶颈?
01:05:00 Agent可利用的数据范围比LLM更广
01:07:28 AI发展的下半场,从解决问题转到定义问题
欢迎订阅「硅基觉醒」播客
🚦我们希望一起见证超级智能的到来,迎接硅基觉醒的年代。汇聚AI创业者、投资人、以及大厂一线的实践和观察,在最前沿直击AI的技术与商业演变。
欢迎加入「硅基觉醒」部落,成为首批村民
🔮 与资深AI学者、创业者、投资人深入交流
🤖 寻觅你的技术与商业化伙伴,共商AI创业大计
📩 添加小助理微信【silicon_era】获取入群通道,或者扫描下方二维码,备注【硅基觉醒入群】