大模型之后,我们还能研究什么?——OpenAI姚顺雨《AI 的下半场》

大模型之后,我们还能研究什么?——OpenAI姚顺雨《AI 的下半场》

41分钟 ·
播放数4965
·
评论数11

本期内容:

本期聊一聊最近AI圈很轰动的姚顺雨写的博客《The Second Half》,讨论AI研究的现状和未来可能的方向。

时间线:

01:39 《The Second Half: AI 研究的下半场》主要讲了什么?

03:01 AI的上半场的3个代表性成果

06:05 AI当前的不足/痛点

08:05 AI发展的下半场是什么?

14:35 打破AI局限性

17:40 “强化学习”的三要素:算法,环境,先验知识

35:33 关于AI测试集的疑问解答

姚顺雨博客链接:

The Second Half

联系邮箱:

quater_seek@proton.me

展开Show Notes
L艺真
L艺真
2025.5.03
内容很棒 加油
06:45 效用问题
HD941173w
HD941173w
2025.10.09
15:21 强化学习是突破大模型智能上限的训练步骤。强化学习三要素:算法、环境、先验知识。大模型缺失的是先验知识eg知识图谱(大模型预训练环节)。下半场的重点是效用(AI对现实生活生产力的协助),关键是对AI的重新评估,在技术上是强化学习中AI如何模拟人思考的过程,而非单纯依靠动作-结果反馈来执行。解决效用问题的主角是agent&强化学习,agent用过思考、做动作得出反馈,是强化学习的主体。 当前发展方向:模型&方法层面的创新显著性不强,重要的是如何测评模型(目前测评数据集本身不够有效),需要的是真正衡量人本身需求的、有用的测试集,基于测试集发展出来的模型才能真正提升生产力,解决效用问题。
HD941173w
HD941173w
2025.10.09
08:07 万能方法:大模型+强化学习+agent
25:10 冷启动问题 先思考
11:40 测试数据集 无代表性 现实互动
小楠子_
小楠子_
2025.9.15
全部听完了,讲解的清晰易懂,期待下一期的更新~~
尧舜禹 这名字好霸气啊
17:34 回顾强化学习
08:26 现有万能方法 大 强 agent