大模型之后，我们还能研究什么？——OpenAI姚顺雨《AI 的下半场》

一刻求索

41分钟 ·1 年前

5069

本期内容：

本期聊一聊最近AI圈很轰动的姚顺雨写的博客《The Second Half》，讨论AI研究的现状和未来可能的方向。

时间线：

01:39 《The Second Half: AI 研究的下半场》主要讲了什么？

03:01 AI的上半场的3个代表性成果

06:05 AI当前的不足/痛点

08:05 AI发展的下半场是什么？

14:35 打破AI局限性

17:40 “强化学习”的三要素：算法，环境，先验知识

35:33 关于AI测试集的疑问解答

姚顺雨博客链接：

The Second Half

联系邮箱：

quater_seek@proton.me

展开Show Notes

L艺真

2025.5.03

内容很棒加油

飞船落在陈塘关

2025.5.04

22:36 总结

飞船落在陈塘关

2025.5.04

06:45 效用问题

HD941173w

2025.10.09

15:21 强化学习是突破大模型智能上限的训练步骤。强化学习三要素：算法、环境、先验知识。大模型缺失的是先验知识eg知识图谱（大模型预训练环节）。下半场的重点是效用（AI对现实生活生产力的协助），关键是对AI的重新评估，在技术上是强化学习中AI如何模拟人思考的过程，而非单纯依靠动作-结果反馈来执行。解决效用问题的主角是agent&强化学习，agent用过思考、做动作得出反馈，是强化学习的主体。当前发展方向：模型&方法层面的创新显著性不强，重要的是如何测评模型（目前测评数据集本身不够有效），需要的是真正衡量人本身需求的、有用的测试集，基于测试集发展出来的模型才能真正提升生产力，解决效用问题。

HD941173w

2025.10.09

08:07 万能方法：大模型+强化学习+agent

飞船落在陈塘关

2025.5.04

25:10 冷启动问题先思考

飞船落在陈塘关

2025.5.04

11:40 测试数据集无代表性现实互动