[人人能懂AI前沿] 从AI的直觉、地图到闭卷考

你有没有想过，AI的“内心”也会上演一出出精彩的戏码？这一期，我们将一起潜入AI的大脑，看看它如何像我们一样，在解题前就有了“这题我能行”的直觉；然后我们会给它一张“地图”，看它如何从迷茫游客变身城市规划师，看懂整个复杂的软件世界；接着，我们将见证一位机器人“偷师学艺”，只通过观看视频就学会了打篮球；最后，我们还会聊聊顶尖数学家们如何给AI办一场杜绝作弊的“闭卷考”，以及AI训练场上一条好心办坏事的“交通规则”是如何被修正的。

00:00:40 AI的“第六感”，它如何知道自己快答对了？

00:05:17 给AI一张地图，让它看懂整个软件世界

00:10:47 机器人偷师记，它怎么光看视频就学会了打篮球？

00:18:33 给AI一场“闭卷考”，顶尖数学家们想干啥？

00:23:05 AI训练场上的“交规”，为什么好心会办坏事？

本期介绍的几篇论文：

[CL] Sparse Reward Subsystem in Large Language Models

[Tsinghua University & Stanford University]

arxiv.org

---

[CL] Closing the Loop: Universal Repository Representation with RPG-Encoder

[Microsoft Research Asia]