[人人能懂AI前沿] 更聪明的AI：从精准辅导、内心独白到自我陪练

你有没有想过，我们到底该如何培养一个更聪明的AI？本期节目，我们将一起揭秘几篇最新论文，看看科学家们是如何给AI请“精准家教”，让它花十分之一的钱办成同样的事；如何窥探AI的“内心戏”，了解它什么时候是真的自信；又是如何通过一个关键的“中间态”和不知疲倦的“AI陪练”，把它从偏科生打造成全能高手，并最终教会它“懂分寸”，成为一名好裁判的。让我们一同探寻AI的成长之道。

00:00:35 AI的“补习班”，如何花十分之一的钱，办成同样的事？

00:06:21 AI的“内心戏”，它怎么知道自己懂不懂？

00:12:18 你和高手的差距，可能只是一个“中间态”

00:18:32 AI的“陪练”，高手是怎么喂出来的？

00:24:11 如何把一个“耿直”的AI，训练得“懂分寸”？

本期介绍的几篇论文：

[LG] Efficient Exploration at Scale

[Google DeepMind]

arxiv.org

---

[CL] How do LLMs Compute Verbal Confidence

[Google DeepMind]