你有没有想过,我们到底该如何培养一个更聪明的AI?本期节目,我们将一起揭秘几篇最新论文,看看科学家们是如何给AI请“精准家教”,让它花十分之一的钱办成同样的事;如何窥探AI的“内心戏”,了解它什么时候是真的自信;又是如何通过一个关键的“中间态”和不知疲倦的“AI陪练”,把它从偏科生打造成全能高手,并最终教会它“懂分寸”,成为一名好裁判的。让我们一同探寻AI的成长之道。
00:00:35 AI的“补习班”,如何花十分之一的钱,办成同样的事?
00:06:21 AI的“内心戏”,它怎么知道自己懂不懂?
00:12:18 你和高手的差距,可能只是一个“中间态”
00:18:32 AI的“陪练”,高手是怎么喂出来的?
00:24:11 如何把一个“耿直”的AI,训练得“懂分寸”?
本期介绍的几篇论文:
[LG] Efficient Exploration at Scale
[Google DeepMind]
---
[CL] How do LLMs Compute Verbal Confidence
[Google DeepMind]
---
[LG] PRISM: Demystifying Retention and Interaction in Mid-Training
[IBM Research]
---
[AI] AI Scientist via Synthetic Task Scaling
[Princeton University & Microsoft Research]
---
[LG] REAL: Regression-Aware Reinforcement Learning for LLM-as-a-Judge
[University of California, Los Angeles & The University of Texas at Austin]
![[人人能懂AI前沿] 更聪明的AI:从精准辅导、内心独白到自我陪练](https://image.xyzcdn.net/FuDP4HpAp8ezgVZMmEel3mblKCmJ.jpg@small)