[人人能懂AI前沿] 更聪明的AI:从精准辅导、内心独白到自我陪练

[人人能懂AI前沿] 更聪明的AI:从精准辅导、内心独白到自我陪练

30分钟 ·
播放数227
·
评论数1

你有没有想过,我们到底该如何培养一个更聪明的AI?本期节目,我们将一起揭秘几篇最新论文,看看科学家们是如何给AI请“精准家教”,让它花十分之一的钱办成同样的事;如何窥探AI的“内心戏”,了解它什么时候是真的自信;又是如何通过一个关键的“中间态”和不知疲倦的“AI陪练”,把它从偏科生打造成全能高手,并最终教会它“懂分寸”,成为一名好裁判的。让我们一同探寻AI的成长之道。

00:00:35 AI的“补习班”,如何花十分之一的钱,办成同样的事?

00:06:21 AI的“内心戏”,它怎么知道自己懂不懂?

00:12:18 你和高手的差距,可能只是一个“中间态”

00:18:32 AI的“陪练”,高手是怎么喂出来的?

00:24:11 如何把一个“耿直”的AI,训练得“懂分寸”?

本期介绍的几篇论文:

[LG] Efficient Exploration at Scale

[Google DeepMind]

arxiv.org

---

[CL] How do LLMs Compute Verbal Confidence

[Google DeepMind]

arxiv.org

---

[LG] PRISM: Demystifying Retention and Interaction in Mid-Training

[IBM Research]

arxiv.org

---

[AI] AI Scientist via Synthetic Task Scaling

[Princeton University & Microsoft Research]

arxiv.org

---

[LG] REAL: Regression-Aware Reinforcement Learning for LLM-as-a-Judge

[University of California, Los Angeles & The University of Texas at Austin]

arxiv.org

展开Show Notes
04:45 人类的鼓励和肯定是AI的多巴胺😁