[人人能懂AI前沿] 从“眼神”训练、“精准点拨”到“隐形教练”

[人人能懂AI前沿] 从“眼神”训练、“精准点拨”到“隐形教练”

29分钟 ·
播放数161
·
评论数0

你有没有想过,我们到底怎样才能让AI从一个“博闻强识的学霸”,进化成一个“举一反三的宗师”?今天,我们就从五篇最新论文出发,揭秘几种让AI变聪明的“心法”:我们将看到,如何只用13个参数就撬动一个AI大脑;如何训练AI的“眼神”而不是答案;以及,如何让AI在一次次失败后,学会“吃一堑,长一智”,甚至在不知不觉中被一位“隐形教练”所塑造。准备好了吗?让我们一起探索AI学习能力的全新边界。

00:00:38 AI变聪明的秘密,不只看答案,更要看“眼神”

00:05:59 13个参数,撬动一个AI大脑

00:10:24 你的AI,为什么总在同一个地方犯错?

00:16:39 如何训练一个没有“标准答案”的AI?

00:00 你的数据里,藏着一位“隐形教练”

本期介绍的几篇论文:

[CL] Reinforced Attention Learning

[Google & Google DeepMind & UC Davis]

arxiv.org

---

[LG] Learning to Reason in 13 Parameters

[FAIR at Meta]

arxiv.org

---

[LG] Scaling In-Context Online Learning Capability of LLMs via Cross-Episode Meta-RL

[Boston University & LinkedIn]

arxiv.org

---

[CL] Likelihood-Based Reward Designs for General LLM Reasoning

[Meta FAIR & University of Amsterdam]

arxiv.org

---

[LG] Subliminal Effects in Your Data: A General Mechanism via Log-Linearity

[UC Berkeley & Microsoft Research]

arxiv.org