你有没有想过,我们到底怎样才能让AI从一个“博闻强识的学霸”,进化成一个“举一反三的宗师”?今天,我们就从五篇最新论文出发,揭秘几种让AI变聪明的“心法”:我们将看到,如何只用13个参数就撬动一个AI大脑;如何训练AI的“眼神”而不是答案;以及,如何让AI在一次次失败后,学会“吃一堑,长一智”,甚至在不知不觉中被一位“隐形教练”所塑造。准备好了吗?让我们一起探索AI学习能力的全新边界。
00:00:38 AI变聪明的秘密,不只看答案,更要看“眼神”
00:05:59 13个参数,撬动一个AI大脑
00:10:24 你的AI,为什么总在同一个地方犯错?
00:16:39 如何训练一个没有“标准答案”的AI?
00:00 你的数据里,藏着一位“隐形教练”
本期介绍的几篇论文:
[CL] Reinforced Attention Learning
[Google & Google DeepMind & UC Davis]
---
[LG] Learning to Reason in 13 Parameters
[FAIR at Meta]
---
[LG] Scaling In-Context Online Learning Capability of LLMs via Cross-Episode Meta-RL
[Boston University & LinkedIn]
---
[CL] Likelihood-Based Reward Designs for General LLM Reasoning
[Meta FAIR & University of Amsterdam]
---
[LG] Subliminal Effects in Your Data: A General Mechanism via Log-Linearity
[UC Berkeley & Microsoft Research]
![[人人能懂AI前沿] 从“眼神”训练、“精准点拨”到“隐形教练”](https://image.xyzcdn.net/FuDP4HpAp8ezgVZMmEel3mblKCmJ.jpg@small)