[人人能懂AI前沿] 给AI“减肥”、“立人设”和“夸到点子上”,需要几步?

[人人能懂AI前沿] 给AI“减肥”、“立人设”和“夸到点子上”,需要几步?

24分钟 ·
播放数178
·
评论数0

你有没有想过,最简单的数学平均值,竟然能打败最复杂的压缩算法?或者,在教AI“做什么”之前,我们其实可以先给它“喂”一套完整的思想和人设?本期节目,我们将从四篇最新的AI论文出发,一起探寻如何让AI自己长出可拆分的“乐高模块”,以及如何像一位顶级名师那样,把奖励精准地“夸”到AI的灵光一闪之处。

00:00:29 你的记忆能被压缩多少,藏在一个几何定律里

00:06:42 训练AI,从“喂”指令到“喂”思想

00:11:47 AI减肥记,如何让一个大模型只带“脑子”出门?

00:17:54 AI也需要“夸到点子上”?

本期介绍的几篇论文:

[LG] The Geometry of Consolidation

A Bharadwaj Vangara, A Gopinath

github.com

---

[AI] Model Spec Midtraining: Improving How Alignment Training Generalizes

C Li, S Price, S Marks, J Kutasov

arxiv.org

---

[CL] EMO: Pretraining Mixture of Experts for Emergent Modularity

R Wang, A Bhagia, S Min

arxiv.org

---

[LG] DGPO: Distribution Guided Policy Optimization for Fine Grained Credit Assignment

H Jin, R Zhu, Z Du, X Jiang…

arxiv.org