[人人能懂] 从结构稀疏、自我博弈到过程奖励

[人人能懂] 从结构稀疏、自我博弈到过程奖励

26分钟 ·
播放数382
·
评论数0

我们总觉得AI的发展就是更大、更强、更耗电,但今天我们要聊点不一样的。本期节目,我们将看到科学家们如何用一系列“四两拨千斤”的巧思,解决AI发展中的大难题。我们会聊到,如何向我们自己的眼睛“偷师”给AI一个天生好骨架,如何让AI自己给自己出题实现永动式学习,甚至如何通过一个被遗忘的“开关”和打上“过程分”,让训练事半功倍。这些最新论文的洞见,不仅关乎技术,更是一堂堂关于如何聪明解决问题的思维课。

00:00:38 AI瘦身指南:向你的眼睛“偷”个师

00:05:32 AI的终极自学法:如何自己给自己出题?

00:10:35 AI训练场上的“鬼打墙”:一个被遗忘的开关如何解决大问题

00:15:36 AI写作的“两难”:如何让机器既懂“感觉”又懂“规矩”?

00:20:28 AI也需要“过程分”:从“废料”里炼金

本期介绍的几篇论文:

[LG] Topographical sparse mapping: A neuro-inspired sparse training framework for deep learning models

[University of Surrey]

www.sciencedirect.com

---

[CL] SPICE: Self-Play In Corpus Environments Improves Reasoning

[FAIR at Meta]

arxiv.org

---

[LG] Defeating the Training-Inference Mismatch via FP16

[Sea AI Lab]

arxiv.org

---

[LG] CANDI: Hybrid Discrete-Continuous Diffusion Models

[Purdue University & Google DeepMind]

arxiv.org

---

[CL] Repurposing Synthetic Data for Fine-grained Search Agent Supervision

[Alibaba Group]

arxiv.org