[人人能懂AI前沿] 从推测解码、世界模型到训练解耦:深入AI的“内功心法”

[人人能懂AI前沿] 从推测解码、世界模型到训练解耦:深入AI的“内功心法”

30分钟 ·
播放数77
·
评论数0

本期,我们将一起揭秘AI的几套最新“武功秘籍”。我们会看到,AI如何通过聪明的“实习生”机制实现疯狂提速;又如何为自己打造一个“驾校模拟器”,在行动前预判成败。更进一步,我们还会深入AI的“厨房”与“健身房”,看看科学家是如何为它定制私房菜谱、修炼训练内功,把它从一个“独行侠”培养成一个懂得协作的“项目主管”!

00:00:30 “快”与“好”的战争,AI是怎么悄悄提速的?

00:06:23 让AI学会“脑补”,需要分几步?

00:11:32 如何喂养一个聪明的AI?一份来自顶尖研究的私房菜谱

00:17:59 如何把一个“普通学生”AI,训练成“项目主管”?

00:23:27 AI训练的“内功心法”,快慢分开走

本期介绍的几篇论文:

[LG] DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation

[DeepSeek-AI & Peking University]

github.com

---

[CL] Qwen-AgentWorld: Language World Models for General Agents

[Qwen Team]

arxiv.org

---

[AI] OpenThoughts-Agent: Data Recipes for Agentic Models

[UC Berkeley & Stanford University & JSC]

arxiv.org

---

[AI] SPIRAL: Learning to Search and Aggregate

[Stanford University]

arxiv.org

---

[LG] Improving Neural Network Training by Decoupling the Magnitude and Direction of Weight Vectors

[EPFL]

arxiv.org