[人人能懂AI前沿] 从精准剪枝、模仿起跑到迭代反思

[人人能懂AI前沿] 从精准剪枝、模仿起跑到迭代反思

27分钟 ·
播放数112
·
评论数0

你有没有想过,真正的高手和普通人的思维差异在哪?今天我们要聊的,就是AI如何向各路高手“偷师学艺”。我们会看到,AI如何学会像园艺大师一样“精准剪枝”,做出最少却最关键的改动;如何像一个学霸,通过模仿,赢在训练的“起跑线”上。甚至,它还学会了我们最熟悉的两个策略:像写作者一样“先打草稿再定稿”,以及像我们读书时一样,边读边在脑子里贴上“思维小纸条”。当然,我们还会聊聊,如何给AI的“说明书”能力,建立一个既靠谱又高效的自动化考场。准备好了吗?让我们一起探索AI思考的进化之路!

00:00:45 高手调参,为什么“少做”有时比“多做”更聪明?

00:05:50 AI训练的起跑线,一个被忽视的“小动作”

00:10:08 AI的“说明书”能力,我们该如何衡量?

00:16:29 AI如何像高手一样思考,先打草稿,再定稿

00:21:02 AI“开小差”的秘密,边读边想,效率翻倍

本期介绍的几篇论文:

[LG] BONSAI: Bayesian Optimization with Natural Simplicity and Interpretability  

[Meta]  

arxiv.org 

---

[LG] Mimetic Initialization of MLPs  

[CMU]  

arxiv.org 

---

[LG] How2Everything: Mining the Web for How-To Procedures to Evaluate and Improve LLMs  

[Allen Institute for AI & University of Maryland]  

arxiv.org 

---

[LG] iGRPO: Self-Feedback-Driven LLM Reasoning  

[NVIDIA]  

arxiv.org 

---

[CL] Latent Reasoning with Supervised Thinking States  

[Google Research]  

arxiv.org