[人人能懂AI前沿] 从约束、协同到自校准:AI思考方式的五大革新

[人人能懂AI前沿] 从约束、协同到自校准:AI思考方式的五大革新

28分钟 ·
播放数91
·
评论数0

我们总惊叹AI越来越聪明,但你有没有想过,聪明的AI也会有自己的烦恼?比如,它可能像个伪装极深的“卧底”,悄悄藏着偏见;也可能像个只会刷题的“好学生”,答案虽对,却毫无灵气。它在解决难题时,可能会反复“无效内卷”,或者在关键的推理环节“脑子短路”。本期节目,我们就从几篇最新论文出发,看看科学家们如何通过巧妙的设计,教会AI自我审视、优雅试错、清晰思考,甚至让它的思考过程变得有迹可循。准备好,我们一起揭开AI变得更聪明的秘密。

00:00:40 AI的“无间道”,如何揪出那些伪装良好的“卧底”偏见?

00:05:55 AI变聪明的秘密,不是多试几次,而是换个姿势再试

00:11:08 AI侦探断案,为什么它连“你妈的儿子的老婆”都搞不清?

00:16:45 怎样让AI的思考,既聪明又有迹可循?

00:22:06 AI的“好学生”困境,做对题,为何还是不对劲?

本期介绍的几篇论文:

[CL] Distill to Detect: Exposing Stealth Biases in LLMs through Cartridge Distillation

[Stanford University & University of Texas at Austin]

arxiv.org

---

[LG] QuasiMoTTo: Quasi-Monte Carlo Test-Time Scaling

[Stanford University]

arxiv.org

---

[CL] DiscoLoop: Looping Discrete Embeddings and Continuous Hidden States for Multi-hop Reasoning

[UC Berkeley]

arxiv.org

---

[CL] Graph-Native Reinforcement Learning Enables Traceable Scientific Hypothesis Generation through Conceptual Recombination

[MIT & Oak Ridge National Laboratory]

arxiv.org

---

[LG] Right in the Right Way: LM Training with Verifiable Rewards and Human Demonstrations

[MIT]

arxiv.org