[人人能懂AI前沿] 从任务分解、思维几何到注意力黑洞

[人人能懂AI前沿] 从任务分解、思维几何到注意力黑洞

32分钟 ·
播放数89
·
评论数0

我们总以为AI的进步就是靠“大力出奇迹”,但如果这个“大力”会扭曲现实、甚至有它砸不开的墙呢?本期,我们就来看几篇“反其道而行”的最新论文,看看AI如何学会像乐高大师一样分解任务,像生物一样进化出看问题的“火眼金睛”。我们还会给AI的思维做个“CT扫描”,看看它在百万份文件中是如何被“噪音”淹没,又是如何学会重新聚焦的。准备好,让我们一起探索AI如何告别蛮力,走向真正的“巧”劲儿。

00:00:35 AI能扮演人类吗?一个关于“大力出奇迹”的意外发现

00:08:00 如何给AI的思维过程做个“CT扫描”?

00:13:57 让AI学会“开窍”,聪明的数据,胜过强大的模型

00:19:46 高手解题,为何偏爱“笨办法”?

00:25:23 大模型记忆的极限,为什么“知道”不等于“能说出来”?

本期介绍的几篇论文:

[CL] Will Scaling Improve Social Simulation with LLMs?

[Stanford University]

arxiv.org

---

[LG] Geometric Signatures of Reasoning: A Spectral Perspective on Task Hardness

[Northeastern University & University of Southern California & Google Research]

arxiv.org

---

[LG] Evolutionary Feature Engineering for Structured Data

[University of Michigan & Google Research]

arxiv.org

---

[LG] DecompRL: Solving Harder Problems by Learning Modular Code Generation

[FAIR at Meta & Inria]

arxiv.org

---

[CL] Can Language Models Actually Retrieve In-Context? Drowning in Documents at Million Token Scale

[UC Berkeley & UT Austin]

arxiv.org