[人人能懂] 从虚假纠错、全知指数到诗歌越狱

我们总惊叹AI越来越聪明，但你有没有想过，它为什么也越来越会“一本正经地胡说八道”？我们又该如何教会它回归事物的本质，甚至理解整个物理世界的运行规律？而当一个AI变得如此强大时，为什么一句简单的诗，就能轻易攻破它的安全防线？今天，我们就从几篇最新论文出发，一起聊聊AI光环之下的真实面貌。

00:00:29 AI：一个既聪明又靠不住的“好学生”

00:05:23 AI画画：为什么“猜噪音”不如“看本质”？

00:10:13 为什么聪明的AI也爱“一本正经地胡说八道”？

00:14:35 AI当学霸：如何用一个模型，通晓万物运行之道

00:19:54 为什么AI大模型，偏偏就怕“文化人”？

本期介绍的几篇论文：

[LG] Structural Inducements for Hallucination in Large Language Models

[University of Maryland]

---

[CV] Back to Basics: Let Denoising Generative Models Denoise

[MIT]

---

[CL] AA-Omniscience: Evaluating Cross-Domain Knowledge Reliability in Large Language Models

[Artificial Analysis]

---

[LG] Walrus: A Cross-Domain Foundation Model for Continuum Dynamics

[Flatiron Institute & University of Cambridge]

---

[CL] Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models

[DEXAI – Icaro Lab]