[人人能懂] 重塑AI的行为、思考与形态

[人人能懂] 重塑AI的行为、思考与形态

29分钟 ·
播放数95
·
评论数1

我们总希望AI不只是个聪明的工具,更像个能沟通、能反思、甚至能自我进化的伙伴。本期节目,我们就从几篇最新论文出发,看看科学家们是如何脑洞大开地教AI“忏悔”错误、在虚拟世界里“动手”实践、像团队一样“合成”智慧,甚至上演一出匪夷所思的“灵魂互换”大戏。准备好了吗?让我们一起探索,如何把AI从一个“黑箱”变成一个我们可以理解和塑造的智能体。

00:00:33 让AI“忏悔”,我们能得到什么?

00:05:49 当AI不再只是个“书呆子”

00:11:06 AI自己不行的事,怎么让一群AI办成?

00:16:56 AI的“复盘”教练:如何用人话把它教聪明

00:22:11 AI变形记:为什么你训练的和最后用的,不必是同一个模型?

本期介绍的几篇论文:

[CL] Training LLMs for Honesty via Confessions

[OpenAI]

cdn.openai.com

---

[AI] SIMA 2: A Generalist Embodied Agent for Virtual Worlds

[Google DeepMind]

arxiv.org

---

[AI] Algorithmic Thinking Theory

[Google & NYU]

arxiv.org

---

[LG] Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space

[UC Berkeley & ByteDance Seed]

arxiv.org

---

[LG] Network of Theseus (like the ship)

[MIT CSAIL & Johns Hopkins University]

arxiv.org

展开Show Notes
ovesellestte
ovesellestte
20小时前
04:26 【奖励对ai的意义是什么】