#596.AI 智能体:当百万个代理开始替你谈判、花钱与协作

#596.AI 智能体:当百万个代理开始替你谈判、花钱与协作

43分钟 ·
播放数693
·
评论数2

📝 本期播客简介

本期我们克隆了:Google DeepMind《When millions of AI agents meet

原内容更新时间:2026-06-23

本期来自 Google DeepMind 播客,由数学家、科普作者 Hannah Fry 主持,对谈 Google DeepMind 高级主任研究科学家 Nenad Tomašev。节目讨论的是当下 AI 领域最热、也最容易被低估风险的方向:AI agents。它们不再只是回答问题的大语言模型,而是能够观察环境、调用工具、执行多步骤计划,甚至代表用户做决定的行动系统。

这期对话的重点不只是“智能体能帮我订餐、写代码、发邮件”这些个人效率场景,而是进一步追问:当数百万个智能体同时存在于互联网中,它们彼此交易、协商、委托、竞争,会不会形成一种新的“智能体经济”?这种经济可能如何分配资源、如何建立信任、如何避免串通、闪崩、提示注入和自动化偏见?

Nenad 的判断非常克制但信息量很高:智能体会加速科学发现和复杂任务执行,但越是要进入真实世界,越需要人类保持清醒、权限控制、纵深防御、声誉机制和经济激励设计。节目最后提出一个关键视角:未来的 AGI 也许不是一个巨大单体模型,而更像由通用层和无数专用型智能体组成的分布式智能社会。

👨‍⚕️ 本期嘉宾

Nenad Tomašev,Google DeepMind 高级主任研究科学家,长期研究人工智能、医疗 AI、多智能体系统与 AI 安全。他曾参与医学影像、放射学等高风险领域的机器学习研究,熟悉 AI 系统在真实世界部署时面临的可靠性、复核、责任与安全问题。正因为他既理解前沿模型能力,也熟悉高风险场景中的工程与治理约束,这期对话不是简单展望“AI 替人干活”的乐观叙事,而是从系统、经济、网络安全和社会整合多个层面,拆解智能体真正大规模落地前必须解决的问题。

⏱️ 时间戳

开场与节目背景

00:00 跨国串门计划开场:用 AI 声纹克隆翻译全球优质播客

00:38 本期克隆节目介绍:Google DeepMind《When millions of AI agents meet》

00:50 主持人与嘉宾:Hannah Fry 对谈 Nenad Tomašev

01:04 开场金句:智能体、清醒监督、信任与未来通用层

01:42 Google DeepMind 播客正式开始:从 AI 助手到 AI 智能体

02:22 核心问题:当数百万个智能体彼此交易、谈判、委托会怎样

什么是 AI 智能体

02:51 从基础开始:大语言模型和智能体到底有什么区别

03:03 智能体不是新概念:早于大语言模型的 AI 研究传统

03:26 智能体的核心定义:观察世界状态,并在环境中采取行动

03:48 语言模型只是续写回答,智能体会通过外层 harness 执行动作

04:14 自主性来自哪里:把一连串决策与多步骤行动串起来

04:56 敏感操作仍需要批准:人类输入不能轻易消失

05:12 使用体验:你仍在对话,但角色更像决策者和审批者

05:47 婚礼筹备例子:从推荐名单到真正发邮件、订供应商

06:04 工具访问权限:给 Gmail、钱包、网页后,智能体才真正能办事

06:34 “理想情况下”:智能体完成任务的前提是没有出错

智能体现在擅长什么

06:42 当前阶段:智能体最擅长的方向之一是编程

07:07 软件开发被加速:人类注意力回到想法和设计

07:37 为什么还要人在环路中:不是不能做,而是不可能百分百准确

08:12 错误可能很隐蔽:自动化偏见让人逐渐放松警惕

08:48 人不只是“在场”,还必须真正投入、保持清醒

09:04 长期冲击:AI 正在进入科学、数学等过去难以想象的领域

09:59 变化速度令人不安:这次适应窗口可能比工业革命更短

10:26 为什么要构建智能体:推动科学进步、改善健康和人类福利

10:59 自主性的争议:是否应该把更多行动权交给系统

智能体与科学自动化

11:40 Nenad 的核心梦想:用智能体加速科学研究

11:45 科学不只是好点子:还包括实验、观察、分析与闭环反馈

12:10 自主研究实验室:让智能体安排实验运行

12:24 真实世界接口必须有安全保护:材料、生物、电池都可能出事故

12:45 科学闭环比软件更难:物理实验才是反馈来源

13:16 当智能体能自主测试问题,人类角色在哪里

13:34 短期答案:当前系统还不是 AGI,人类仍有关键作用

13:48 这一代系统的能力边界:组合式延展人类已有技能

14:08 还没有深层科学变革:尚未出现人类完全想不到的发现

为什么现在才落地

14:23 智能体被谈论多年,为什么最近才真正走向普通人

14:38 早期窄智能体:数据中心优化、交易算法等已存在但不可交流

15:17 新变化:基于语言模型的智能体可以被对话、引导和影响

15:34 阻碍大规模部署的关键:不只是底层模型,而是协调与编排

16:08 用户将变成“团队管理者”:管理一队智能体的工作流

16:29 智能体会犯非人类式错误,也还不够了解你

16:50 幻觉与灾难性后果:为什么信任智能体是一大步

17:10 信任可以给予,但必须被赢得:声誉追踪与持续验证

委托、验证与复杂任务

17:48 智能体之间的委托:一个任务如何拆给专用智能体

17:58 复杂任务瓶颈:没有单个智能体能完成所有部分

18:36 智能体间协议:委托、失败管理与提前预防

18:54 判断可委托对象:可靠性、能力认证与恶意交互防护

19:17 大型活动类比:协调越复杂,出错点越多

19:41 多智能体系统现状:很多只是并行化,不是真正智能委托

20:17 随机拆任务的风险:买酒和买杯子的智能体可能互不理解

20:35 为什么软件场景更容易:单元测试让结果更可验证

21:10 奖励黑客:技术上完成请求,却违背真实意图

21:30 可验证性与正式契约:委托方和受托方必须定义清楚

21:38 可逆任务与不可逆任务:花钱、下单等现实后果需要更谨慎

22:04 反向委托:AI 也会把任务交给人类

医疗 AI 与人机协作

22:26 医疗 AI 背景:Nenad 曾长期研究医学场景

22:31 窄领域超人类系统:医学影像模型已能高水平识别病灶

22:55 AI 仍会出错:人类专家复核是重要配置

23:16 AI 先预测,不确定时标记给人类

23:32 最佳团队配置:AI 在不确定时把判断让给人类

23:49 即使 AI 超过人类,也需要人类处理不确定性和敏感操作

网络安全与智能体陷阱

24:21 网络安全问题:越来越多智能体在互联网互动,会被攻击

24:40 智能体式陷阱:大规模部署困难的主要原因之一

24:48 统计性失败:大量互动中,只要单次不可靠,系统就自然会失败

25:11 环境就是互联网:如果网页被投毒,智能体可能踩入陷阱

25:38 提示注入案例:酒商网站隐藏指令改变智能体目标

25:54 隐藏 token:网页中人类看不见、智能体会读到的内容

26:23 动态伪装:对人类和智能体展示不同页面

26:45 钱包权限风险:智能体可能被诱导转钱或执行恶意操作

27:21 一旦开放部署,攻击动机迅速增强

27:32 网页可能已进入“智能体生成、智能体消费”的阶段

27:49 网页分裂:给人看的版本与给智能体看的版本

28:11 如何缓解风险:无法控制整个网页时,怎么保护智能体

纵深防御与权限管理

28:24 网页安全并非新问题:附件病毒、钓鱼页面与资源验证

28:43 对抗样本类比:人类无感的微小修改也能攻击模型

29:08 护栏不能只盯智能体本身,也要看外部环境

29:22 纵深防御:没有单一方案能解决全部问题

29:39 一层层缓解措施:让安全网足够密

29:49 网页认证、资源信任、模型缓解与智能体侧防护

30:05 人类控制与权限最小化:被越狱时把损害降到最低

智能体经济:交易、拍卖与公平

30:25 什么是正式的智能体式经济

30:39 个人助理智能体:拥有持久记忆、偏好和部分自主性

30:57 给智能体预算:个人助理之间形成局部经济

31:06 演唱会门票例子:所有智能体同时抢票会怎样

32:00 拍卖机制是设计选择:公平性由系统规则决定

32:12 同等预算与偏好分配:让智能体代表真实需求行动

32:55 人群规模上的公平:机制设计决定资源分配结果

33:03 从门票到金融市场:智能体可能冲击高频交易与股票系统

33:36 向已有金融系统学习:不必重新发明风险缓解机制

33:56 AI 智能体的新问题:底层模型高度集中

34:15 认知单一文化:百万个相似决策者会制造相关故障点

34:57 智能体式群体思维与潜在串通

35:16 不直接通信也可能协调:需要反串通措施

为什么发布必须谨慎

35:29 安全担忧越具体,越能理解为什么要慢慢发布

35:47 自动驾驶类比:最后一公里往往最难

36:07 编排智能体不只是技术问题,也涉及政策和社会理解

36:27 现在不是完全自主经济,而是把 AI 整合进人类结构

36:46 另一面:智能体社会也可能像人类社会一样完成伟大事情

未来形态:专用型智能体社会

36:59 多智能体的真正价值:不只是并行提速,而是差异化分工

37:26 智能体经济需要专用型智能体,不只是通用型智能体

37:39 AGI 的 G 是通用,但经济终局未必是单一通用模型

37:59 国际象棋例子:专用引擎比通用模型更快、更准、更便宜

38:40 AGI 常见误区:把“人类水平智能”误解成“全人类水平智能”

39:20 未来可能不是一个巨型模型,而是专用智能体组成的社会

39:41 专用智能体可认证、低成本、更可靠,因此更符合经济逻辑

39:54 通用层像连接组织:知道全局,并负责编排具体任务

分布式智能与对齐挑战

40:10 分布式智能:更像人类社会,而不是单一 AGI

40:33 对齐问题改变:不再只是对齐一个模型

40:57 一万个智能体复杂互动时,系统本身都难以界定

41:31 经济激励可能成为分布式智能体社会的对齐起点

41:53 单个智能体安全仍是群体安全的前提

42:03 群体层面风险需要更多工作,而时间非常短

42:19 主持人总结:别只盯单个智能体,要看到智能体社会

42:39 未来图景:通用型、专用型、委托型智能体共同构成更大系统

42:57 也许目标不是复制一个人,而是复制全人类水平智能

🌟 精彩内容

💡 智能体的本质不是“会聊天”,而是“会行动”

Nenad 把智能体和普通大语言模型的区别讲得非常清楚:语言模型主要是在 prompt 后续写回答,而智能体会观察环境状态,并通过工具或外层系统真正改变世界。这也是为什么智能体一旦接入邮箱、网页、钱包、实验设备,风险和价值都会同时放大。

"智能体会观察世界的某种状态,然后在它所处的世界里、在给定的环境里采取行动。"

💡 人在环路中,不等于人真的在负责

节目最重要的安全提醒之一,是“human in the loop”不能只是形式上的审批按钮。如果智能体连续几次做对,人类很容易产生自动化偏见,开始默认它可靠,最终让隐蔽错误漏过去。真正的监督要求人保持注意力,而不是把责任外包给流程。

"人还必须真正投入,保持清醒。因为你一旦放松警惕,就等于在掷骰子。"

💡 信任智能体不是一次性授权,而是一种持续赢得的关系

面对会幻觉、会失败、会被攻击的智能体,Nenad 强调不能因为它“大多数时候可靠”就盲目信任。未来智能体系统可能需要声誉机制、持续验证、能力认证和任务风险分级:可逆任务可以大胆试,不可逆任务则必须谨慎授权。

"信任可以被给予,但也需要被赢得。"

💡 多智能体不是“多开几个模型”,而是委托、契约和失败管理

现在很多所谓多智能体系统,本质上只是把任务随机拆开并行处理,速度变快但不一定更聪明。真正的智能体委托,需要知道谁擅长什么、任务如何定义、失败如何处理、结果如何验证,以及委托方和受托方之间的正式契约。

"目前我们看到的很多多智能体系统,其实更像是在做并行化,而不是委托。"

💡 互联网会变成智能体的战场

当智能体开始浏览网页、读原始 HTML、执行购买和转账,网页本身就可能成为攻击面。隐藏 token、提示注入、动态伪装都可能让智能体在用户不知情的情况下改变目标。未来的网页可能不再主要围绕人类注意力,而会围绕智能体行为重新设计。

"如果环境本身被投毒了,如果陷阱已经布好了,智能体和互联网互动时就可能踩进去。"

💡 百万个相似智能体会制造“认知单一文化”

如果大量智能体都基于少数相似模型,它们可能在金融、拍卖、资源分配等场景中做出高度相关的决策。这会让个体错误变成群体性故障,类似群体思维,甚至可能出现不明显的协调和串通。因此未来不仅要让单个智能体安全,也要让智能体群体保持决策多样性。

"当你一下子部署几十万、几百万个人工决策者,而它们又倾向于做出相似决定时,故障点就会变得相关。"

💡 未来的 AGI 也许不是一个巨型大脑,而是一个智能体社会

Nenad 提出了一个很有启发性的终局想象:经济上最合理的形态,未必是一个昂贵、缓慢、无所不能的通用模型,而是一个通用编排层加上大量便宜、可靠、可认证的专用智能体。它更像人类社会的分工网络,而不是单个超级人类。

"也许未来会有某种更通用的通用层,像这个经济体的连接组织。它知道所有事情,也负责编排所有事情。"

💡 对齐一个社会,比对齐一个模型更难

如果未来智能不是单体模型,而是成千上万个智能体动态互动、委托、交易、向人类求助的分布式系统,那么传统“观察一个模型行为并调齐它”的方法远远不够。对齐将变成系统级、经济级、制度级问题,涉及激励、监管、权限、声誉和群体风险。

"当你有一万个智能体,以非常复杂的方式相互互动时,要突然对齐整个系统,或者甚至要知道这个系统到底是什么,都不是特别简单。"

```

🌐 播客信息补充

本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的

使用 AI 进行翻译,因此可能会有一些地方不通顺;

如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

展开Show Notes
王旭_h2ox
王旭_h2ox
6小时前
动作真快,我看是昨天新视频
红茶莫扎
红茶莫扎
7小时前
这期内容很赞👍🏻