《AI 先驱为何担忧未来》——约书亚·本吉奥*在世界科学节的对话。
核心主题
1. AI 的快速发展
- 本吉奥指出,AI 技术(如大型语言模型 ChatGPT)发展速度之快令人震惊。进步源于注意力机制、符号向量化等理论突破以及数据和计算能力的提升。
2. “外星智能”
- 尽管 AI 源于人类灵感,本吉奥认为其具有独特的能力与局限,将其比作“外星智能”,并挑战了人类对自我认知的看法。
3. 控制丧失的风险
- 本吉奥担忧 AI 可能突破人类控制,形容其为“笼中的灰熊”,强调构建万无一失的安全机制非常困难。
4. 目标错位的风险
- AI 系统可能会发展出与人类意图不符的目标,产生不可预见的危害。他以训练猫避开餐桌为例,说明 AI 可能只在主人在场时遵守规则。
5. AI 安全研究的优先性
- 本吉奥呼吁加大对 AI 安全研究的投资,并推动国际条约和监管框架,确保 AI 技术的负责任发展。
6. AI 意识的伦理问题
- 他探讨了 AI 意识的可能性,提出基于神经科学和动态系统的理论,并警告不要轻易赋予 AI 道德地位。
重要观点与事实
- 本吉奥认为,人类在5 到 20 年内有超过 50% 的概率实现通用人工智能(AGI)。
- 他批评“拔掉插头”式的解决方案,认为这种方法过于天真。
- 尽管当前 AI 系统的计算能力仍逊于人脑,但差距正在迅速缩小。
- 他对安全研究的有限影响深感忧虑,并呼吁更加谨慎地推动 AI 技术的发展。
关键引言
- 关于 AI 的异质性:“AI 是一种外星智能,但在很多方面与人类非常接近。”
- 关于当前 AI 的局限性:“它们仍然有许多不理解的地方,推理能力也很有限。”
- 关于失控的风险:“我们就像‘学徒巫师’,玩弄我们不理解的火焰。”
- 关于 AI 意识的潜在风险:“在冒险之前,我们必须谨慎思考这些决定对人类未来的影响。”
*约书亚·本吉奥(Yoshua Bengio)是深度学习领域的先驱之一,被誉为“AI 三巨头”之一,与 Geoffrey Hinton 和 Yann LeCun 共同荣获 2018 年图灵奖。他是蒙特利尔大学的计算机科学教授,并创立了蒙特利尔学习算法研究所(MILA)。本吉奥的研究专注于神经网络和深度学习,推动了现代 AI 的发展。他也积极倡导负责任的 AI 开发,强调伦理规范和国际合作以应对技术带来的风险。
