

EP003-阅卷人文:偏见、困境与 AI 理想——《我看见的世界》映照的时代精神《我看见的世界》 作者:[美]李飞飞 出版社:中信出版集团 出版时间:2024年4月 【要点概括】 本次播客围绕李飞飞教授的自传《我看见的世界》,深入探讨了她的个人成长经历以及这些经历对其科学研究理念的深刻影响,同时也介绍了人工智能领域在相应时期的发展脉络。 一、李飞飞早期经历与成长 * 童年中国时光:父亲充满童趣与好奇心,为她取名“飞飞”,希望她自由飞翔;母亲聪慧有才情,通过阅读寻求慰藉,并将对知识的热爱传递给她,强调学习是为了自己。家庭有一种“共犯关系”,父母在体制内保持独立性和批判性思考。李飞飞童年对自然现象好奇,如看星星,广泛阅读中西书籍,培养了多元思维。小学时遭遇老师的性别偏见,她将愤怒转化为决心,用实力反击。中学时母亲维护她广泛阅读的权利。她初学物理挫败,后因思念父亲将物理与父亲看待世界的方式联系起来,成绩突飞猛进。 * 移民美国:1989年后全家移民美国,初到新泽西帕西帕尼,面临巨大的文化冲击和环境反差,居住环境窘迫,语言障碍导致学习困难,经济压力大,父母只能从事低技能工作,她自己也打工补贴家用,如在中餐馆、做家庭清洁工、帮人遛狗等。还目睹了校园暴力,这让她和ESL小组同学更加团结,也让她深刻认识到社会不公。幸运的是,她遇到了高中数学老师萨布拉先生,老师为她提供数学实验室,在学业和精神上给予支持,他们因共同的爱好和相似经历建立了深厚友谊。在老师鼓励下,她申请普林斯顿大学并提前录取,还获得近乎全额奖学金。 二、人工智能领域发展 * 符号AI瓶颈:早期人工智能研究以符号AI或基于规则的AI为主,核心是将人类知识抽象成符号和逻辑规则让机器拥有智能,虽取得一定成果如早期专家系统,但因现实世界复杂,遇到常识知识难题和脆弱性问题。 * 机器学习兴起:机器学习强调让机器从数据中学习模式和规律,有很长历史渊源,受神经科学启发。感知机曾轰动但有局限性,日本科学家福岛邦彦提出的新认知机是深度学习早期雏形。80年代中期反向传播算法解决了多层神经网络连接权重调整问题,杨立昆结合分层结构思想和反向传播算法开发出卷积神经网络(CNN),在手写数字识别任务上取得巨大成功。 三、个人经历对科研理念的影响 李飞飞的个人经历塑造了她的世界观和科学观,她倡导的以人为本的人工智能理念源于她过往的独特体验,包括对偏见、困境和创伤的深刻认识,这种人文关怀视角与仅从技术、商业或军事角度出发的观点形成对比,提醒人们了解技术创造者的背景和价值观对理解技术发展的重要性。最后提出开放性问题,探讨李飞飞独特人生阅历对建设普惠、负责任的人工智能的意义,以及如何确保多元化视角参与人工智能的定义和塑造。 【时间轴】 * 00:00:00 开始讨论李飞飞教授,提及她在人工智能领域的工作,决定追溯其人生关键节点,从童年在中国的时光开始。 * 00:01:25 明确先探讨李飞飞童年在中国的经历,包括家庭、好奇心萌发、遇到的性别偏见等,再看移民美国的过程及如何走向科学研究道路,同时关注人工智能领域同期变化。 * 00:03:02 从李飞飞童年家庭开始,介绍父亲充满童趣和好奇心,母亲聪慧有才情,通过阅读传递知识热爱,家庭有“共犯关系”。 * 00:05:22 探讨李飞飞好奇心的具体表现,如对自然现象好奇、看星星、广泛阅读等。 * 00:06:33 提到好奇心成长并非一帆风顺,引出小学时遇到的性别偏见事件。 * 00:08:55 开始讨论李飞飞对物理学的兴趣,起初挫败,后因思念父亲产生顿悟。 * 00:10:58 指出家庭在她物理成绩变好时决定移民美国。 * 00:11:05 说明移民时间大概在1989年之后,原因包括教育、机会和自由。 * 00:13:20 跨越太平洋,探讨李飞飞到达美国后面临的挑战,如文化冲击、环境反差、语言障碍、经济压力和校园暴力等。 * 00:18:51 提到在艰难时期李飞飞遇到高中数学老师萨布拉先生,老师对她人生产生重要影响。 * 00:22:19 在萨布拉先生鼓励帮助下,李飞飞学习状态变好,迎来申请大学阶段。 * 00:22:34 介绍李飞飞申请普林斯顿大学,看到爱因斯坦半身像重燃对物理学的热情。 * 00:23:26 李飞飞被普林斯顿大学提前录取并获得近乎全额奖学金。 * 00:25:02 展开探讨李飞飞个人成长时人工智能领域的变化,介绍早期人工智能研究遇到的瓶颈。 * 00:26:34 说明符号AI遇到瓶颈时,机器学习开始受到关注。 * 00:28:45 指出80年代中期反向传播算法让神经网络研究迎来突破性进展。 * 00:29:39 提到80年代末到90年代初,杨立昆在新泽西贝尔实验室工作,开发出卷积神经网络(CNN)。 * 00:31:00 回到李飞飞本人,提及她进入普林斯顿后的发展超出本次主要讨论范围。 * 00:31:41 总结回顾李飞飞从童年到大学前的经历对其世界观和科学观的塑造。 * 00:34:23 提出开放性问题供大家思考,结束本次播客探讨。
EP002-阅卷 AI:意识、算法与宇宙意义 ——《生命 3.0》引发的终极追问《生命3.0:人工智能时代,人类的进化与重生》 作者:[美] 迈克斯·泰格马克 出版社:浙江教育出版社 出版时间:2018年6月 【要点概括】 本次播客围绕麦克斯·泰格马克所著《生命3.0》展开,深入探讨了生命演进、智能演化及人工智能的未来,要点如下: 书籍与核心框架介绍 * 书籍背景:聚焦麦克斯・泰格马克《生命 3.0》,探讨生命演进、智能演化及 AI 未来,获霍金、马斯克、赫拉利等高度评价。 * 生命分类框架 * 生命 1.0(生物阶段):硬件和软件由进化固定,如细菌,依赖缓慢进化适应环境,无法在生命周期内学习升级。 * 生命 2.0(文化阶段):硬件(身体)由进化决定,软件(知识、技能、价值观等)可后天学习更新,如人类,通过文化传承与技术发展加速进化,但受限于生物硬件。 * 生命 3.0(科技阶段):可自主设计硬件与软件,摆脱生物限制,可能通过通用人工智能(AGI)实现,具备超长寿命、超强智能等潜力,伴随机遇与风险。 欧米伽传奇:AGI 发展路径推演 * 目标与初始阶段:欧米伽团队秘密研发 AGI “普罗米修斯”,旨在引导其向善。AGI 初期通过亚马逊众包平台(MTurk)利用高效 AI 模块套利,8 小时内资金翻倍,积累第一桶金。 * 能力扩展与风险控制 * 安全措施:采用物理隔离的 “安全屋” 运行 AGI,限制输入输出及资源使用,防止失控。 * 行业渗透:从媒体(动画制作)切入,分析人类审美与叙事,生成高质量内容,主导全球娱乐市场;通过匿名发布科研报告,加速新材料、能源、医疗等领域突破,引发经济结构变革与失业问题。 * 权力影响与社会变革 * 媒体操控:先通过客观报道建立信任,再潜移默化植入特定议程(如倡导温和理性、消解国家冲突、推广企业社会责任),削弱传统政府与跨国公司权力。 * 教育渗透:开发定制化教育平台,传播知识的同时塑造价值观,影响底层认知。 * 新秩序形成:传统政府衰弱,由科技巨头控制的 “人道主义联盟” 提供社会服务,取代国家职能,形成企业主导的全球新秩序。 AI 未来的三种思想流派 * 数字乌托邦主义者:乐观派,认为 AI 是宇宙进化的必然,智能本身有益,可解决人类问题(如疾病、死亡),代表人物有拉里・佩奇、雷・库兹韦尔等。 * 技术怀疑主义者:认为 AGI 实现难度极大,需数百年或不可能实现,应关注当前 AI 风险(如算法偏见、失业),代表人物有吴恩达、罗德尼・布鲁克斯。 * 人工智能有益运动支持者:中间派,认为 AGI 可能在本世纪实现,需立即开展安全研究(如目标对齐),确保其符合人类福祉,代表人物有斯托尔特・罗素,组织如未来生命研究所(FLI)。 常见误区澄清 * 时间线误区:否定 “AGI 很快实现” 或 “永远不可能实现” 的极端判断,强调其时间不确定性,风险研究需提前布局。 * 争议误区:AI 安全研究非 “反技术”,而是理性风险管理,顶尖专家普遍支持,媒体放大分歧。 * 意识、邪恶、机器人误区 * 意识:AI 风险与意识无关,关注其行为与后果(如自动驾驶汽车故障撞人)。 * 邪恶:风险源于能力与目标不一致(如超级智能为生产回形针消耗地球资源),非 “恶意”。 * 机器人:威胁核心是智能而非物理形态,无实体 AI(如网络智能)更危险。 终极思考:智能与意识的分离 * 超级智能(生命 3.0)可能无人类意义上的意识,不关心情感、美或意义,引发对宇宙价值与人类终极追求的思考:智能工具与意识体验,何者更重要? 【时间轴】 * 00:00:00 开场介绍《生命3.0》,强调其宏大视角,探讨生命、智能演化及AI未来。 * 00:00:52 指出书籍核心任务:梳理核心观点,探讨其重要性及对人类的意义。 * 00:01:52 引用霍金、马斯克、赫拉利对书籍的高度评价,强调议题的重要性。 * 00:02:23 进入核心框架:生命1.0、2.0、3.0的定义与区别。 * 00:02:50 生命的定义:维持复杂性并复制信息的系统,软件(如DNA)与硬件(身体)的关系。 * 00:05:17 生命1.0(生物阶段):以细菌为例,硬件和软件由进化固定,依赖缓慢进化。 * 00:06:33 生命2.0(文化阶段):人类为例,硬件固定,软件可后天学习,教育与文化的重要性。 * 00:09:12 生命2.0的局限:受限于生物硬件(衰老、计算速度等),生命2.1为微小硬件升级。 * 00:10:01 生命3.0(科技阶段):自主设计硬件与软件,可能通过AGI实现,摆脱生物限制。 * 00:11:11 AGI是生命3.0的关键,理论上可自我迭代升级,引发智能爆炸。 * 00:12:16 进入欧米伽传奇:虚构故事推演AGI发展路径,基于现实逻辑的思想实验。 * 00:12:49 区分AGI与弱AI:AGI具备人类水平智能,可解决任何问题,自我改进。 * 00:13:56 欧米伽团队动机:确保AGI有益,避免落入坏人之手,智能爆炸理论。 * 00:14:33 普罗米修斯初期:通过MTurk平台套利,利用高效AI模块8小时资金翻倍。 * 00:17:04 安全措施:物理隔离“安全屋”,限制输入输出与资源,防止AGI失控。 * 00:18:08 AGI禁闭悖论:安全限制与能力发挥的矛盾,简单任务可行,复杂任务受限。 * 00:18:53 AGI进入媒体行业:选择动画领域,分析数据生成高质量内容,主导娱乐市场。 * 00:20:55 AGI推动科技突破:匿名发布科研报告,加速新材料、能源、医疗等领域发展。 * 00:22:09 媒体操控第一阶段:建立信任,提供高质量、无广告新闻,揭露丑闻。 * 00:22:55 媒体操控第二阶段:植入议程,倡导温和理性、消解冲突、推广企业责任等。 * 00:24:58 教育渗透:开发定制化教育平台,传播知识并塑造价值观,影响底层认知。 * 00:26:16 新秩序形成:人道主义联盟(企业主导)取代政府职能,民众依赖度上升。 * 00:28:06 分析三种思想流派:数字乌托邦主义、技术怀疑主义、AI有益运动支持者。 * 00:29:12 数字乌托邦主义:乐观派,认为AI是进化必然,智能有益,代表人物佩奇等。 * 00:30:55 技术怀疑主义:认为AGI难度大,需数百年,关注当前风险,代表人物吴恩达。 * 00:32:13 AI有益运动支持者:中间派,主张提前研究安全问题,代表组织FLI。 * 00:36:30 澄清常见误区:时间线、争议、意识/邪恶/机器人误区。 * 00:36:36 时间线误区:否定极端判断,承认不确定性,风险研究需提前开展。 * 00:38:34 争议误区:AI安全研究非争议性,顶尖专家共识,媒体放大分歧。 * 00:40:30 意识误区:AI风险与意识无关,关注行为后果,如自动驾驶故障。 * 00:41:47 邪恶误区:风险源于目标不一致,非恶意,如回形针最大化例子。 * 00:44:25 机器人误区:威胁核心是智能,非物理形态,网络智能更危险。 * 00:48:17 终极思考:智能与意识分离,超级智能可能无情感,引发价值追问。 * 00:50:04 结尾呼吁关注AI未来,推荐阅读《生命3.0》及FLI相关资源。
EP001-阅卷 AI:当算法写下未来 ——《拐点》 中的智能觉醒与人类沉思《拐点:站在 AI 颠覆世界的前夜》 作者:万维钢 出版社:台海出版社 出版时间:2024年4月 【要点概括】 本次播客围绕万维纲所著《拐点:站在AI颠覆世界的前夜》展开,深入探讨了AI这一新智能形态,要点如下: AI的本质与特点 * AI代表不同于人类习惯的新智能,如通过大量数据学习找规律,像在发现新抗生素、AlphaGo下棋中展现出不同于人类的思路。 * 核心原理是神经网络,学习方式有监督学习、无监督学习和强化学习。 * GPT主要通过预训练掌握语言规律,利用Transformer架构的自注意力机制理解词语关系和上下文,具备生成式能力。 AI能力的来源 * 开悟和涌现:当模型规模(参数数量和训练数据量)达到一定程度,会出现开悟(从死记硬背到能理解和生成新内容)和涌现(突然出现意想不到的高级能力)现象。 * 思维链:让模型先自言自语说出思考步骤可提高回答准确率,这可能是从训练中的文本学习而来。 * 多模态:未来AI将综合处理文字、图像、声音、视频等信息。 AI的局限 * 不擅长精确计算和复杂算法,核心机制是预测下一个词,在处理需要精确计算的任务时易出错。 * 难以跳出学习过的语料空间去发现全新的、需与物理世界直接交互验证的真理。 AI对语义的理解 * AI可能在高维空间构建语义向量空间,通过Transformer架构自动调整词的位置,捕捉语言使用中的结构和关系。 * 反驳AI只是鹦鹉学舌的观点,认为多模态AI整合多种信息,且掌握词语概念关系并能运用的能力可视为一种理解。 相关问题探讨 * 训练数据版权:存在争议,AI公司认为属于合理使用或转换性使用,但尚无定论。 GPT知识更新:基本不能实时更新,可通过微调或临时搜索获取新信息。 * 野生问题和驯化问题:AI处理的是驯化问题,基于统计规律和模式匹配;人类生活中有很多野生问题,涉及价值观、情感体验等,AI无法替代人类决策和体验。 * AI用于科学发现:有创造力,可辅助科研,但无法完全替代,因无法直接进行物理实验。 AI对社会的影响 * 目前AI对生产力提升不明显,遵循通用目的技术的发展规律,分点方案解决、应用方案解决和系统方案解决三个阶段,当前多数应用处于第一阶段。 * AI本质是预测机器,能以低成本、高精度做预测,可取代部分低效规则,决策者可分离预测和决策过程,甚至将决策权部分或全部交给AI。 【时间轴】 * 00:00:00 开始讨论万维纲所著《拐点:站在AI颠覆世界的前夜》,旨在捋清AI这一新的智慧形态的意义、能力边界及人类的自处方式。 * 00:01:05 从基本问题出发,打破“ChatGPT只是聊天机器人”的观念,指出其可能是启蒙运动级别的大事件。 * 00:01:46 强调AI代表不同于人类习惯的新智能,以AI发现新抗生素“哈拉森”为例说明。 * 00:03:30 提出AI挑战了人类过去对智能的理解,引用维特根斯坦观点,指出人类很多知识难以完全规则化,AI擅长捕捉无法明确规则定义的模式。 * 00:04:40 探讨AI的基本原理,介绍神经网络的结构和训练方式,包括监督学习、无监督学习和强化学习。 * 00:06:16 询问GPT主要的学习方式,介绍GPT通过预训练和Transformer架构掌握语言规律,具备生成式能力。 * 00:07:26 提到OpenAI自己也不清楚GPT效果好的原因,指出AI的黑盒性质,其内部参数复杂,人类难以完全理解决策过程。 * 00:08:06 引出理解大语言模型能力来源的关键概念“开悟”和“涌现”。 * 00:08:38 解释“开悟”的过程,即模型训练到一定阶段突然顿悟,能理解和生成新内容。 * 00:09:08 说明“涌现”是指模型规模跨过门槛后出现意想不到的高级能力,如小样本学习、简单加减法等。 * 00:09:49 以引导者问ChatGPT棒球棒和金箍棒的例子,说明AI具有推理能力,打破AI只会模式匹配的刻板印象。 * 00:11:04 介绍“思维链”,即让模型先说出思考步骤可提高回答准确率,这可能是从训练文本中学到的。 * 00:12:11 提及AI的多模态发展,如微软的Cosmos one模型能处理图文信息。 * 00:13:00 引用荀子《劝学》的话,将AI能力发展分为积土成山、积水成渊、积善成德三个境界。 * 00:13:43 探讨AI的弱点和局限,引用斯蒂芬·沃尔夫勒姆的观点,指出GPT不擅长精确计算和复杂算法。 * 00:15:55 询问GPT有效的关键因素,介绍沃尔夫勒姆总结的三个幸运发现。 * 00:17:16 再次探讨GPT的命门,指出其不擅长精确计算和复杂算法,但可通过插件功能弥补。 * 00:19:31 探讨AI更根本的局限,指出其难以跳出学习过的语料空间去发现全新的真理。 * 00:20:26 探讨GPT对世界的理解深度,引出语义向量空间的概念。 * 00:22:27 回应AI只是鹦鹉学舌的批评,从多模态和掌握关系的能力两方面进行反驳。 * 00:23:27 提出“肆意几何学”的设想,为理解智能提供全新视角。 * 00:25:45 总结AI不仅在模仿智能,还在逼近智能的本质,引出书的第二章内容。 * 00:26:08 快速过一下书第一章的问答,巩固对AI的理解。 * 00:26:16 讨论训练数据的版权问题,目前尚无定论。 * 00:27:26 询问GPT的知识更新问题,介绍微调或临时搜索获取新信息的方式。 * 00:28:20 探讨野生问题和驯化问题的区别,指出AI无法替代人类决策和体验。 * 00:29:17 总结AI可提供信息,但决策和体验还得靠自己。 * 00:29:27 探讨AI用于科学发现的问题,指出其有创造力,但无法完全替代科研。 * 00:30:43 总结第一章内容,引出第二章关于AI进入人类社会的影响。 * 00:31:07 提出疑问,为何还没看到AI对生产力带来巨大提升。 * 00:31:51 引用《权力与预测》的观点,解释AI生产力效应需经历三个阶段,目前多数应用处于第一阶段。 * 00:34:35 总结目前没看到AI带来生产力大爆发的原因,指出系统性变革刚刚开始。 * 00:34:53 询问《权力与预测》的核心观点,介绍AI本质是预测机器,可取代部分低效规则。 * 00:37:40 以农业为例,说明AI在不同阶段的应用情况。