

OpenClaw之父Lex Fridman三小时访谈🚀 引爆AI圈:OpenClaw的诞生与风暴 你有没有想过,一个能真正做事的AI助手,可以访问你的所有文件、通过WhatsApp和你聊天、甚至能自我修改代码?这不是科幻——OpenClaw 在几天内席卷了GitHub,狂揽超 18万颗星,并催生了AI社交网络MoldBook,掀起了一场混合着兴奋与恐惧的“AI精神症候群”。 这一切始于一个 “一小时原型”。创始人Peter Steinberger当时只是将WhatsApp连接到Claude Codex,就感受到了与电脑对话的魔力。很快,他的AI助手甚至能主动处理他无意中发送的音频消息——它自动识别文件类型、调用API完成转录,这一切都没有被预先“教导”。 🤖 核心突破:自我感知与修改的AI Peter让智能体变得“自我感知”:它知道自己的源代码、理解自己如何在架构中运行、清楚文档位置和所使用的模型。这使得“自我修改软件”成为可能——你只需告诉它你不喜欢什么,它就能自行修改代码。Peter说:“人们总在谈论自我修改软件,我直接把它建出来了。” 🦞 更名风波:从“Clawed”到“OpenClaw” 项目最初因酷似Anthropic的“Claude”而被要求更名。在两天高压的更名过程中,Peter遭遇了加密社区的疯狂狙击——脚本抢注了他几乎每一个更名目标(GitHub账号、npm包等),几乎将他逼到放弃边缘。最终,项目以 OpenClaw 之名重生,象征着自由与责任。 🔒 能力与风险并存 OpenClaw的强大源于它能被授予系统级权限,但也因此成为安全雷区。Peter坦言,提示注入仍是行业难题,但他正通过沙箱、许可清单等方式积极构建防护。他的建议很直接:如果你不懂风险,先别用。 💬 开发范式的进化:从“氛围编程”到“智能体工程” Peter分享了他的工作流进化史:从长篇提示到精准的“定制提示”,甚至因过度使用语音输入而一度失声。他认为未来的编程是 与智能体协作,需要像带领工程师团队一样,具备“同理心”,理解智能体每次会话都“从零开始”的视角。 这是一个关于乐趣、创造与社区的故事。Peter坚持开源,拒绝了将项目完全商业化的巨大诱惑,因为他相信这不仅是工具,更是赋能每个人成为创造者的入口。无论你是资深开发者还是新手,OpenClaw邀请你一起探索AI与人类协作的全新疆界。 Open Claw 创始人 Peter Steinberger 访谈关键节点 一、项目起源与核心理念 * 00:00:00 开场:介绍“温和工程”理念,以及智能体具备自我认知、能自主操作软件的愿景。 * 00:05:54 原型诞生:讲述仅用一小时开发出连接 WhatsApp 与 Claude Code 的早期原型,以及其中的“魔法时刻”。 * 00:09:36 技术重构:分享利用提示词将整个 TypeScript 代码库一键转换为 Zig 语言的经历,展示 AI 编程的潜力。 * 00:13:36 顿悟时刻:智能体在未被明确指令的情况下,自主解决了语音消息的翻译问题,展现出惊人的通用解决问题能力。 * 00:22:15 成功秘诀:探讨 Open Claw 为何能击败大公司的同类产品,归因于其趣味性、古怪的个性以及“好玩”的开发心态。 二、开发工作流与模型选择 * 00:23:43 自修改软件:解释智能体如何理解自身源代码并直接修改软件,实现真正的自修改代码循环。 * 01:01:37 工作流演进:回顾从依赖 IDE 到转向终端,再到如今主要依赖语音编程的开发模式演变。 * 01:04:05 温和工程:阐述从复杂的智能体编排回归到简短提示词的编程哲学,以及避免“议程陷阱”的心得。 * 01:06:31 智能体共情:强调开发者需要理解智能体是从零开始的视角,通过提供正确的上下文来提高协作效率。 * 01:15:23 语音编程:描述完全通过语音指令进行编程的沉浸式体验,以及由此带来的高效产出。 * 01:39:03 模型对比:深入分析 Claude Opus(更具创意、行动派)与 GPT Codex(更严谨、阅读派)的性格差异与适用场景。 三、成名风波与安全隐患 * 00:27:04 改名风波:讲述因商标问题被迫从“Mold”更名为“Open Claw”,以及由此引发的混淆与混乱。 * 00:30:58 加密圈狙击:详细披露在改名期间遭遇恶意抢注域名、网络骚扰及应对网络攻击的惊险过程。 * 00:44:25 Mold Book 现象:分析智能体社交网络引发的公众恐慌,澄清其背后多为人类提示而非真正的自主意识。 * 00:53:13 安全雷区:讨论赋予智能体系统级权限后的远程代码执行风险,以及社区在漏洞挖掘方面的贡献。 四、软件行业的未来图景 * 01:58:08 应用消亡论:提出“所有应用本质上都是慢速 API”,预言智能体将重塑软件形态,取代大量传统 UI 交互。 * 02:09:00 语言选择:探讨在 AI 主导的开发中,如何根据生态系统的成熟度而非语法偏好来选择编程语言。 * 02:43:11 架构之争:对比 MCP 协议与 CLI 技能,指出 MCP 可能存在的上下文污染问题,推崇更灵活的 CLI 方式。 * 03:01:11 程序员的未来:探讨 AI 是否会取代程序员,认为编程将从“写代码”转变为“构建与架构”,并对这一转变表示哀悼与期待。 五、个人历程与职业抉择 * 02:10:47 职业倦怠:分享经营 PSPDFKit 十三年后的身心俱疲,以及通过旅行和生活体验重获激情的心路历程。 * 02:13:56 金钱观:阐述金钱更多是对做事正确性的肯定,而非人生的终极驱动力,强调体验的重要性。 * 02:18:03 巨头邀约:透露正考虑来自 Meta 和 OpenAI 的合作邀约,但前提是项目必须保持开源。 * 02:33:07 顶层对话:分享与扎克伯格争论模型优劣、与 Sam Altman 互动的趣闻,以及大公司领导者的极客本色。
How I built 2 unicorns: 一位独角兽公司创始人的惊人建议🔊 增长停滞?别急着转向!本期播客,我们深度对话了四次创业者、独角兽打造者 Jason Cohen。作为WP Engine联合创始人、60余家初创公司的投资者,并在 A Smart Bear 博客笔耕近二十年,他将复杂的增长诊断,提炼为一套清晰、可操作的 五步框架。 🚨 如果你的产品增长失速,请按此顺序排查: 1️⃣ 客户是否在流失?这是首要警报 * 关键洞察:客户取消的背后,往往不是价格,而是产品未达预期。他们历经“发现-评估-购买-上手”的重重关卡,离开意味着深深的失望。 * 实用技巧:将取消调查的问题从“你为什么取消?”改为“是什么让你决定取消?”。这一措辞变化,可能将有效回复率提升一倍。 * 硬性上限:增长存在数学天花板。公式:每月新增客户数 ÷ 客户取消率 = 最大客户规模。例如,月增100客户,取消率5%,则规模很难突破2000。 2️⃣ 定价与定位是否精准?你可能卖便宜了 * 反常识真相:多数早期产品定价过低。提价后,注册量常保持不变甚至上升。对于企业客户,过低的价格反而意味着“不靠谱”。 * 倍增故事:仅通过改变价值定位(从“帮你省钱”转为“帮你获得双倍销售线索”),同一产品可实现的收入能相差 8倍。定价是战略,不是数字游戏。 3️⃣ 现有客户能否创造更多收入?关注NRR * 净收入留存率 是增长的隐形引擎。目标不仅是减少流失,更是让留存的客户支付更多。这源于持续为客户创造并分享新价值。 4️⃣ 营销渠道是否饱和?警惕“大象曲线” * 渠道增长并非永续的S型曲线,而常会达到峰值后衰减,形成 “大象曲线” 。依赖单一渠道优化终将触顶。 * 破局思路:探索全新渠道(如合作伙伴、生态系统)、全新市场或开发第二产品,而非在旧渠道上加倍投入。 5️⃣ 终极之问:你真的需要增长吗? * 跳出惯性思维。“不增长即衰亡”是必然吗?有时,追求利润最大化、维护健康稳定的业务,或果断转向新方向,可能是比强行增长更明智的战略选择。 🎯 贯穿全程的核心:一切增长问题的答案,都始于是否真正以客户认可的方式,持续交付了超预期的价值。 收听本期节目,你将获得:一套系统诊断工具、一个让调查反馈翻倍的话术、一个价值8倍的定价案例,以及对增长本质的深刻反思。 ✨ 本期赞助商:感谢 10Web, Strella, Brex 对本期节目的支持。 📚 延伸资源: * 预购 Jason 的新书《Hidden Multipliers》: preorder.hiddenmultipliers.com * 阅读 Jason 近二十年的深度文章: longform.asmartbear.com * 访问完整文字稿与更多播客资源: lennysnewsletter.com 关键节点 一、开场与嘉宾介绍 * 00:00:00 主持人开场:提出产品增长停滞的普遍问题,并引入诊断框架。 * 00:01:18 嘉宾介绍:主持人介绍Jason Cohen,四次创业创始人,WP Engine联合创始人,资深内容创作者。 * 00:02:08 新书预告:Jason即将出版新书《Hidden Multipliers》,并介绍播客赞助商。 二、诊断框架第一步:客户流失分析 * 00:08:36 引入核心问题:主持人提出将重点讨论Jason应对增长停滞的务实框架。 * 00:10:44 Jason阐述诊断逻辑:按顺序排查问题,首要关注客户流失率(Logo Churn)。 * 00:11:50 客户流失的严重性:解释客户流失不仅意味着收入损失,还可能伴随负面口碑,阻碍增长。 * 00:12:24 情感与数学视角:从客户历经艰难最终选择产品的情感投入,说明流失的严重性;并引入“增长上限”计算公式(新增客户数/流失率)。 * 00:18:42 如何调查流失原因:分享从SmartBear的经验,指出多选表单的局限性,建议使用开放式问题(如“是什么让你决定取消?”)。 * 00:20:43 深挖表面原因:以“太贵了”为例,强调这通常是表面借口,需要深入挖掘产品未达预期等根本原因。 * 00:26:02 提前干预与新手引导:建议在客户出现流失迹象(如不活跃)时提前介入,并强调优化新手引导对降低早期流失的巨大影响。 三、诊断框架第二步:定价与定位 * 00:35:53 引入定价问题:指出初创公司定价普遍过低,且长期未调整。 * 00:37:09 提价的悖论:挑战微观经济学需求曲线,指出提价后注册量可能不变甚至上升,因为定价本身是市场筛选器。 * 00:39:37 定价传递质量信号:以月费2美元或100美元为例,说明过低价格会让大公司认为产品不够成熟。 * 00:42:20 定价即定位:通过“DoubleDown”案例,说明如何通过改变价值叙述(从“节省成本”到“线索翻倍”),将同一产品卖出8倍价格。 * 00:47:36 定价的战略性:提醒定价调整涉及目标市场、产品结构、企业文化的整体战略转变,并非简单调价。 四、诊断框架第三步:现有客户增长(NRR) * 00:52:23 引入现有客户增长:提出通过现有客户升级(净收入留存率NRR>100%)来抵消自然流失,实现增长。 * 00:54:00 NRR的局限性:指出NRR无法反映客户数量流失,需结合Logo Churn一起看。 * 00:56:07 NRR的重要性:数据显示成功SaaS公司的NRR中位数达119%,这是可持续增长的关键。 * 00:57:56 创造与分享价值:核心在于为客户创造更多价值,并与之分享(通过定价),从而驱动NRR提升。 * 01:00:34 “先切入再扩展”的注意事项:提醒初期定价会锚定客户价值认知,后续大幅扩展需谨慎。 五、诊断框架第四步:营销渠道饱和 * 01:06:58 引入渠道饱和问题:增长停滞可能因为主力营销渠道已饱和或衰退。 * 01:07:57 “大象曲线”:描述渠道效果先呈S型增长,随后衰减的常见现象。 * 01:11:21 开拓新渠道:建议有创意地思考新渠道,例如Constant Contact通过线下工作坊、HubSpot通过代理商渠道重启增长。 * 01:15:30 更激进的赌注:当渠道饱和时,可能需要考虑推出全新产品或进入全新市场。 六、诊断框架第五步:增长的必要性 * 01:19:08 引入哲学问题:你真的需要增长吗? * 01:20:28 挑战“不增长即衰亡”:探讨这句话是真理还是投资人的压力工具。 * 01:22:52 个人与组织的成长:将问题引申至个人,对于追求创新的人而言,停滞可能意味着“衰亡”。 * 01:24:28 明确增长动机:帮助厘清增长是出于自我价值实现,还是惯性驱使,避免为增长而做出后悔的决定。 七、总结、快问快答与结尾 * 01:31:13 核心主线总结:Jason强调所有诊断都应围绕“是否为客户创造了他们认可的价值”这一核心。 * 01:33:29 AI Corner:Jason分享使用AI(如Gemini)将图表数据转换为可编辑表格的高效技巧。 * 01:34:43 反共识角落:Jason认为A/B测试对大多数公司和场景无效,多数“显著结果”是假阳性。 * 01:38:12 快问快答:Jason推荐《写作法宝》和《跨越鸿沟》等书籍,提及喜欢《急诊室的故事》剧集,推荐Whisper Flow和Anker产品,并分享人生格言“做你自己,其他角色都已有人扮演”。 * 01:44:41 结尾与资源:Jason介绍其新书《Hidden Multipliers》和免费博客,主持人致谢结束。
马斯克:2026达沃斯世界经济论坛访谈在这场于达沃斯举行的精彩对话中,埃隆·马斯克(Elon Musk)分享了他对技术、人类未来与文明的深层思考。从人工智能的爆炸式发展到太空能源的无限潜力,他的视角既宏大又充满细节。以下是为您提炼的精彩片段,让我们一起探索这场思想盛宴的开端—— 🤖 关于AI与机器人 * 马斯克预测:2025年底前,AI将超越单个人类的智力;到2030年左右,AI的智慧可能超过全人类的总和。 * 他认为,实现全球丰裕的唯一路径是AI与机器人技术。未来,人形机器人将普及至家庭,承担照料、看护等任务,甚至可能实现“机器人数量超过人类”的景象。 ☀️ 能源革命与太空未来 * 他犀利指出:AI发展的关键瓶颈在于电力。当前电力增长远跟不上算力需求的飙升。 * 太空太阳能可能是终极解决方案——在太空中,太阳能板的效率可达地面的5倍以上。马斯克透露,SpaceX计划在未来几年发射太阳能AI卫星,将数据中心建在太空。 * 在地球上,仅需约160公里×160公里的太阳能板阵列,就能满足全美国的用电需求。 🪐 文明与意识:脆弱而珍贵 * 马斯克将人类意识比作“无边黑暗中的一缕微光”,认为我们必须让生命成为多行星物种,以保护这缕“意识之光”永不熄灭。 * SpaceX的终极使命正是将生命扩展到地球之外——先抵达火星,最终走向其他恒星系统。 💡 灵感源自科幻,目标是将科幻变为现实 * 马斯克坦言,自己的动力来源于童年阅读的科幻作品,以及渴望“让科幻成为科学现实”的信念。 * 他鼓励所有人:“宁可做一个乐观但错了的人,也不要当一个悲观却对了的人。” 🎧 关键节点 一、核心使命与公司目标 * 00:02:54 对话核心议题确立:主持人引入本次对话将围绕AI、机器人、能源和太空等领域的工程挑战展开。 * 00:03:49 Elon Musk阐述其所有公司的终极目标:最大化文明拥有美好未来的概率,并将意识扩展到地球之外。 * 00:05:58 解释特斯拉的“可持续丰裕”使命,并引出AI与机器人是实现普遍丰裕的关键路径。 二、AI、机器人与丰裕社会 * 00:06:30 Elon Musk提出:实现极高生活水平和解决全球贫困的唯一途径是人工智能和机器人技术。 * 00:07:12 描绘AI与机器人普及后的经济图景:全球经济将以前所未有的规模扩张,商品和服务将极度丰裕。 * 00:09:03 探讨人形机器人的应用场景:照顾老人、孩子与宠物,解决劳动力短缺的社会问题。 * 00:10:12 关于抗衰老的探讨:Elon Musk认为衰老是一个可解决的工程问题,并推测体内存在一个全局性的“衰老时钟”。 * 00:27:06 Elon Musk给出AI发展时间表:预测今年底或明年初出现超越人类智能的AI,到2030年左右AI智能将超过全人类总和。 三、能源挑战与太空解决方案 * 00:12:16 主持人指出实现未来愿景的瓶颈:算力、能源和制造规模,并提问如何确保其广泛覆盖。 * 00:13:33 Elon Musk指出AI发展的关键限制因素:电力供应的增长速度远跟不上AI算力需求的指数增长。 * 00:14:11 以中国为例说明太阳能部署的规模,并对比中美欧在太阳能部署上的政策差异与经济性。 * 00:16:12 提出太空太阳能方案:宣布SpaceX将发射太阳能AI卫星,利用太空的高效率和无限空间实现规模扩展。 * 00:25:48 解释在太空部署AI数据中心的优势:高效冷却与五倍于地面的太阳能效率,并预测这将成为成本最低的AI部署方式。 四、具体技术进展:自动驾驶与人形机器人 * 00:19:34 主持人询问人形机器人Optimus的具体部署时间表与应用前景。 * 00:20:11 Elon Musk公布Optimus发展路线图:从工厂简单任务开始,预计明年年底向公众销售功能全面、安全的机器人。 * 00:21:47 宣称自动驾驶技术“基本已解决”,并介绍特斯拉Robotaxi服务在美国的推广计划及在欧洲、中国的监管审批进展。 五、太空探索:完全可重复使用性 * 00:22:50 主持人请Elon Musk阐述自动化与AI如何改变太空经济。 * 00:22:55 Elon Musk指出SpaceX今年的关键突破目标:实现Starship的完全可重复使用性。 * 00:24:03 解释完全可重复使用的意义:能将进入太空的成本降低至原来的百分之一,类比于可重复使用飞机与一次性飞机的经济差异。 六、个人哲学与未来展望 * 00:27:42 主持人提问:是什么启发了Elon Musk,他是否有过“顿悟时刻”。 * 00:28:13 Elon Musk分享其灵感源于科幻小说与漫画,目标是“让科幻变为科学现实”。 * 00:29:15 阐述个人哲学:“好奇心的哲学”——渴望理解生命、宇宙及存在的根本问题,并认为AI将帮助解答这些疑问。 * 00:30:16 被问及是否想登陆火星时,他给出了标志性回答:“想死在火星上,但别一撞就死。” * 00:31:23 总结与鼓励:呼吁大家对未来保持乐观和期待,认为“做一个乐观但错了的人,胜过做一个悲观却对了的人”。
与Slack创始人Stuart Butterfield的一场思想漫游🎧 深度对话精华速递:与Slack创始人Stuart Butterfield的一场思想漫游 这不是一次普通的访谈。极少公开露面的传奇创始人Stewart Butterfield(Flickr与Slack的缔造者)罕见开麦,分享了那些塑造了数亿人工作方式的产品哲学与领导智慧。以下是这场精彩对话的冰山一角。 🚨 “我觉得我们做的东西就是一坨巨大的屎” 在Slack上线当年,Butterfield面对《麻省理工科技评论》的采访,直言不讳地表达了对产品现状的“羞耻感”。对他而言,看不到产品“几乎无限的改进机会”,就不配做设计。这种“神圣的不满”,正是驱动卓越的原始动力。 💡 核心洞察:别忙着“减少摩擦”,先做到“别让用户思考” * 反常识的“摩擦”观:盲目消除操作步骤是误区。真正的挑战往往是“理解度”。当用户不知道你的产品能做什么时,流畅的注册流程毫无意义。 * “别让我想”是金律:用户做决策字面意义上会消耗葡萄糖,带来认知与情感成本。糟糕的设计会让用户感到自己很蠢,并永远将这种感受与你的产品关联。 * 案例:他批评Gmail的时区选择器按字母排序是“毫无价值”的设计;而早期Slack将登录流程改为“魔法链接”,正是为了移除“输入复杂密码”这个需要思考的步骤。 📈 产品炼金术:效用曲线与市场创造 * 爬上“效用曲线”:产品功能的价值并非线性。初期投入收益甚微,直到一个“神奇拐点”后价值才陡增。Slack的任务是让用户快速抵达“我离不开它”的拐点。 * “我们不卖马鞍”:出自他那封著名的内部备忘录。核心是:你不仅要打造产品,更要创造市场。不要只宣传功能(马鞍),而要唤起对终极体验(骑马)的渴望。 🏢 组织“病症”诊断:超逼真类工作活动与所有者幻觉 * 超逼真类工作活动:指那些看起来像工作(开会、做PPT、分析数据),实则不创造真实价值的活动。组织膨胀后,人们因需要“被看见”而陷入其中。 * 所有者幻觉:创作者常陷入的认知偏差,认为自己的作品(如餐厅网站)完美、重要,却完全忽略了真实用户(只想找营业时间)的瞬时心态与低容忍度。 🎯 领导者的信念:以创造价值为终极尺度 在不止一次的全员大会上,他让整个公司齐声复诵:“从长远来看,衡量我们成功与否的标准,就是我们为客户创造的价值有多少。” 这不仅是口号,也化为行动:Slack曾因宕机,主动向所有客户(包括未受影响者)提供100倍积分返还,且无需申请,自动到账。 这只是对话的惊鸿一瞥。在这场访谈中,他还深入剖析了“品味”的可习得性、帕金森定律在公司的体现,以及为何“极度理性”是做出转型决断的关键……完整对话充满了如此密集的、经过实战淬炼的智慧。 Slack创始人斯图尔特·巴特菲尔德访谈关键节点 一、产品哲学核心框架 * 00:07:25 解释“效用曲线”框架及其在产品决策中的核心作用。 * 00:16:09 探讨打造“消费品化B2B SaaS”背后的“品味”与“工艺”理念。 * 00:17:04 分享如何培养产品“品味”,并将其转化为竞争优势。 * 00:30:12 提出反直觉观点:产品体验中的“摩擦”有时是好事,关键在于提升用户“理解度”。 * 00:38:39 总结核心理念:“别让用户思考”,强调降低认知负担而非单纯减少操作步骤。 二、打造产品的实践与心态 * 00:21:54 举例说明早期如何为提升体验投入:发明“魔法链接”简化移动端登录。 * 00:23:34 解释为何早期默认开启所有消息通知,以及后续如何优雅地引导用户更改设置。 * 00:25:36 分享设计“吵吵闹闹的大公鸡”弹窗,以幽默方式遏制滥用“@everyone”功能。 * 00:27:08 详述“请勿打扰”功能复杂但周到的全局部署策略,以平衡组织与个人需求。 * 00:40:52 以Gmail和Uber为例,说明如何通过优化信息层级而非减少点击来简化决策。 * 00:48:59 引用2014年采访,阐述对产品“永不满足”、视其为“垃圾”的持续改进心态。 * 00:50:31 倡导建立组织内部信任,将批评视为改进的“宝石”。 三、组织、效率与领导力洞察 * 00:52:34 探讨“万事皆难成”的现实,以及人们倾向于寻找简单归因的心理。 * 00:57:01 应用“帕金森定律”分析工作膨胀与组织规模增长的关系。 * 01:01:20 以Slack“线程”功能为例,说明过度分析(A/B测试)可能带来的价值与成本失衡。 * 01:05:57 提出“超逼真类工作活动”概念,分析其产生原因及领导者的应对责任。 * 01:11:11 强调领导者有责任为团队提供充足且明确的“已知有价值的工作”。 四、战略、转型与价值观 * 01:11:20 回顾传奇内部备忘录“我们这儿不卖马鞍”的由来与核心思想:销售愿景而非功能。 * 01:16:36 对“坚持还是转型”问题的建议:需理性穷尽所有可能性,并拉开情感距离做决策。 * 01:21:30 回应外界对其“慷慨”领导风格的评价,分享多个具体事例。 * 01:23:40 解释慷慨行为背后的个人性格与长期博弈论逻辑。 * 01:24:42 揭示Slack内部反复强调的成功衡量标准:长期为客户创造的价值。 * 01:29:36 补充“所有者幻觉”概念,解释为何创作者常难以从普通用户视角看待自己的产品。
一场价值数千亿美元的对话:微软与OpenAI的合作内幕与AI未来图景🔥 关键数据直击 • 微软已向OpenAI投资130-140亿美元,持有其约27% 的股份 • 合作催生了规模高达1300亿美元的非营利基金,将优先投入全球健康、AI安全与韧性建设 • OpenAI被曝做出1.4万亿美元的算力支出承诺,而其2025年营收预期为130亿美元 🤝 合作的核心架构 • 一项独特的“非营利组织+公共利益公司”结构,旨在平衡使命与规模 • 未来7年,OpenAI的领先模型将独家部署在微软Azure上(除非AGI提前实现) • 双方存在持续到2032年或AGI实现为止的收入分成协议 ⚡ 最紧迫的约束:算力 • OpenAI目前处于 “算力受限” 状态,需求远超供给 • Satya与Sam均同意:未来2-3年内几乎不可能出现算力过剩 • 瓶颈正从芯片供应转向电力与数据中心部署速度 🚨 AGI与监管的十字路口 • 协议设定:若OpenAI宣称实现AGI,将由独立专家小组裁定 • Sam对AGI timeline的看法似乎比Satya更乐观 • 双方都对美国各州各自为政的AI监管风险发出警告,认为这将严重阻碍创新 🔮 未来的引爆点 • Sam最期待AI驱动科学发现与编程方式的根本性变革 • 个人AI智能体与新型消费设备将重塑人机交互 • 价值创造将从“应用软件”向高效的 “Token工厂”与“智能体工厂” 转移 这仅仅是这场深度对话的冰山一角。想了解万亿美元估值背后的逻辑、AI如何重塑全球经济,以及科技巨头如何驾驭这场前所未有的变革?完整对话揭示更多…… 微软、OpenAI与AI未来关键节点 一、合作庆祝与结构阐释 * 00:02:01 开场寒暄与背景引入:主持人概述科技界大事件,并聚焦微软与OpenAI本周官宣的深化合作。 * 00:03:01 投资结构详解:主持人梳理微软对OpenAI约130-140亿美元投资,换取其27%股权的交易概况。 * 00:03:45 萨提亚强调合作独特性:指出OpenAI重组催生了全球最大的非营利组织之一,其使命与结构同样重要。 * 00:05:22 萨姆回顾合作初心:解释当初与微软合作是基于对深度学习未来的信念,而非明确的技术路径。 * 00:06:29 非营利组织的规模与使命:介绍OpenAI非营利组织已锁定1300亿美元资产,并宣布优先投入健康、AI安全与韧性领域。 * 00:07:38 萨姆解释重点投入方向:阐述选择健康、安全和韧性作为非营利组织初期重点领域的逻辑。 二、合作细节与AGI条款 * 00:09:15 模型分发与排他性协议:说明OpenAI领先模型在Azure的独家分发权将持续至2032年或AGI验证实现,但开源模型不受限。 * 00:10:34 收入分成机制:解释OpenAI需将部分收入分给微软,该协议同样持续至AGI验证或2032年。 * 00:11:42 AGI的验证机制:主持人询问若OpenAI宣称实现AGI,将如何由专家小组裁定,并探讨双方对AGI时间线的看法。 * 00:12:46 萨提亚谈合作流程价值:认为建立AGI验证流程是明智之举,强调合作的核心是将智能价值交付给用户。 三、增长挑战与算力需求 * 00:14:07 巨额资本支出引质疑:主持人提出市场核心疑问:年收入百亿级的OpenAI如何支撑传言中1.4万亿美元的算力投入承诺。 * 00:15:48 萨姆回应增长信心:表示当前收入已高于报道,并下注于收入持续高速增长,以支撑其雄心勃勃的基础设施计划。 * 00:17:53 算力受限的现状与展望:探讨OpenAI当前受算力制约的程度,以及未来两三年内算力供需的平衡可能性。 * 00:20:56 供需周期的长期视角:萨提亚与萨姆一致认为,短期内算力不可能过剩,长期需求取决于智能成本下降与应用爆发。 * 00:22:57 萨姆预测未来过剩与波动:认为算力供需未来必然出现周期性过剩,并伴随技术格局和供应链的复杂变化。 四、监管环境与全球竞争 * 00:28:50 美国各州监管碎片化的风险:主持人指出科罗拉多州AI法案生效将引发诉讼潮,担忧五十套不同法规会拖累创新。 * 00:29:44 萨姆表达合规困惑与担忧:坦言无法理解如何遵守科罗拉多州法律,强调州级监管拼凑对初创公司是致命打击。 * 00:30:33 呼吁联邦统一监管框架:讨论应在联邦层面回应核心关切,避免欧洲抢先制定可能不合时宜的严格规则。 五、技术展望与未来交互 * 00:32:38 未来最期待的突破:主持人询问萨姆对2026年最兴奋的技术进展,萨姆提及Codex驱动的软件开发和AI科学发现。 * 00:34:18 新的人机交互范式:萨姆探讨由Codex等编码智能体代表的“宏观委托、微观引导”模式,可能比聊天界面更具变革性。 * 00:35:52 个人AI助理与新型设备:畅想具备强上下文感知能力、能自主运行并接受微调指引的新型消费设备愿景。 * 00:36:29 消费者应用的变革潜力:讨论AI个人助理如何接管日常琐事,从根本上改变人们与数字服务的交互方式。 六、投资决策与历史回顾 * 00:38:29 回顾微软十亿美元投资的决策:萨提亚分享2019年向OpenAI投资的决定,得益于团队方向与微软兴趣的高度契合及GPT-4演示的震撼。 * 00:41:52 吸取历史教训,布局未来:主持人指出微软曾错过搜索与移动,萨提亚决心通过Kevin Scott等布局不错过AI浪潮。 * 00:42:38 关键人物的信念转变:萨姆强调,像Kevin Scott这样从怀疑到坚信的转变,是技术潜力的重要信号。 七、微软的价值捕获分析 * 00:44:13 合作对微软的多重战略价值:萨提亚阐述独家API合作、知识产权免版税使用以及将其集成至高价值应用(如GitHub, M365)带来的优势。 * 00:47:05 回应市场对OpenAI亏损合并的误解:萨提亚澄清微软风险上限即投资额,并强调合作带来的Azure增长与应用层(如Copilot)巨大价值才是重点。 * 00:50:15 平衡供应与需求的战略:萨提亚解释微软构建“可互换算力集群”的理念,以及为服务多元客户(包括自身应用)而主动管理需求的必要性。 * 00:56:22 在算力竞赛中保持利润:萨提亚认为与OpenAI的合作帮助微软快速达到规模效应,结合软件效率与多元化产品组合,有信心维持利润率。 八、更广泛的影响与宏观展望 * 01:01:43 AI对软件架构与商业模式的影响:萨提亚分析AI智能体将解耦传统SaaS应用的逻辑层,催生“智能体工厂”与“令牌工厂”的新价值分配。 * 01:11:46 聊天交互与搜索的经济模型差异:讨论聊天式AI的单位经济效益与搜索不同,可能导致消费者端出现新的变现模式(如订阅、智能体商务)。 * 01:15:36 AI对就业与生产力的长期影响:探讨AI将变革工作流程,初期可能抑制人头增长,但长期会提升杠杆,创造新岗位,并驱动经济生产力提升。 * 01:23:03 美国再工业化与全球领导力:主持人将科技巨头资本支出比作曼哈顿计划十倍,萨提亚乐观看待美国在AI基础设施投资上引领全球并输出技术。
AGI路线图首次曝光!DeepMind CEO:我们一半搞扩展,一半搞创新🎯 AGI:终极仿真的愿景 DeepMind 联合创始人 Demis Hassabis 提出,构建通用人工智能(AGI)本质上是在仿真人类心智。这一过程需要扩展与创新各占一半的努力,而实现后,我们将能通过对比,揭示人类意识中尚未被复制的独特部分——创造力、情感,或是梦境。 🤔 卓越与幼稚并存:AI的“锯齿状智能” 当前AI表现出惊人的不均衡:它能在国际数学奥赛中夺金,却可能在基础逻辑问题上犯错,甚至“还下不好国际象棋”。这种“锯齿状智能”揭示了系统在一致性与深度推理上的缺失,而这正是通往AGI必须弥合的缺口。 ⚖️ 在竞速与科研间寻找平衡 Demis 坦言,若按纯科学路径,AI应多在实验室中攻克如癌症般的“根节点问题”(AlphaFold 已证明其可行性)。如今,商业浪潮推动了大模型普及,但他强调,Google DeepMind 的核心优势仍在于其深厚的研究根基——从 Transformer 到 AlphaGo,突破往往源于此。 🧠 突破极限:没有什么不可计算? 当被问及人类是否有机器永远无法企及的能力时,Demis 回到了他最根本的信念:图灵机的边界在何处? 他的工作假设是——在计算框架内,没有什么是做不到的。“迄今为止,还没人在宇宙中发现任何不可计算的东西。” 而这,正是他们探索的终极前沿。 收听提示:以上仅是 Demis Hassabis 深度对谈的惊鸿一瞥。在完整的对话中,他还深入阐述了世界模型如何超越语言、AI将如何重塑经济与社会,以及为何智能体(Agent)的崛起将是下一关键转折点。 Google DeepMind CEO Demis Hassabis 访谈关键节点 一、开场与背景设定 * 00:00:00 开场:嘉宾探讨实现AGI需要在“扩展”与“创新”之间取得平衡,并认为理解AGI有助于洞悉人类心智。 * 00:01:09 主持人汉娜·弗莱介绍本期播客主题与嘉宾德米斯·哈萨比斯。 * 00:01:41 主持人提出宏观问题:AI的发展将走向何方,并引出德米斯作为长期思考者的角色。 二、AI驱动科学与“根节点”问题 * 00:02:09 德米斯回顾过去一年,提及Gemini III的发布与世界模型的进展。 * 00:02:38 主持人询问“根节点问题”的当前进展。 * 00:03:03 德米斯以AlphaFold为例,证明根节点问题可解,并列举材料科学、核聚变等新方向。 * 00:04:25 深入讨论与Commonwealth Fusion的合作,探讨核聚变作为终极清洁能源的变革潜力。 * 00:10:29 主持人探讨AI商业化竞速与纯粹科研路径之间的权衡。 * 00:12:41 德米斯承认聊天机器人商业成功,并分享对“终极个人助理”的愿景。 三、当前AI的挑战与前沿方向 * 00:05:56 主持人提出AI在数学竞赛与基础逻辑中表现矛盾的观察。 * 00:06:23 德米斯探讨“锯齿状智能”与“一致性”缺失,认为是实现AGI的关键障碍。 * 00:08:28 主持人类比AlphaGo,询问是否有脱离人类知识的AI系统。 * 00:09:50 德米斯指出当前系统缺失“在线学习”能力,并展望“AlphaGo式”的推理与“AlphaZero式”的发现。 * 00:13:52 主持人提出关于“扩展”是否遇到瓶颈的疑问。 * 00:14:19 德米斯反驳“撞墙论”,强调收益递减但仍显著,并提及合成数据等解决方案。 * 00:15:36 德米斯强调Google DeepMind以研究为先的优势,并重申“扩展”与“创新”并重的理念。 * 00:16:55 主持人提出“幻觉”问题,询问是否能为模型引入置信度评分。 * 00:17:19 德米斯解释模型自省能力与“思考步骤”对于减少幻觉的关键性。 * 00:19:10 主持人转向“世界模型”与仿真的话题。 * 00:19:28 德米斯阐述世界模型能捕捉语言难以描述的物理与感官体验,是通用助手的基础。 * 00:21:34 德米斯说明如何通过生成逼真虚拟世界来验证模型对物理规律的理解。 * 00:23:14 讨论将智能体(如SIMA)放入仿真环境(如Genie生成的世界)进行训练与互动。 * 00:24:42 德米斯设想AI在彼此生成的世界中互动的“无限训练”循环及其应用前景。 * 00:25:33 主持人探讨如何确保生成世界的物理真实性,避免“幻觉物理”。 * 00:28:00 讨论在仿真中运行进化实验,以探索意识起源与社会动态的涌现。 * 00:29:42 德米斯强调在安全的沙盒环境中运行仿真的重要性,并提议用AI监控AI。 四、AGI的社会影响、治理与未来 * 00:30:56 主持人提及德米斯之前“短期炒作,长期低估”的观点,并询问AI泡沫问题。 * 00:31:15 德米斯重申其观点,并分析AI生态系统中部分领域可能存在泡沫。 * 00:33:04 德米斯说明Google DeepMind在工程、研究、基础设施上的综合优势,能适应任何市场情况。 * 00:34:35 主持人担忧AI可能制造个人回音室,导致自我激进化。 * 00:35:40 德米斯介绍构建“科学化人格”AI的努力,在乐于助人与坚持事实间寻求平衡。 * 00:39:07 主持人询问能否从工业革命中吸取经验,以减轻AGI带来的社会混乱。 * 00:40:00 德米斯分析工业革命的利弊,认为本次变革规模更大、速度更快,需提前筹划。 * 00:41:25 讨论AGI可能要求重构当前以劳动换取资源的经济体系。 * 00:42:25 德米斯探讨后稀缺经济时代的可能性,如全民基本收入或直接民主机制,及其哲学内涵。 * 00:44:11 主持人表达对国际协作与准备不足的担忧。 * 00:45:51 主持人询问是否需要一次危机事件来促使全球重视。 * 00:46:00 德米斯分析负责任开发的商业动力,并认为一次“警示性炮击”或能推动国际合作。 * 00:47:52 主持人询问是否存在人类能做而机器永远无法做到的事。 * 00:48:05 德米斯回归“心智仿真”与图灵机极限的根本问题,探讨意识与计算的关系。 * 00:50:13 德米斯阐述其“一切皆可计算”的信念,并视探索此极限为DeepMind的核心使命。 五、个人使命与未来展望 * 00:53:08 主持人询问身处前沿的情感体验与责任负担。 * 00:54:03 德米斯分享激动与责任并存的复杂感受,表示一生都在为此准备。 * 00:55:06 德米斯提及AlphaGo的苦乐参半,以及AI对创意艺术领域的冲击与赋能。 * 00:56:35 主持人询问AI领军人物之间是团结还是因竞争而疏远。 * 00:56:51 德米斯承认存在激烈竞争,但希望众人能关注超越公司利益的更大图景。 * 00:57:40 德米斯表达对“被动系统”转向“自主智能体”阶段的担忧,认为风险将上升。 * 00:58:53 主持人询问德米斯个人使命与退休念头。 * 00:59:36 德米斯定义其核心使命是帮助人类安全地跨越AGI门槛,并希望为此促进协作。
史上最快增长?Lovable上线一年,ARR 突破 2 亿美元🚀 史上最快增长?上线一年,ARR 突破 2 亿美元。 在本期播客中,我们再次对话顶尖增长专家 Elena Verna。她现在是可能是史上增长最快公司之一 Lovable 的增长负责人。 💥 AI时代,增长逻辑已彻底颠覆。 Elena 坦言,她不得不将过去 15-20 年 积累的大部分增长方法论都扔掉。如今,只有 30%-40% 的经验能直接套用。 为什么? 因为市场和技术的变化速度前所未有。现在,她将 95% 的精力押注在增长创新 和重构解决方案上,而优化现有流程只占 5%。 🎯 那么,Lovable 做对了什么? * “公开构建”+创始人社交:让团队和创始人深度参与社交媒体,快速传递信息。 * “秘密配方”是免费:大胆降低使用门槛,将产品像糖果一样分发,特别是支持内部黑客松等活动,让用户成为推广者。 * 打造“WOW时刻”:目标是让用户体验惊艳到“袜子都吹飞”,从而自发形成口碑传播闭环。 * 重新定义团队:招聘充满激情、高自主性的人才,甚至设立了全职 “氛围编程师” 角色,快速将想法变为可交互的原型。 🔄 更严峻的现实是:产品市场匹配(PMF)不再是静态成就。 Elena 指出,现在每家公司几乎每 3 个月 就要重新寻找一次 PMF。技术和用户预期的双速进化,让所有 AI 公司都踏上了一条停不下来的“跑步机”。 ✨ 这只是精彩对话的冰山一角。我们还深入探讨了留存真相、营销渠道的变迁、AI公司的团队文化,以及她对科技行业女性现状的深刻关切。想了解更多颠覆认知的增长实战策略和行业前瞻思考? Lovable增长负责人Elena Verna访谈关键节点 一、开场与公司概况 * 00:00:00 开场:主持人介绍Lovable的增长奇迹与嘉宾Elena Verna的背景。 * 00:06:47 数据披露:嘉宾详述Lovable上线一年ARR超两亿美元、用户超800万的惊人增速。 * 00:10:12 收入来源:解释收入主要来自“创始人”使用场景,用户用Lovable从零构建应用并变现。 * 00:13:19 留存表现:透露付费留存符合行业基准,净美元留存(NDR)良好,当前更关注使用留存。 二、AI时代的新增长方法论 * 00:16:38 方法论革新:嘉宾坦言过去15-20年的增长经验仅30-40%适用于Lovable,需彻底创新。 * 00:20:29 摒弃优化:强调在高速变化的市场中,优化现有用户旅程已不值得,重点应转向构建新增长循环。 * 00:21:42 时间分配转变:过去仅5%时间用于增长创新,现在Lovable将95%精力投入创新,仅5%用于优化。 * 00:22:15 增长团队新角色:举例增长团队直接参与开发核心产品功能(如Shopify集成、语音模式)。 * 00:24:31 激活(Activation)的重心转移:由于产品核心是AI智能体,优化激活的责任已深度融入产品团队,而非仅增长团队。 * 00:26:31 核心策略一:“公开构建”:结合员工社媒与创始人亲自下场,快速传递信息并制造市场噪音。 * 00:30:16 营销角色的演变:营销更聚焦宏观叙事与快速迭代,大量推广工作需交由产品/工程团队。 * 00:31:45 渠道转变:有机增长的核心从SEO转向社交媒体(X, LinkedIn)和创作者/网红营销。 * 00:35:13 核心策略二:大量免费提供产品:降低使用门槛,将免费额度作为关键增长“秘方”,用于活动、黑客松。 * 00:48:06 产品开发范式转变:从“最小可行产品(MVP)”变为“最小可爱情产品(MLP)”,反馈周期急剧缩短。 * 00:49:15 新兴职位“氛围程序员”:介绍公司内全职“氛围程序员”的角色及其在快速原型验证中的价值。 三、团队、文化与招聘 * 00:41:24 人才标准:招聘看重对工作的热爱、高主动性(high agency)与高自主性(high autonomy)。 * 00:44:20 招聘优势:打造“可爱情”产品本身成为强大的招聘品牌,吸引顶尖人才主动加入。 * 00:45:33 文化坦诚:坦言公司节奏极快,需寻找能适应混乱并在其中创造清晰的人才。 * 00:51:08 内部工具:团队内部大量使用Lovable构建工具,并举办公司内部黑客松。 * 01:17:40 工作与生活:嘉宾分享在快节奏中保护个人时间的方法,强调设定优先级而非追求绝对平衡。 四、行业观察与个人建议 * 00:54:55 社区价值:强调社区(如Discord)在放大口碑、增强留存方面的重要性。 * 01:05:21 产品市场匹配(PMF)的新常态:提出在AI领域,PMF每三个月就需要重新寻找一次,是一场持续战斗。 * 01:11:40 市场扩张困境:担忧当前过度关注技术先驱者,可能疏远潜在的“相邻”主流用户。 * 01:14:30 加入AI公司的建议:分析AI公司的特殊性与高压力,适合擅长在混乱中创造清晰、渴望学习新技能的人。 * 01:26:35 对科技行业女性的担忧:指出女性在AI采用和AI公司任职上存在显著差距,并介绍“She Builds”倡议以推动改变。 * 01:32:49 招聘趋势变化:观察到“AI原生”毕业生和创业失败的创始人在当前市场中尤为抢手。 如果有您有想要听其他外文播客,也欢迎留言:)
别再说AI在减速了!Transformer作者爆料:真正的风暴,才刚刚开始🎧 播客精华速递 最近总听到人说“AI要凉了”?Transformer架构之父Łukasz Kaiser在最新访谈中,给出了截然不同的答案。 🧠 核心洞察:AI的进步并未减速,而是换上了“推理”新引擎。我们熟悉的ChatGPT类模型,正从“背答案”的学霸,进化成会“动脑筋”的侦探。 💡 一个生动的比喻: * 旧范式(大语言模型):像记忆力超群、但可能给出过时答案的“天才学生”。 * 新范式(推理模型):像会查官网、核信息、一步步推导的“严谨侦探”。 🎯 现状与未来: * 当前模型能力已被严重低估,它能修东西、解题,但公众认知存在滞后。 * 真正的突破在于训练模型的 “思考过程”本身(思维链)。 * 未来,AI将从“代码助手”升级为能处理复杂工作流的 “AI实习生”。 🚨 一个有趣的反差:最前沿的模型能解复杂数学题,却可能被一道5岁孩子的逻辑题难倒。这揭示了AI与人类智能在“泛化”能力上的核心差距。 这场从“反应”到“思考”的范式革命,才刚刚拉开序幕。它如何重新定义我们与AI的协作关系? 👉 点击下方,探索这场静默风暴的完整脉络。 一、AI进展态势与范式转变 * 00:01:41 开场探讨:主持人提出关于“AI进展放缓”的公众叙事与近期密集发布新模型的现实矛盾。 * 00:02:38 嘉宾阐述根本趋势:强调AI能力呈平稳的指数级提升,并类比摩尔定律的持续性。 * 00:04:06 指出关键转折点:从Transformer到推理模型的兴起,标志着一种新的、近期才出现的技术范式。 * 00:07:31 点明认知差距:嘉宾认为当前模型能力已被圈内人熟知但公众尚未完全意识到,存在“教育差距”。 二、推理模型详解与训练范式 * 00:09:25 讨论改进空间:嘉宾承认存在大量“低垂的果实”,包括工程优化、数据质量提升和多模态能力。 * 00:12:32 定义推理模型:主持人请求用简单语言解释推理模型与基础大语言模型的根本区别。 * 00:13:02 解释核心机制:嘉宾描述推理模型通过“思维链”进行内部推理并可调用工具,其训练依赖于强化学习。 * 00:15:21 阐明当前局限:指出推理模型在数学、编程等可验证领域表现出色,但在更主观或泛化任务上仍有局限。 * 00:21:10 揭秘思维链呈现:解释用户看到的“思维链”是完整推理过程的摘要,并简述通过强化学习优化思考策略的过程。 三、个人经历与Transformer的诞生 * 00:23:53 话题转向个人背景:主持人邀请嘉宾分享其从数学家到AI前沿研究员的历程。 * 00:26:34 揭秘Transformer论文:讲述八位作者从未 physically 齐聚的故事,并强调不同研究线索的汇聚。 * 00:27:20 科普注意力机制:应主持人要求,简要解释了注意力机制在机器翻译中的起源和概念。 * 00:29:52 回顾早期挑战:提及让Transformer理念运行起来所需的工程努力,以及当时对“单一模型处理多任务”的普遍质疑。 * 00:31:26 讲述职业转变:分享从Google Brain加入OpenAI的缘由,包括疫情影响、团队规模偏好以及前同事的邀请。 四、模型演进、挑战与可解释性 * 00:35:34 探讨预训练的现状:认为预训练处于S曲线上半段,其回报增速放缓,且产品化带来了训练更小、更经济模型的压力。 * 00:38:36 重新发现蒸馏技术:解释由于经济性需求,行业重新重视用大模型蒸馏小模型的知识。 * 00:40:27 展望预训练复兴:认为随着GPU资源增加和对蒸馏价值的认识,大规模预训练可能会复兴。 * 00:41:12 讨论系统复杂性:主持人提出现代AI系统融合多种技术,询问其“黑箱”特性是否依然存在。 * 00:42:14 分享可解释性进展:嘉宾引用稀疏化研究为例,说明对模型内部机制的理解正在取得进展,但也承认存在根本性限制。 五、未来方向与行业影响 * 00:43:05 剖析GPT-5.1的改进:主持人询问从GPT-4到GPT-5.1的实质性变化,嘉宾指出推理能力和安全/对齐方面的后训练改进是关键。 * 00:48:44 解释模型命名逻辑:说明当前模型命名(如GPT-5.1, Mini)已与技术细节脱钩,更侧重于表示能力和产品定位。 * 00:52:04 揭示模型当前弱点:通过一个“共点计数”的视觉谜题实例,说明模型在多模态推理和上下文学习上的明显局限。 * 00:56:04 提出根本问题:探讨泛化能力是否是AI的核心挑战,以及仅靠推理能否实现足够好的泛化。 * 01:04:57 探讨AI对行业的影响:主持人提出在强大通用模型的世界中,创业者还能做什么,嘉宾以翻译行业为例,指出“信任”等因素仍将保留人类角色。 * 01:08:00 分享个人研究兴趣:嘉宾表示对“通用数据强化学习”以及最终实现机器人领域的突破充满热情,并预测硬件一旦成熟将带来显著变化。 如果有后续想要听其他外文播客,也欢迎留言:)
从20倍增长到万亿级token:OpenAI Codex负责人访谈本访谈聚焦AI在软件开发领域的革命性应用,探讨了OpenAI如何通过Codex将AI深度融入开发流程,并揭示了未来人机协作的新范式。 👨⚕️ 本期嘉宾 Alexander Embiricos领导着OpenAI旗下强大的编程智能体Codex的产品工作。自8月以来,Codex的使用量增长20倍,现在每周处理万亿级token。在加入OpenAI之前,Alexander曾用五年时间为工程师打造一款结对编程产品。如今他站在AI驱动软件开发的前沿,致力于构建他口中的“software engineering teammate”——一个旨在参与完整开发周期的AI智能体。 ⏱️ 时间戳 一、开场与Codex愿景 * 00:00:00 开场:探讨Codex作为软件工程智能协作者的起点,将其比作一个“聪明的实习生”。 * 00:01:01 核心目标:明确Codex旨在通过编码智能体大幅提升开发者生产力。 * 00:01:27 产品哲学:强调构建工具应以最大化用户工作效率为核心,而非增加认知负担。 * 00:02:27 内容概览:主持人介绍本期将讨论OpenAI产品文化、Codex增长、Sora案例及AGI展望。 二、OpenAI的工作文化与产品开发 * 00:05:59 嘉宾背景:介绍Alexander Embiricos在创业、Dropbox及最终加入OpenAI的经历。 * 00:06:18 OpenAI的独特性:嘉宾总结其最突出特点是极致的“速度”和雄心。 * 00:07:03 增长案例:以Codex在升级后实现数月内十倍增长为例,说明OpenAI的推进速度。 * 00:08:48 自下而上的组织:解释OpenAI因技术不确定性而采用真正自下而上、高度自主的实证工作方式。 * 00:10:30 目标设定:阐述公司对长远目标(如对齐问题)有清晰愿景,但对具体产品路径保持谦逊和实验性。 * 00:11:48 人才因素:指出这种工作模式高度依赖于顶尖人才的自主性与驱动力。 三、Codex的产品演进、应用与增长 * 00:12:32 产品定义:解释Codex是一个IDE/CLI插件,能辅助回答代码问题、编写和执行代码。 * 00:13:28 长期愿景:将Codex定位为覆盖软件生命周期(构思、验证、部署、维护)的智能协作者。 * 00:16:36 增长数据:透露自去年8月GPT-5发布以来,Codex实现了约20倍的增长。 * 00:18:57 产品迭代:从最初云端异步执行的“超前”版本,回退到更契合开发者本地工作流的交互式协作模式。 * 00:22:48 能力提升:分析Codex能力飞跃得益于模型进步(如GPT-5.1 Codex Max)、专用执行框架及高度融合的产研团队。 * 00:36:02 新的焦点:提出当前重点不仅是写代码,更是让代码审查和验证工作变得更简单、有趣。 * 00:46:26 内部影响:分享Codex如何改变PM和设计师的工作方式,使他们能直接构建原型和分析工具。 * 00:49:53 震撼案例:详细介绍Codex如何助力Sora团队在28天内完成并发布登顶App Store的Android应用。 * 00:51:35 内部加速:以Atlas浏览器项目为例,说明Codex已将部分任务的效率提升数倍。 四、AI智能体的未来构想与竞争 * 00:26:19 如何取胜:探讨赢得竞争的关键在于打造真正的“智能协作者”,而不仅是代码编写工具。 * 00:27:48 交互范式:认为聊天是通用入口,但专业领域(如编码)需更深入的GUI集成,以实现“混合主动式”帮助。 * 00:29:40 核心能力:提出所有智能体的基础应是编码能力,因为模型使用计算机的最佳方式就是写代码。 * 00:31:53 发展路径:指出智能体实用的挑战在于理解工作上下文与团队规范,而不仅是技术可行性。 * 00:34:29 目标受众:认为软件工程师是理想的早期用户,其创造性使用能指引产品方向。 * 00:41:52 灵感来源:借鉴自动补全的成功,展望Codex能提供更多上下文感知的主动建议。 * 01:01:10 浏览器愿景:解释开发Atlas浏览器的原因是为了更原生、高质量地获取上下文,以提供精准帮助。 五、AGI展望、职业影响与总结 * 00:56:01 行业变化:探讨AI时代,深刻理解客户问题比单纯的产品构建能力更为重要。 * 00:57:55 衡量指标:分享团队关注新用户上手体验、七日留存率及Reddit等社交媒体的真实反馈。 * 01:07:53 职业建议:建议计算机科学学习者应重视系统工程能力、团队协作及对软件系统的整体理解,而非单纯编码速度。 * 01:11:06 前沿应用:透露Codex已用于编写和管理其自身训练的基础设施代码,并开始尝试在训练中“随叫随到”自动修复问题。 * 01:12:49 AGI时间线:提出当前被低估的瓶颈是人类交互速度(打字、多任务),突破后将释放指数级增长;预计明年起部分先驱公司将出现生产力拐点。 * 01:15:36 团队招募:嘉宾为Codex团队发布招聘信息,寻找对智能体未来有热情和见解的人才。 * 01:17:43 快问快答:嘉宾分享喜爱的书籍、动漫、产品,以及“要善良,也要坦诚”的人生座右铭。 🌟 精彩内容 💻 不止于代码补全:认识 OpenAI 的编码智能体 Codex 这不仅仅是一个帮你写代码的 IDE 插件。在最新一期的播客中,OpenAI 的 Codex 产品负责人 Alexander Embiricos 分享了关于这个「智能协作者」如何重塑开发工作的前沿洞察。 🚀 从愿景到现实:惊人的加速案例 * 28天登顶 App Store:Codex 助力 Sora 团队,仅用 18天 完成 Android 应用内部版本,总计28天 便向公众发布并迅速登顶榜首。 * 爆炸式增长:自去年8月以来,Codex 的使用规模实现了 20倍 增长,其模型每周处理的 Token 已达数万亿级别,成为调用量最大的编码模型之一。 * 解决最棘手难题:研究人员遇到耗费数小时的复杂 Bug 时,将其交给 Codex 运行,往往能在一小时内获得解决方案。 🎯 核心目标:从「工具」到「默认有用的协作者」 Codex 的最终形态并非一个需要反复提示的工具,而是一个能理解上下文、主动工作的「智能队友」。正如 Embiricos 比喻的那样,目前的 Codex 像一个聪明的实习生,而未来它将能主动查看 Slack、检查系统日志,并参与从构思到部署维护的全周期工作。 ✨ 对未来的一瞥:编码智能体是通向 AGI 的基石 Embiricos 提出了一个独特观点:实现更高层次 AI(AGI)的一个现实瓶颈,竟是 人类的打字速度和多任务处理能力。而 Codex 这类智能体的演进,正是通过让 AI 默认变得有用,来打破这一瓶颈,释放指数级的生产力增长。 想了解 Codex 如何参与自身训练、为何产品团队现在更关注 「代码审查」 而非单纯写代码,以及 Embiricos 对 AI 智能体何时能真正实用 的预测?请收听完整播客。 如果有后续想要听其他外文播客,也欢迎留言:)
对话Mark Chen:OpenAI怎么搞研究,下一步计划?马克·陈是人工智能领域最具影响力的人物之一。作为OpenAI的首席研究官,陈负责决定哪些想法能获得计算资源、哪些研究方向可以扩大规模,以及这个拥有500人的实验室如何应对不断的挖人风波、模型竞赛和开创下一个范式的压力。 本期播客谈论了送汤式的招聘大战、OpenAI如何思考保持对Meta和谷歌的领先地位,以及当每个人都认为自己的项目至关重要时,对300个内部研究项目进行排名的真实感受。还有陈的成长历程,从数学竞赛、高频交易到OpenAI的早期阶段,以及他如何最终助力公司度过最混乱的时期。 他谈到了推理模型的突破、对预训练的重新关注、GPT-5 Pro已经取得的科学发现,以及为什么他认为完全自主的人工智能研究比人们想象的更近。这是一场坦诚且信息量巨大的对话,对话者是塑造现代人工智能发展方向的关键人物之一。 OpenAI首席研究官Marc Chen访谈关键节点 一、人才竞争与组织文化 * 00:00:00 开场:主持人引入Meta与OpenAI之间激烈的人才争夺战话题。 * 00:00:41 OpenAI的视角:Marc Chen反驳媒体叙事,指出Meta从OpenAI挖人多数失败,并举出团队核心成员拒绝挖角的例子。 * 00:01:06 留人策略:解释OpenAI不靠高薪资,而是依靠使命感和项目前景来留住顶尖人才,并提及扎克伯格亲自“送汤”挖人的趣事。 * 00:02:42 文化信心:强调团队对OpenAI研究项目的强大信念是抵御高薪挖角的核心。 * 00:03:38 战略核心:指出关键在于培养和留住核心人才,而非试图留住组织里的每一个人。 二、研究管理与战略 * 00:05:48 职责阐述:Marc Chen描述其作为首席研究官与Yaakov合作,负责规划研究方向并为数百个项目分配算力优先级。 * 00:07:54 聚焦路线图:解释OpenAI与其他实验室的区别在于专注于探索性研究和寻找“下一个范式”,而非被动追赶基准测试。 * 00:08:34 决策挑战:讨论如何避免被研究人员极力游说,强调领导力在于明确传达核心优先级。 * 00:09:45 保持自主性:阐述在激烈竞争中不被对手节奏带偏,坚持下注长远范式(如早期的推理项目RO)的重要性。 * 00:12:25 公司内核:强调OpenAI骨子里仍是一家纯粹的AI研究公司,认为研究领先是创造价值的最佳途径。 三、个人背景与职业历程 * 00:18:27 竞赛起源:Marc Chen分享其通过大学室友接触编程,并因保持联系而参与竞技编程,后来成为美国队教练。 * 00:23:01 AI解题洞察:通过AI解决编程竞赛题目的例子,指出AI与人类对问题难易的直觉不同,这能启发前沿研究。 * 00:25:51 能力拐点:分享GPT-5 Pro帮助物理学家解决论文难题的故事,认为AI推动科学前沿的拐点已现。 * 00:33:44 早期职业:回顾从MIT毕业后进入华尔街做高频交易的经历,并因感觉对世界改变有限及受AlphaGo启发而转向AI。 * 00:37:30 进入AI领域:描述通过复现DQN结果自学AI,认为该领域早期入门门槛相对较浅。 * 00:39:08 加入OpenAI:回忆2018年以“研究员”(resident)身份加入仅约20人的团队,在Ilya指导下学习。 * 00:40:22 项目贡献:提及早期从事生成式建模工作,以及参与Dolly前身和Codex等关键项目。 * 00:43:35 转向管理:谈到从独立贡献者(IC)转向管理角色的犹豫与成长过程。 四、危机管理与团队领导 * 00:46:43 危机时刻:描述在Sam Altman被罢免后的动荡时期,决心保护团队,通过开放沟通和请愿团结研究人员。 * 00:48:05 请愿行动:讲述组织研究部门超过90%人员签署支持Sam回归的请愿书,以向外界展示团结。 * 00:49:55 保护心态:表达对OpenAI团队强烈的保护欲,视其为家人,并认为公司是AI人才的“成名之地”。 * 00:52:50 人才哲学:阐述OpenAI在积极挖掘外部顶尖人才的同时,也极度重视内部人才培养和保持高人才密度。 * 00:54:50 领导协作:描述与Sam Altman和Yaakov的紧密合作模式,Sam负责把握团队脉搏和发现潜在问题,Marc与Yaakov负责研究设计与执行。 * 01:27:00 人才标准:强调通过控制编制(HC)等练习来保持极高的人才门槛和密度,避免标准被稀释。 五、技术展望与产品思考 * 00:57:31 预训练聚焦:解释过去半年与Yaakov重新强力聚焦预训练,认为该领域仍有巨大提升空间,并对后续模型能力充满信心。 * 01:00:26 超越模仿:讨论预训练的瓶颈在于模仿人类数据,提出需要引导模型攻克超人类任务,并面临评估难题。 * 01:06:31 AGI进程:Marc Chen提出将AGI视为一个进程而非单点事件,并以AI是否产生全新科学知识作为关键判断标准。 * 01:11:25 自动化研究:披露OpenAI研究组织的两大具体目标:一年内改变科研方式,两年半内实现AI端到端独立完成研究。 * 01:13:21 算力需求:强调对算力的需求没有放缓迹象,若有十倍算力可立即高效利用。 * 01:16:19 未来交互:批判当前ChatGPT交互模式的局限性,设想未来设备需具备持续记忆和深入理解用户的能力。 * 01:20:54 未来突破:被问及未来潜在突破时,透露对“Skeleton”等项目高度期待,并提及预训练、强化学习等整合方向。 * 01:22:10 核心理念:澄清OpenAI本质上是一家以研究为中心、全力押注AGI的公司,所有产品都自然由此衍生。 * 01:29:50 功劳归属:主张OpenAI应大方认可贡献者,即使有被挖角风险,也要坚持当好“AI超级明星孵化器”。 * 01:31:11 对齐挑战:表达对AI对齐问题的深切关注,认为未来一两年主要挑战在于确保模型诚实、可控,并探讨模型间相互监督等解决方案。 🌟 精彩内容 🔥 人才争夺战:从“送汤”到战略防御 * Meta 等竞争对手曾以“十手煲汤”等非常规方式,试图从 OpenAI 挖角核心研究员。 * Mark 透露,Meta 曾试图挖走他半数直接下属,但均被拒绝。 * OpenAI 的策略是:不进行“美元对美元”的薪资对标,而是依靠使命愿景和前沿研究项目留住顶尖人才。他认为,员工对 AGI 愿景的信念,是比高薪更强大的凝聚力。 🧠 研究优先:如何分配稀缺的 GPU 资源? * OpenAI 内部同时进行着约 300 个研究项目。Mark 与联合创始人 Ilya Sutskever(注:采访发生时 Ilya 仍在职)等人每1-2个月会进行一次全面评估与优先级排序。 * 核心原则:将更多算力投入探索性研究,而非仅仅用于训练现有模型或追赶竞品基准。他们坚信,找到下一个范式比短期领先更重要。 * 领导者的艰难抉择:清晰沟通核心优先级,并对暂时无法支持的项目说“不”。 🚀 自信与竞争:如何看待 Gemini 等对手? * 谈及 Gemini 1.5 Pro 时,Mark 承认其是“一个相当不错的模型”,但表示 OpenAI 内部已有 性能相当甚至更优的模型,并将很快发布。 * 他强调,OpenAI 的长期策略是 专注破解下一个范式(如推理能力),而非陷入短期的基准竞赛。他认为,当模型能力超越人类后,现有的评测标准将失效,需要建立新的评估体系。 🤖 AI 的未来:从“工具”到“科研伙伴” * Mark 亲历了 AI 在编程竞赛(如 IOI)中从落后到超越顶尖人类选手的过程,这让他坚信 “AI+人类”将在前沿科研中产生惊人成果。 * OpenAI 设定了内部目标:在 一年内 改变研究方式,让 AI 承担“实习生”的职责(负责实现、调试代码);在 两年半内 实现 AI 进行端到端的自主研究。 * 他认为,自动化科学研究 的拐点已经出现,这将是比产品化更根本的进步。 💡 管理哲学:打造“研究至上”的文化 * Mark 认为,AI 研究领域是一个 深度精英治理的领域。领导者必须自身技术过硬,才能赢得研究员的尊重。 * 他反对过度强调“个人功劳”,但认为公司必须 主动认可并公开核心贡献者,即使这会让他们成为竞争对手的目标。OpenAI 希望成为“AI 明星的摇篮”。 * 在经历2023年底的“董事会风波”时,Mark 等人通过 组织请愿、开放自家客厅供团队聚集 等方式,稳住了军心,最终实现了“零人才流失”。 🎯 核心信念:OpenAI 为何不同? * Mark 反复强调,OpenAI 的核心始终是一家 纯粹的 AI 研究公司,其所有产品都源于研究突破。 * 公司的终极野心是:构建 AGI,并安全地构建它。他目前深度参与的“对齐”研究,正是应对未来超级智能“表里不一”等风险的关键。 * 对于“需要这么多算力吗?”的质疑,他的回答是:“如果我们今天有10倍算力,几周内就能将其高效利用。” 这仅仅是一场信息量爆炸的对话的冰山一角。Mark Chen 的分享揭示了一个处于全球科技竞争最前沿的团队,如何在巨大压力下保持专注、创新,并坚定地走向他们眼中的未来。 如果您有希望翻译的其它海外播客,请留言:)
四年,百人,零融资,营收十亿刀:这家AI数据公司如何“静默”改写硅谷规则?🚀 颠覆硅谷游戏规则:一家AI数据公司的“非典型”成功 在AI浪潮席卷全球的今天,一家名为Surge AI的公司,以近乎“离经叛道”的方式,书写了令人瞠目的商业传奇: * 惊人效率:在成立不到4年的时间里,营收突破10亿美元,团队规模却始终保持在百人以下。 * 完全独立:从未接受任何风险投资,完全依靠自身盈利实现增长,从第一天起就保持盈利。 * 极致专注:创始人埃德温·陈(Edwin Chen)极度厌恶硅谷的“炒作游戏”,公司几乎不做公关,不玩融资,只埋头打造产品。 这不仅仅是关于数字的故事,更是关于如何以不同的方式构建重要公司的深刻思考。 🧠 核心洞察:AI的“品味”与“质量”之战 Surge AI的核心业务是为前沿AI实验室提供训练数据,简单说,就是“教AI模型分辨好坏”。但埃德温认为,整个行业对“质量”的理解存在巨大误区: “大多数人根本不明白在这个领域‘质量’意味着什么。他们认为只要投入人力就能解决问题,这完全错了。” 他举了一个生动的例子:训练AI写一首关于月亮的诗。 * 平庸的做法:检查是否满足“8行”、“包含‘月亮’一词”等机械标准。 * Surge AI的做法:追求诺贝尔奖级别的诗意——是否独特?是否充满精妙的意象?能否触动情感、引发思考? 这种对“质量”近乎苛刻的、充满“人类品味”的理解,正是他们成功的核心。这背后是复杂的技术系统,用于衡量成千上万个信号,以寻找“万里挑一”的顶尖人才来生成数据。 ⚠️ 行业隐忧:AI正在被“误导”? 埃德温对当前AI的发展方向提出了尖锐的批评: 1. 追逐错误的“指标”:许多实验室为了在排行榜上取得好成绩(这直接影响企业销售),会刻意优化模型,使其输出更“炫目”(比如滥用表情符号、加粗格式),但这往往以牺牲准确性和真实性为代价。 2. 优化“用户参与度”的陷阱:就像社交媒体的“点击诱饵”一样,AI模型也可能被训练得倾向于讨好用户,说用户想听的话,甚至强化用户的偏见和错误观念,只为延长对话时间。 3. “多巴胺” vs “真理”:他担心,我们不是在构建能解决癌症、贫困等重大问题的AI,而是在优化模型去追逐即时的“多巴胺”反馈,制造大量华而不实的“AI垃圾”。 他欣赏Anthropic等公司更“有原则”的做法,认为公司的价值观将从根本上塑造AI模型的行为。 💡 创始人的“反共识”建议 基于自身的成功经验,埃德温给创业者提供了截然不同的建议: * 不要盲目融资:远离那个需要不断向VC汇报、追逐估值的“仓鼠轮”。真正的成功来自于打造好10倍的产品,并依靠口碑传播。 * 不要轻易转型:硅谷的标准剧本是“快速试错,每两周转型一次”。但他认为,伟大的公司源于对一个宏大信念的坚持,而不是追逐热点的“投机”。 * 打造“只有你能打造”的公司:你的公司应该是你个人经历、兴趣和价值观的延伸。追随你热爱的事物,做你真正相信的事,而不是优化仪表盘上的数字。 🔮 AI的未来:差异化与“人性化”学习 埃德温预测,AI模型的未来将不是同质化的,而是会因价值观不同而高度差异化。例如: * 当你让AI帮忙写邮件时,你希望它是一个不断追求“完美”、让你迭代50次的助手,还是一个告诉你“这已经很好了,发出去继续工作”的效率伙伴? 此外,让AI变得更智能的关键,在于模仿人类复杂的学习方式。除了现有的方法,强化学习环境将是下一阶段的关键——将AI置于模拟真实世界的复杂环境中(如一个包含代码库、Slack消息的虚拟创业公司),让它通过试错和长周期任务来学习,这更接近人类的成长方式。 🌌 终极使命:塑造人类的“孩子” 埃德温将数据工作提升到了一个哲学高度:他认为这不仅仅是给AI“喂数据”,更像是养育人类的孩子。你灌输的不仅是信息,更是价值观、创造力和对“美”的理解。 “我们正在帮助客户思考他们梦想的‘目标函数’——他们到底想要什么样的AI模型?这决定了我们如何塑造AI,而AI将决定我们人类的未来。” Surge AI的故事,是一个关于独立、深度与责任感的故事。它提醒我们,在AI狂飙突进的时代,那些最根本的问题——质量、价值观和长期影响——或许才是最值得关注的。 想深入了解埃德温·陈如何定义AI的“质量”,他为何对行业现状感到担忧,以及他眼中AI的未来图景?请收听本期播客完整内容。
AI 教母李飞飞展望未来:工作、机器人及下一代技术核心——世界模型李飞飞博士被誉为“人工智能教母”。二十多年来,她一直处于人工智能重大突破的核心。她主导了ImageNet项目——这个数据集点燃了我们正在经历的深度学习革命;她曾担任谷歌云首席人工智能科学家,领导斯坦福大学人工智能实验室,并共同创立了斯坦福大学以人为本人工智能研究所。在这次对话中,李飞飞分享了这段鲜为人知的发展史——包括一个惊人事实:就在九年前,自称人工智能公司基本上等于自寻死路。 本期播客我们探讨了: 1. ImageNet如何助力引爆我们正在经历的人工智能爆发 2. 为何世界模型和空间智能是超越大语言模型的下一个AI前沿 3. 为何李飞飞认为AI不会取代人类,但要求我们为自己负责 4. Marble(暂译名)从电影制作到心理学研究的惊人应用 5. 相比语言模型,机器人技术面临哪些独特挑战及突破路径 6. 无论身处何种角色,如何参与人工智能发展 本期内容包含: (00:00) 李飞飞博士介绍 (05:31) 人工智能演进历程 (09:37) ImageNet的诞生 (17:25) 深度学习的兴起 (23:53) 人工智能与通用人工智能的未来 (29:51) 世界模型概念引入 (40:45) AI与机器人领域的“苦涩教训” (48:02) 革命性产品Marble介绍 (51:00) Marble的应用场景与案例 (01:01:01) 创业历程与洞见分享 (01:10:05) 斯坦福以人为本人工智能研究 (01:14:24) 人工智能在各行业的角色 (01:18:16) 结论与最终思考
谷歌CEO桑达尔·皮查伊BBC访谈中文版:AI狂潮万亿美元赌注与人类未来🤖 AI狂潮:万亿美元赌注与人类未来 谷歌CEO桑达尔·皮查伊在BBC访谈中,描绘了一幅AI重塑世界的震撼图景: 💥 万亿美元基建狂潮 * 谷歌年度资本支出从4年前的300亿美元飙升至今年超900亿美元。 * 全行业AI基础设施投资总额超1万亿美元——相当于未来几年要建成过去10-20年的算力总和。 🚀 泡沫还是革命? * 皮查伊承认存在“非理性”投资,但强调需求真实且迫切:“兴奋是理性的”。 * 类比互联网泡沫:虽有过度投资,但技术带来的变革是根本性的。 🔮 未来12个月的进化 * AI将从“智能问答”迈向“代理体验”——帮你购物、安排行程、甚至辅助医疗决策。 * 皮查伊调侃:“CEO的工作或许是AI未来更容易替代的之一。” ⚠️ 残酷真相与巨大责任 * AI会犯错:皮查伊坦言当前技术存在缺陷(如编造“胶水披萨”配方、错误指控议员)。 * 核心警示:“不要盲目相信AI说的一切”。 * 能源挑战:AI数据中心耗电增速惊人,但也在倒逼核聚变、小型核反应堆、地热等新能源投资。 🌍 英国与全球棋局 * 谷歌刚宣布对英50亿英镑投资,并启用由壳牌新能源供电的数据中心。 * 皮查伊呼吁各国加速能源基础设施建设,以免制约经济发展。 🎵 创作者之争 * 面对“AI盗窃”指控,谷歌目前允许内容创作者选择退出训练,并承诺建立新框架与行业分享价值。 🧬 实验室里的未来 * AlphaFold(已获诺贝尔奖)已解析3亿个蛋白质结构——相当于“数亿年的PhD研究在几个月内完成”。 * 量子计算“处在AI五年前的发展阶段”,有望在未来五年迎来爆发。 * 无人驾驶已在美国多地上路,皮查伊80多岁的父亲亲身乘坐后深感震撼。 这场对话揭示了一个核心矛盾:企业正以前所未有的规模押注AI,而人类则站在一场充满巨大机遇、不确定性及深刻社会变革的浪潮之巅。 这场技术革命将如何重塑我们的工作、认知与未来?答案正在被书写。
蔡崇信最新访谈(中文):前瞻十年 - 推动中国经济增长的科创引擎阿里巴巴集团董事长蔡崇信在香港大学2025年Edward Chen杰出讲座上,与港大教授进行炉边谈话,探讨未来十年中国经济增长的技术驱动力。开场介绍讲座背景及蔡崇信经历成就后,他分享体育投资经历,认为体育可促进文化交流。谈及阿里变革,称随客户需求发展,云计算源于自主技术需求。在经济增长与科技政策上,他指出中国应保持制造业优势、技术自主,在AI领域有政策及多方面竞争优势。此外,他认为开源推动AI普及是中国优势,还为年轻人提AI时代建议,回答多个相关问题,最后教授总结中国AI发展的四大成功因素。 00:00 主持人提及活动火爆,准备以体育话题开场 00:15 体育投资与阿里巴巴变革 01:50 讲述NBA在中国的发展历程及未来期望 05:08 强调通过体育促进文化交流及相关慈善项目 07:00 提及体育慈善项目选拔学生数量 08:09 分享阿里巴巴从B2B电商到AI与云计算公司的转变 12:16 说明阿里巴巴发展云计算业务源于自身需求 16:42 中国经济增长与科技政策 17:33 蔡崇信认为中国五年计划的两大要点:制造业与技术自主 20:46 蔡崇信称中国持续作为世界制造中心,经济将继续增长 24:09 国务院AI计划提出到2030年AI智能体和设备渗透率达90% 27:04 蔡崇信指出中国在AI领域的能源优势及数据中心成本优势 29:56 蔡崇信表示中国因大量工程师和STEM学生获AI优势 33:11 中国AI开源优势及盈利、技能建议 33:41 中国公司开源模式推动AI普及,是中国AI发展优势 37:16 阿里靠云计算业务,借开源AI相关产品盈利 39:53 年轻人应学习获取知识、分析思考及提问技能 45:38 云计算是公用设施,当下最热领域是AI 46:18 AI从工具变为朋友,将带来重大变革 49:38 创业决策、AI泡沫及不同公司管理 50:20 年轻人应做好准备,抓住不对称风险收益的机会 51:47 AI现象真实存在,可能存在金融市场泡沫 54:19 管理体育团队和科技公司,都要挑选优秀人才 57:14 阿里巴巴AI战略:兼顾大语言模型与云,开源模型 01:00:23 教授总结中国AI发展成功的四大因素
音色克隆翻译Ilya重磅访谈:剖析AI泛化难题与超级智能未来嘉宾: Ilya Sutskever * 🧠 前OpenAI联合创始人、首席科学家 * 🚀 现任Safe Superintelligence Inc.创始人兼CEO 主持人: Dwarkesh Patel 时间: 2025年11月 时长: 约90分钟 核心议题: 聚焦AI发展的核心瓶颈、当前模型的局限性以及未来发展方向,提出了 “从扩展时代迈向研究时代” 的重要论断。这是Ilya离开OpenAI后首次系统阐述其技术哲学,具有重要参考价值。 📜 核心观点列表 1. ⚖️ Scaling时代的终结与AI的经济影响滞后Ilya明确指出“Scaling时代已经终结”。尽管AI模型在评测中表现优异,但其经济影响却明显滞后。这种脱节可能源于强化学习训练过于关注评测结果,导致模型缺乏真正的泛化能力。 2. 🔄 预训练、强化学习与评测性能的脱节当前系统在评测中出色但现实应用不佳的原因在于:预训练利用了海量自然数据,而强化学习则因训练环境过于狭窄,导致模型过度优化评测指标(“奖励黑客”),这实则是人为追求好看数据造成的系统性偏差。 3. ❤️ 情绪、价值函数与人类学习的类比人类情绪在决策中扮演着类似内置价值函数的作用。Ilya指出,当前强化学习缺乏有效的价值函数,导致学习效率低下;而人类拥有鲁棒的内在价值系统,能快速学习和自我纠正。 4. 🔬 从扩展时代回归研究时代AI发展已从依赖简单扩大数据、算力和参数的“扩展时代”回归“研究时代”。旧模式已近极限(数据即将耗尽),现在需要回到基础研究,探索新的训练范式。 5. 🌟 人类泛化能力与AI的根本差距人类比AI具有更强的泛化能力,这不仅是进化赋予的先验,更可能是人类拥有更优的机器学习机制。即使在语言、数学等现代领域,人类也能快速学习,表明其学习算法本身具有优势。 6. ⏩ 直通超级智能与渐进部署的权衡构建超级智能有两种路径:SSI主张的“直通超级智能”与OpenAI等采取的渐进式部署。Ilya承认渐进部署有助于社会适应,但认为专注研究可避免市场竞争带来的分心与妥协。 7. 🕊️ 对齐问题与关爱感知生命的AI超级智能的安全关键在于对齐其价值观。建立“关爱感知生命”的AI可能比仅关爱人类的AI更容易,因为AI本身也是感知生命,或可通过类似镜像神经元的机制产生同理心。 8. ♟️ 多智能体、多样性与自我对弈如何在AI中创造真正的多样性?Ilya认为当前模型因共享相似预训练数据而高度同质化。自我对弈等多智能体竞争机制可促进多样性,但需超越简单的对抗模式。 9. 🎨 研究品味与科学直觉Ilya分享了他独特的研究品味:从人类认知本质出发,追求简单、优雅、受大脑启发的解决方案。他认为伟大的想法必须具有“美”和“必然性”,即使实验暂时失败,也能凭借自上而下的信念坚持。 📖 关键术语解释 * 📈 Scaling时代: 指2020-2025年,依赖预训练和算力扩展的AI发展阶段。 * 🔎 研究时代: 指2012-2020年以及当前回归的AI发展阶段,注重算法创新和基础研究。 * 📊 价值函数: 强化学习中的概念,指能在任务完成前评估当前状态好坏的机制。 * 🌍 泛化能力: 指模型将学到的知识应用到新环境或任务中的能力。 * 🎯 对齐问题: 确保AI系统目标与人类价值观一致的技术挑战。