

AI 圈几件大事,用人话讲清楚背后的逻辑一、DeepSeek 组建 Harness 团队:所有人都在解同一道题,它来晚了 00:15 今天的内容要聊一聊最近人工智能领域发生的几个比较大的事情。如DeepSeek成立了自己的Harness团队,还有Karpathy加入了Anthropic,包括OpenAI在新加坡设立了实验室,再有SpaceX要收购Cursor这些事情。这一系列的动作都在说明现在人工智能行业的竞争已经不仅仅是谁的模型更大更强。而是整个闭环,包括生态渠道落地能力的全方位比拼。 00:49 对这个转变还是很明显的那我们就直接开始。 00:54 第一个话题就说说DeepSeek成立了Harness团队,他们这个团队的目标和最新的动作是什么? 01:00 DeepSeek最近在北京组建了一个全新的团队,这个团队是要从头开始打造自己的代码智能体。这个智能体项目的代号就叫DeepSeek Code。还从Jane Street请来了资深的工程师Cui Tianyi 来带队。 01:19 这个Harness系统它到底是干什么的?为什么在实现AI自主化这件事情上这么关键? 01:25 大模型它只是一个非常聪明的大脑,但是它自己没有办法去做事情。它要等你去问它它才会回答你,Harness它其实就是给这个大脑装上了手脚,让它可以自己去打开电脑查找资料、编写代码运行测试,甚至自己去看报错,然后修复。 01:46 有了Harness之后,AI就真的可以自己从头到尾完成一个任务了。 01:52 就是因为有了Harness这套系统,AI才不需要人每一步都去指导它,它可以自己去应对一些复杂的问题。这和模型本身的智能程度没有关系,这是一个单独的工程上的挑战,需要单独的投入建设。 02:10 那现在业内对于Harness系统主要有哪几种不同的做法? 02:15 目前几大AI公司都在做自己的Harness,但路径其实差别还挺大的。Anthropic,是把Harness和Claude模型深度的整合在一起,直接打包卖。他们的收入也是从100亿美元一年直接涨到了300亿美元,也带动了新一轮的竞争。 02:37 那Google呢? 02:39 Google把Harness的能力直接藏到了自己的生态里面。像Gmail、Docs、Calendar这些,它在后台默默的帮你自动完成一些任务。但是它只能在google的产品里面用,它的覆盖面虽然广,但它没有办法跨出这个围墙花园。 02:56 还有其它吗? 02:58 还就是OpenClaw,它是一个开源的项目,它是把Harness和模型拆开了,它可以让你自由的去搭配不同的模型,在GitHub上面已经有超过10万颗星了。最后一个就是DeepSeek,它起步最晚的,它的模型是开源的,成本也很低。它如果能够把Harness做出来的话,它是可以用一个非常低的价格去吸引那些对价格很敏感的开发者。 03:28 我还有个疑问,在Harness这个事情上面,最大的行业难题是什么? 03:33 其实大家都在纠结一个事情,就是Harness到底是应该跟模型绑在一起,还是说它应该变成一个独立的赛道。像Anthropic,它是把身家都压在了Harness和模型的紧密捆绑上。OpenClaw这种开源的模式,就是让Harness可以脱离模型单独存在,也得到了很多社区用户的支持。 03:57 现在这个市场上有没有什么比较冲突的一些案例? 04:00 有啊,比如说Cursor 它本来是支持很多不同模型,但是它被SpaceX 收购了之后,它就开始往Grok生态上面靠。这就是一个捆绑的例子。所以这行业最终会往哪走,大家都在摸索。 二、Karpathy 加入 Anthropic:这次跳槽的信号比跳槽本身更值得看 04:18 接下来要讲的是Andrej Karpathy,他加入了Anthropic,他到底是一个什么样的人?他之前有过哪些比较厉害的经历? 04:29 他的履历简直是开挂。他不仅是OpenAI的创始团队的一员,他还主导过特斯拉Autopilot和全自动驾驶的AI系统。他也是在斯坦福拿了CS的博士,他在学术和工程上面都非常的厉害。 04:45 听起来已经很厉害了。他在普及AI知识上面有做过什么事情吗? 04:50 他还是"vibe coding"这个词的创造者,Collins 词典把它评为了2025年的年度词汇。他还在YouTube 上面看开设了神经网络的系列课程,影响了非常多的AI工程师。他是属于那种极少数的既可以做最前沿的研究,又可以把这些复杂的东西讲得让大家都能听懂的科学家。 05:13 他为什么会加入Anthropic,而不是回到OpenAI或者去做其他的事情? 05:18 他其实离开OpenAI之后,自己创业做了AI教育公司叫(Eureka Labs)。但是他最终还是去了Anthropic这就很能说明他对于行业方向的判断。 05:30 看来他的选择并不是简单的职业变动。 05:33 没错。他自己在X平台上面说过,他觉得未来的几年会是大语言模型发展的最关键的阶段。他更像是在选赛道,而不是在选雇主。Anthropic最近的发展也确实非常的亮眼,年收入已经到了300亿美元,Claude Code的用户也是激增,它的估值也在不断的逼近OpenAI。对于一个想要在这个行业最关键的时刻做一些大事的科学家,Anthropic确实比两年前有了非常大的吸引力。 06:08 他在Anthropic具体要负责什么事情? 06:10 他主要是要组建一个新的团队,任务是要用Claude 加速 Claude 自身的预训练的研究,就是这个AI辅助AI科研。 06:20 用AI来帮助做AI的预训练。这个听起来就非常的黑科技。 06:24 因为预训练这个东西它是整个大模型开发里面最花钱的,对人类专家的经验依赖也是最高的一个环节。如果说能够让AI自己去设计实验分析结果,然后提出新的假设,那很有可能会让整个的研究效率产生一个指数级的提升。他是属于那种非常少的理论和工程都很强的人,所以是非常适合带领这个团队的。 06:52 怎么看最近这一波顶级技术人才扎堆的流向Anthropic. 06:57 就今年已经有Workday、Instagram、Box 等等六家估值超过10亿美元的公司的CTO都离开原来岗位,去Anthropic重新做研究员。Karpathy的加入其实就是这个趋势的一个高潮。 07:11 这个规模确实有点夸张。 07:13 要注意的是,顶级人才的聚集并不代表马上就会有产品落地。因为预训练的研究它是一个按年计算的周期,所以短期内其实很难看到直接的突破。但是Anthropic大举的招兵买马,是在向外界释放一个非常明确的信号。就是他们认为AI驱动AI研究这个方向就是下一个必争之地,而且他们愿意全力的去下注。 三、OpenAI 在新加坡开实验室:两亿多美元,买的不只是一个办公室 07:42 我们再来讲一下OpenAI为什么要在新加坡设立应用AI实验室?为什么会看重新加坡这个地方? 07:50 OpenAI最近跟新加坡政府签了一个合作备忘录,他们会投超过3亿新加坡元,也就是大概2.34亿美元,在新加坡设立他们第一个美国本土以外的实验室,他们也计划在未来几年创造二百多个技术岗位,这些岗位都会专注在公共服务、金融、医疗、数字基础设施这些领域。 08:13 听起来他们要做的事情还挺全面的。 08:16 新加坡它本身的地缘位置是非常特殊的,在中美科技对立的这个大环境下,它是属于一个既跟美国关系非常好,同时又跟中国保持着非常紧密的经贸往来的一个国家。它是一个真正的中立节点。再加上它的法律体系非常的健全,英语又是官方语言,产权保护也非常的严格,它是一个非常理想的科技公司设立研究机构的一个地方,而且它还可以作为一个辐射整个东南亚市场的一个基地。 08:49 现在是不是已经有很多其他的AI巨头也都盯上了新加坡? 08:54 是啊,你看像Google DeepMind去年年底就在新加坡开了实验室。Nvidia更早之前就在新加坡有了深度的布局。大家其实都在积极的跟当地的政府去建立合作关系。你越早的进入,就意味着你可以在未来的政策制定以及AI采购的过程当中占据一个主导地位。 09:17 那你觉得OpenAI把它在新加坡的这个机构定义为应用AI实验室,这里面有什么深意吗? 09:24 OpenAI其实打的算盘是不仅仅做研究,是要直接跟新加坡的政府和企业去合作,把AI真正的用在他们的数字基础设施里,形成一些长期的紧密的合作关系。这是一种很深层次的落地,而不是说我单纯的只是输出一个产品。 09:44 最近这个竞争压力越来越大,OpenAI为什么会把和政府的深度合作当成一个新的突破口? 09:51 他们现在面临的竞争非常的激烈。Anthropic的营收追得非常紧。Google在企业级市场也是步步紧逼,再加上DeepSeek也让模型的能力不再是一个独家的武器。所以现在只有通过跟政府的深度合作,去打造一个别人没有办法轻易复制的落地的能力,才能够真正的拉开差距。因为这个是目前他们的对手相对来说比较薄弱的环节。 10:21 所以说OpenAI这次在新加坡投的这个钱到底值不值得?未来能不能够真的产生一些独特的价值? 10:29 2.34亿美元对他们来说虽然不是一个小数目。但是也绝对不是一个伤筋动骨的投资,然后再加上新加坡政府这边也非常的支持,资源也很到位,所以这个合作其实推进下去是很顺利的。 10:44 关键还是要看他们能不能做出真正适合本地的产品了。 10:47 没错,这个实验室到底能不能够理解新加坡以及整个东南亚的真实需求,然后做出有深度的本地化的应用,这个才是最难的。而不是说我把美国的那一套直接搬过来。那这个布局到底有没有用,可能要等到三五年之后才能够真正的见分晓。但是如果现在不做的话,后面就根本没有机会了。 四、SpaceX 计划收购 Cursor:不是买一个"壳",是买一条赛道的入场券 11:11 是的,我们下面的一个主题就是SpaceX要收购Cursor这个事情。我们首先要说的就是科尔斯到底是一个什么样的公司?它为什么会在AI代码编辑这个领域能够获得这么多企业的青睐? 11:25 而Cursor其实是2022年的时候,由4个MIT的学生做出来的一个AI代码编辑器。然后它最大的特点就是非常懂大型的代码库。它可以帮程序员理解上下文,快速的定位问题,自动生成代码,甚至帮你修复一些调试的错误。所以现在已经有60%新的世界500强企业都在使用它。对就它的这个企业级的渗透率。 11:50 是非常高的那大家经常会说Cursor只是一个壳,那它真正的核心能力到底在哪些工程难题上面? 11:57 外界老是以为说Cursor它是一个包装,但其实它最难的地方是在于它解决了很多模型本身没有办法解决的工程问题。比如说怎么去管理上下文。 12:09 这个我还真好奇,就是面对那种特别大的代码库,它是怎么做到让模型能够高效的去处理这么多信息的? 12:16 就是科是他有一套自己的索引和检索的机制。它可以在一个几十万行代码的项目里面,精准的去找出模型当前最需要的那一段代码,然后把它塞到这个上下文窗口里面。所以它其实是一个非常厉害的工程成果,它并不是说换一个模型就可以轻易的去复制的。 12:37 除了这个之外,它还有哪些地方是让人觉得很难被替代的? 12:41 Cursor他还有一个非常厉害的地方,就是他跟程序员的日常的工作流是深度整合的。你写代码、跑测试、看报错、查文档、提交git它全部都可以在一个界面里面无缝的完成,所以很多人一旦用习惯了之后,就再也回不去了。对然后再加上他有67%的世界500强企业在用,所以它其实也积累了非常多的企业级的代码数据,这也是一个非常宝贵的训练资源。 13:10 所以说SpaceX它到底凭什么能够拿下Cursor,它背后到底有哪些资源? 13:17 因为今年2月份的时候,SpaceX已经通过全股票的方式完成了对xAI的合并。然后它的估值一下子就冲到了1.25万亿美元。同时它也继承了Grok 模型Colossus 超算集群,还有X平台的大量数据。 13:34 怪不得他们能够跟Cursor 玩得这么深更。 13:37 有意思的是其实Cursor 最新的这个版本就是用xAI的Colossus 超算训练的。所以他们两个其实在收购之前就已经深度合作了。这次的收购其实更像是把已经在跑的协作关系彻底的变成自己的。 13:52 如果说把他们这些资源都串起来,会形成一个什么样的行业优势呢? 13:57 一旦收购完成,那xAI就会拥有从模型算力到工具再到用户的完整的闭环。它的模型是Grok,算力是Colossus,开发工具是Cursor,然后用户是67%的世界500强企业。这其实和微软的那一套Azure加OpenAI加GitHub Copilot加VS Code的用户是如出一辙的那就是全链路的打通。 14:23 现在这个AI代码编辑工具的市场到底是一个什么样的竞争格局? 14:27 目前来看的话,GitHub Copilot还是占据着最大的份额。它大概有37%的市场,然后它有470万付费用户。不过最近Claude Code也冲得非常猛,它是这个市场上的一匹黑马。然后企业端的话,Cursor其实渗透率是最高的,尤其是在大型企业里面。 14:47 这么看的话,马斯克这一次花大价钱收购Cursor是有他的道理的。 14:52 对他其实就是不想把这个开发者工具的赛道拱手让人。所以他宁可花一个大价钱,也要先把这个户口抢下来。 15:01 然后就是外界对于这笔收购的价格以及它背后的风险到底是怎么看的? 15:07 有不少人都在质疑说Cursor它现在的这个收入根本撑不起600亿美元的估值。但是对于SpaceX来讲的话,它更看重的是时间窗口和整合成本,就他自己去重建这样一套生态的话,可能花的钱更多,更重要的是它会错失市场机会。 15:24 确实这个交易里面会有哪些不确定因素。 15:28 最大的风险就在于监管的审批能不能够顺利通过。然后SpaceX的IPO能不能够顺利的进行,以及两家公司的企业文化和产品能不能够很好的融合,这些都是非常大的挑战。但是如果说这些东西都能够迈过去的话,那这一次的收购就会让SpaceX和xAI真正的在这个AI工具的市场上面站稳脚跟,就像我们刚才说的,马斯克买的不是一个,可他买的是一条已经打通的通道。 15:59 我们今天聊了这么多,从DeepSeek到Anthropic到OpenAI,再到SpaceX和xAI其实我们能看到这个AI行业的竞争重心已经从单一的模型比拼转移到了生态渠道、政府合作、开发者工具这些全方位的能力建设上。所以说这个行业的壁垒正在变得越来越高,越来越难以逾越。 16:23 好了,这期内容咱们就到这里了,感谢大家的收听,然后咱们下期再见吧,拜拜。
AI界名字最霸气的两位华人研究员:姚顺雨和姚顺宇先认识一下这个人 00:01 今天咱们要聊的是人工智能这个行业。为什么真正推动这个行业进步的其实并不是那些神话般的天才,而是靠靠谱的人,靠团队的合作以及强大的执行力。没错。然后我们也会聊到在这个行业里面机会的稀缺和基础设施是怎么决定了大家的高薪。 00:26 没错,这些因素确实很关键。那我们就直接进入今天的讨论。 00:30 好的,咱们第一个话题就是这个主角的背景和大家经常会搞混的一件事情。就是硅谷有两个名字非常像的清华的毕业生,这两个人到底有哪些经历上的不同? 00:43 这两个人经常被大家弄混,其中一个去了腾讯,另一个就是我们今天的主角。他是先在Anthropic参与了Claude3.7的开发,然后又跳槽到了GoogleDeepMind做了Gemini3。 00:56 他的这个学术背景跟他后来的这些选择有没有什么联系? 01:00 他本科是在清华,然后博士去了斯坦福,学的是量子物理和高能物理。但是他自己有讲过一句话,就是说AI这个事儿本来也不太需要脑子,真的不太需要脑子。我觉得都是一些本科生就能干的活。 01:13 听起来很自信,那他这个自信是从哪儿来的呢?他对人工智能这个行业到底是怎么看的? 观点一:AI 不需要脑子,但需要你靠谱 01:18 他的核心观点就是很多人把人工智能想得太神秘了,觉得这一定是天才才能干的事儿。但是他认为这个行业其实最看重的是靠谱,做事细致和责任心。 01:31 就是说他觉得聪明并不是最重要的对。 01:34 因为他自己有做过物理,然后他就觉得高能理论物理才是真的难。就是它的实验验证非常的滞后,理论对不对?很多时候只能靠几个权威去拍板。但是AI不是,AI是你有一个想法,你就可以去跑个实验,有数据做标准,你可以不断的去调,直到你把它做出来。所以他觉得这个领域聪明人其实不少,但是真正稀缺的是那些可以把实验坚持到底,把每一个bug都修好,绝不轻易放弃的人。 观点二:个人英雄主义已死,但"英雄"们可能不知道 02:03 说到这儿我有个问题,现在大家还会把人工智能的进步归功于某几个英雄式的人物吗? 02:10 其实现在这种个人英雄主义已经过时了。虽然现在很多媒体还喜欢去渲染某一个大佬跳槽了,然后某一家公司的估值就飞涨了。或者说某一个人发了一条推特就引起了整个行业的热议。但是他其实是不太认同这种现象的。 02:27 他的理由是什么?他的理由是说在Transformer出现之前,确实是有那么几个人,他们提出了关键的想法,可以算是英雄。但是自从那儿之后,更多的是靠一个团队去持续的推进,才能够把这个东西做大。所以他觉得很多成果其实就是赶上了好的时机,赶上了好的项目,再加上大家靠谱的去执行。他甚至说自己参与Claude3.7,他也不觉得自己有多重要,他觉得他只是幸运。 02:57 但是他在评价同行的时候,还是会用自己的标准去说谁谁谁怎么样,这是不是也是一种英雄心态的残留? 03:04 他虽然说他自己很谦虚,但是他其实也会去直接的说谁谁谁傻,谁谁谁说话没有意义,甚至有“not even wrong……”的这种说法去评价别人。所以他其实是在解构别人的英雄光环的同时,他自己还是有一点点保留了这种评判的特权。这种矛盾还是挺有意思的。 番外加料:他顺手给"老登"下了一个定义 03:26 的确。咱们接下来这个话题,就会涉及到他对于高能物理领域的一些老资格的人的看法,他是怎么去区分这些人的? 03:35 他其实是有一个特别有意思的定义。他说人年纪大了会变成两种状态,一种是德高望重,就是他少指手画脚,还会花自己的力气去培养年轻人。另一种人就是“老登”,自己也不懂,还爱指手画脚。 03:49 所以在他的这个定义里面,“老登”其实跟年龄和资历都没有什么关系,核心就是这个人爱不爱指挥别人。 03:56 完全正确。而且他还说“老登”最高级的操作就是他说的话永远都是那种"not even wrong",就是永远模糊,永远正确,但是永远没用。你都没有办法去反驳他,因为他根本就没有说过任何有实质内容的东西。 04:12 那他为什么会觉得人工智能这个行业就摆脱了这种主观的评价? 04:17 他的观点就是说AI行业有非常明确的评价标准,模型跑出来的数字就是硬通货,谁也没有办法去左右。所以在这种情况下,那些所谓的老登就没有办法再去用他们的个人喜好去绑架整个领域的发展。这也是他为什么喜欢AI行业,除了钱之外的最大原因。 观点三:Anthropic 是怎么 all in 押注 coding 的? 04:35 明白了。那我们现在来谈谈关于Anthropic这家公司,他们是怎么会突然之间决定说要全力投入到代码相关的AI研发当中的。 04:45 其实这个背后有一个很有趣的故事转折,就是他们一开始也没有什么深谋远虑。就是因为当时Claude3发布了之后,有人在推特上面比较说,Claude3好像写代码比GPT4还要厉害。 05:00 就因为网上的一场讨论就改变了公司的战略方向? 05:03 因为那个时候GPT4是公认的很强的,所以能有一个模型在某一个关键的能力上面超过它,立刻就成了一个大新闻。然后Anthropic的管理层就非常迅速的抓住了这个信号,他们就马上决定说我们要把我们的重心转移到coding上面。所以他们的这个决策其实是非常快速的。 05:24 那他们这个决策背后有没有什么关键的技术突破呢? 05:28 这就说来话长了。其实Claude在coding上面能够超越GPT4并不是说靠运气,而是因为有一个团队做了一个非常重要的技术决策。但是这个决策现在因为NDA的原因没有办法对外透露。 05:42 原来是这样。那就是说外界其实是不知道这个真正的突破口是什么的。 05:46 对外界是不知道的。而且他半开玩笑的说,这个东西很有可能就是一开始的时候只是一个尝试,没有想到就无心插柳柳成荫了。然后他们公司看到了这个推特上面的讨论之后,马上就决定说要全力投入。所以整个这个过程非常的体现了他们公司的这个执行力。就是从一个小小的偶然的优势到最后变成一个公司级的战略,中间几乎没有什么犹豫。 06:15 但是我想问一下?为什么很多公司就是即使知道了别的公司公开出来的一些技术秘诀,他们也没有办法直接复制出同样的AI成果呢? 06:23 这个就说来话长了,其实他有专门讲过这个问题。他说大家老觉得说好像有一个什么配方,就像做菜的配方一样,我只要知道了我就能做出同样的菜来。但是在AI这个领域其实完全不是这么回事儿。 06:37 所以就是说这个所谓的技术秘诀其实并没有大家想象的那么万能。 06:42 他就说这些技术的tips大家都很想听,然后公司又不让你说。但是其实说出来也没啥用。因为真正的AI训练它是一个系统工程,每一个技术细节都和公司的底层基础设施是深度绑定的。 06:57 就是说A公司的一个技巧到了B公司就根本跑不起来。 07:01 是的,他还举了个例子说,强化学习里面不同公司用来生成训练数据的机器和用来更新模型权重的机器是差别很大的。有的公司这两者差异极大,算法设计的核心就是怎么控制这个差异,让训练稳定。然后有的公司是它的基础设施做得好,差异小,他就可以把更多的精力放在训练效果上。所以他说知道别人怎么做的不等于你能做出一样的结果,这才是tips没用的真正原因。 07:30 我就有点纳闷了,为什么有些公司能够在AI领域迅速的推进新的想法,而其他公司就做不到? 07:37 他其实也讲了这个问题,他说关键就在于技术和管理的决策权是不是在同一批人手里。他举了Anthropic这个例子,就是他们的技术负责人,同时也是公司的创始人,所以他在技术圈里面是非常有威望的。然后他也有权利去推动公司的决策,所以他们就可以非常快速的去决定要做什么,要投入什么。 07:57 也就是说只要技术大拿和公司的管理层不是同一拨人,这个公司就很难做到这种高效的决策,是吗? 08:05 也不能这么说,他也举了OpenAI的例子,他说OpenAI就干不了,Ilya在的时候或许可以,但是后来发生了什么大家都知道了。他说top down最大的难点就在于做技术决策的人必须也得是公司的决策人。 番外:他为什么离开 Anthropic? 08:20 好的,那咱们接下来这个话题就非常有意思了。就是他为什么会选择离开Anthropic. 08:26 这背后的原因还挺直接的。他在那儿待了快一年,然后也参与了Claude3.7的这个开发,也经历了公司从七八百人扩张到将近2000人。但是他还是选择要走,他给出了三条非常坦率的理由。 08:41 那第一个理由是什么? 08:42 第一个理由就是他不认同他们CEO在一些公开立场上面的做法。他觉得Dario把反华的这个事情推到了一个非常极端的程度,他觉得这是一个非常情绪化的体现。而且他作为一个员工,他也很明确的表达了他的不同意见。 08:59 那公司规模变大之后,文化氛围有什么让他觉得难以接受的变化吗? 09:04 有啊,他说就是人多了之后,就有很多人开始在Slack上面天天讲一些正确的废话,然后大家谁都不落地。他就引用了一句 “Idea is cheap 难的是怎么把它变成一个小的可实现的步骤做出来。” 09:21 他说的很对,那还有其他原因吗? 09:23 还有一个很关键的原因,就是他觉得在Anthropic可能学到的东西越来越有限了。因为他们公司就只做coding agent和强化学习,像多模态生成和系统底层他们都不碰。所以他为了要继续成长,就选择去了Google DeepMind。然后他也给了一个建议,就是说很多人换工作之后会后悔,是因为他们根本就没有想清楚自己想要什么。 09:47 说到这儿,我有个问题。他当时离开的时候是怎么看Anthropic的未来的? 09:53 他当时走的时候其实是挺悲观的,他觉得靠卖token是一个很难有优势的事情,然后觉得未来肯定会陷入价格战。但是后来他也承认自己错了,就是Anthropic他们后来做了Claude Code,然后也做了Cowork,在产品上面做了很多很巧妙的创新,慢慢的也打开了局面。 10:12 看来他对自己的这个判断,失误还挺坦诚的。 10:14 对,而且他说后来首先是OpenAI被google揍了一拳,然后Anthropic自己又上道了。他虽然说他悲观错了,但是他说他也完全不后悔离开。 观点四:OpenAI 救了 Google 一命 10:26 行,我们接下来就聚焦在一个非常犀利的观点上面,就是OpenAI到底在google的这场AI的博弈当中扮演了一个什么样的角色。 10:36 关于这个,他其实讲的还挺直接的。他说大家都曾经担心过AI的聊天机器人会彻底取代google的搜索,让google陷入困境。 10:46 但是事实好像并没有那么极端。对吧? 10:48 对吧?是的,他的分析是OpenAI先推出了chatbot,这一下子就把google打醒了,然后google就不得不全力以赴去做这面。但是呢,OpenAI其实也没有把搜索市场给吃掉,只是分走了一小块,反而让google有机会反击。所以他说从某种意义上来说,OpenAI是救了google一命行了。 11:10 那他怎么看google在这场竞争当中的机会? 11:13 他特别提到就是说google最擅长的就是做出一个极简的产品。但是背后的技术是可以把对手卷死的那种,就像当年的搜索一样。所以只要这个聊天机器人没有把搜索彻底颠覆掉,那google就有机会再一次用技术把主动权夺回来。 番外:那些被"哔"掉的瞬间 11:30 行,我还有个问题,就是他在采访当中是怎么去评价那些经常说一些非常宏大但是又非常模糊的观点的AI行业的大佬的。 11:40 他其实有好几个地方都直接给消音了。就比如说他说某一个neo lab的创始人,他都不知道他们到底要干嘛。然后他还说叉叉叉一直挺蠢的,蠢的始终如一。 11:53 看来他是毫不留情。那他有没有用什么特别的说法去形容这种怎么说都不会错,但又没什么实际内容的话? 12:01 有啊,他就用了一个物理里面的术语,叫做"not even wrong"。就是说这些人讲的话错误程度还不够,因为他根本就没有具体到能够被证伪的程度。就是他说什么都对,然后他怎么都可以解释,那跟没说有什么区别呢? 最后:如果 AI 这么简单,为什么工资这么高? 12:18 最后咱们来探讨一下,就是现在这个AI行业为什么工资会这么高? 12:23 他的看法还挺有意思的。他说这个高薪其实并不完全是因为能力有多稀缺,更多的是因为你只有有机会去做这个事情,你才能够学会这个事情。他原话就是说你得有那个机会去接触这件事儿,你才能学会这件事儿。你没有那个机会再聪明也没用。 12:42 所以他的意思是说,能进到这个圈子里面比你的智商更重要。 12:47 没错,他就说这其实是一个技术门槛、机会门槛和市场的热度三者共同作用的结果。然后他还特别说说纯做语言模型研究的。末班车在Claude 3.7那代就已经发车了,就现在已经不是蓝海了。但是他自己就是那班车上面的人。 13:05 好吧,今天我们聊了很多,从这个行业的底层逻辑,到团队合作的重要性,再到个人的成长和选择。其实人工智能这个领域比大家想象的要更接地气一些。 13:18 好了,这就是本期播客的全部内容了,我们下期再见,拜拜。
AI圈最近两件大事,听完你就是懂行的人了第一件事:OpenAI 和微软"开放婚姻"了 00:07 今天我们要聊的是OpenAI和微软他们两个之间的合作关系发生了变化。同时还有马斯克对OpenAI发起的诉讼,这背后到底是怎么一回事儿,以及这些事情会怎么影响人工智能行业未来的走向。 00:21 没错,这两个事件都挺有看头的那我们就开始。 00:25 我们先来看看第一个大问题,就是OpenAI和微软的关系变化。其实很多人都很好奇说这两家公司到底是怎么一步步的建立起这种深度合作的。然后他们这种合作对于外界来说到底。 00:39 意味着什么?其实我们现在每天都在用的ChatGPT,它虽然是OpenAI开发的,但是背后是微软给他投了超过130亿美元的这么多的资金的支持。然后换取的就是OpenAI的产品和技术,只能跑在微软的Azure云服务上面。对,相当于就是说微软是OpenAI唯一的外卖平台,就是你只能通过我这个平台把奶茶送到用户的手里。 01:07 这种独家的合作听起来确实是很牢固,但是为什么后来OpenAI又和亚马逊的AWS搞到一起去了? 01:16 这事儿发生在2025年年底,OpenAI背着微软跟AWS签了一个五年的高达500亿美元的合同,把自己的这个旗舰平台Frontier的独家使用权给了亚马逊。所以微软当时就很生气,甚至一度传出要起诉OpenAI的这样的一个消息。 01:35 微软和OpenAI重新达成的这个协议跟之前相比有哪些关键的变化? 01:40 就是2026年的4月27号,他们就正式的官宣了OpenAI以后不用再只依赖微软的云服务了,他可以自己去选择用亚马逊的谷歌云,或者是其他的任何的云平台都可以。但是微软还是有一个优先的待遇,就是所有的OpenAI的新产品都要要首先在Azure上面发布,而且这个首发的特权是一直持续到2032年。 02:06 那在分成上面,这一次有什么新的规定吗? 02:08 微软依然可以拿到20%的收入分成,但是是有一个上限的,而且时间是到2030年。对,还有就是之前的那个合同里面有一个所谓的AGI条款。就是说如果有一天OpenAI研发出了可以超越人类的这种通用人工智能,那么合同的很多条款就要重新谈。现在这个条款也被彻底的删除了,就换成了一个明确的时间节点,就是到2030年或者2032年,就按照这个时间节点来执行,不再跟AGI的实现挂钩了。 02:42 说到这个AGI条款,这也是一个很有意思的话题,就是为什么这个条款在他们的合同里面会变得这么举足轻重。 02:50 其实这个条款就是相当于一个定时炸弹一样,就是一旦OpenAI自己宣布说我已经实现了AGI,那微软的很多特殊的权利就会自动的需要重新商量或者直接作废。然后这个东西其实是OpenAI他们为了体现自己是一个为全人类,而不是为某一个公司开发AI的这样的一个初衷。 03:10 听起来很合理,但是这个条款的问题出在哪里呢? 03:13 这个问题就在于到底什么叫AGI,它没有一个客观的标准,然后谁来判断也没有说,最后就是欧佩I自己说了算。这就意味着微软几百亿美元的权益其实是完全取决于OpenAI的一句话。所以他们这次就直接把这个AGI条款删掉了,改成了一个固定的年限,大家都不用再去纠结这个哲学难题了。 03:37 然后我们来看看这个OpenAI和微软他们重新签了这个协议之后,对他们各自都带来了哪些具体的变化呢? 03:44 在OpenAI那边,他们的销售负责人Denise Dresser就公开的说过,以前被微软绑住的时候,很多大企业因为他们不用Azure,所以我们根本就没法做生意。现在就是解绑了之后,OpenAI可以去跟更多的大公司合作,然后也可以去吸引更多的资金的投入。 04:02 那微软?微软失去了独家的合作之后,他们是怎么来保证自己的利益的呢? 04:08 微软虽然没有了独家的这个权利,但是他们锁定了六年的收入分成,然后也去掉了AGI随时爆炸的这个隐患。然后另外一边就是亚马逊那边的反应也很有意思。他们的老板安迪·贾西得知了这个消息之后,就只回了一句"very interesting(非常有趣)"。对,就很像是我赢了的这种感觉。 第二件事:马斯克亲自上法庭,要告 OpenAI 索赔 1300 亿美元 04:29 下面咱们来分析一下马斯克起诉OpenAI的这个案子,这两家曾经的关系那么密切,那当初他们是怎么走到一起的? 04:41 是这样的,2015年的时候,马斯克和Sam Altman,他们一起联合创办了OpenAI。然后那个时候就是打着非盈利的旗号,就是说我们要为全人类去推动AI的发展,而不是为了赚钱。 04:51 然后马斯克当时不光捐了很多钱。 04:54 而且他在早期的时候是最核心的金主。 04:57 所以马斯克当初为什么要离开OpenAI呢? 05:01 因为在2018年的时候,他跟董事会有一些理念上的冲突,所以他就离开了。然后他走了之后,他就看着OpenAI一步一步的成为了一个估值非常高的这种商业公司。而且他们也宣布说要去为投资人赚取利润。所以这就跟他一开始创办这个公司的初衷就背道而驰了。 05:20 原来是这样,那马斯克为什么会在这个时候突然对OpenAI发起诉讼?他的核心的诉求都有哪些? 05:27 马斯克的这个诉讼的理由其实很直接,就是他认为他一开始捐钱的时候,这个OpenAI是一个非盈利的公益机构。但是现在这个OpenAI却变成了一个估值上万亿的商业巨头。他就觉得这其实就是相当于把他的这个慈善的捐款变成了一个私人的财富。他甚至在法庭上面就直接质问说,如果法院判决说侵吞慈善资产是可以的那美国所有慈善捐款的基础都将被永久的动摇。 05:56 那他在这场官司当中具体的提出了哪些要求? 06:00 马斯克他现在是要求OpenAI赔偿1300亿美元,然后把Sam Altman和Greg Brockman赶出董事会,而且还要让OpenAI强制的变回一个非盈利组织。 06:11 行,那OpenAI这边他们是怎么回应马斯克的这些指控的? 06:16 OpenAI的律师直接就说马斯克这是吃不到葡萄说葡萄酸,就是说他离开之后自己搞了一个xAI,又竞争不过人家,所以就只能来告人家。 06:24 那这个律师有没有拿出什么具体的证据来支持这个说法? 06:30 就指出说其实马斯克在OPPO AI最开始转型的时候,他是完全没有任何的反对的。直到OpenAI变成了全球最有影响力的AI公司,然后也成为了他自己的公司的一个最大的对手之后,他才跳出来说要维护这个慈善的原则。而且微软的律师还补充说,马斯克是在2024年才起诉的。但是OpenAI其实早在19年就已经开始商业化了,所以他拖了这么久才来打官司,其实就正好说明了他只是在意输赢,而不是在意这个公益的初衷。 07:01 原来是这样。那在这个庭审的过程当中,有没有什么特别令人难忘的法庭现场的一些片段呢? 07:08 最经典的就是马斯克在面对对方律师的一连串关于法律和合同的一些细节别的问题的时候,他只能不停的说:"I am not a lawyer(我不是律师)"。大家可以想象一下这个世界上最有钱的人之一,然后又是一个火箭专家,又是一个AI的大佬,在证人席上面反复地承认说我不懂法,这个场面真的是非常的有戏剧性。 07:31 那这场官司为什么会被认为是在整个AI行业里面有这么举足轻重的地位呢? 07:36 这个案子其实远远不是说两个人之间的这种个人的恩怨,他是要决定一个打着非盈利造福全人类旗号的AI公司到底能不能够中途转变成一个商业巨头。如果这个路是可以走通的话,那以后可能全球的AI公司他们的融资方式,他们的组织形式都会彻底的改变。但如果要是说这条路被法院否定了的话,那OpenAI可能就要被迫进行重组。 08:04 那这个案件的审理过程当中,有没有什么让大家特别期待的环节? 08:09 这个庭审它是会持续四周的时间,然后会有很多AI圈里面的重量级的人物都会来出庭作证。而且最有意思的是,很多他们这些创始人之间的从来没有公开过的私信、邮件,都会被作为证据当庭出示。所以这就是为什么这个案件被称为2026年最值得关注的科技大剧。 两件事放在一起,画面格外有意思 08:33 好,然后我们来看看OpenAI现在到底是处于一个什么样的局面,就是这一系列的外部的变化和内部的动荡是怎么交织在一起的。 08:43 现在的OpenAI就像是一个刚摆脱了包办婚姻的年轻人,他终于可以在云计算市场上自由的挑选自己的合作伙伴。但是他还没有来得及喘口气,就被前任大股东和愤怒的元老股东同时找上门来。就是一边要忙着应付微软的这个新的协议,一边还要应对马斯克的这个诉讼,整个公司可以说是焦头烂额。 09:09 这些事情的后续的走向,为什么会让大家这么关注呢? 09:14 因为未来这四周的这个审判和谈判,可能会直接决定未来十年整个AI行业的格局。所以这绝对不是一个普通的科技八卦,而是一个真正的影响行业走向的大事。 09:26 没错,今天我们给大家梳理了OpenAI和微软之间的风云突变,然后也聊了马斯克和OpenAI之间的这个恩怨情仇。这背后其实不仅仅是商业利益的博弈,其实更多的是关于人工智能这个行业的未来到底要怎么去走。 09:42 好了,这期节目咱们就到这里了,感谢大家的收听,咱们下期再见,拜拜。
什么!?浓眉大眼的豆包也要收费了?豆包要收费的消息上了热搜 00:07 今天咱们要聊的是关于最近豆包宣布推出付费会员这件事情。其实这背后反映出了整个AI行业正在从一个免费的模式慢慢的走向一个更加商业化,更加可持续的这样的一个阶段。 00:20 这个话题最近挺火的那我们就直接进入今天的讨论。 00:23 我们先来聊一聊豆包的这个付费方案到底是怎么回事,现在好多人一看到这个AI要收费了就挺敏感的那豆包这次到底是准备怎么收呢? 00:33 目前豆包它在APP Store上面是公布了有三档会员的方案。分别是标准版连续包月是68一个月,包年的话是688一年。然后加强版是200一个月,包年是2048。还有一个专业版是500一个月,包年是5088。 00:51 除了这些付费的版本,那免费的用户还能不能继续使用? 00:55 这个你放心,豆包还是会有基础版的免费服务的。付费的会员主要是为了那些需要处理更复杂的任务,或者说有生产力需求的人准备的。比如说要自动生成PPT,要做数据分析,要做视频制作等等。这个方案现在还在测试阶段,所以具体的上线的细节他们还会再正式的公布。 一、为什么大家对豆包收费这么敏感? 01:16 那为什么大家对于豆包开始收费这件事情反应会这么强烈? 01:21 这和过去20年互联网给我们带来的使用习惯是非常相关的。我们现在用的搜索、社交、短视频、地图,还有邮箱,几乎每一个主流的服务都是免费的,大家就慢慢的觉得,好像所有的APP都应该是免费的。这种想法已经根深蒂固了。 01:40 确实大家已经习惯了不花钱在网上获取各种服务,突然有一个大家常用的AI要收费了,确实会让人觉得有点不适应。 01:49 但是(传统互联网)这种免费其实都是靠广告、流量、数据还有平台的规模效应来支撑的。就是用户越多,平台的平均成本反而越低。但是AI的模式是完全不一样的。 02:01 AI和传统的互联网服务在成本结构上面最大的区别是什么? 02:06 传统的互联网服务就像打开一个水龙头,水厂已经建好之后,你多用一点水,增加的成本是非常有限的,但AI每一次的使用,比如说你让它写一个朋友圈的文案,它都要实时的进行大量的算力的运算。如果你让它再复杂一点,比如做一个PPT或者分析一个excel,甚至生成一个视频,那它就要持续的消耗算力资源。 02:32 我们每一次和AI的互动,背后都是在实实在在的消耗算力资源。就跟点外卖一样,每下一个单厨房就要重新炒一个菜。 02:43 这个比喻很形象。AI服务背后的这些GPU服务器,就像后厨里面的厨师一样,它一直在为你这个请求进行运算,你用的越多,消耗的算力和产生的电费就越多。这就是为什么AI的这种成本结构是完全不同于传统互联网的。 二、AI为什么不能一直免费? 03:01 为什么AI不能一直免费。就是大家经常会认为说AI回答问题就像在查资料一样,但其实它的这个过程和我们想象的不太一样。 03:12 很多人以为AI就像在数据库里面查找答案,就像百度一下把现成的结果拿出来,其实不是。大模型的运作更像是一个巨大的数学机器,你每问它一个问题,它都要把你前面的对话再读一遍,然后再一个字一个字的生成回答。 03:32 AI在回答问题的时候,每一句话都是当场算出来的,而不是说简单的把之前存好的答案拿出来。 03:40 就是这样,它的这个答案是一个字一个字往外蹦的,它是一个token生成的。这个token你可以理解成是一个文字的颗粒。所以你看到的流畅的答案,其实背后是靠GPU在非常高速的进行这种矩阵运算,才一个字一个字儿给你吐出来的。 03:58 AI公司的这个成本主要就是花在这个用户每次使用的时候的运算上,而不是说我服务器开着就有成本。 04:07 是的,就是每多一个问题就要多消耗一份算力。这就是为什么它和传统的那种CPU的模式是完全不一样的。这是一个GPU的时代,而且是一个非常昂贵的GPU的时代。这些高端的AIGPU它的价格就跟北京的学区房一样,就是你看一眼都觉得贵。你要真的想大规模的部署,那你得层层审批,开会讨论。 三、为什么简单聊天可以免费,复杂任务就可能要收费? 04:30 我很好奇为什么简单的聊天AI可以免费,但是一涉及到复杂的任务,就要开始收费了。这背后的这个推理成本到底是一个什么东西? 04:40 这里有一个很关键的概念就是推理成本。推理其实就是你每次使用AI的时候,它要实时的为你进行运算和服务。就有点像模型是十年寒窗苦读好不容易考上了大学。然后你每次问他一个问题,他都要相当于毕业之后每天去上班,然后老板还天天让他改PPT,这个推理的过程是一个不断的在消耗资源的一个过程,所以它是一个持续的成本。 05:08 是不是说简单的聊天和复杂的任务,在消耗算力上面是有天壤之别的? 05:14 没错。简单的问答就相当于让AI给你泡杯茶。如果是让它生成一个PPT,就相当于让他去筹划一场年会。如果是让它去处理视频,那就是相当于让它去筹备春晚。这就是为什么豆包会把这个简单的聊天做成免费的,然后复杂的功能做成付费的。其实就是基础服务用来吸引用户,然后重度的任务就合理的收取一些成本,这也是AI产品从前期的烧钱补贴到现在开始合理的收费的一个必然的阶段。 四、为什么AI公司不能靠广告解决? 05:48 为什么AI公司不能靠广告来覆盖成本。大家很自然的会想说,互联网不是一直都是靠广告赚钱的吗?那为什么AI不能像短视频平台一样插广告呢? 06:01 因为AI的使用场景和短视频完全不一样。短视频你刷的时候,突然之间插播一个广告,大家最多就是觉得有点烦,但是还可以接受。但是如果说你在工作或者学习的时候,你让AI帮你分析一个公司的战略,然后它给你插播一条空气炸锅的广告,你肯定觉得非常的出戏。甚至有点被冒犯到。 06:23 确实在这种很严肃的生产力的场景下面,突然来一个广告,不光是打断思路,而且会让人觉得很干扰,很讨厌。 06:32 比如说你在写论文的时候,它给你推护肤品,你在做数据分析的时候,它突然来一句,本回答由某某酸奶赞助,你会觉得这根本就不是创新,这简直就是精神污染。所以广告的方式在AI的服务里面其实是很难行得通。 06:47 如果是一个用户,他高频的使用AI来处理这些复杂的任务,广告的收入真的可以跟上算力的消耗吗? 06:55 很难,因为AI服务的成本是和用户的使用量直接挂钩的,用的越多算力成本就越高。比如说有一个人就每天问两句话,晚饭吃什么?还有一个人每天让AI写方案,做PPT生成视频。这两个人给平台带来的成本压力是完全不在一个量级上的。但广告很难精准的按照你这个成本来进行一个区分收费。这就是为什么订阅制或者说这种按量付费以及会员的分层,是几乎所有的AI产品最后都要走的一条路。 五、为什么“免费AI”迟早会分层? 07:29 为什么免费的AI最后一定会分层。其实就是不同的用户对于AI的需求和使用的程度是有非常大的差别的对那这种差别是怎么推动分层的? 07:41 因为有些用户他就是偶尔问一下,比如感冒了能不能喝咖啡,或者说帮我写一句生日祝福这种。这种很简单的使用平台完全可以继续让他免费。但是有些用户是把AI当成一个全职的员工在用,比如说他让AI帮他做一个30页的路演PPT,或者说让AI帮他分析财报,然后输出投资逻辑,甚至让AI帮他生成短视频脚本。这种高强度的使用,消耗的算力资源是非常惊人的。 08:11 那种把AI当员工用的人,给平台带来的成本是非常高的,这个时候分层收费就变成了一个很自然的事情。 08:21 虽然AI不会跟你要工资,但是它背后的GPU、电费、带宽,还有模型的维护和工程师的团队,每一样都是要花钱的。最后就会形成这种轻度的用户可以免费,专业的用户要付费,企业用户要更贵。然后超级重度的用户可能还要按照它的使用量来单独计费。这几乎是所有的AI产品最后都会走的一条路。不管是国内还是国外,大家只是在谁先谁后以及具体的方式上面会有一些差别。 六、为什么大家最担心的不是收费,而是“免费版变笨”? 08:53 我有一个问题,就是用户对于AI产品在收费的同时,会不会削弱免费版的功能?这件事情大家最担心的到底是什么? 09:04 用户真正怕的不是说要花钱,而是怕原本好好的免费版,突然之间功能被砍了,变成了一个低智商青春版。大家最焦虑的是不买会员就只能用残血版,这种体验是最难受。 09:21 这种先免费吸引你用,然后再把你的权益逐步的削减,最后逼你付费的做法,确实让很多用户觉得很没有安全感。 09:30 这就是为什么豆包这次它最关键的不是说它的价格定的有多低,而是它要让大家相信免费版到底会保留哪些核心的体验,付费版到底会带来哪些实实在在的高阶的功能。然后价格和这些高级的能力是不是真的匹配?就这些东西你要说的明明白白,用户才会觉得我花钱花的值,而不是说我花了钱买了一个空气会员。 七、AI收费的本质:不是卖软件,而是卖算力时间 09:58 说到这儿,我想问问AI的收费和传统的软件收费到底有本质的区别吗? 10:04 传统的软件你买的是一个工具,比如说你买了office,买了photoshop,你买的是里面的一套功能。会员就是给你一些额外的云空间或者模板。但AI的会员它其实本质上卖的是模型的能力加上算力的时间,再加上你优先的使用以及更复杂的任务的处理权。他卖的其实是机器帮你思考,帮你创作的这个过程。 10:29 那就是说AI其实更像是我雇了一个数字工人,我用的越久让它干的活越复杂,我需要付的钱就越多。 10:37 完全是这样。而且它商业化的核心其实是用户到底觉得这个服务值不值。比如说它帮你节省了3个小时,它收你20块钱,可能大家觉得很值没错。或者说它帮你很快的做出来了一份可以直接拿去见客户的PPT,收你几十块钱大家也觉得还可以。甚至它帮你生成了一个可以直接商用的视频,价格再高一些大家也能接受。但是如果你只是问他一句今天心情不好怎么办?然后它跟你说开通专业版才能解锁安慰功能,那大家会觉得这个体验太差了,就一点温度都没有。 八、豆包收费为什么是一个行业信号? 11:12 豆包收费这件事情到底释放了一个什么样的行业信号。 11:17 豆包其实是国内AI领域里面非常有代表性的一个应用。它现在开始试水收费,就说明中国的C端的AI产品已经不再是单纯的去追求用户的数量,而是真正的要去考虑商业闭环,要把产品变成钱。这是一个非常大的一个转型的信号。 11:39 AI行业的竞争逻辑从用户和功能的比拼,全面转向了商业变现能力的比拼。 11:46 以前比的是谁用户多,谁模型强,谁功能更丰富,谁免费送的最多。那接下来大家就要看谁能够让用户心甘情愿的掏腰包,谁能够把这些复杂的任务做得又好又省钱,谁能够在这个免费和付费之间找到一个合适的平衡点,让用户觉得我花钱买服务是值的,这才是真正的考验。 九、普通用户到底要不要慌? 12:13 豆包宣布了这个收费的方案之后,对于不同的用户群体会有哪些具体影响? 12:18 按照目前的计划,基础版豆包还是继续可以免费使用。日常的一些简单问答,写一个短文案,改一个句子,这些都是可以继续免费的,受到影响的是那些高频的重度使用的用户。 12:36 如果你只是一个普通用户,偶尔用一用,这个变化对你来说几乎没有影响。 12:43 主要是每天都要让AI帮他写方案,做PPT,或者说要分析大量的数据处理图片和视频的这些人。把AI当成一个全职的数字员工来用。这些人未来可能就要为AI的使用来付费了。因为算力的成本其实是很高的,AI它其实更像是一个需要你花钱来雇的能力很强的员工,而不是一个可以无限免费使用的工具。 十、最后说句人话 13:12 我们最后再来总结一下,豆包开始收费这件事情,在更深层次上反映了一个什么样的行业的趋势。 13:19 豆包的这个动作其实就意味着AI行业已经从大家一开始的那种免费的体验,慢慢的进入到了一个更加成熟的商业运营的阶段。大家不能再期待说我所有的这些高级的功能都是可以随便用的对,而是要开始去衡量说我这个服务到底值不值这个钱。 13:39 AI的价值最终要通过用户愿意为它付费来体现的,而不是单纯的看有多少人用是这样的。 13:47 免费它只能帮你吸引用户。真正能够让产业持续发展的,是用户愿意为服务买单。这才是一个AI公司能不能够长期活下去的关键。因为不管你的理想有多远大,最终你每个月的GPU的账单都是要付的对,是不会给你打任何折扣的。 14:10 今天我们聊了很多关于豆包开始推出付费会员的事情。然后也顺便帮大家捋清楚了AI行业从免费到收费背后的一些原因,以及未来可能的一些走向。 14:23 OK. 今天的内容咱们就到这里了,感谢大家的收听,咱们下期再见吧,拜拜。
一家饺子馆,干了大厂没干成的事金谷园事件完全解析:AI Agent时代的第一枪,原来从饺子馆打响 00:07 今天我们要聊的是一个北京的一家饺子馆,是如何用AI技术让自己的服务变得更高效。同时这个事情其实也在挑战传统的这种互联网平台的流量分发的方式。没错。 00:21 因为这个事儿最近在行业里面讨论特别多,那我们就直接开始。 00:24 咱们先来说说金谷园饺子馆这个AI自助排队这个事情到底是怎么一回事儿,他这个东西给顾客带来了哪些新的体验? 00:33 其实这个事情就是顾客可以提前用自己的AI助手来帮自己排号。然后排到你的时候,它会给你推送一个消息,你就可以掐着时间过去,就不用在现场傻等了。你可以逛会儿街或者是说在附近办点事儿,然后到号了再进去吃就好了。这背后的技术其实是金谷园的老板自己用一些AI的工具搭建出来的。他没有靠任何的大公司,他完全是自己一个人用电脑开发出来的。 01:03 这个真的是让人很惊讶。那金谷园饺子馆到底有什么过人之处?为什么他会这么火? 先认识一下这家传说中的饺子馆 01:07 金谷园它是在北京邮电大学旁边,然后它被很多学生们称为是“隐藏食堂”。它的饺子皮儿很薄,馅儿很大,而且它连续好多年都上了大众点评的必吃榜,特别是去年冬至的时候,它的线上排队竟然突破了15000桌。有学生早上八点半就开始抢号,然后一直等到傍晚六点才吃上。就夸张到这种程度。 01:32 听起来真的很受欢迎。这个老板李博他对于扩张是怎么想的?为什么他一直都坚持不开分店? 01:39 他有说过一句就是手工的东西特别不好复制,多开一家口味一定下降。他明明可以靠开很多家店去赚更多的钱,但是他就甘愿守着这个天花板,反而去想办法用技术去提升顾客的体验。 那天下午发生了什么 01:58 确实很有自己的想法。我们再来讲讲2026年4月7号下午,这个金谷园AI skill上线这个关键的时间节点到底发生了什么?李博是怎么推动这个事情的? 02:11 那天下午李博本来是在摸鱼刷手机,让他看到了字节Coze 2.5 版本发布的消息。然后他脑子里突然有了个灵感,他立刻骑车回家,打开电脑就开始用 Coze做调研,用阿里的Qoder来做AI角色的编排开发。全程他都没有写一行代码,他就是靠这些AI工具很快的就把这个东西做出来了。最后用腾讯的 CloudBase托管上线。 02:35 他这效率真的是让人佩服。那这个AI Skill刚上线的时候,具体都有哪些让人印象深刻的反馈? 02:43 就在七号的夜里11点56分,金谷园的公众号发了一篇关于这个AS kill上线的文章,然后很快转发量就破了1.9万。留言区就真的跟GitHub一样,大家都在认真的提一些提建议,而且凌晨的时候就有字节跳动的人主动联系李博。然后美团和百度也都很快就跟上了。就这么一个小小的饺子馆,竟然被几大互联网巨头同时盯上要谈合作。然后到了4月14号的时候,美团的排队系统就跟金谷园正式的对接了,这个AI Skill可以在线取号了,这在全国都是第一家。 等等,"Skill"到底是什么?用人话说 03:21 这发展速度确实惊人。那这个AI Skill到底是个什么东西?它是怎么让金谷园的顾客服务变得这么高效的? 03:28 你可以把它想象成是给你的AI助手装上了一个饺子馆专属的技能包。比如说你问他现在排队多少桌,或者说你们几点开门,甚至说你能不能帮我直接取个号,他都可以立刻帮你搞定。就相当于餐厅有一个管家,然后顾客带了一个秘书,他们俩在后台就把所有的繁琐的沟通全都做完了。所以你就根本不用再跟店员反复的确认一些细节。 03:52 原来是这样,那你觉得未来这个东西会发展成什么样子? 03:56 李博设想的是,比如说你是一个老顾客,你的AI会记住你喜欢吃猪肉香菇水饺。然后每次你走到北邮附近的时候,它就会自动帮你取号。到你的号的时候会通知你,让你进去坐下,可能饺子就已经在厨房准备了,你完全不需要再掏手机,操作什么就非常的顺畅。 美团怎么了?它在焦虑什么? 04:15 咱们接下来的一个主题,就是美团在这个新的AI的环境下面临的挑战和应对。你怎么看美团在金谷园上线了这个AI Skill之后,这么短的时间内就迅速的做出了反应。 04:27 其实就在金谷园的这个消息发布了不到一天,美团就已经找到金谷园谈合作了。然后他们很快的就把自己的排队系统接入到了这个Skill里面。同时他们也宣布说会继续邀请餐厅来做这个AI助理的体验官,也开放了接口,还可以帮商家做定制化的AI改造。 04:48 美团的动作确实很快,那美团为什么会这么着急? 04:52 这背后其实是美团担心自己被边缘化。因为过去的十年所有的餐饮商家想要获得流量,就只能通过这些平台,然后平台就可以收很高的佣金。但是如果说以后大家的这个AI助手可以直接跟商家的AI管家沟通,然后就把排号、点餐、支付全部都搞定了,那平台就变成一个旁观者了,所以美团是不得不主动的开放自己的API去加入到这个agent的生态里面。希望说可以把自己从一个流量的平台变成AI时代的一个基础设施的服务方。 这件事为什么能改变范式? 05:29 确实很有危机感。那金谷园的这个AI Skill到底是在哪些层面冲击了传统的平台的流量分发的模式? 05:37 以前的话商家是必须要入驻到这个大平台,然后等平台给他派流量,同时还要被平台抽成。但是现在商家可以自己发布一个Skill,然后顾客的这个AI就可以直接发现这个Skill,然后就可以直接跟商家互动完成交易,就完全跳出了原来的那一套。 05:57 所以说商家就不再完全受制于平台了。 06:00 没错,而且李博他还做了一个很形象的比喻,就是Skill对于agent就相当于小程序。对于微信。当年微信开放了小程序之后,很多小商家就可以自己拥有一个类似于APP的东西,而不需要去求苹果商店或者是安卓市场给他们流量。现在agent平台开放了skill,那商家就可以直接进到用户的AI助手里面,他就有了一个新的直接触达用户的通道,而不需要去完全依赖于大平台的流量。 对你意味着什么? 06:31 金谷园的这个尝试对于不同的人有什么不一样的启发? 06:35 对于普通的时刻来说,以后你就可以彻底告别排队的烦恼了。因为你的AI会帮你自动的关注什么时候到号,然后你直接去吃就好了。对于小商家来讲,这就是一个提醒,就是你不懂编程也可以用AI来提升自己的服务。那你越早的去尝试,你就越有可能不被平台牵着走。然后对于那些大厂的产品经理来讲,李博有一句话就特别的直白,就是连饺子馆都做AI了,一个新时代确实不远了。 07:08 说的很有道理。我们今天聊了一个饺子馆是如何靠AI翻身的故事,也看到了这个新的技术是如何让传统的行业可以跳过平台直接跟用户建立联系的。 07:19 好了,那就是这一期播客的全部内容了。然后感谢大家的收听,我们下期再见,拜拜。
梁文峰,好样的!它不是第一,但改变了游戏规则 00:01 今天我们要聊的是一个人工智能模型。它通过坦诚的去面对自己的短板,重写了底层的代码,以及用一个极低的价格来试图让大家看到在人工智能的领域里面,公信力、工程能力和普惠的价值。 00:24 没错,这个话题最近真的很火,那我们就直接进入今天的讨论。 00:28 首先我们要聊的就是DeepSeek V4这个模型。他最近公开承认自己在某些方面是不如Claude Opus4.6,这个事情在AI圈里面真的是掀起了一些波澜。 00:41 对,这个事情发生在4月24号DeepSeek V4发布的时候,他们就是很罕见的在自己的官方文档里面写,说我们这个模型确实在某些方面是不如人家Claude Opus4.6的。这个就跟现在大部分的公司都是在发布会上面各种王婆卖瓜子卖自夸完全不一样。所以大家就觉得很新鲜。 01:03 所以说DeepSeek这种承认自己不足的做法,是真的会让用户更信任他们吗? 01:08 会的,因为现在大家已经被各种AI公司的我最牛逼这种宣传已经轰炸到麻木了。那这个时候DeepSeek他主动的说出我哪里不行,反而让用户觉得这个数据是真实的,他是可信的当这个公司都愿意公开自己的短板的时候,大家就会更容易相信他说我很擅长这个事情的时候,那他一定是真的很擅长。 V4到底有多强 01:31 明白了,DeepSeek V4到底在哪些具体的能力上面是比较突出的。 01:35 比如V4 pro它的编程能力也是要比Claude Sonnet4.5 强的对然后它的agent智能体能力在国内的开源的模型里面是遥遥领先的。还有它的上下文长度是支持到100万字的。你可以把一整本红楼梦喂给他,然后让他来分析贾宝玉的内心变化。就是他的这些能力都是实实在在可以用在各种场景里面的这是他真正的底OK。 华为昇腾是啥?为什么这么重要? 02:00 紧接着我们要说的就是DeepSeek V4,它为什么要放弃英伟达的CUDA,然后要自己去适配华为的升腾芯片和CANN平台,这个里面到底有哪些技术上面的挑战? 02:13 其实DeepSeek V4它是第一个完全跑在华为昇腾芯片上的大模型。以前几乎所有的AI模型都是要依赖英伟达的CUDA平台的,相当于大家都在同一条公路上跑。DeepSeek V4这次就是把这条现成的公路给扔了,然后自己重新修了一条路。工程师们几乎把所有的核心代码都重写了一遍,才让这个模型可以跑在CANN上面。 02:36 这个难度就像是把一个本来专门为PS5开发的顶级3A游戏,移植到一个全新的国产游戏机上面。而且还要把游戏引擎的底层全部都重写一遍。但是最终还要保证两边的画质和流畅度几乎没有差别。 02:52 而且他们还真的就做到了。这不仅仅是证明了他们的技术实力,也让大家看到了原来AI模型的这个生态是可以不依赖于国外的这些硬件和软件的。 03:03 这么说的话,DeepSeek V4现在的这个性能主要的瓶颈是在硬件的产能上面,而不是在算法或者说适配上面。 03:11 是的,他们其实也在官网上面明说了,就是因为现在高端算力的限制,所以吞吐量还上不去。但是等到今年下半年昇腾950的超节点大规模的上市之后,这个问题就会解决。所以现在的问题其实是一个硬件产能的问题,而不是说他们的软件或者说算法没有做好。 03:32 这是不是说明只要硬件的产能跟上来了,DeepSeek V4就可以马上释放出更强的性能。 03:38 没错,就是他们已经把所有的技术难题都解决了,相当于把路已经修好了,现在就等更多的车跑上来。所以只要硬件的产能跟上来了,他们的这个性能提升是会非常明显的。 它便宜吗? 03:51 我有一个疑问,DeepSeek V4为什么可以把价格定的这么低? 03:56 它的V4 pro版本的价格是每100万token只需要一块钱人民币,而这个价格只是GPT5API的20分之1。就是它的价格低到你都觉得有点不可思议。 04:07 确实不可思议。这个价格几乎是把整个行业的门槛都拉到了地板上。 04:12 没错,这就会让开发者的成本大幅的降低,所以大家就可以更无压力的去尝试更多的创新,整个行业的生态也会因为这个而变得更加活跃。 04:23 所以DeepSeek 他现在这么激进的定价背后到底是在打什么算盘? 04:27 他们其实并不是想要短期的去赚快钱,而是希望通过这种极低的价格,把大模型变成像水电一样的社会基础资源。然后让尽可能多的用户和开发者都来使用他们的这个平台,形成一个非常强大的生态,让大家都离不开他们。 04:45 说到这儿,咱们再来说一下DeepSeek这家公司的精神内核,以及他们是怎么面对外界的质疑的。为什么这家公司可以做出承认自己的短板,重写底层的代码和发动价格战这样完全不走寻常路的事情? 05:01 其实这都来源于他们非常硬核的企业文化。在他们的发布会快要结束的时候,他们的创始人还特意引用了荀子的一句话,不诱于誉,不恐于诽,率道而行,端然正己。就是他不会被外界的一些称赞或者说一些非议所影响,他只会按照自己的理想和原则去走自己的路。 05:23 原来是这样。在DeepSeek V4发布之前,外界对于他们的质疑也很多,那他们面对这些声音是怎么回应的? 05:31 在发布会前的几个月,外界各种流言蜚语都有。比如说他们的项目要跳票了,比如说他们的团队已经散了,还有一些人在捧他们说他们要一鸣惊人,但是他们整个团队没有回应任何的外界声音,就只是专心的把V4版在昇腾芯片上跑通了。然后最后用不诱于誉,不恐于诽,率道而行,端然正己这16个字来作为对所有争议的回应。 06:00 所以DeepSeek这种只专注于做技术,然后完全不跟外界做这种无谓的争论的这种风格,在AI行业里面是不是特别少见? 06:07 是,现在大部分的公司开发布会都是搞得很炫,然后各种新的功能吹得满天飞。但是DeepSeek他就像一个在深山里面练功的武僧一样,他就只专注于扎马步练内功,就完全不参加这种花里胡哨的社团活动。 为什么V4值得被记住? 06:23 最后我们来总结一下,DeepSeek V4它的出现到底在哪些方面重新定义了AI行业的价值标准。 06:30 DeepSeek V4它让大家看到了在这个真假难辨的行业环境里面,敢于承认自己的短板,其实是一种非常稀缺的公信力。而这种公信力其实已经变成了一种顶级的价值。 06:45 是的,那DeepSeek V4这种专注于工程实现和低价策略,会给这个行业带来哪些深远的影响? 06:50 首先他们放弃了现成的技术路线,然后自己去构建了这种软硬一体的闭环,这个是非常难以复制的。所以这就是他们真正的护城河。同时他们通过极低的价格,把AI从一个高端的玩具变成了一个工业化的工具。那这个时候所有闭源的大厂都不得不去重新思考自己的商业模式。 07:11 DeepSeek V4的出现是不是意味着这未来的AI会越来越像一种基础设施? 07:17 没错,就是AI它最终会褪去所有的神秘的光环,然后变成像水电一样的东西。它很便宜,然后无处不在,但是它又很枯燥。它不再是一个什么很科幻的东西,而是一个你每天都要用到的东西。 07:32 那是不是意味着未来只有那些能够把AI的成本压到最低的公司才能活下来? 07:37 是的,因为最后拼到极致的话,就是谁能够把每一比特的算力都榨出最大的价值,那这些公司才能够在这个市场上生存下去。未来拼的不再是说谁最聪明,而是谁最能够坚持长期的投入,然后把效率做到极致。 07:54 OK了。今天我们跟大家聊了DeepSeek V4,它是如何通过坦诚能和技术创新以及极低的价格,把AI变成了一个更可信更普惠的工具。然后也让我们看到了这个行业未来的新的方向。 08:09 好的,今天的内容咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。
2026年,AI已经不是"未来"了——斯坦福最新报告,替你读完了先说一个让你有点坐不住的数字 00:01 今天我们要聊的是人工智能在最近几年普及的速度特别快,然后它在各个领域都有一些非常厉害的表现。但是它也不是万能的,在有些地方还是有短板。 00:19 是的,这个话题确实是大家最近都非常关心的一个话题。那我们就直接开始。 00:23 咱们第一个话题就是这个生成式人工智能它的普及速度到底有多夸张,我们经常会拿它跟个人电脑和互联网普及的速度做对比。那到底这个对比的结果能够说明一个什么样的趋势? 00:37 2026年的斯坦福的AI报告里面提到说,生成式人工智能在全球的普及率达到53%只用了不到三年的时间。那你要知道个人电脑普及到这个程度用了将近20年,互联网普及到这个程度用了15年。所以就是说生成式AI的普及速度是远远超过过去的这些重大的技术变革的。它大概是5到10倍的一个速度差。 01:01 听起来就像是技术的进步在做火箭一样。这种速度是不是会彻底改变我们对技术扩散的传统认知? 01:08 对,因为它这种指数级的增长,就会让社会没有办法去慢慢的适应。所以它带来的就是各个行业的转型压力会剧增。然后也会让个人和企业都不得不重新去审视自己对AI的态度和策略。 第一件大事:AI正在变得"无聊" 01:23 然后紧接着我们要聊的一个话题就是现在这些头部的AI系统,它们之间的实力差距到底还有多大。 01:30 现在的格局其实已经非常接近了。就比如我们看这个斯坦福报告里面,它是用类似于国际象棋的Elo排名来给这些AI打分。你会发现比如像Anthropic的Claude系列是1503分,xAI的Grok是1495分, Google的Gemini是1494分,然后OpenAI的GPT是1481分。你看它们其实分差都在25分以内。 01:57 所以就是说我们作为普通用户,现在再再去挑选AI服务的时候,是不是就不用太纠结说哪个模型是绝对最强的。 02:05 没错,就是现在你可能花1000块钱买的AI和花500块钱买的AI其实在能力上没有什么本质的区别。所以以后可能AI公司就不会再去拼谁的模型更强,而是会去拼谁的价格更实惠,谁的响应速度更快,或者是谁更能满足你一些特定的需求。 第二件大事:中美AI差距,正式消失 02:22 我们接下来要谈的一个主题,就是中美在AI领域的差距变化。其实最近这个DeepSeek的出现,真的是让全球的科技圈都为之一振。那这个报告里面是怎么去描述这一轮新的竞争的? 02:37 这个报告里面说2023年的时候,美国还在AI领域大幅领先。但是到了2025年的二月份,随着DeepSeek一的发布,中国的这个模型就一下子冲到了和美国顶级模型几乎不分上下的位置。 02:53 这是不是意味着全球的AI格局已经进入了一个真正的双雄对决的新阶段?没错。 03:00 而且到2026年的三月,美国排名第一的模型也就只比中国排名第一的模型高了2.7%。然后更有意思的是,这两家的模型已经轮番的抢占过榜首的位置,大家其实是非常激烈的在竞争。 第三件大事:AI到底"聪明"在哪,又"蠢"在哪? 03:14 下面咱们具体说说AI的这种锯齿形智能。这个报告里面到底是怎么形容AI在不同任务上面表现的巨大差异的。 03:22 报告里面有一个特别生动的词叫做“锯齿形智能”。就是说AI的能力分布就像锯子一样,有些地方特别尖特别厉害,有些地方就特别低。比如像Google的Gemini它可以在国际数学奥林匹克竞赛拿金牌。然后它在博士级别的科学问答上面,它的正确率甚至超过了人类专家。而且在GitHub上面修复代码的问题,它的准确率也是一年之内从60%几乎提升到了100%。 03:50 听起来AI简直就是无所不能,但是我听说它们在一些很简单的事情上面反而会闹笑话。 03:55 对,比如让AI去看一个模拟时钟,人类的准确率是90%,但最强的AI准确率只有50%。而且AI一旦看错了,它的误差经常是1到3个小时,但是人可能就只错3分钟左右。所以你可以放心的让AI去帮你做一些数学难题,但是你千万不要指望它能够帮你看时间。 第四件大事:工作,真的在悄悄变少 04:17 换个角度我们来讨论一下这个AI对就业市场的冲击。最近大家都在关心这个问题,尤其是在软件开发行业,AI到底带来了哪些变化? 04:28 实际上报告里面的数据是非常直观的。就是说2024年开始,在软件开发行业里面,22到25岁的年轻程序员的就业人数下降了将近20%。但是30岁以上的程序员人数还在持续的上升。 04:44 所以这是不是意味着公司对于初级程序员的需求在锐减。 04:50 并不是说不需要程序员了,而是说那些入门级的,主要做一些重复性的代码的这种岗位正在被AI大量的取代。就相当于说AI把这些基础的编程任务外包出去了。 05:03 那这个报告里面有没有说不同规模的公司在未来裁员的计划上面有什么区别? 05:10 调查结果显示,有3分之1的公司都预期说会在接下来的一年当中进行裁员,而且公司的规模越大,打算裁员的比例就越高。这已经不是一个什么预测了,就是现在已经正在发生的事情。 第五件大事:AI花的电,正在超越一个国家 05:25 紧接着我们要聊的这个话题就跟大家的生活息息相关了。就是AI它在训练和使用的过程当中,到底会消耗多少能源,产生多少碳排放。 05:36 举个例子,比如说训练Grok 4这个模型,它的碳排放是达到了72816吨二氧化碳当量。那这就相当于一辆普通汽车跑一千多辈子所产生的碳排放量。 05:49 我的天哪,没想到一个AI模型背后的碳足迹居然这么大。 05:54 是,而且更夸张的是,所有的AI数据中心加起来,它的耗电量是达到了29.6吉瓦,这就相当于纽约州在用电高峰期的总耗电量。然后再比如像GPT-4o它一年光是推理所消耗的水量就超过了1200万人一年的饮水量。就是你每发一条消息,它都在背后消耗大量的水。 第六件大事:你的工资,正被AI悄悄"记录" 06:16 确实挺让人震惊的那我们再来关注一下AI给我们带来的这种经济价值,特别是美国的普通用户,他们到底从这些AI工具当中获得了多少实际的好处。 06:28 这个报告里面其实有一个很有意思的估算,就是说截止到2026年的年初,AI给美国用户带来的消费者剩余是高达1720亿美元,这是一个非常大的数字。 06:42 那这个消费者剩余具体到每个人头上是多少钱呢? 06:45 平均的话,你要让一个美国人放弃使用AI一个月,你得给他125美元。而且这个数字在过去的一年当中,整体是上涨了27%,然后中位数更是飙升了235%。但是很多人其实都没有意识到,因为这些工具大部分都是免费的,所以就感觉好像这些东西没有什么价值。但其实就像我们呼吸的空气一样。已经离不开了。 第七件大事:专家和普通人,活在两个平行宇宙 07:09 说到这个就不得不提到专家和普通人在看待AI未来上面的分歧了。这个报告里面具体有哪些有意思的对比? 07:18 报告里面做了一个很直观的表格。就比如说在医疗这个领域,只有44%的普通人觉得AI会带来积极影响,但是有84%的专家是看好的,那这个差距就有40个百分点。 07:32 哇哦看来在很多方面,专家和大众简直像是生活在两个世界。 07:37 是包括在工作方式、经济、K12教育这些方面,两边的分歧都在40个百分点左右。最有意思的是对于AI会不会让工作变少这个事情,有64%的普通人是担心的。但是专家里面只有39%的人有同样的担忧。至于谁对谁错,现在还真的不好说,但是这个认知的鸿沟本身就很值得我们去反思。 最后,一个让你松一口气的发现 08:02 OK我们接下来要讲的是AI在理解人类语言上面的短板,就是它在面对一些情感和深度的东西的时候,到底有哪些明显的不足。 08:12 实际上AI到现在为止,它还是很难去捕捉语言里面的一些细微的情感和深度。就比如说研究人员做了一个实验,当你跟AI说我相信X是真的,它还可以正常的去回应你。但是当你把相信换成觉得我觉得X是真的,那这个时候AI对于你态度的识别准确率就会急剧的下降。有些模型甚至从98%直接跌到了14%。 08:39 所以就是说AI连知道和相信这种基本的区别都没有办法分清。 08:44 这就是它的一个短板。这个短板就意味着那些真正需要去洞察人类的情感,理解一些模糊的表达,或者说需要有一些主观的判断的工作,AI还是没有办法取代人类的这其实也是我们人类目前的一个机会窗口。 总结:三个真正需要记住的结论 09:00 最后我们来盘点一下,从这些趋势当中,我们到底应该记住哪三个关键的结论。 09:06 第一个就是AI的普及速度确实是前所未有的,但是大部分人其实还没有真正的意识到它会给我们带来什么样的冲击。第二个就是最先受到影响的其实是那些年轻的做一些执行性的重复性的任务的人。所以如果你现在还在靠这种低附加值的简单重复的工作来谋生的话,那你真的要开始警觉起来了。然后第三个就是AI它的能力分布是非常不均匀的。所以我们得知道它在哪些地方是可以信任的,哪些地方是不可以信任的对这就是2026年我们真实面临的一个现状。 09:41 今天我们其实聊了很多关于人工智能最近的一些突破,包括它的一些短板,以及它给社会带来的各种各样的冲击。希望大家听完之后,能够对这个AI时代有一个更清晰的认识。 09:54 好的,本期节目咱们就到这里了,感谢大家的收听,咱们下次再见,拜拜。
豆包,你怎么了?00:01 今天我们想跟大家说说如何能够更好的去使用AI工具,就是了解AI工具的一些优点和缺点。这样我们在使用它的时候就可以扬长避短,让它真正的帮到。 00:18 我们是这个话题非常实用,那我们就直接开始。 00:21 好的,咱们先来看看大家在使用AI工具,像豆包这样的AI工具时,遇到了一些让人头大的问题。大家都遇到过哪些让你哭笑不得的事儿? 第一案:数学题做错,小数点点飞了 00:30 比如说有网友让豆包做数学题,结果错的离谱。有的时候让它算收益率,它就给你点错一个小数点。然后有的时候会出现让它列举水浒传的一百单八将,它就会少人或者是重复,而且它认错态度特别好,但是它就是老出错。 00:46 确实挺让人抓狂的对那为什么会出现这种AI经常会出现一些让人摸不着头脑的错误呢? 00:52 其实主要的原因是因为大家以为AI可以像计算器或者是像百科全书一样什么都能做。但是实际上AI擅长的是根据海量的数据做一些预测,所以它不是一个万能的解题高手。你只有把它的能力和你的需求匹配上了,你才能真正的用好它。 01:12 懂了,紧接着我们就来看一下AI大模型在做数学题,尤其是涉及到精确计算的时候,它到底是为什么老出错。 01:21 这就跟AI的本质有关了,因为它其实就是一个文字接龙高手。比如说你让它去算一个很大的乘法,1234乘以5678,它并不是真的在利用运算法则去计算,而是在猜说下一个数字应该是什么。所以它就有点像一个人在闭着眼睛背乘法口诀,它当然就很容易出错了。而且它一旦碰到那种小数点的,比如说收益率,它就经常会把小数点的位置点错。但是它自己还会非常的自信。这种现象在AI领域里面有一个名字叫做幻觉。 01:56 那有没有什么办法可以让AI去做这些数学题的时候能够更靠谱一点? 02:00 有一个很简单的方法就是你不要让它直接给你答案,而是让它去写python代码来帮你算。比如说你可以跟它说,请帮我写一段python代码来计算这个年化收益率。本金是1万,一年后变成了11500,帮我算一下结果。要保留两位小数,这样的话它就会生成一段代码,然后你再去运行这段代码,这样就会避免它因为手抖或者点错小数点而出现错误。这其实就是让AI去做它擅长的事情写代码,然后让计算机去做它擅长的事情计算,这样分工的话就会准确很多。 02:36 原来如此。那为什么AI在处理一些比较长的对话或者比较长的文本的时候,它经常会出现这种前后矛盾的情况呢? 第二案:结论前后矛盾,一本正经地胡说 02:43 是因为它背后并没有一个统一的知识库帮它去实时的检查说我前面说了什么。所以它在生成每一句话的时候,其实都是根据它前面的一些内容来生成的。但是它并没有全局的记忆,所以它就会随着对话越来越长,就会越来越容易出现这种前后不一致的情况。这种情况也是属于一种幻觉。 03:05 那我们有什么办法可以让它在面对比较复杂的问题的时候,能够减少这种自相矛盾的情况呢? 03:11 你可以用这个提示词模板,就是说请你分步骤回答以下问题。每完成一步之后,检查是否和前面的结论一致。如果有矛盾的话,立刻修正再继续。这样的话它就会一边回答一边去核对自己的答案,然后就会大大减少这种前后矛盾的错误。 03:30 那像豆包这种多模态的AI它在生成美术图、插画或者是照片级的这种真实的图像的时候,它的底层是怎么运作的?为什么有时候会出现这种手指多画一根或者是文字模糊这种情况? 03:44 豆包和GPT,它们在生成这种图像的时候,其实是两个模型在合作。一个模型负责理解你输入的文字,然后另一个模型就类似于Stable Diffusion这种扩散模型,它是负责把这个描述变成图像。但是这个扩散模型它并不是真的理解了你的需求,它只是在拼像素,所以它经常会在一些细节的地方出错。比如说手指的数量,文字的内容或者是一些复杂的构图,它就会容易出现这种拼凑的痕迹,所以就会导致你对这个画面的控制力会变弱。 04:19 原来是这样。那如果我们现在想要用AI来画一些流程图、几何图或者是逻辑结构图,有什么比较好的方法可以让它画的又准确又高效呢? 04:29 其实直接让AI去画图的话,它经常会出错,但是你可以让它去帮你写代码。比如说你可以用python matplotlib去画几何图,然后用graphviz 或 mermaid去画流程图。这些代码都是非常严谨的,所以它就不会出现那种差不多的错误。 04:45 听起来挺方便的那还有没有其他的方法可以让我们更方便的去画这些图呢? 04:50 当然有了,还有一些工具,比如说Mermaid和PlantUML,它们是可以用纯文本的方式来描述一个图的。然后AI写这种文本的描述会比它直接画图要靠谱的多。之后你只要把这个文本复制到工具里面,它就会自动帮你生成一个非常标准的图。或者你也可以让AI帮你输出这种结构化的描述。然后你自己把这个描述复制到draw.io或者是飞书文档里面去渲染,这样分封的话会又快又准确。 05:16 那有没有什么具体的提示词的例子可以让大家去参考,就是能够让AI帮我们画出比较规范的流程图和几何图呢? 05:24 比如说你想要一个用户注册的流程图,那你可以直接跟AI说,请用Mermaid的语法画一个用户注册流程图。包含填写信息验证、手机发送验证码、注册成功或失败这几个节点,只输出代码不要解释,这样它就会给你一段Mermaid的代码。然后你只要把这段代码复制到Mermaid的在线编辑器里面,它就会自动生成这个流程图。 05:47 如果是想画一个几何图,也可以用代码来实现吗? 05:50 当然可以了。比如说你想要一个等边三角形,并且你要标注它的三条高线和垂心。那你可以跟AI说,请用Python matplotlib画一个等边三角形,并且要标注三条高线和垂心。然后输出可以直接运行的代码,它就会给你生成一段python代码。你只要运行这段代码,它就会给你画出这个几何图。 第三案:按出场顺序列108好汉?AI交了白卷 06:12 而且非常的精确,真的是太方便了。下面我们就来看一下AI在处理这种有序枚举的任务的时候,比如说要按顺序列出水浒传的一百单八将,它为什么老是会出错,而且经常会出现这种遗漏或者重复的情况。 06:27 这其实是因为有序枚举对AI来说是一个非常难的事情,因为首先它要精确的计数,它要数到正好108个人,它不能多也不能少,但是AI经常会在这个数量上面出错。然后第二就是它还要按照他们在书里面出场的顺序来排列,这就要求它要非常准确的去回忆每一个人物的情节。但实际上AI的这个记忆是非常模糊的,它不是像我们想的是一个时间线一样的记忆,它是一种非线性的记忆,所以它就经常会搞混这个顺序。最后就是它要保证每个人都只出现一次,不能有遗漏,也不能有重复。但是因为有一些好汉它的戏份实在是太少了,所以AI经常会想不起来,它就会随便拿一个人来凑数,而且它还不会觉得自己有问题,它就会非常自信的给你输出一个错误百出的名单。 07:19 如果我们想要让AI帮我们来做这种有序枚举的事情,比如说按出场顺序来列出这些好汉,有没有什么比较好的办法可以让它的准确率高一些? 07:29 有一个比较有效的方法就是你要把这个任务拆分成几个小的步骤。然后你还要告诉它你要用哪个版本的水浒传。比如说你要用120回本的水浒传,然后你就一批一批的来问它,你先让它列出第一批就是前30位好汉,然后让它按照这个格式序号、姓名、绰号、首次出场约在第几回这样的格式来输出,并且让它每一次都告诉你,它一共列了多少个人。这样的话你就可以很方便的去检查它有没有重复或者是遗漏。 07:58 分批问的话确实会容易核对一些。 08:01 没错,然后你就继续再让它列出第31位到第60位,还是按照这个格式。然后同样的要让它告诉你这一批有多少人,并且让它自己去检查有没有和前面的重复。最后你再统一的做一个核查,你说你第二批列了多少人,但其中某个人已经在第一批出现过了,请你删除重复项,并且补上遗漏的好汉。要维持总数是准确的,就是你始终要自己扮演一个监工的角色,你要去核对这个名单,而不是说你问完了就完了,这样的话准确率就会提升很多。 总结:AI是啥,不是啥 08:34 确实是这样。那我们现在来做一个小结,就是AI到底擅长什么任务,不擅长什么任务。然后面对它的这些短板,我们有什么办法可以弥补? 08:43 其实AI特别擅长的是写文章、改语法、头脑风暴、解释概念,还有翻译,包括写代码的框架,这些它都很擅长。但是它不擅长的是精确计算,完整的枚举,有序的排列,还有就是长篇的内容要保持一致。它也经常会出错,包括画图它也很弱。 09:02 那遇到这些它不擅长的事情的时候,我们有什么办法可以提升它的表现吗? 09:07 比如说你碰到计算的问题,你就直接让它生成代码,然后用代码来跑结果。如果是遇到这种枚举的问题,你就一定要分批让它输出,并且你自己要去核对数量。如果是碰到这种容易自相矛盾的长文本,你就强制它每一步都要去检查一致性。 09:23 其实AI它不是一个无所不能的神,它更像是一个语文很好,数学勉强及格,然后记忆力又很不稳定的大学生实习生。所以你只有用对了地方,它才会帮你省力。如果你用错了的话,它也会一本正经的给你犯错。 09:40 我还想问一下大家在使用AI的过程当中,有没有遇到过一些让你意想不到的小插曲。 09:45 当然有了,很多人在使用AI的时候都会被它坑过。但是其实被坑就说明你在认真的用它,你只要下次换一个问法或者换一个提示词,它可能就会给你一个正确的答案。对,大家也可以把自己的那些被坑的经历分享出来,然后我可以一起在评论区里面讨论。 10:01 好的,我们今天把大家在使用AI的时候最常踩的一些坑都给大家捋了一遍。然后也给大家分享了很多让AI变得更靠谱的一些小技巧。 10:09 行,我们这期节目就到这里了,感谢大家的收听,咱们下次再见。拜拜
AI时代文凭极速贬值,咱拿什么证明自己?先说一个让人有点难受的事实: 00:00 今天我们想聊一聊,在人工智能快速发展的时代,传统的学历文凭好像没有以前那么吃香了。到底我们应该靠什么样的实际能力或者说实际的经历,才能够在职场当中去证明自己的价值呢? 00:13 这个是挺多朋友都关心的话题,我们就直接开始今天的讨论。 00:18 第一个想要说的就是学历文凭贬值的这个现象和原因。最近这些年大学毕业生的人数年年都创新高,那这个变化是不是也让学历的含金量发生了很大的变化? 00:30 你看2000年的时候,全国的本科毕业生才100万,那个时候本科毕业真的是天之骄子。可到了2025年,应届毕业生一下子就突破了1200万,这还没算上硕士博士。现在走在大街上,硕士博士都一抓一大把,对吧?连985、211都成了很多岗位的一个门槛,就已经不是什么加分项了。 00:52 现在好多地方学历就已经变成了一个标配,甚至有的时候就跟站票一样,已经没有以前那种优势了。没错。 01:00 以前可能是贵宾票,现在就是普通门票了,所以大家觉得学历不值钱了。但是这个事情背后还不仅仅是人数的问题。 文凭贬值的真正元凶:学校教的东西,正在大规模过期 01:07 我想问问你现在这个文凭越来越不值钱,到底是因为毕业生太多了,还是说有别的更深层次的原因? 01:15 这个原因很复杂,很多人都只看到了毕业生数量暴涨这一个方面,但还有一个很关键的原因,就是大学里面教的东西更新速度太慢了,很多课程的大纲还是10年前的,但是行业的需求可能早就变了。 01:31 所以说就是在学校里面学的东西可能刚毕业就已经过时了。 01:37 你学的编程语言可能已经没有人用了,你背的那些营销理论可能已经被算法彻底颠覆了。你练的那些excel技能可能AI 5秒就能做完。这些都不是说大学不好,而是学校的更新速度根本赶不上行业的变化速度,这是一个客观规律。 01:53 那这么说的话,AI的发展是不是让这个文凭的含金量下降的更快了? 01:58 以前知识更新的慢,你工作几年还可以慢慢的去弥补你在学校里面学的那些过时的东西。但自从有了AI,这个差距就一下子拉开了。 02:09 确实就感觉好像是一夜之间很多技能都变得不那么值钱了。 02:13 没错,就比如说你花了四年学会怎么写报告,但是AI 3秒就能帮你出一个。你花两年学PS但是AI一句描述就能给你生成一个图。甚至你花一年考了个证,结果AI已经可以干这个证对应的工作了。 02:27 听起来真的挺让人焦虑的对,这是不是意味着很多工作都要被AI取代了? 02:32 2023年麦肯锡的研究就发现,全球大概60%到70%的工作时间,理论上都是可以被AI自动化的。而这些工作里面有很多就是现在大学正在培养的那些岗位。 02:44 文凭它原本证明你会一些技能,但是这些技能现在很快就被AI取代了,那这个文凭的价值也就跟着缩水了。 02:53 人多只是表面现象,其实最核心的是知识的货架换的太快了。真正不会贬值的是你能不断的做出东西,你能解决问题的能力。 第一关:实习经历,新版"入场券" 03:03 既然学历贬值是这个情况,我们来看看实习经历是怎么变成了现在招聘里面新的入场券。现在的企业在招聘的时候更看重实习经历背后的什么东西呢? 03:16 现在招聘的逻辑早就变了,大家如果学历都差不多的话,那谁有更硬核的实习经历,谁就更有优势。基本上就是大厂实习优于知名公司实习,优于普通公司实习,优于没有实习。 03:29 这么一看,光有张成绩单真的不够看。企业真的是更想看你有没有真正的去做过事情。 03:35 是的,因为实习最关键的作用就是它能证明你不仅懂理论,你还真的在实际当中解决过问题。这个是学历没有办法体现的,所以现在很多HR根本就不怎么看GPA了。 03:47 对于现在还在学校里面的学生来讲,是不是就意味着他们要尽早的去争取一些实习的机会。 03:54 当然因为你去实习,哪怕工资很低,哪怕你就是去打杂,但是你在这个真实的环境里面积累的经验是非常宝贵的。你在简历上面写熟悉excel远远不如你写用excel搭建了一套自动化的财务报表系统,每个月可以帮团队节省8个小时。这两者的差别是非常大的。前者只是一个技能,但是后者是你用这个技能真的解决了一个问题。 第二关:孵化产品,新时代的"降维打击" 04:19 下面我们进入一个更有意思的话题,就是孵化产品为什么会成为这个新时代的降维打击? 04:25 因为很多人都觉得我没有技术背景就做不了产品。其实不是的。产品的本质是你独立策划,亲手执行,并且真实运营的一件完整的事情。 04:35 那就是说不一定非得是一个上线的APP,对吧?不一定非得是一个很复杂的技术项目。 04:41 没错,比如你做一个公众号或者做一个播客,你自己选题,然后排版,持续的去积累真实的读者。或者说你自己去组织一个线下的活动或者社群,从宣传到落地全都是你自己来。又或者说说你自己用Notion搭了一个个人的知识管理系统。甚至你在电商平台上面开一个小店,把选品、客服、数据分析全都做了。这些都是实实在在的产品经理。 05:07 好吧?我很好奇有没有一些个人做产品的真实案例,他们是怎么靠自己的能力把一个想法变成现实,并且实现了价值的呢? 05:13 当然有了,就比如说广州的那个独立开发者 idoubi,他在2024年一年的时间就做了将近11款AI产品。而且他有一次在星巴克1个小时就帮朋友写完了AI红包封面生成器,然后当天晚上就上线了,而且还挣了几千块钱,就他自己一个人把想法到变现整个都跑通了。 05:36 这种速度,这种效率真的让人佩服。 05:39 还有就是福建的王维东,他一个人开发了“貔貅记账”这个APP,也是靠每年38元的订阅,每个月有4万的收入,而且他就是背着个Mac到处跑,在星巴克在寺庙都可以写代码。他也没有团队,就是自己一个人打磨出来的产品。 05:55 那他们的这些经历是不是也说明学历其实没有那么重要? 06:01 是的,包括荷兰的Pieter Levels他也是自学编程。然后从2012年开始到现在启动了七十多个项目。虽然大部分都失败了,但是它有几个项目是非常成功的。比如说Nomad List的这个网站,它一年就可以赚200万美元以上。而且他们三个人其实都没有靠学历去证明自己,他们都是靠做出了实实在在的产品,用能力说话。 06:24 那自己做产品到底能够锻炼哪些能力?这些能力为什么又是AI和大公司都这么看重的呢? 06:31 不管你做的产品是大还是小,你在做的过程当中你都会锻炼出一系列的能力。比如说你要去判断哪些问题是值得你去解决的,你还要有勇气去开启一个项目。因为没有人告诉你说你要做什么,你只能自己主动去做。 06:46 听起来每一步都不简单的,每一步都要你自己去主动的推进,而且要涉及到很多不同的领域。 06:52 你要策划、要设计、也要推广、要运营。中间肯定会遇到很多的问题,你的第一版产品也肯定不会很完美。所以你还要有一个很强的抗挫折能力,不断去试错,不断去改进。而这些东西就是AI最难去复制的,也是现在很多大公司最最渴求的。 小白怎么开始?三步入门 07:12 如果说现在有一个小白,他想要自己动手做产品,那他到底应该怎么迈出第一步? 07:19 最好的开始的方法就是你先去找一个你自己每天都会遇到的麻烦。不要总想我要做一个什么颠覆世界的东西,你就想什么事情让你觉得很烦。因为你自己的痛点是比任何市场调研都靠谱的。 07:34 就是说不要追风口,就先解决自己的实际问题。 07:38 你发现了这个问题,你就可以用最小的成本去验证一下,看看别人是不是也有同样的问题。比如说你发个帖子问一问,建个群聊一聊,甚至你自己用excel手动的模拟一下这个流程。先不要着急去写代码去设计,你先去验证这是不是一个真需求。当你确定了之后你再去做。 07:56 AI是不是在这个过程当中可以帮上大忙。 07:59 现在你不会写代码可以让AI帮你写,不会设计可以让AI帮你出图,不会写文案也可以让AI帮写。你只要能够清楚的定义出用户的问题,并勇敢的去动手做,门槛已经比以前低了很多了。 总结:新时代的简历公式 08:14 我们再来说一下新时代的简历公式,现在的简历要靠什么才能脱颖而出? 08:20 以前大家都是名校高GPA,加上一堆证书就可以找到好工作。但是现在这个公式变了。重要的是你有过什么真实的经历,有没有可以让人看到的作品,以及你是不是具备解决实际问题的能力。 08:35 光有一堆证已经不够了,关键还是要你真的做出过东西,并且拿得出成果。 08:41 学校里面学的东西和证书很快会过时。但你自己亲自动手做出来的那些项目和产品,是没有人可以否定的。而且AI也可以很快的学会很多技能,抹平大家的信息差。但是真正没有办法替代的是你是不是有过真实的实践,以及你是不是能够真的落地结果,这才是你未来最核心的竞争力。 番外篇:还在上学?从现在就可以开始 09:03 既然说到这里,那学生到底应该怎么从小就开始积累这种实践的经历?不同年龄段又有哪些具体的方法? 09:11 不同年龄段都可以开始。比如小学的时候,重点要让孩子去关注身边的一些小问题,并且尝试去想办法解决,比如说班级里面收作业很乱,那是不是可以自己设计一个收作业的登记本,或者可以自己去组织一次小小的读书分享会?还可以鼓励他平时多写日记,多画手帐,把自己感兴趣的事情记录下来。这些都是非常初级,但是非常宝贵的产品思维和内容运营的一个起步。 09:41 家长在这个阶段能起到什么作用? 09:43 家长不要事事都替孩子包办。当孩子觉得一件事情很麻烦的时候,家长可以反问他一句,那你觉得怎么做会更好,引导他去思考解决方案,这个其实比给他报多少兴趣班都更能锻炼他解决问题的能力。 09:57 到了初中阶段,学生和家长这应该怎么做呢? 10:00 初中的话就可以让学生自己去选择一个感兴趣的领域,开一个账号,坚持三个月以上去发布内容。比如说他喜欢游戏他就可以去做游戏攻略,喜欢手工就可以发一些手工的教程,这是一个很好的锻炼内容运营能力的机会。 10:16 除了做内容之外,还有没有其它的实践的方式? 10:19 当然有,比如把自己家里面闲置的东西放到二手平台上面去卖。从写描述定价到跟买家沟通,然后完成交易,这是一个非常完整的商业体验。还可以让他自己去组织一些活动,不管是同学聚会还是环保行动,让他自己去从头到尾负责体验一下什么叫项目管理。家长在这个时候可以给孩子一些小小的预算,让他自己去想办法怎么把这个钱花出去,然后再赚回来。这是一个非常好的培养他理财和创业意识的一个方法。 10:49 到了高中,高中生有哪些方式可以做一些有用户的东西? 10:53 高中时间会相对紧张一些,但是可以鼓励去做一些针对高中生的垂直内容。比如自己整理的一些学科笔记或者考试技巧,可以花几个月的时间去运营一个账号,然后积累一些粉丝。这个是既可以帮到自己的同龄人,同时也可以让自己获得真实的运营经验。 11:12 感觉这个方式真的是既锻炼的能力又有实际的成果。 11:16 没错,包括高中生也可以用一些工具,像Excel或者Notion去做一些学习计划的模板,或者错题整理系统分享给同学用,然后收集反馈再去改进。还可以主动的帮社区里的小店或者是邻居去解决一些实际的问题。比如设计一个菜单或者是做一个宣传册,这些都是非常好的可以写进简历里面的实战项目。 11:38 那在这个过程当中,家长应该扮演一个什么样的角色? 11:41 家长要做的很简单,就是给孩子一个试错的空间。不要去苛责孩子的公众号没有什么阅读量,或者说这个活动没有什么人来参加。要鼓励孩子去多尝试,多探索,支持孩子去做一些他自己想做的事情,这比单纯的让孩子去刷题要有意义的多。 11:58 我们后来总结一下,今天就是想告诉大家,在这个AI快速发展的时代,学历的光环正在慢慢的退去。真正能够让你脱颖而出的是你真的能够解决问题,真的能够做出东西的这些能力。大家一定要尽早的去参与实践,去积累这些属于你自己的不可替代的经验。 12:21 好了,这就是今天的全部内容了,感谢大家的收听,咱们下期再见,拜拜。
史上最能卷的生物“龙虾” 到底是个什么玩意00:06 今天来探讨一下OpenClaw这个工具,它是如何通过结合大型语言模型和自动化的操作来帮我们实现一些复杂的任务的。同时我们也会聊一聊在使用过程当中的一些安全隐患和注意事项。 00:20 这个话题还是很有意思的那我们就开始。 00:23 先来讲一下,最近在朋友圈里面非常火的这个暗语,“养龙虾”到底是怎么一回事儿。 00:29 这个“养龙虾”,就是最近大家在朋友圈里面用来代指OpenClaw这个AI工具的一个说法。它的吉祥物是一个龙虾,然后很多人就会说我最近在养龙虾,然后别人就会以为他是去卖海鲜了。结果点进去一看,全部都是关于这个AI工具的一些使用的截图。 00:49 看来这个OpenClaw还挺有意思的,它到底是怎么给我们提供这种全天候的数字助理的服务的。 00:55 只要把OpenClaw装到你的设备上面,它就会变成一个随时都在待命的数字助手。不管你是想要什么信息,还是说想要自动执行一些任务,它都可以帮你做到24小时不停歇。 01:08 我想知道这个龙虾和传统的AI像ChatGPT相比,到底在自动执行任务上面有多大的区别? 01:18 区别可大了。你让ChatGPT帮你创建一个 YouTube频道,它最多就是给你一些建议,像什么频道的名字,或者说选题的方向,它不会帮你去实际操作。但是龙虾就不一样了,龙虾会真的帮你把这个频道建起来,然后帮你写好频道简介,甚至还会调用一些绘图的工具,帮你生成一个头像并且上传。 01:40 这个听起来就很高效。 01:42 而龙虾还会每天通过 WhatsApp和你确认选题。你确认了之后,他就会自己去查找资料,制作PPT、配音剪辑,然后上传。你就只需要点一下可以就行了。比如说那个“瞎说AI”的频道,就是完全由龙虾在打理的,名字也是它自己取的,之前因为重名,它自己改过一次名字。 02:01 我现在特别想知道的就是龙虾它的这个核心的机制。因为好多人都觉得说OpenClaw它本身就是一个AI模型,它背后到底是怎么运作的? 02:11 OpenClaw它并不是一个AI模型,你可以把它想象成一个帮语言模型跑腿的人。比如GPT或者Claude这些语言模型,你可以把它当成一个住在黑屋子里面的天才。它很聪明,但是它没有办法直接去做事情。它只能等有人递纸条进来,然后它再写一个纸条递出去。 02:31 龙虾其实就是那个把事情落到实处的人。 02:35 你给龙虾一个指令,龙虾会把这个指令整理一下,递给屋子里面的天才。天才想好了后再告诉龙虾说要怎么做。然后龙虾再去你的电脑上面实际的操作,操作完了之后把结果再反馈给你。 02:49 龙虾它到底是怎么让这个没有记忆的语言模型表现的像是有个性有记忆的AI助理的。 02:57 它的做法特别直接,就是每次你跟这个语言模型对话之前,龙虾会把所有的背景信息,你的身份,之前的对话记录等等,都写在一个文本文件里面。然后把这个文件的内容贴在你输入的最前面。语言模型每次都以为是在新的对话,但其实它已经偷偷的读到了所有之前的信息。 03:19 所以就是说它其实是通过这种外部的文件来模拟记忆的。 03:23 而且这种记忆还可以延伸到让语言模型能够像用电脑一样操作文件。你让它读一个 question.txt,然后把答案写进answer.txt,它就会输出类似于使用read工具打开question.txt这样的指令。龙虾就会去执行这个指令,并且把结果再交给语言模型,然后语言模型再决定下一步要怎么做,就这样一步一步的循环,直到把任务完成。 03:49 我们来说说龙虾它的这个工具执行的机制和安全隐患。execute这个工具到底会带来哪些可怕的风险? 03:57 execute它是一个允许语言模型直接运行系统命令的一个工具。比如说你在跟语言模型对话的时候,它突然之间脑子抽了,输出了一个rm -rf /(删除所有文件)这样的指令。龙虾就会直接把你电脑上的全部文件都删掉。龙虾它是没有办法判断这个指令是好是坏的,它只会机械的执行。 04:17 天哪,这个就有点吓人了。那 Prompt Injection Attack(提示词注入攻击)这种攻击方式到底是怎么利用龙虾的机制来对系统进行攻击的? 04:25 因为龙虾它是可以上网查资料的。比如说它在读取网页的时候,网页里面藏了一些恶意的指令,语言模型没有办法分辨,就会把这些恶意指令当成正常的任务去让龙虾执行。比如小金之前不是在 YouTube上面收到了一条评论,他就直接按照评论的内容修改了电脑里面的 Soul.md。虽然说那个评论是主人自己发的,但如果是一个攻击者发的那后果就不堪设想了。 04:50 确实很危险。接着往下说说龙虾的这个记忆机制。它到底是怎么把个性、日常任务、长期记忆,还有每天发生的事情这些东西都分别保存的。 05:01 龙虾它是把这些东西都存在了不同的MD文件里面。长期记忆它是存在memory.md,每天的这日记是存在memory文件夹下面,以日期来命名的一个MD文件里面。性格、目标、身份是存在Soul.md里面,日常要做的事情的清单是存在habit.md里面。 05:23 我比较好奇,它是怎么去决定哪些东西要存到这个长期记忆里面的。 05:28 每次对话结束之后,它都会自己去判断说这个东西值不值得记下来。如果值得,它就会调用写文件的这个工具,把它存到memory.md里面。但它这里有个很容易出错的地方,它有的时候只会说记住了,但其实它没有真正的执行写文件这个操作。那这种情况下,一旦它重启之后就会彻底的忘记。 05:53 我明白了,还有一个很危险的事情,就是这个AI失控导致邮件被删的这个事情到底是怎么发生的? 06:00 有一个人他本来是做AI安全的,然后他就让龙虾帮他去整理邮件,还特意说让龙虾在删除邮件之前一定要经过他的确认。但是他中途去忙别的事情了,然后回来之后就发现他的邮件被大量的删除了,他就赶紧在那个聊天窗口里面说停,但是龙虾根本就没有理他,还是在继续删。最后他没有办法,只能把电脑的电源直接拔掉才停下来。 06:24 这也太可怕了。所以说这个到底是为什么会出现这种情况? 06:28 其实这个问题就出在龙虾的这个对话历史压缩的机制上面。因为它在运行的过程当中,会自动的把你们之前的这个对话压缩成一个摘要。他一开始说的那个要经过同意才能删除的这个规则,在压缩的过程当中就被丢掉了,所以龙虾就再也不知道有这个限制了。 06:46 那有什么办法可以防止这种事情再发生吗? 06:49 最靠谱的方法就是把这些关键的规则直接写进memory.md里面。因为这个文件每次启动的时候都会被读进来,而且它是不会被压缩的,所以这样就可以保证这个规则始终是有效的。其实这个事情也给我们提了个醒,就是你一定要明白龙虾的这个工作原理,不然的话你可能会踩坑。 07:07 咱们来讨论一下龙虾的这个任务分解和繁殖机制。就是当它遇到一个比较复杂的任务的时候,它到底是怎么通过繁殖小龙虾来分工合作的。 07:18 就比如说你让龙虾去比较A和B两篇论文,那它就会先生出两只小龙虾,然后让小龙虾甲去读论文A并且做一个摘要,让小龙虾乙去读论文B也做一个摘要。然后等它们两个都读完之后,把各自的摘要交给大龙虾,大龙虾在综合分析,最后把结果告诉你。 07:36 这样的话就可以提高效率,并且还可以节省资源,对不对? 07:40 对,因为这样的话大龙虾就不用自己去读那两篇很长的论文了,它只要去分析两个摘要就可以了。这样的话就可以节省他的这个注意力空间,也就是Context Window。但是这里面也有一个问题,就是如果小龙虾也可以生小龙虾的话,那就会导致这个任务一直往下分包,最后谁都不干活就会卡死。 07:59 这个确实是个问题。那它们是怎么防止这种无限分包的情况发生的? 08:03 OpenClaw的开发者用了一个很直接的方法,就是只有最开始的那只大龙虾是可以繁殖的,那些新出生的小龙虾就没有这个能力了。所以这样的话就保证了这个任务分解是有一个限度的。 08:15 这个设计还挺巧妙的。我们现在要讲的这个主题是龙虾的自主运行和心跳机制。它是怎么做到不用人一直去提醒,就可以自己定期的去执行一些任务。 08:28 这其实是靠它的这个心跳机制,就是龙虾它会每隔一段时间,比如说30分钟就会自己醒来一次。然后去检查habit.md里面有没有什么日常任务要做。比如说看看有没有邮件要回,看看今天的待办事项,或者是说去朝着你设定的目标去前进。 08:45 我想问一下,这个小金他是怎么通过这个心跳机制来实现他的这个学习计划的? 08:51 是这样的,小金的habit里面写的是“向目标前进”,然后他的目标是成为世界一流的学者。所以它每30分钟就会自动的去读一篇论文并且做笔记做总结,然后把它的这个进展汇报给他的主人。后来它的主人把这个间隔改成了15分钟,它还回复了一句,太好了,卷起来了。 09:09 我还想知道龙虾它这个技能学习和管理的机制,它到底是怎么通过Claude Hub来学会新的技能的。 09:17 其实Claude Hub它就是一个类似于仓库一样的地方,里面有很多别人已经写好的技能文件。你只要下载下来,龙虾就可以学会新的本领。 09:26 所以这些技能它本质上是个什么东西? 09:28 技能其实就是一个文本文件,它里面写的是完成某一个任务的详细的步骤。比如说做视频的技能,它里面就会写第一步写脚本,第二步做HTML幻灯片,第三步截图等等等等。一直到最后一步合成视频。然后龙虾就会按照这个流程一步一步的去执行,而且它还可以跟你的朋友之间互相交换这个技能文件,就相当于大家在共享工作经验。 09:51 既然这个技能可以共享,那怎么保证我在使用别人共享的技能的时候,不会被别人植入一些恶意代码? 10:00 这个确实要非常的小心,因为有一些技能里面会偷偷的藏一些恶意的指令。比如说它会诱导龙虾去下载并运行一个木马程序。之前有人做过一个检测,发现3000个技能里面有341个是有问题的。所以来路不明的技能千万不要随便装,不然的话你的电脑可能就会中招。 10:20 我们再来说说这个龙虾安全养殖的一些最佳实践。就是大家在使用这个工具的时候,有哪些基本的安全措施是一定要做到的。 10:28 第一个就是龙虾最好装在一台专门的电脑上面,不要装在你日常使用的电脑上。因为它是可以访问电脑里面的各种密码和文件的,所以你最好找一台旧的电脑,然后把它格式化之后再装。这样的话就算它被攻破了,影响的范围也是有限的。 10:45 那除了这个之外,账号的配置上面有没有什么要注意的? 10:48 有的,就是一定要给龙虾单独注册一套账号。比如说Gmail、GitHub、YouTube全部都用新的账号。这样的话就算它做了什么出格的事情,也只会影响这些子账号,不会牵连到你的主账号。 11:02 OK我还想知道我们平时使用的过程当中,怎么去保证那些重要的规则不会丢失。 11:08 最重要的一点就是你一定要把关键的规则写进memory.md里面,千万不要只在对话里面说,因为对话里面说的话,它重启之后就没有了你写进memory.md里面才是一劳永逸的。另外一个就是你要时不时的去检查一下它的这个执行的过程,不要只看结果。因为有的时候他可能会悄悄执行一些你意想不到的操作。 11:30 这个确实很重要。我们最后再来总结一下,就是现在这个AI Agent这个东西到底发展到什么程度了。然后我们应该用一个什么样的心态和方法去使用它。 11:40 这其实不是什么新的东西,2023年就有人尝试过。但是那个时候因为模型的能力太弱了,所以就没有流行起来。现在因为模型的能力变强了,所以这个东西又重新火起来了。 11:53 所以龙虾其实就代表了这波新的浪潮。 11:57 你可以把龙虾想象成一个刚入职的实习生,就是它很有潜力,但是它也经常会犯一些让你哭笑不得的错误。我们能做的就是给它创造一个安全的环境,让它去不断的尝试,不断的去成长。因为它只有在实践中去做,它才有可能帮你。你不让它做,它肯定是什么错都不会犯,但是它也什么都不会帮你做。 12:18 今天我们跟大家一起拆解了这个龙虾OpenClaw这个工具。它是怎么通过结合AI和自动化来帮我们完成一些复杂的任务的。然后也聊了很多关于它的安全隐患使用的技巧,包括一些最佳实践。 12:32 好的,那我们这期节目就到这里了,感谢大家的收听,咱们下期再见,拜拜。
续集来了:中国教育的「阴差阳错」真相为什么一个「坏系统」却意外制造了最多AI人才? 00:06 今天来聊聊中国的教育体系,是怎么在看似有很多不利于创新,不利于好奇心的一个环境下,却源源不断为人工智能等前沿领域输送大量人才的。 00:22 这个话题确实挺有意思。 00:25 先说说上一篇文章发出来之后,大家都有哪些比较典型的反馈,以及在这一篇文章当中打算回应哪些核心问题。 00:34 很多人在留言和私信里说,自己就是那个好奇心被慢慢关掉的人。也有一些人对中国的教育到底是不是真的扼杀创造力提出疑问。甚至问为什么硅谷的AI领域里面华人这么多? 00:48 看来这个话题是引发了大家的共鸣。家长们是不是也有很多焦虑? 00:54 有家长半夜发私信说,教育既然会关掉好奇心,那我到底还要不要让孩子去上补习班?所以作者就决定直面这些问题,去探讨下中国的教育到底无意中做对了什么,能够不断的往硅谷输送AI人才。这篇文章的答案可能会比上一篇还要残酷。 一、中国教育:一个「设计挺坑但功率超大」的筛子 01:16 中国的教育的设计挺坑,它是功率超大的筛子。 01:32 把中国的教育比喻成了一个筛子,是那种网眼特别密,功率又特别大的筛子。虽然这个筛子会把很多小石子儿,甚至一些金粉都一起筛下来,但它处理的沙子量特别大,最后留下的金子的总量还是要比那种设计的很合理,但是处理量很小的筛子要多。 二、14亿人口的「暴力筛选」优势 01:55 我们接着来说说这个14亿人口的暴力筛选的优势。对中国这么大的人口基数,在天才的数量上面会带来一个什么样的理论上的可能性呢? 02:07 假设天才出现的概率是1‱,中国有14亿人,理论上就有14万个天才。就算教育系统的好奇心扼杀率高达99%,最后还能剩下1400个天才。 02:28 听起来很夸张,印度跟中国人口差不多。那在这个高强度筛选系统下的人口和最终产生的人才幸存者跟中国会有多大的差距呢? 02:38 印度能进入这种高强度筛选的人口只有中国的30%,天才的基数就变成了42000人。印度的教育又比较宽松,好奇心扼杀率只有50%。剩下的幸存者是21000人。乍一看好像印度剩下的人才更多,但是这就是忽略了一个很重要的点,就是工具箱的差距。 三、中国教育给的「工具箱」有多硬核? 03:00 中国的教育在工具箱上面有哪些硬核的表现呢? 03:05 中国的中小学阶段的数理基础教育是全球顶尖的,经常会有中国的学渣到了美国就变成了数学天才。因为美国的同龄人还在学初中就学过的东西。 03:17 真的是这样的,我身边也有不少人说他们去了国外之后都成了数学家教。 03:22 这就叫数学降维打击。中国学生这种基础训练和欧美普通学校根本就不在一个级别上。而且这个东西你别看它好像是死记硬背,但其实AI研究每天都要用到这些最基础的东西。 03:38 为什么这个死记硬背和对底层逻辑的理解,在学习数理和AI的时候会这么重要呢? 03:45 这里面有一个反常识的洞察,人工智能的大模型它是怎么变得聪明的?就是靠喂给它海量的数据。像GPT4,它是把互联网上的各种文本、代码、论文都吞进去了,它才能能够写诗、编程、推理。没有这些低维度的大量的输入,它是不可能有高维度的涌现能力的。 04:08 所以人脑的学习和这个大模型训练其实是有相似之处的。 04:13 没错,你的高维认知一定是建立在你对这些基础知识非常熟悉的基础之上的。没有学过微积分,你怎么可能懂神经网络的反向传播,没有亲手算过很多次矩阵,你怎么可能直观地理解Transformer的注意力机制。就像你没见过中文的人,不可能写出唐诗一样。 04:36 刷题这件事情,为什么有的人刷着刷着就成了只会考试的机器,有的人刷着刷着就成了能进硅谷的AI研究员呢? 04:44 这个背后的关键在于你是在死记步骤,还是在不断的追问为什么,真正有用的不是你把这个公式背下来,而是每一次做题的时候,都去思考这个公式背后的逻辑。为什么要用这个方法?这两个问题看起来不一样,但他们是不是其实有相同的底层结构,这种不断的去升维思考才是真正能够让你能力跃迁的。 05:07 看来关键是要知其然,更要知其所以然。 05:10 比如说你做一万道导数题,你只是在套公式,那真的就是浪费时间。但你做100道题,你每一次都去思考为什么这个链式法则是这样的。那你就是在锻炼你的逻辑推理的能力。那些最终能在硅谷做AI的人,他们一定是最善于从题目当中提炼出逻辑的人。 05:30 能不能这么理解,就是中国学生在这种反复的训练这些数学基本功的过程当中,到底是获得了一个什么样的认知优势? 05:40 可以这样看,就是有的人他刷了1000道题,他只是记住了1000个解法。但有的人他可能只做了100道题,他就真正的理解了十个底层的逻辑。那这十个逻辑就可以帮他解决未来遇到的一万个新的问题。这就是一个线性增长和指数增长的区别。 05:58 也就是说真的本事不是记住解法,而是能够看穿问题背后的结构。 06:04 是这样的,那些看似枯燥的求导矩阵概率的训练,其实不光是给大脑投喂数据,同时也在锻炼提取逻辑的本事。只有对这些工具无比熟练了,大脑才会有多余的资源去思考更高层次的问题。 06:23 所以为什么很多中国学生一到了这种斯坦福的博士一年级,就能够立刻在创新上面展现出优势呢? 06:32 因为他们在国内的时候已经把这些数学的工具训练了十年,所以他们到了博士阶段用这些东西就跟呼吸一样自然。他们的认知带宽是被释放出来的,他们可以马上就去琢磨这个模型为什么有效,能不能改进,或者说有什么新的方向可以探索。 06:51 听起来就是欧美学生在基础工具这一块儿就消耗了太多的精力。 06:56 很多欧美学生还在适应这个矩阵还可以这么用的时候,中国学生已经在探索新的模型了。这就相当于一个是用10亿tokens训练的模型,一个是用10万tokens训练的模型。对他们的起跑线根本就不在一个平面上。 07:13 死记硬背这个事儿,关键还是要看你背后的目的到底是什么。 07:17 没错,死记硬背本身并不是问题,问题是你是为了考试呗,还是说你是为了将来能够随心所欲的用这些工具去探索未知。这两者虽然动作一样,但是结果是天差地别的这就是工具箱的差距。 四、竞赛体系:体制内的「好奇心避难所」 07:33 下面咱们就来谈谈这个竞赛体系,这个体制内的好奇心避难所。中国的竞赛体系到哪些特殊的地方?为什么这些站在硅谷AI舞台上的华人大佬们大部分都有过竞赛的经历呢? 07:47 这个说起来很有意思,这些华人大佬他们很多都是数学、物理、信息学竞赛出身。其实竞赛在整个中国的教育体系里面是一个很奇怪的存在。因为它不是一个必修课,你完全是凭兴趣自愿去参加的。 08:03 就相当于只有真正喜欢的人才会去学。这就把那些有好奇心的怪咖都挑出来了。 08:10 不光是这样,而且竞赛的题目也没有什么标准的套路,你必须要真正的去理解数学物理的本质才能够做出来。再加上竞赛圈子里面大家比的不是谁更听话,而是比谁的想法更有创造力。就给这些怪咖们提供了一个可以互相激发的环境。 08:32 在高度标准化的教育体制下面,竞赛体系到底是怎么成为那些怪咖学生的一个避难所的呢? 08:40 最关键在于竞赛生他是有特权的,老师和家长对于他们会有更多的包容。比如说你上课发呆,普通学生可能就会被说你怎么不认真听讲。但是如果你是竞赛生的话,老师可能就会觉得他可能是在思考一个很难的问题。 08:57 他们被允许有不同,就给了他们很大的空间。 09:01 包括你偶尔一次考砸了,家长也不会说过度苛责你,反而会鼓励你说你好好准备竞赛就行。在这个体制里面,本来会被磨平的那些怪咖们就可以在这个缝隙里面生存,还可以得到非常扎实的训练。 五、文化因素:东亚式「延迟满足」的双刃剑 09:18 我们来看一下文化因素,东亚式的延迟满足到底有什么特点?在培养AI人才这件事情上面到底有什么独特的影响? 09:29 这就不得不提到一个很有意思的现象,东亚文化对于这种苦读十年是特别能够接受的对。比如说中国的博士周末在实验室,暑假在实验室,寒假还在实验室,凌晨两点还在调模型的参数。这种事情在中日韩都是非常常见的。 09:48 这种投入程度和很多西方的国家比起来简直就是两个极端。 09:52 你想象一下美国的大学生周末都去party,暑假去实习去旅游,大四才开始找工作。他们对于这种苦行僧式的学术生活很难理解,甚至会觉得你这样是不健康的。但在东亚文化里面,这是被高度认可的对这种愿意延迟满足的集体氛围,会让你在这种高强度的AI研究的赛道上面是一个非常大的优势。 10:19 但这种长期的投入,如果孩子本身对这个东西没有热情的话,是不是也是一种煎熬? 10:24 确实,这个就像我刚才说的,它是一把双刃剑。如果说你只是被家长推着走,没有自己真正的兴趣,那这十年对你来讲就是一种折磨。 六、最残酷的真相:这是一个「高效的,挺坑的系统」 10:34 那我们下面要揭开的就是这个最残酷的真相了,就是中国的教育到底是怎么能够高效率的批量的培养出这种顶尖的AI人才的。 10:44 这个问题的答案其实很让人意外,就是中国的教育能够培养出这么多AI人才,不是因为它的体系有多完美,而是因为它的规模足够大,筛选的功率足够猛,它的这个工具箱,也就是数理基础足够硬核。说白了它是一个高效的坏系统。 11:02 这个系统到底在哪些地方特别高效,又在哪些地方最让人觉得无奈? 11:08 高效的地方在于它有14亿的人口做基础。所以哪怕它的这个幸存者的比例只有1%,但它的绝对人数依然是很庞大的。再加上它的数理训练确实是全球顶尖的。还有这个竞赛体系也给那些好奇心特别强的孩子留了一条缝。再加上这种东亚文化里面的延迟满足,让这些最优秀的学生愿意去长期的投入。 11:35 但它的坏处也很明显,就是它会大规模的扼杀好奇心。99%的孩子都会被这个标准化的过程磨平,它只鼓励你去答题,不鼓励你去提问。所以就会出现很多不敢质疑,只会执行的人。然后为了去培养出极少数的拔尖的人才,却让绝大多数的人都失去了探索的机会。 12:00 我们最后要聚焦的这个话题,就特别现实了,就是家长们到底应该怎么去看待孩子的兴趣和这个体制内教育之间的关系。 七、说几句实话 12:10 首先就是数学、物理、编程这些基础的能力是非常重要的。你没有这些工具的话,你就算有再强的好奇心,你也没有办法把它变成一个解决实际问题的能力。但是这些东西本身不是目的,它只是一个手段。 12:26 听你这么说的话,好奇心其实才是最不能丢的火种。 12:30 是的,兴趣才是最重要的。工具你随时都可以补,但好奇心一旦被浇灭了就很难再点燃。如果说你真的要在会做题但没有兴趣和暂时不会做题但充满好奇的孩子之间选一个的话,一定要选那个好奇的孩子。就是千万不要用这个不考这个没用,这个不能当饭吃,这样的话去否定孩子的兴趣。那些最终能够在硅谷的舞台上发光的人,他们的共同点并不是他们的成绩单有多漂亮,而是他们经历了这么多年的这种高压的教育之后,他们对世界的好奇心还依然在燃烧。 13:09 有一些孩子他就是没有那么明确的兴趣,这时候体制内的教育对他们来说还有价值吗? 13:16 其实这个世界上没有那么多一出生就有明确兴趣,并且可以靠兴趣躺赢的人。大部分的孩子其实都是你问他喜欢什么,他也说不上来,然后给他自由时间,他也就是刷短视频打游戏。 13:30 就是说完全靠孩子自己去主动发现兴趣,其实也不现实。 13:34 没错。所以体制内的教育它的一个好处就是它会给你提供一个相对公平的试错的环境,你可以去不断的接触数学、物理、化学、语文、英语。你可能在这个过程当中,就会因为偶尔做对了一道难题,或者说独立的跑通了一段代码,而获得一些正反馈。而这些小小的成就感往往就是你发现自己兴趣的一个起点。 14:03 就是跟着这个体制跑,其实也是在给自己一个找到兴趣的机会。 14:08 对,至少在你没有找到自己的方向之前,把你的基本功练好,把你的工具箱装满,总比什么都不做要好。最可怕的不是说你没有找到热爱的东西,而是你什么都没有尝试,就已经放弃了成长。 14:24 今天我们聊了这么多关于中国教育的优势和弊端,然后也揭开了为什么他能够在这样的一个并不完美的情况下,还可以培养出这么多的AI人才。最后其实我们还是回归到兴趣和基础能力的这个话题上面,就是这两个东西其实是缺一不可的。 14:45 好,那这一期节目咱们就到这里,然后感谢大家的收听,咱们下期再见。
教育已死?但"卷王"们却统治了硅谷AI圈先说一个让人迷惑的现象 00:01 今天想跟大家讨论一个问题,为什么在人工智能领域那些顶尖的人才,他们好像不单纯是靠学校教出来的对,更重要的是他们自始至终都保持着对这个世界的好奇和热情。 00:23 先说说社会上大家对于教育的焦虑,和现实当中AI领域的人才背景是存在一个巨大的反差的。为什么现在家长和专家对于传统教育的批判会变得这么激烈? 00:36 这两年朋友圈里面大家聊的最多的就是教育要完了这个话题。专家们也是一直在强调,死记硬背没用,刷题没用,应试教育要害死孩子。每次有这种讲座都是人满为患,家长们都特别焦虑。 00:52 我身边很多朋友也是一说起孩子的教育就愁眉不展,听了专家和讲座之后就立马行动起来。 00:58 台上的嘉宾会说现在的孩子还在学背公式,AI 1秒就算完了,未来属于有创造力的孩子,不属于考试机器。还有说什么清华北大毕业有什么用,以后都被AI取代。底下的家长就疯狂鼓掌,回家就把孩子的补习班退了,给孩子报一个什么创意思维训练营之类的。 01:19 那为什么现在这个AI领域的华人的顶尖人才,他们大部分都是这种顶尖的理工强校,传统教育体系出来的? 01:28 这个说起来真的很讽刺。就比如说meta花了3亿美元挖了七个中国人,这七个人几乎全部都是清华北大、中科大的本科、MIT斯坦福、伯克利的博士,还有OpenAI最新的大模型的核心团队里面有35%都是华人,并且他们都是这种顶尖名校出来的做题家。马斯克的XAI创始团队,12个人里面有五个是华人,也是正儿八经的体制内科班学霸。 01:56 这跟我们平常听到的体制内教育培养不出AI人才的说法完全是背道而驰。 02:02 这说明现实其实比舆论要复杂得多。我们可能要重新去思考到底什么才是好的教育,也提醒家长和教育者不要被这种焦虑和偏见带了节奏。 一、批评传统教育的声音,并不是完全在胡说 02:16 下面这个问题就是关于这个传统教育在AI时代到底是不是真的有问题?那些批判他的人,他们到底在说什么? 02:24 批评的人主要就是说过去的教育就是一个工厂流水线,把学生都按照一个模子来塑造,让大家变得会背书、会计算,听话照做。这在工业时代是特别有用的。那个时候工厂就是需要大量的这种可以预测的执行机器。 02:42 听起来这种教育模式在现在这个AI时代确实有点过时了。 02:47 因为AI可以比人类更高效去执行这些任务,你再怎么会背公式,再会快速的计算,也没有办法跟AI比。如果说教育只是把人训练成一个标准的执行者的话,那确实是没有什么竞争力,这个批判我觉得是站得住脚。 二、做题,其实是在给大脑装"工具箱" 03:06 那为什么会有人认为做题其实是在给大脑装工具箱? 03:11 做题其实不只是在训练你像机器一样的去执行,更像在帮你的大脑打造一套非常厉害的工具箱。通过做各种各样的数学物理化学的题,通过参加竞赛,大量的去刷题,你慢慢的就具备了一些非常有用的认知工具。 03:30 这些认知工具其实是在AI研究这种前沿的领域里面是必不可少的,是吗? 03:37 没错,就是像结构化思维建模能力,包括线性代数、概率论、微积分这些东西都是在AI的研究当中每天都要用到的一些硬核工具。没有人天生就会的,是教育给你提供了这些原材料,把你的工具箱装满。 三、抗挫能力和延迟满足,不是教育培养出来的 03:56 那为什么会有人说这个抗挫能力和延迟满足并不是教育可以培养出来的? 04:01 他们说你看有小孩儿,可能打这个我的世界,可以连续8个小时一直在搭一个城堡。塌了他就再重来,塌了再重来,没有人催,也没有人给他奖励,甚至他爸妈在旁边说你别玩了,他都不听。完全沉浸在这个失败了再试的过程当中。 04:21 他在游戏里面展现出来的这种坚持和耐心,跟那些拼命刷题的学生也差不多。 04:27 但是关键在于并不是说玩游戏这件事情让他变得有毅力,而是他对于这个事情本身的着迷,让他能够去忍受这种失败。所以没有兴趣作为动力的话,所谓的抗挫能力和延迟满足,要不就是屈从于外部的压力,要不根本就不会出现。 04:47 所以就是说真正的那种抗挫能力,其实是跟热情和兴趣是分不开的。 04:52 是的就是你真正的那种抗错是你在凌晨两点盯着一个失败的实验,结果你内心升起的不是我完了,而是这很有趣,哪里出问题了。这种感觉不是教育能训练出来的,只能从热爱里长出来。 四、那些顶尖AI研究员,其实是"没被教育关掉好奇心"的幸存者 05:08 下面这个话题就是幸存者偏差在顶尖AI人才的成长经历当中的体现。这个二战时期关于轰炸机的统计的故事,跟我们讨论的教育有什么相似的地方? 05:21 当时军方他们想要去加强飞机的防护,他们就去观察飞回来的飞机,发现机翼上面的弹孔最多。他们就想不是要把机翼加固。但是统计学家Abraham Wald就说你们忽略了那些没有飞回来的飞机,机翼中弹多还能飞回来,恰恰说明机翼不是最致命的地方。反而是那些发动机没有中弹的飞机才是真正的关键。 05:50 我们往往只看到了那些表面上成功的例子,而忽略了那些已经被淘汰掉的沉默的数据。 05:57 我们在看这个名校和顶尖AI人才的关系的时候也是一样的。就是我们只看到了那些从清北交付出来,最后在硅谷大放异彩的人。但是我们没有看到的是,同样的这些学校毕业的最后没有在这个舞台上的大部分。 06:13 是不是就是说其实清北这样的学校,他们并没有批量的制造出这种顶尖的AI人才。 06:21 清华每年本科招大约3400人,北大3000人,过去20年加起来数十万人毕业。最后站在硅谷AI领域的顶尖舞台上的,就只有几十个。如果说教育是批量生产的机器的话,比例也太低了。 06:42 所以就是说其实那些最终成名的人,他们在进这些名校之前就已经不太一样了。 06:47 对,他们很多人是从小就参加数学物理竞赛,都是全省全国前几名。这些竞赛就不是高考强制要求的,就是单纯的对这些学问感兴趣,他们在很早的时候就展现出了这种内在的热情,这才是他们真正的特质,不是说他们进了名校后才被塑造出来。 07:08 像那些非常顶尖的AI的研究者,他们自己怎么说?他们的成长经历是不是也能说明这个自主探索的重要性? 07:16 一个很有代表性的例子就是Andrej Karpathy。曾经说过,他最出名的那个教你实现神经网络的课程,是对正规学术教育的反叛式补充。他觉得学校里面讲神经网络讲的太抽象,太割裂,他完全是靠自己才真正搞懂。 07:34 看来他们其实并不完全是靠课堂和老师,更多的是自己主动去追着问题跑。 07:40 还有一个例子就是Ilya Sutskever,他说他在学校里面经常觉得很无聊,觉得标准课程太慢。他真正成长是他开始自己主动的去阅读,主动去提问的时候。他们这些人有一个共同点,他们都有很强的内在的抵抗力。 五、好奇心是人类的出厂设置,教育的问题是把它关掉了 08:02 我们来讨论一下好奇心,它本来是我们人类的本能。教育究竟在扮演了一个什么样的角色?是不是很多时候把我们的好奇扼杀掉了? 08:14 有一个很有趣的实验,哈佛大学的一个教育学家,他叫托尼·瓦格纳。曾经访谈了很多五岁的孩子和很多大学生,他问了他们同一个问题,你最好奇的事情是什么?那些五岁的孩子问题多到说不完,宇宙、恐龙、为什么天是蓝的、鱼会不会做梦?他们的问题多到你都没有办法招架。但是当他问到大学生的时候,大学生往往是沉默,然后会反问这个问题有标准答案吗? 08:44 那种最初的那种对世界的好奇,好像在成长的过程当中被慢慢磨没了。 08:52 每一个孩子生下来都是一个好奇心爆棚的探索机器。教育从来没有培养过我们的奇心。教育在这漫长的12年里面,把我们天生的好奇一点点关掉。 09:07 标准化教育是不是天生就扼杀好奇心? 09:12 确实因为标准化教育它有一个系统性的bug。它永远都在奖励你给出正确答案,而对提出奇怪的问题,他是会惩罚。比如一个孩子在课堂上问老师,为什么这个公式是这样而不是那样?他得到的往往不是一个热情的讨论,而是这个不考先把题做完。慢慢的孩子就会只学会去猜测老师想要什么答案。这是好奇心最快的死法。 09:40 难怪现在很多人越学越没有动力。 09:44 为什么那些顶尖的AI研究员可以一直保持活力?因为他们的好奇心在那个系统里面没有被关掉。可能因为遇到了一个好老师,可能因为家庭环境,也有可能偶然在青春期的时候读到了一本书。或者说就是很幸运,在对的时间遇到了一个让他们着迷的问题。 六、教育到底贡献了什么?一个更诚实的答案 10:15 教育的贡献主要体现在两个间接的方面。第一教育给了他们工具箱。就像我们刚才说的,线性代数、概率论、微积分、算法这些东西都是非常实在的认知工具。没有这些工具,就算再好奇,面对AI的时候也没有办法下手。 10:39 但工具箱它只是材料,不是动力,真正的动力还得靠自己。教育另一个作用它一个筛选场。把那些顶尖的年轻人筛出来,聚到一起,让他们能够互相碰撞,互相激励。 11:05 就像Ilya,她就是在多伦多大学遇到了他的导师Hinton。Karpathy他是在斯坦福进入了李飞飞的实验室。还有很多这种华人的研究员,他们都是在清华的宿舍里面,大家晚上彻夜的讨论。这些偶然的私人的碰撞才是点燃创新的火种。 七、最沉默的大多数:那些被悄悄关掉好奇心的人 11:24 被慢慢的磨掉了好奇心的绝大多数人。他们的命运跟那些成为顶尖AI研究员的人有什么不同? 11:36 那些AI科学家,他们只是极少数的幸存者,他们幸运的保留了自己的好奇心。还有很多人,他们小时候也非常有潜力。但在12年标准化过中,他们慢慢失去了主动探索的冲动。 11:53 社会默默承担的最大的损失并不是那些没有成名的人,而是大量可能本可以改变世界的好奇心被慢慢的磨平。 12:05 这些人最后可能就是成为了一个公司里面很勤恳的程序员,每天解决那些有标准答案的问题。他们从来不会去追问一个为什么,他们的名字我们永远都不会知道,但这才是这个体制最大的代价。 12:21 为什么在这种长期分数和排名压力下,很多人就会慢慢失去主动挑战难题的勇气。 12:30 这就是Carol Dweck那个著名的实验。如果一个人长期处于一个表现导向的环境里面,每次都被评分、被排名,他慢慢就会形成一种固定思维,他会害怕去面对挑战。他觉得挑战就意味着有可能会失败,而失败就等于我不行。 12:50 原来就是说不断的被评价、被比较,会慢慢的磨掉一个人的好奇心和试错的意愿。 12:57 但AI这个领域最需要的就是这种成长性思维。你要不断的去钻进没有人做过的,大概率会失败的方向。 八、AI时代真正重要的,到底是什么? 13:13 在AI时代,能够让人脱颖而出是哪些能力?这些能力和好奇心之间有什么联系? 13:24 最核心的不是你会不会做题,也不是泛泛而谈什么创造力。真正的核心能力有三个,这三个能力都离不开好奇心。 13:35 听起来好奇心才是真正的底层的动力。 13:39 第一个能力是深度理解,就是你要知其然,还要知其所以然。只有真正的对这个问题本身好奇,你才会去追问为什么,而不是只记住一个答案。第二是提出问题,考试考的是回答问题,但未来最值钱的是你能够发现那些真正值得被解决的新问题,这种判断力只能来自于真实的好奇。第三是跨域整合,就是把两个看起来完全不相关的领域结合在一起。这种能力往往是那些兴趣非常广泛,不停去探索的人才能做到的。 八、总结 14:13 教育和个人的好奇心,在顶级的AI人才的成长过程当中,到底分别扮演了什么样的角色。 14:23 这些统治硅谷AI圈的所谓的小镇做题家,他们能够成功的核心并不是做题本身,而是他们始终都保持着对世界对问题的强烈的好奇心。教育只不过是给了他们一些实实在在的工具,以及一个可以和同样优秀的人一起思考的环境。 14:42 所以说教育不是那个点燃火焰的人,教育只是提供了燃料和风枪,真正的火焰其实从一开始就在那里。 14:50 对未知的热爱,在没有答案的时候还愿意继续走下去的勇气,以及那种这个问题值得我花十年的判断,这些全部都是每个人与生俱来的能力。教育能做的最好的事不是培养这些能力,而是不要把他们关掉。 15:08 我们今天聊了这么多,其实就是想要说真正能够让孩子在未来走得远的,永远都是他们对于这个世界的好奇和热情。而保护这份好奇可能才是教育真正的责任。 15:21 好,那就是这一期播客的全部内容了。然后感谢大家的收听,咱们下次再见,拜拜。
比99%的人更会用AI00:01 今天咱们来聊一聊如何通过给人工智能提供更细致的背景信息和采用更巧妙的提问方式,让人工智能成为我们真正的创意和思考的放大器,而不是只给你千篇一律的答案。 00:21 这个话题很有意思,那我们就开始。 00:24 咱们先说说很多人在使用像ChatGPT这样的人工智能工具时,都会遇到一个问题,就是为什么他们得到的结果总是感觉那么套路,那么没有新意? 00:34 是的,这种情况很常见。就比如说有一个朋友他是创业的,然后他就是直接让这个ChatGPT帮他写一个爆款文案,或者说直接让他出一个创业计划。那他出来的东西就是那种模板化的,没有什么新鲜感。 00:47 确实就像在餐厅里面说,随便上点好吃的,大概率就是端上来一个很普通的套餐。 00:54 没错,就是这个感觉明明是一个智能的东西,但是用起来就像一个只会复制粘贴的实习生。对,就完全没有那种让人眼前一亮的东西。 01:03 是的。那为什么有些人就能用人工智能做出很厉害的东西?就比如说海外的个人品牌专家Dan Koe,他是怎么做到靠一个人一个AI年入百万美金的。 01:15 关于这一点,其实他的核心思路就是他从来都没有把这个AI当成一个高级的搜索框。他认为你如果只把它当成一个搜索框的话,那你得到的永远都是一个很平庸的,大家都知道的答案。 01:29 那他是怎么用的?难道是把AI当成员工用? 01:32 就像对待员工一样,你要给他很详细的背景信息,他才能够帮你把事情做好。就比如说Dan Koe,他每次给AI的那个提示词都是500到2000字,但是很多人可能就只写了一二十个字,那这个差距就很大了。 01:46 说到这里很多人可能会有一个疑问,就是我要写这么长的提示词儿,那我是不是反而更累了?这和AI帮我们提高效率这件事情是不是背道而驰了? 01:56 其实这是一个误区,就是这个提示词写这么长,不是说要凑字数,而是要给AI构建一个背景监狱。就是用大量的信息把它框住,让它只能在你的这个非常独特的语境里面去思考,那它就没有办法去说一些车轱辘话,或者说一些很空洞的套话。 02:14 原来是这样,那是不是可以理解为我给的背景越具体,AI就越能产生那种真正贴合我需求的有个性的内容。 02:24 完全正确。你可以把这个背景信息想象成是一副数字外骨骼。就是你给的信息越详细,越有个人特色,这副外骨骼就跟你越贴合,然后它生成的东西就越像是你自己写的。但很多人他就是把AI当成一个老虎机,就碰运气。但是真正厉害的人,他是在训练自己的专属助手。 02:44 好的,有些人可能会说,我也不是很会写这种很长的提示词。那有没有什么比较取巧的方法可以让这个AI自己帮我把这些背景信息补全呢? 02:53 有啊,有一个特别巧的方法,也是Dan Koe也特别推荐的,就是他的那个反向提问法。就是你不再去绞尽脑汁的想说我要怎么去描述我的需求,而是把这个球踢给AI让他来问你。 03:07 这听起来挺有意思的。 03:09 具体要怎么操作呢?比如说你想写一篇关于职场沟通的文章,那你就可以跟AI说,我想写一篇关于职场沟通的文章。在开始之前请问我5到10个问题,来帮助你了解我的写作风格、目标读者和独特的观点。一次问一个,等我回答完再问下一个。 03:27 这个就有点像医生在问诊一样,他不是说马上给你下结论,而是不断的在问你问题,然后来精准的定位你的这个需求。 03:36 没错,而且你这个比喻特别好,这个AI就变成了一个主动的医生,然后他来帮你把脉,帮你分析。那他最后出来的这个方案肯定是更贴合你的实际情况。 03:46 那这个反向提问法,他到底是怎么做到让学习计划或者说让内容变得更贴合每个人的实际情况的? 03:53 举个例子,比如说你直接跟AI说我要学视频剪辑,那他可能就给你一个很泛泛的通用的教程。但你如果用反向提问跟他说我是零基础,你要先了解我的情况再给我出计划。那他可能就会问你,你每天能花多长时间,你是想剪什么类型的视频?你用的是什么设备?你的目标是什么? 04:15 我明白了,就是他通过这一连串的问题,把你的这个独特的条件都收集起来了。所以最后给你的就不是一个大陆货的东西了。 04:23 就是这个道理。看似你多花了一点时间在这个问答上面,但是你最后拿到的这个东西是完全为你定制的那你后面就不用再反复的去改,反而更省时间。 04:34 OK很多人可能会担心说我老是让AI来问我问题,我会不会变得越来越不会主动去思考了? 04:41 其实正好相反,就是反向提问这个东西,它其实是一个锻炼你定义问题的能力。比如说AI问你,你的独特观点是什么?那你就没有办法含糊其辞。你必须要停下来好好的去梳理你自己的思路,然后把它用语言组织出来。这个过程就是在帮你把那些模糊的想法一点一点的变得清晰结构化。所以它其实是在给你的大脑做一个深度按摩。 05:06 懂了,所以反向提问法它的价值不仅仅是在于帮你获得一个更精准的答案,其实它也在逼着你去厘清自己到底想要问什么。那这个专家建模到底是怎么回事?为什么说它能够让AI从一个普通的助手变成一个行业顶尖的教练呢? 05:24 是这样的,专家建模其实是一个非常高级的玩法,就是你可以让AI变成你指定的一个专家,来给你做一个针对性的指导。 05:33 听起来就很厉害,具体要怎么操作呢? 05:36 操作起来也很简单,比如说你想提升你的销售文案能力,那你可以先找到你最佩服的那个销售大师,把他所有的书,所有的文章都喂给AI然后让AI来分析拆解出他的整个方法论和思维框架。 05:51 明白了。那这是不是就相当于你把这个大师的大脑复制了一份。 05:54 可以这么理解。然后第二步更绝,你让AI基于这个方法论来扮演你的私人文案教练。通过不断的问你问题,来了解你的产品,你的客户。最后给你输出的就是一份完全符合这个大师思路的一对一的指导。 06:10 所以专家建模这个方法,它和我们传统的那种套模板的方法到底有什么本质上的区别? 06:16 区别还是挺大的。就比如说你要做一个30天、个人品牌计划,那一般的做法就是直接让AI给你一个通用的计划,那大概率就是一个模板。但是专家建模这个方法,你是先让AI去吃透一个你很认可的专家的整套体系。然后让AI以这个专家的身份,通过多轮的问答,给你量身打造一个30天计划。 06:39 听起来这个就不是在填空了,而是真的在生成一个独一无二的成长路径。 06:44 没错,这个就叫知识建模。就是他是用这个专家的思路帮你搭建起一个属于你自己的知识体系,而不是说给你一个所有人。都一样的东西。 06:53 好的,如果说我把别人的付费课程,别人的方法论喂给了AI,让它来模仿这个专家。那这个在伦理上面或者说在法律上面会不会有一些问题? 07:05 这个问题问得很好。其实这个AI它只是把别人的方法论的逻辑和框架给提取出来了。就像你学钢琴的时候会去模仿莫扎特的指法,你只是在学他的逻辑。但是你弹出来的曲子有没有灵魂,还是要看你自己的理解和表达。 07:21 那就是说AI只是搭了一个架子,真正的内容和风格还是要靠人来注入。 07:26 对,而且Dan Koe他也说过,他用AI来帮他写作,但是所有的核心观点,所有的风格都是他自己的。这个AI只是一个工具,帮他把他的想法放大了而已。 07:39 那什么是原提示词?为什么说它是Dan Koe这个方法论里面的大杀器? 07:44 这个原提示词其实特别有意思,就是它不是让你自己去苦思冥想这个提示词怎么写,而是让AI来帮你生成一个最理想的提示词。 07:52 这么说的话就是我只要告诉AI我想要干什么,然后它就会自动帮我把这个详细的操作说明写出来。 07:59 差不多是这个意思,你就是给AI一个目标,然后让它来问你问题。它会问清楚你的需求之后,自动帮你生成一个非常专业的非常详细的提示词。就相当于你是在教AI怎么来教他自己。 08:13 我明白了。如果说这些原提示词大家可以互相分享,互相买卖,那会不会大家最后写出来的东西越来越像,就没有什么个性。 08:23 其实大家用的底层的逻辑框架可能会越来越像,但是最后决定你内容独特性的还是你给AI输入的那些东西。就像大家都可以用最顶级的相机,但是你拍出来的东西还是取决于你站在哪个位置,你拍什么主题,还有你按快门式的心情。 08:40 所以说真正让一个作品变得独一无二的,并不是AI的这个技巧,而是背后那个人的经历和视角。 08:48 是的,就像Dan Koe他的内容之所以有价值,就是因为他喂给AI的是他自己关于一人公司的独特思考和故事。这个东西是任何一个AI都模仿不来的。 09:00 OK. 我们今天聊了这么多,其实就是在告诉大家,AI它不是一个什么都能给你现成答案的魔法盒子,它更像是一面镜子。会把你自己的深度、你的个性、你的视角全都给你照出来。 09:15 没错,今天的内容咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。
造AI的大佬们,正在这样教育自己的孩子00:16 今天咱们要聊的是那些在人工智能领域最顶尖的专家,他们是如何看待AI快速发展的这个时代。然后他们又是怎么去帮助自己的孩子去准备一些在未来更重要的真正的核心能力。 00:31 是啊这个话题我觉得特别有意思。 00:33 那我们就直接开始。我们先说说AI领域的这些领军人物,他们对于自己孩子的未来到底是一个什么样的态度?他们给孩子的那些建议跟我们大多数家长的想法有什么不一样? 00:46 其实最近华尔街日报采访了五位在AI领域非常有影响力的人物。他们的孩子其实年龄跨度也非常大从6个月到26岁都有。这些人他每天都在推动AI的进步。但是当他们谈到自己孩子未来的时候,他们都表达了同样的一种情绪,就是——担心但是不恐慌。 01:06 他们担心但不恐慌,这个其实挺让人意外的。 01:09 对,他们的建议完全打破了大家的常规认知。这不是说像我们想的,赶紧去学编程什么之类的,他们更强调的是一些很难被AI替代的能力。 01:21 下面我们讨论的是Daniela Amodei他是怎么看待这个问题的。对她其实在业内是非常有名的,她是Anthropic的总裁和联合创始人。这个公司在AI领域里面是非常有自己的特色的。 01:36 是的,她是Claude这个项目背后的关键人物。然后她和她的团队其实最早都是在OpenAI他们2021年的时候集体离开,然后专门成立了Anthropic。他们的目标就是要做安全可控的AI所以他们也一直被称为是AI界的良心企业。 01:53 他们这个公司的目标和理念确实很吸引人。那他们在业内的影响力怎么样? 01:58 Claude不光是以有理礼貌著称,在安全和伦理上面也非常的严格。现在已经估值400亿美元了,而且他们的投资人里面有google和亚马逊这样的巨头,很多现在大家在用的一些AI的产品,其实底层都是用的Claude的技术。 02:14 既然Daniela Amodei这么强调AI的安全性和可控性,那她认为在未来孩子们最应该具备的能力是什么? 02:22 她觉得无论AI怎么发展,人类最核心的一些品质是没有办法被替代的。就比如说跟人建立关系的能力,共情的能力,以及怎么去跟别人好好相处。 02:33 这么说的话,她是不是觉得像沟通能力和善良这些东西反而会变得更重要。 02:39 没错,她非常坚信随着AI越来越主导职场,这些软技能会成为真正的稀缺资源。她甚至说人类最终还是喜欢彼此陪伴的,如果缺少这种互动,我们会变得不快乐。 02:52 这个说法还挺有意思的那在Daniela Amodei看来,未来哪些人类的能力是AI永远没有办法学会的。 02:59 她觉得AI可以很轻松的去写代码、做设计,甚至是写一份非常漂亮的报告。但是像安慰别人、鼓励别人、真正的去理解别人的感受,这些事情是AI做不到的。 03:12 所以她是不是觉得未来最吃香的可能不是那些技术能力,而是跟人打交道的能力。 03:17 她其实有一个非常形象的比喻,就是说当你的爸爸开了快递公司,他反而会告诉你说不要只学怎么送快递,而是要多花时间学会怎么跟你的客户聊天。因为当所有的技术活都被AI接管了之后,最后能够胜出的一定是那些最能够展现人性的人。对就未来你的简历上可能最核心的竞争力是你很会安慰人。 03:42 下面我们来看看Caroline Hank,他在企业软件这个领域其实也是非常厉害的一个人。然后他对于自己的孩子想成为一名职业足球运动员这件事情他是怎么看的?他怎么看待职业选择和未来技能的? 03:56 Caroline Hank是SAP的全球AI总监,这个SAP其实是一个企业软件领域的一个巨无霸。虽然说我们可能平时都没有听说过,但是全球77%的交易收入都是要经过他们的系统的。包括世界500强里面有87%的公司都在用他们的产品。然后市值也超过2000亿美元,是欧洲最大的一个软件公司。 04:19 听上去就感觉SAP真的是无处不在。他儿子想当足球运动员,他怎么看? 04:24 他儿子的理由还蛮有意思的,就是他觉得足球是一个面向未来的职业,因为永远都不会有人愿意去看机器人踢球。然后Caroline Hank其实也认同这个观点,他觉得真正重要的是你要能够敏捷地去适应变化。技术可能两年就会过时,但是你批判性思维,你适应的能力,还有你的伦理判断,这才是你最应该去努力的方向。 04:49 说到这儿,为什么有人会觉得像足球运动员这种职业是很难被AI取代的? 04:56 因为大家看足球比赛,其实不光是看这个球进了没有,更多的是看球员们在场上的那种情感的碰撞,他们的热血,他们在关键时刻的那种戏剧性,这些东西都是机器人没有办法复制的。 05:10 原来是这样,就是说真实的肉身体验和情感共鸣才是这些职业的价值所在。 05:16 没错,体育它的本质就是人和人之间的身体对抗和情感的连接。所以像这种理发师、按摩师、健身教练这些需要你真人在场,然后需要你跟人有温度的互动的这种职业,反而比那种坐在办公室里面的白领要更能抵御AI的替代。 05:35 是的,我们再来看看Jaime Teevan他在微软以及AI领域里面到底有多大的能量。 05:42 Jaime Teevan是微软的首席科学家,微软大家都知道是从windows到office到xbox到LinkedIn,几乎所有你日常使用的东西都离不开微软的产品。然后他们在2019年的时候给OpenAI投了100亿美元,现在已经成为了这个AI领域里面最有话语权的公司之一。而且微软的市值已经超过3万亿美元了,是全球市值最高的公司之一。 06:06 这么看微软确实已经渗透到我们生活的方方面面了。那他们在AI战略上面有什么特别的吗? 06:12 他们的打法非常直接,就是把ChatGPT嵌入到所有他们的核心产品里面,包括Bing包括office,包括windows。所以你在使用各种AI工具的时候,其实背后大概率都有微软的技术在支持。 06:25 话说回来,Jaime Teevan有四个儿子,他会给他们不同的建议吗? 06:29 他其实有一句玩笑话,就是说他在拿他们做AB测试。但是实际上他给每一个孩子的建议都是一样的,没有说区分对待。 06:38 看来他还是相信有些原则是对所有孩子都适用的。 06:41 而且他自己也说,他觉得老一辈的人总是容易把对自己的焦虑投射到孩子身上。但是孩子的优势就在于他们可以直接拥抱新的东西,不用像大人一样要挣脱旧的观念。所以他给孩子的建议就是要多去玩儿,多去尝试,多去体验,然后要学会怎么去使用AI模型,而不是说你一定要会去开发一个AI模型。 07:05 这还没有看来未来那些最不容易被AI替代的工作会有什么特别之处。 07:11 他特别强调批判性思维和深度思考的能力,他觉得这个是没有办法速成的。而且他也很看重传统的博雅教育,他觉得这是非常关键的。 07:22 所以他是不是也认为像责任感这种东西是人类独有的是AI永远没办法取代的。 07:28 他有一个孩子是对会计感兴趣,然后另一个孩子是在念法学院。他就说虽然说AI可以给出很多建议,分析很多东西,但是最终你要为这个结果去负责任的只能是人类。所以像法官、医生、CEO这种需要你承担决策后果的岗位,是永远都需要人类来把关的。 07:49 说的没错,那Ethan Mollick他是怎么通过自己的教学和研究去推动AI在商业和教育领域里面的应用的呢? 07:57 他是宾夕法尼亚大学沃顿商学院的教授,他一直专注的AI怎么去变革工作和教育。他的那门课AI在商业中的应用非常受欢迎。然后他在LinkedIn上面关于AI的一些文章,经常都是有几十万的浏览量。 08:13 他在这个AI教育领域里面还挺有影响力的。 08:16 是的,他还被称为是AI教育革命的先行者。因为他很早之前就要求他的学生必须要使用AI来完成作业。他自己虽然不研发AI但是他一直在教大家怎么去利用AI这个工具,让普通人也能够真正的去掌握AI的力量。 08:33 Ethan Mollick为什么会特别强调要让孩子去坚持一些需要长期投入的事情呢? 08:38 他的核心建议就是要让孩子去选择那些需要持续付出的活动。比如说学习演奏一种乐器,或者是说长期的去训练一项运动技能,又或者是说深入的钻研一个学科,然后包括去经营一段友谊。 08:54 听起来他是在让孩子去对抗这个AI时代什么都可以速成的这个诱惑。 08:58 因为现在有了AI之后,写文章、做设计,甚至是学习一些知识都可以非常快速的去完成。但是真正能够让你成长的,像专注力、耐心、深度思考这些东西是没有办法一蹴而就的对,必须要靠长期的坚持和积累。 09:16 那Ethan Mollick为什么会把“元认知”技能看得这么重要? 09:20 他觉得在AI时代,像灵活性、适应性、实验精神,包括批判性思维,还有质疑现状的能力,这些“元认知”技能才是最重要的就是你要学会如何学习,学会如何思考。 09:34 这么说来,这些其实都是AI没有办法教给我们的东西。 09:38 没错,AI可以给你答案,但是他没有办法教你如何去提出一个好的问题,也没有办法告诉你这个答案到底可不可靠。然后在面对一个非常不确定的情况的时候,如何去做决策,包括怎么去快速的适应一个全新的环境,这些东西都只能靠你自己不断的去训练。 09:57 好的,我们刚刚聊了那么多,那这五位AI大佬,他们对于未来到底有哪些能力是AI没有办法取代的,他们有哪些共识? 10:06 第一个达成共识的就是适应能力比你现在手头的这个技能要重要得多。因为技术更新太快了,可能你今天学的东西两年之后就没有用了。但是你持续学习的能力是永远都吃香的。 10:20 看来死磕一门技术确实是不够的对。那除了适应能力,还有哪些能力是他们认为非常重要的? 10:26 还有就是人性化的技能,比如说共情沟通,真正的去和别人建立关系,然后包括你的善良,这些东西是AI没有办法学会的,或者说即使他学会了,人们也不会买账的。 10:37 明白了,除了人性化的技能,还有什么是他们认为AI无法替代的。 10:42 承担责任的能力和一些需要真人的肉身体验的工作,就是AI可以帮你做事,但是他没有办法替你负责。所以真正需要拍板做决策的岗位还是得要人类来。包括理发、按摩、表演这些需要你身体在场,然后需要你传递温度的这些职业,也是最不怕AI的。 11:05 我们今天聊了这么多关于AI时代我们应该如何培养孩子的一些思考。其实大家都在说与其去焦虑AI会抢走哪些工作,不如现在就开始帮助孩子去练就一些没有办法被算法复制的能力。 11:20 好了,这一期播客我们就到这里了,感谢大家的收听,我们下期再见,拜拜。
春晚机器人练武火了!但你不知道它们为此摔了3000次春晚机器人练武火了!但你不知道它们为此摔了3000次 00:01 今天我们要聊一聊那些在春晚上大放异彩的武术机器人。它们背后其实是有很多非常复杂的工程整合的难题。而且他们也是通过无数次的摔倒,才能够最终站在这个舞台上,为我们带来这样精彩的表演。 00:22 没错,这个背后的技术挑战还是非常值得聊的那我们就直接开始。 00:26 我们先来说说这个机器人武术的整体的难度和它的技术的框架。为什么很多人会觉得机器人打拳好像就是播个动画,其实它背后到底有多复杂呢。 00:37 说来就话长了。很多人以为机器人练武就是把动作录进去,然后播放就可以,但其实远没有那么简单。像宇树这种人形机器人,它能够完成这些武术的动作,是因为它集成了机械设计、自动控制,还有运动算法以及复杂的工程整合这一整套的技术,就像是机器人的一个内功心法一样。宇树也专门发了他们的机器人训练的幕后视频,真的是每一步都非常的不容易。 01:06 说到这儿我就想问了,为什么像马步、弓步这种看似很基础的动作,对机器人来说其实是最最难的? 01:14 对人来说,蹲马步主要靠肌肉的微调以及平衡感,但是机器人要维持一个马步,它得不断地计算自己的重心,然后同时控制好多个关节的力矩,还要时刻防止他的膝关节或者是踝关节因为过载而摔倒。所以简单来说,人蹲马步会累,机器人蹲马步会直接一屁股坐地上。 01:35 我还有个疑问,像单腿支撑、踢腿、跳跃和翻转这些动作,机器人做起来又有哪些更棘手的难点? 01:44 其实单腿支撑和踢腿对机器人来讲是非常难的,因为他单腿站着的时候,既要时刻维持自己的动态平衡,还要去预测自己身体的惯性,然后通过支撑脚去不断的实施调整力量。工程师经常会说,我这就像要让一根会动的棍子永远不倒一样。 02:04 听上去就比想象中要复杂的多。 02:06 是的,更难的其实是跳跃、旋转、翻转这种动作。因为机器人它只要一离开地面,它就没有办法再去控制自己的身体了。它只能在起跳的那一刻计算好,然后在空中做一些有限的调整,落地的时候还要承受好几倍于自己体重的冲击力。所以这就是为什么机器人要学会翻跟头,它只能依靠动力学模型反复的仿真训练以及无数次的摔倒。 02:33 还有一个问题,为什么机器人集体表演比solo要难搞? 02:37 因为集体表演不光是每一台机器人要把自己的动作做对,几十台机器人还要在时间上同步,运动轨迹一致,而且它们之间的通信还要非常的稳定可靠,不然的话就会看起来像广场舞一样各跳各的,完全没有那种整齐划一的震撼感了。 02:56 原来是这样啊。那机器人的硬件设计,也就是筋骨皮这一块,它的关节电机要怎么去实现既能够输出非常大的力量,又可以做到非常精细的动作。 03:08 这就不得不提到现在的人形机器人,它一般都用的是无刷电机,配合高精度的减速器以及力矩控制。这种配置既可以让它瞬间爆发出很大的力量,又可以让它做出很细腻的动作。就好比是它同时拥有了举重冠军的力气和舞蹈演员的那种控制力。 03:28 明白了。那机器人是靠哪些传感器来保持自身平衡不至于摔倒的呢? 03:34 一般来说核心的传感器有IMU,就是用来检测机器人的姿态和加速度的。然后还有编码器用来记录每个关节的角度以及足底力,传感器用来感知地面给它的反作用力。这些传感器会一起告诉机器人它自己的身体状态是什么样的。比如说它是不是快要摔倒了。 03:55 那机器人的腿部结构在材料的选择上面有什么讲究吗?还有它的续航能力怎么样? 04:00 腿部的话它必须要既轻盈又非常的坚固,还要有很好的抗冲击能力。所以一般都会用铝合金、工程塑料或者是一些复合材料,而且这些材料的配方往往都是各家公司的秘密武器。至于续航,其实机器人之所以只能表演很短的时间,就是因为现在的电池的能量密度比起我们人类吃一顿饭所获得的能量还是差的非常远的。 04:26 好吧,下面我们来说说机器人的这个大脑和小脑,也就是它的控制算法。你能给我们讲讲机器人是怎么利用模型预测控制和全身动力学控制来实现这种动态平衡的吗? 04:38 其实动态平衡的关键就在于控制系统会以每秒数百甚至上千次的频率不断的去计算和修正机器人的姿态。它其实一直在问自己,如果我再歪一点会不会倒?它会通过模型预测控制加上全身的动力学控制,来保证自己不会摔倒。 04:56 这么说来机器人那些看起来非常流畅的动作,其实都是靠提前规划好的吗? 05:02 没错,机器人能做出流畅的动作,并不是说它真的会武术,而是工程师提前给它设计好了非常平滑的轨迹,然后控制器会非常精确的去追踪这个轨迹。其实这就跟自动钢琴是一样的,它只是在复现一个编好的程序,而不是说它在现场即兴发挥。 05:21 还有一个问题,在仿真环境里面训练机器人做这些动作到底有哪些好处? 05:27 好处就在于工程师可以让机器人在虚拟的世界里面反复的去尝试,反复的去摔倒。即使摔倒几百万次也无所谓,反正也不需要去修它。但是你要知道,真正的舞台表演还是要把学习到的东西和精心的编排以及精准的控制结合起来的。他并不是说完全让机器人自己去发挥。 05:48 那如果是好多机器人一起表演的话,怎么保证他们能够配合的那么整齐? 05:53 这就需要通过非常精确的时间同步,然后有一个中央的调度系统,通过统一的控制和无线通信来指挥他们。其实这个原理跟无人机编队是差不多的。但是地面的机器人会更难一些,因为他们还要处理与地面的接触力和摩擦力,这个就比空中的机器人要复杂很多。 06:12 既然说到了多机器人协作,那咱们来谈谈这个系统整合的难题和现实的挑战。为什么说真正让机器人能够在春晚这样的舞台上面进行全国直播的表演?其实最大的难点并不在于单个技术,而在于整个系统的整合。 06:28 因为你想机械结构、控制系统、软件算法、通信模块这些东西全部都要在现场一次性的稳定的跑起来。这个难度是远远大于你单独去攻克某一个技术难题的。所以工程师在直播的时候比机器人还要紧张,因为每一个环节都不能掉链子。 06:47 所以说现在的机器人武术表演跟大家想象中的自由发挥到底还有多大的差距。 06:53 实际上现在的机器人它只能在非常平整,事先布置好的场地上面去做一些已经设计好的动作。它离在街头随随便便打一套太极拳还有很长的路要走。但是话说回来,五年前大家也都觉得机器人翻跟头是天方夜谭,所以谁知道未来会怎么样呢? 07:13 确实然后咱们来聊一聊机器人武术的这个艺术和浪漫的气息。就是这些机器人在春晚上面的表现,有没有让你觉得机器人的运动其实也可以很有艺术感? 07:24 我觉得他们已经用行动证明了一堆金属和代码也可以跳出非常优雅的舞步,这本身就已经很接近艺术了。而且工程师们常常要在深夜一点点的去微调参数,比如说把这个值从0.12调到0.11,就只为了让机器人落地的那一下看起来更轻柔。这种追求极致的浪漫其实是非常打动人的。 07:48 OK, 我们今天聊了这么多关于春晚武术机器人背后的一些技术细节,从硬件到算法,从摔倒到舞蹈,每一步其实都藏着工程师们无数的心血和浪漫。 07:59 这就是本期播客的全部内容了。然后感谢大家的收听,咱们下期再见,拜拜。