

【直播回听】Maven计划:特种部队部署和应用(四)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 Cukor向Planatir的高管解释了他的愿景,人工智能应当进入情报处理的每一个环节。最重要的是,他认为这项工作不应当由军方内部机构承担,而应当以商业机构为主,充分发挥硅谷企业的速度优势。Cukor介绍说,Maven计划已经有了算法,完成了概念验证。但它还不是一个方便使用产品,硬件笨重,界面不友好。Cukor希望Palantir能够设计出一个友好的界面,情报需要在地图上呈现准确位置,并且和其他来源的信息联系起来。友好的用户界面能够建立信任,让前线部队愿意使用。Cukor同时还安排了Anduril在内的三家公司同时制作原型。但Palantir是唯一一家Cukor亲自到场说明的承包商。 促成Palantir接受Cukor提议的主要动机并不是对行业前景的看法,而是Palantir当时处境不佳。2016年他们起诉陆军的案子胜诉了,但胜诉显然不会改善公司和军方的关系。Cukor联系Palantir时,他们和海军陆战队的合同已经结束,本来就没有海军的合同,空军业务非常少。在国防部看来,一旦阿富汗和伊拉克战事结束,所有人都会停止和Palantir合作。军方认为Palantir的行为过于傲慢,不像是承包商。
【直播回听】Maven计划:美国如何将AI用于军事(三)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 算法识别的一项优点是能够在地图上实现跟踪,不仅跟踪当前的行动,还可以从保存下来的过去视频中识别同一个对象,复原目标对象之前的行踪,用于建立规律。他们发现,伊斯兰国武装人员制作简易爆炸装置后,用驴子运输队来运送这些装置物。Maven从无人机发回的视频中寻找驴队移动和汇合的规律,他们看不到驴子身上驮的是什么,但逻辑分析告诉他们,有些驴队运送的正是爆炸装置。 因为驴队总是由人工管理的,打击这样的目标可能会伤害平民。通常情况下指挥官不会贸然决定,因为伤害没有武器的平民是战争罪行。凑巧的是,在这一地区,伊斯兰国活动非常活跃,因此上级给予当地指挥官自行决定打击对象的权限。地狱火导弹击中目标后,一些驴子滚下山坡,发生了二次爆炸,证明驴队运输的的确是爆炸装置。在美国本土,国防部官员很想象他们用昂贵的英伟达的芯片来锁定驴子运输队。
【直播回听】Maven计划:美国如何将AI用于军事(二)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 “早餐俱乐部”中没有情报官员,反映军方的偏见。Cukor的本职是情报,但国防部想要的不只是情报,而是作战工具。Cukor认为,国防部忽视了人工智能在情报工作中的前景,这是整个军队中最适合采用人工智能技术的部门。传统上,因为情报不准确不及时,只能由指挥官制定作战计划。如果前线能够获得及时准确的情报,就可以在情报处理的同时发起打击,极大地提高作战效率。 Cukor据此提出一项将情报和作战相结合的设想,以无人机拍摄的视频为基础开发情报平台,综合来自不同渠道的信息,快速分析,形成目标识别和打击建议,包括应当何种弹药和工具。不再依赖人眼盯着视频分析,直接生成一个有识别和跟踪功能的目标锁定工具,简单精确。 Cuko提出这一设想的时机很重要。美军从2001年开始使用无人机,2016年的预算是30亿美元。无人机拍摄了大量视频,可以播放80年,然而美军无法有效利用这些视频。尽管制定了视频标准,然而这些视频分散在不同部门,难以及时处理和共享。Cukor认为,AI技术可以用来处理、搜索和发布这些视频信息。 在伊拉克摩苏尔,美国空军每天要安排五名人手24小时监控无人机视频,他们要将在视频上看到的信息,比如发现有人或车辆活动,标记在数字地图上,然后上传标记过的地图,让所有的人可以共享。这些工作繁琐、重复、打击士气,应当用算法来完成。算法不光可以及时发现和识别,还能记住这些对象和活动并且做出推理,找出模式,进行预测。 Cukor的想法在早餐俱乐部得到好评,国防部长副部长Work也表示赞同。Cukor提出5年5亿美元的预算,Work让Cukor设法制作一个原型产品。
【直播回听】Maven计划:美国如何将AI用于军事(一)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 2026年,彭博社记者Katrina Manson出版了Project Maven,是目前关于美国AI军事应用最有影响力的一部作品。纽约客杂志评论说,科技记者关于委内瑞拉和伊朗军事行动的报道几乎与现实毫无联系。重要的不是人工智能在作战行动中造成的结果,而是美国军方如何接受将人工智能纳入作战系统,和单纯的技术方案相比,这需要国防部长和军队系统发展新的组织能力,支持实现技术应用的进步。Manson这本书的副标题是“一名海军陆战队上校,他的团队和AI战争的黎明”。在这个意义上,Maven计划是一个内部创业的故事,只不过以国防部和人工智能技术为背景。 人工智能的军事应用呈现两个主要特点。第一个特点是军方在技术和认识上的落后。历史上,军方曾经是技术的引导者,典型的如卫星和空间技术,半导体,互联网和材料科学都是军方投资产生技术成果之后扩散到企业界的,这主要是因为政府资金实力比较雄厚,敢于承担风险,其中最典型的就是DARPA的角色,在企业界之前进行投资。然而人工智能没有遵循这一路径,它是由私人企业发展起来的,投资基本上来自私人,不需要政府支持,主要用户和使用场景都不是军事性的。和硅谷企业相比,军方在人工智能领域既缺乏资金也缺乏人才。如果硅谷企业不合作,军方甚至无法获得最先进的技术。 第二个特点是人工智能和之前作为技术创新代表的软件和网络服务不同,它对战场的影响更加直观、迅速和规模化。军队信息化工作已经有很多年,但信息化的产出通常比较复杂,难以理解。人工智能应用极为直观,在视频所呈现战场画面中,用方框围返回工人就是目标,锁定Targeting就是人工智能为作战所提供的关键功能。在锁定背后,是Palantir这样的承包商提供平台部署,Anthropic等公司提供的大模型。
【直播回听】Waymo:慢企业的竞争优势(十)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 在出租车市场上,Waymo最受哪类用户欢迎?公司自己的判断是那些不方便自驾的群体。比如不愿意在路上浪费时间的白领,他们希望不受打扰工作或开会。另一类用户可能是老年人,因为他们不愿意依赖他人帮自己开车。Waymo希望和出租车公司形成错位,也和汽车厂商形成错位,服务于不追求驾驶乐趣或无法享受驾驶乐趣的人群。然而第一批Waymo的重度粉丝却来自事先意想不到的用户群。 2024年,凤凰城的家长圈爆发了一场争论,能不能允许小孩独自乘坐Waymo。争论的起因是越来越多的家长让不满18岁的孩子独自搭乘Waymo,尽管Waymo APP政策本来是不允许这样做的。有家长批评说,将孩子交给机器人照看是不负责任的。如果父母没有时间接着,至少应当让孩子乘坐人类司机驾驶的出租车,比如Uber。如果遇到意外,至少有成人在场帮助。赞同的家长指出,Uber的服务质量不稳定,反而是Waymo更让人放心。 Waymo的优点和缺点与同一样因素相联系,车上要不要有陌生人?选择Waymo的家长认为无人驾驶更让人放心,还可以培养孩子独立性。无人驾驶伤害乘客的可能性更低,行为的可预测性更高。如果社会规范因此改变,未来可能出现的极端情况是不再允许人类司机开车接送孩子。
【直播回听】Waymo:估值缩水80%和安全性叙事(九)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 2018年10 月 30 日,加州车管所向 Waymo 颁发了完全无人驾驶测试牌照。Waymo可以合法在加州公共道路上测试没有安全员的无人车,Waymo是全美第一家获得这项执照的企业。从2014年要求必须车上有人,到2018年允许真正的无人驾驶,Waymo实现了一次重大跨越。然而 11 月底,媒体发现Waymo又将安全员放回了驾驶座。Waymoi当时还在申请其他地区的无人驾驶许可,愿意付出额外的代价来避免事故。12 月初,在亚利桑那州凤凰城郊区,名为 Waymo One 的无人驾驶出租车付费服务正式开始运营。在这里,Waymo同样采用了相对保守的测试方法,很多行程配有安全员。2019年7月,加州批准Waymo可以在无人驾驶载客。11月,经过一年时间,Waymo在凤凰城的运营车辆取消了安全员。此时,这项服务还是受限的。直到2020年10月,才向公众开放商业服务。 Waymo在安全性问题上如此小心谨慎,很可能是为了融资做准备,希望避免意外事件破坏估值。新冠疫情发生后,人们希望尽量选择避免社交接触的服务,这对无人驾驶是一个利好。2020年3月,Waymo融资22.5亿美元,5月,再次融资7.5亿美元,将无人驾驶业务扩大到卡车服务,投资人包括银湖资本,加拿大养老金计划投资委员会,穆巴达拉投资公司。据说公司估值为300亿美元,尽管比2-015年的45亿美元有了6倍的增长,然而严重低于内部的期望。2018年,摩根斯坦利曾经对Waymo给出1750亿美元的估值,其中无人驾驶出租车业务估值 800 亿美元,无人驾驶物流服务估值 900 亿美元。 由于无人驾驶出现严重事故,迫使监管当局采取更严格的审查,技术落地前景变得悲观。行业领袖如马斯克曾经预测到2020年将会有数千辆无人驾驶车行驶在道路上。此时Waymo车队的规模已经有600辆,但能够在凤凰城进入商业运营阶段的车辆为数很少,其他公司的数量更是微不足道。投资者意识到,大规模无人驾驶部署的时间可能会非常长,加上Waymo采取极度谨慎的做法,其估值遭遇严重下挫。
【直播回听】Waymo:Uber的追赶和意外翻车(八)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 新任CEO Krafcick做出的最重要的决定是停止萤火虫的开发。温和的说法是retire,也有一种说法是Kill。资源是有限的,Waymo应当专注于无人驾驶专用技术,包括导航软件和激光雷达等硬件技术。车辆制造并不是无人驾驶技术的核心,是可以放弃的。2016年5月,Waymo宣布订购100辆克莱斯勒Pacifica油电混合车。Waymo放弃了造车路线,改为购买汽车厂商的现有车辆进行改装,延续至今。放弃萤火虫,意味着辛辛苦苦开发的整车技术失去了落地的机会,开发所投入的时间和资金都变成了沉没成本。 这项决策的一个结果是Waymo车辆不再追求独特的外观,Urmson认为柔和的外形可以减弱公众对无人驾驶的防御心理,Krafcick则认为无需担心,公众接受与外观关系不大。今天来看,Krafcick的看法是有道理的。Urmson在追求柔和外观时肯定做过消费者调研。很难想象当初Krafcick为什么会有这样的先见之明。 Waymo的车辆一律来自购买汽车厂商的现有产品,外观上和普通汽车差别不大,内部设施同样做出妥协,不再采用无方向盘和踏板等超前设计,将无人驾驶汽车变成加载Waymo软硬件栈普通汽车。Waymo变得中庸,这种态度一直延续到今天。
【直播回听】Waymo:无人驾驶还是智能驾驶(七)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 2013年初,车夫项目开始测试高速公路版无人驾驶技术,第一批测试人员是Google自己的员工。要求只能在高速公路上使用无人驾驶模式,离开高速公司就必须人工接管。车夫项目设计的接管缓冲时间是6秒钟,车辆行驶时必须保持注意力集中,随时能够接管。测试过程比较顺利,没有发生事故。车内安装了监视镜头,用来记录驾驶者的行为。供技术分析使用。监视团队检查录像时惊恐地看到大量的违规行为,许多人在开车过程中违反了保持注意力的要求。有人拿出笔记本电脑工作,有人看电影,有人在化妆,这些都是危险动作。有一个人睡着了27分钟,车辆的速度是每小时72公里。 测试结果表明,由于需要人类司机配合,无人驾驶技术作为辅助驾驶工具存在严重隐患。解决方法之一是设法提升司机的注意力,这方面有很多办法。但还有另一种可能。一些项目成员认为,他们加入车夫项目是为了开发比人类司机更好的驾驶技术。既然需要人类接管,至少在表面来看,智能辅助驾驶是将人类驾驶行为作为上限。参加测试人员会犯错误,未来的顾客也是一样。看来有问题的不是顾客,而是违反人类行为习惯的接管要求。能不能放弃人类驾驶员接管,做到彻底的无人驾驶? 这是车夫项目二期做出的一项最重大的选择。放弃智能驾驶技术路线,专注于无人驾驶。这项决策的时间比测试更早,2012年12月,Urmson已经做了内部宣布,测试的结果只是证明了决策的逻辑前提。竞争也是影响因素,他们听说德国汽车厂商正在开发供类似的智能辅助驾驶。车夫项目将陷入拥挤赛道,缺乏超越性的优势。此时车夫团队已经知道无人驾驶必须做得比人类驾驶更,但他们还不知道需要好到什么程度。
【直播回听】Waymo:电动汽车、共享服务和无人驾驶(六)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 通用汽车破产后,Burns辞去了他的工作。2009年,哥伦比亚大学经济学教授、地球研究所所长Jeff Sachs邀请Burns主持一个研究计划,名为可持续运输项目。Burns认为市场上已经存在可持续运输的条件,未来的产品和服务形态应当是电动汽车、共享用车和无人驾驶之间的组合。 在另一项计算中,他们估计,共享车队只要服务城市出行中的10%,就可以实现高利用率、低空驶和快速响应。10%,这是共享车辆实现商业价值所需要的市场占有率。他们估算共享车辆的总成本为每英里0.2美元,比传统方式节省1.3美元,换算为金额是3.9万亿美元。 在向Google创始人介绍研究成果时,他重点讨论了无人驾驶出租车服务赢利点的车队规模。10%的市场份额就已经足够,并不需要很大规模,完全可以从一个小城市起步。
【直播回听】Waymo:“妈妈看我,不用手开车”(五)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 车夫团队需要克服一项主要技术挑战是图像识别,比如行人的特征,特别是两条腿移动作为识别特征,其他包括宠物的运动特征、自行车、滑板、轮椅、儿童车。最难的图像识别是交通警察的手势。在图像识别基础上,车夫团队开发了行为引擎,用于判断对象的行为趋势。例如,前方道路变窄,右侧车辆可能会加速,无人驾驶预见这种可能,就会减速避让。右侧有一辆自行车,前方有一车辆临时停车占用道路,自行车会进入无人驾驶车辆前方道路,需要提前减速。在路口识别成年人和儿童的基础上,计算机会判断成人将遵守交通规则,而儿童可能不会。行为引擎可以做到每秒钟完成10到20次预测,配合每次预测间对象行为或姿态的改变,能够做出更加准确的预测。在一些特定场景下,频繁预测是很有用的,比如信号灯由黄转绿时,横向车道上的自行车可能出发,即使看到红灯,也不会停止或后退。
【直播回听】Waymo的诞生:无人驾驶从DARPA到Google(四)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 Google不是传统企业,佩吉想要的是能够改变世界的技术。Google没有提出具体的产品目标,而是为团队设置了两个里程碑指标。一是距离,要求在公共道路上累计完成10万英里无人驾驶里程。二是难度,两位Google创始人在加州挑选了10条路线,总共1000英里,要求Thrun团队在这些路段验证无人驾驶技术。有些路段难度相当大,有一条路线经过旧金山伦巴弟街,是当地出名难走的路段。如果按时完成挑战,团队将获得丰厚的奖金。 Thrun回忆说,佩吉和布林亲自挑出最难的测试路线,他们显然从这项工作中收获了极大的快乐。Thrun怕学生们拿不到钱,想要讲条件,提出应当允许有一两次人工干预。佩吉和布林严辞拒绝,他们说这很公平,因为DARPA比赛也是同样要求。Google为项目命名代码“车夫”,团队成员私下里则用“佩吉1000英里”来称呼,大家都知道真正的难度在这里。Google给的项目时间期限是两年。项目团队一共11人,绝大多数出生于海外。
【直播回听】Waymo前史:计算机视觉和激光雷达(三)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 第一届比赛的结果暴露出无人驾驶技术的一处瓶颈,计算机视觉能力非常弱,经常发生错误判断,比如无法区分阴影和障碍物,会将车辆错误叫停。有些团队干脆禁用视觉功能,或者大幅度降低视觉功能的决策权限,主要依靠激光雷达判断障碍物。Thrun的评价是,参赛车辆没有真正看到道路。 Thrun运用机器学习方法,让计算机对比激光雷达返回的信息和人类驾驶员的决策,学习如何排除误报,机器学习的成果实现了几个数量级的提升,激光雷达误报从13%下降到0.02%。 摄像头比激光雷达看得远,能够提前探测、理解远处的路况,可以用来指导车辆。然而当时计算机运算速度有限,无法处理摄像头提供信息。来自英特尔的工程师Bobby Davies想出了聪明的解决办法,他认为,计算机不需要处理所有的图像信息,只要处理与道路有关的信息就可以了。在地图上,这代表着计算机只要绘制车辆即将通行的前方道路,其余部分直接忽略,数据处理量可以大大减少。下一步是将摄像头提供的视觉地图和激光雷达生成的地图重叠起来,称为适应性计算机视觉adaptive vision。计算机视觉负责远处,激光雷达决定细节操作。
【直播回听】Waymo前史:尴尬的成绩和DARPA难度(二)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 2004年3月,已经有100支团队提交了参赛申请。不过其中大多数只是概念,最终通过审查进入资格赛阶段的只有25支队伍。进一步的检查发现,这些车辆的情况普遍不大好。DARPA的比赛规则是每支车队要跑两遍,这项要求几乎不可能达到。在资格赛的第一天,参赛的8支 车队中,没有一支能够跑完全程,开始的几辆甚至无法启动。 6:30分,第一批6辆车启动,沙漠风暴打头,以五分钟一辆的间距出发,每辆车后面都跟着一辆监测车,车里安装着远程控制紧急开关。天上是直升机,直升机里也有紧急开关。考虑到记者出片的需要,前面几英里路段的任务比较简单。沙漠风暴表现不错,很快就消失在视线之外,最高速度达到每小时30英里。 其他车辆却没有这样好的运气,这一轮出发的车辆最远的只走了1.2英里,它们遇到各式各样的问题。最普遍的情况是传感器和计算机配合失误,没能看到障碍物,导致碰撞,超出界线。还有的车辆无法处理传感器收集的信息,只能停止或不断做出重复的移动。 到了一处急转弯,沙漠风暴转弯时有些偏外。车辆向内侧切入,左侧车轮滑出路面。车身卡在路堤上,被微微抬起。由于轮胎摩擦力不足,车辆无法前进。计算机并不理解这一情况,一直给出加油的指令。3分半钟后,前轮胎冒烟,DARPA官员按下开关强行终止行程。到此为止,沙漠风暴一共行驶了7.4英里,5%的比赛距离。 9点钟,距离比赛开始不过两个半小时,整场比赛宣告结束,所有车辆都没能超过沙漠风暴。Tether坐上直升机赶到终点,记者还在那里等着看第一辆车到达。Tether告诉他们,不用等了,比赛到此为止。
【直播回听】Waymo前史:DARPA无人驾驶大奖赛(一)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 Zipline创始人兼CEO Keller Rinaudo Cliffton认为,从历史经验来看,硬件服务商业化通常会对人类社会产生重大影响。同样是硬件产品,不同产品的开发过程也有各自的特点。手机、无人机、工业机器人这些硬件产品是在商业环境中开发并取得成功的,无人驾驶却不是这样。无人驾驶能够取得技术突破,给人印象最深的不是理论研究,也不是商业竞争,而是技术攻关的组织工作。在无人驾驶技术研发过程中,存在着一个强大的主导力量,DARPA。 2021年美国国防授权法案中有两项非常具体的技术规定。到2010年,1/3美军纵深打击飞机应当是无人驾驶和远程控制的。到2015年,1/3的地面作战车辆应当是无人驾驶的。前一项要求比较容易,DARPA开发的捕食者察打一体无人机1995年已经开始执行作战任务。第二项则要难得多,立法人员并不了解无人驾驶车辆的技术难度。地面无人车辆已经有,但只限于特定功能车辆,不具备通用能力。然而国会的要求是无人驾驶车辆要达到每小时20~30英里,这样的技术当时并不存在。
【直播回听】Zipline:无人机快递市场第一名(二)每周新书听友群微信号:yinmingshu002。音频文字发布在公众号“北京读天下”。 零售送货通常是短途,无人机本来就有速度优势。P2平台的重点是解决剩余的两个问题,准确投递和减少噪音。亚马逊无人机在投递时,先要下降到四米高度,然后将货物抛下。竞争对手Wing投递时悬停高度大约45米,它的特点是用缆绳放下货仓,减少落地冲击。Zipline P1无人机的投递高度是20~35米,采用降落伞,落点更加分散。 所有的设计都有一个共同的弱点,因为悬停高度比较低,噪音很明显。收货人也许不在意,但邻居会有反弹。Keenan Weirobeck回忆说,Zipline分析了消费市场的特点,将减少噪声作为设计中的最优先级。只有真正降低噪音,才能看到规模化投递。Zipline认为,只有提高悬停高度,才能降低噪音。他们的目标是将噪音降低到汽车的水平,最终设计的悬停高度达到90米。这样的悬停高度对邻居打扰少,社区友好。