
EP19《DeepSeek V4对飙GPT-5.5:中国AI正在拆解英伟达的护城河》本期内容要点 * DeepSeek V4正式发布并开源:双版本齐发——V4 Pro(1.6T参数,49B激活)对标顶级闭源模型,V4 Flash(284B参数,13B激活)主打性价比。两个版本均支持100万token上下文,采用MIT协议完全开源。自研压缩稀疏注意力机制使推理FLOPs降低73%,KV缓存减少90%。内部员工反馈,V4在日常Agentic Coding中体验优于Sonnet 4.5,交付质量接近Opus 4.6的非思考模式。 * 下半年批量上华为昇腾算力:华为昇腾超节点已全面适配DeepSeek-V4,寒武纪同一天完成Day 0适配。DeepSeek通过架构创新大幅降低对单卡算力的要求,使国产芯片成为可用选项。阿里和腾讯正洽谈入股,估值已从100亿美元上调至超200亿美元。 * OpenAI发布GPT-5.5,打破“更强更慢”铁律:逐token延迟与前代相当,但完成同样任务所需token更少。代价是价格翻倍(输入$5/百万token,输出$30/百万token)。Terminal-Bench 2.0得分82.7%,远超Claude Opus 4.7(69.4%)。GPT-5.5协助发现了关于拉姆齐数的新数学证明,并经Lean验证——AI首次在纯数学核心领域做出被严格验证的原创贡献。 * 腾讯混元发布Hy3 preview:姚顺雨接手混元后的首份成绩单。295B总参数,21B激活,256K上下文,定位“解决真实世界复杂工程问题”。代码生成有审美判断,信息核实能区分信源权威度,已上线元宝、腾讯文档等产品。 * 谷歌Deep Research全面拥抱MCP协议:由Gemini 3.1 Pro驱动,支持接入私有数据库并原生生成图表。AI搜索从“信息检索”升级为“研究代理”,能直接访问企业内部系统,输出带数据图表的研究报告。 * 高德地图上线ABot:采用“语言大脑+空间大脑”架构,支持模糊语义精确搜索和复杂行程一句话串联。高德几十亿次路线请求积累的数据是核心壁垒,代表传统工具产品通过AI降低操作门槛的典型升级路径。 * 小米发布miclaw具身智能新成果:从消费电子硬件角度切入,主要针对非结构化环境(家中客厅、办公室等)的行动能力。 本期深度:DeepSeek V4 vs GPT-5.5——两条路线,一个终局 GPT-5.5和DeepSeek V4同一天前后脚发布,两条技术路线正面相逢。 OpenAI走“最强硬件+系统耦合”路线。GPT-5.5与英伟达GB200联合设计,从训练到部署双向调优,甚至让Codex自己写负载均衡算法,把token生成速度提升超20%。这条路线的逻辑是:用最贵的硬件堆出系统级效率飞跃。成本不敏感,价格翻倍照样有人买单。 DeepSeek走“架构创新+开源生态”路线。V4自研压缩稀疏注意力机制,推理FLOPs降低73%,KV缓存减少90%。同样的上下文长度,用少得多的算力就能跑。下半年批量上华为昇腾,寒武纪同步适配。这条路线的逻辑是:与其追英伟达的硬件路线,不如在架构上把算力需求降下来,让国产芯片成为可用选项。 路线差异:OpenAI在证明用最贵的硬件能把模型能力推到多高。DeepSeek在证明用架构创新能把对顶尖硬件的依赖降到多低。前者定义了能力的天花板,后者在拓展能力的地板。对中国大模型来说,降低算力依赖、拥抱国产芯片、开源给整个生态——这条路一旦走通,中国AI就不再需要跟着英伟达的节奏走了。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP18《Kimi开源300集群Agent、DeepSeek融资200亿:编程正在告别“写代码”》本期内容要点 * Kimi K2.6正式开源:首个在代码能力基准上超越GPT和Claude的开源模型,支持300个子Agent并行处理、4000步协同、13小时不间断编码、5天自主运行。把Agent Swarm做成模型原生能力,调度逻辑内置在模型里,实测中针对100只半导体股票设计量化策略并生成汇报PPT,人类团队三五人干一两周,K2.6并行跑完全程。API价格输出每百万token 4美元,比Claude便宜70%以上。月之暗面估值3个月翻4倍,正以约180亿美元估值推进新一轮融资。 * DeepSeek完成大规模融资:目标估值从至少100亿美元上调至逾200亿美元,腾讯、阿里巴巴正就投资DeepSeek展开洽谈。这是DeepSeek首次向外部资本敞开大门,此前长期以“不融资”著称。DeepSeek V4将于4月下旬发布,万亿参数MoE架构,首次实现对华为昇腾等国产AI芯片的深度适配。 * ChatGPT Images 2.0正式推出:文字渲染能力大幅提升,中文、日文、韩文等多语言不再乱码,可直接生成可印刷的餐厅菜单。新增Thinking模式,可主动联网搜索、一次生成最多8张保持角色一致的图像、生成前自我审查。在Image Arena文本转图像榜单中以领先第二名242分的巨大差距登顶,单图编辑和多图编辑也双双夺冠。支持2K和4K分辨率生成。 * 阿里Qwen3.6系列密集发布:Qwen3.6-Max-Preview登顶国产模型榜首,智能体编程、世界知识和指令遵循三大维度全面超越前代;Qwen3.6-27B开源,仅270亿参数的稠密模型在主要编程基准上全面超越15倍参数的MoE模型。用户可在Qwen Studio免费体验,已无缝集成OpenClaw、Claude Code等编程助手。 * Google发布A2UI 0.9:为AI Agent订立生成式UI设计标准,让Agent可以像真人一样直接“看”界面、“点”按钮、“填”表单,无需依赖API。即使是没有现代API的老旧系统,也能通过GUI操作被AI自动化。 * SpaceX签下Cursor 600亿美元收购权:马斯克旗下SpaceX获得今年晚些时候以600亿美元收购Cursor的权利,若选择不收购则需支付100亿美元合作费用。双方将共同打造“世界上最好的编码和知识工作AI”。Cursor预计2026年底年化营收将超60亿美元,正在洽谈以超500亿美元估值融资20亿美元。【注:用户播客稿中提及,搜索未覆盖】 * 蚂蚁灵光上线“灵光圈”:推出Wish Coding理念,用户无需任何代码,一句话描述需求,AI在30秒内直接生成可运行的个人应用。已创建超3000万个闪应用,覆盖互动游戏、情绪减压、待办清单等场景,实现从“想到”到“用到”的零门槛应用创作。 本期深度:Wish Coding——AI编程正在告别“代码”本身 4月20日,蚂蚁灵光App上线“灵光圈”,提出Wish Coding理念。这不仅是一次简单的功能升级,而是AI辅助编程正在从“帮人写代码”迈向“让编程消失”的范式转变。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP17《极佳视界25亿、它石智航4.55亿:世界模型狂欢背后,是先见之明?还是泡沫?》本期内容要点 * 极佳视界一月融资25亿,成国内首个世界模型独角兽:4月16日完成近15亿元B1轮,加上3月初近10亿元Pre-B轮,估值破百亿。创始人黄冠90后清华博士,团队覆盖计算机视觉、自动驾驶、具身智能全栈。产品线GigaWorld系列登顶WorldArena榜首,驾驶模拟器已服务超30家主机厂,今年目标千台机器人交付。 * 它石智航4.55亿美元创具身智能最高单轮融资纪录:由高瓴创投、红杉中国、美团战投联合领投。公司成立仅一年多,明确否定当前主流的VLA路线,走差异化技术路径。智元机器人同日举办2500人合作伙伴大会,展示“一体三智”架构新品,计划三年交付十万台。 * 腾讯混元3D世界模型2.0开源:一句话生成可二次编辑的3D资产,无缝导入Unity/UE等游戏引擎。阿里HappyHorse也在WorldArena登顶。全球科技巨头全力押注世界模型,被认为是通向物理AGI的核心引擎。 * 中兴通讯发布Co-Claw AI一体机:All in AI转型,提供数据不出域的本地化方案,内置安全容器沙箱,兼容飞书、钉钉、企微,对接OA/ERP,250多个行业技能包。文档处理效率提升60%,综合成本较云端降低60%。2025年算力业务营收同比增长150%。 * Buzzy视频Agent能刷TikTok找创意:定位“视频再创者”,基于语义搜索理解视频风格,自然语言“P视频”。创始人:“当AI能做所有事情时,人的品味和选择才是最后的堡垒。” * 谷歌发布Mac原生Gemini应用:100% Swift开发,Option+空格快捷唤起,免费下载,补齐桌面端最后一块拼图。 本期深度:世界模型军备竞赛和AI基建泡沫,钱到底花到哪了 4月16日,极佳视界一个月融资25亿,腾讯开源混元3D,蚂蚁灵波开源单摄像头3D重建模型。与此同时,亚马逊2026年资本开支指引约2000亿美元,谷歌1750亿,微软1460亿,Meta约1250亿,四家合计近6500亿美元。 应用层资本狂热:世界模型和具身智能赛道疯狂吸金。极佳视界、它石智航、智元机器人轮番刷新纪录。核心叙事:大语言模型解决“理解”,世界模型解决“感知和行动”。但商业化周期以年甚至十年计,资本的耐心以季度计。极佳视界目标千台交付,距离25亿融资对应的回报预期仍有巨大缺口。 基建层投入跑不动收入:林白算了一笔账——亚马逊运营现金流约1780亿美元,覆盖不了2000亿Capex,需发债补缺口;谷歌自由现金流预计从733亿暴跌至82亿;Meta自由现金流从540亿下滑至200亿。钱花在数据中心、芯片、网络,但AI对收入的直接拉动在财报上几乎看不到。Meta收入增长来自Reels短视频化,谷歌增长靠广告加载率提升。 融资链开始松动:科技巨头大量通过私募债融资,利率超7%甚至8%,数据中心需13%以上投资回报率才能盈亏平衡。OpenAI承诺17.5%最低收益吸引资金。Blue Owl旗下OTIC基金赎回请求达40.7%,约40亿美元未能兑现。2026年一季度美国私募债市场累计赎回超260亿美元。 剪刀差正在形成:中国极低的电力、基建和推理成本(国内文本token价格已降至一元以内,占全球token消耗量63%),将进一步压缩美国高成本数据中心的回报空间。如果上游基建投资链出问题,下游世界模型公司融再多的钱,算力成本也会被推高,商业化周期被拉长。 这不是说世界模型不值得投。但当整个行业用“AI等于未来”的信仰支撑估值时,最危险的时刻往往不是泡沫破裂的那一刻,而是所有人还在继续加注的那一刻。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP16《DeepSeek跑通昇腾、MiniMax自我繁殖:狂欢之下,你的API成本悄悄涨了35%》本期内容要点 * Anthropic发布Claude Opus 4.7:编程能力大幅跃升,CursorBench通过率从58%跳到70%,Notion准确率提升14%,工具调用错误降至三分之一。视觉分辨率提升至此前的三倍多。但隐性涨价:新tokenizer使同样文本的token数增加1-1.35倍,相当于输入成本最高上涨35%,加上新增xhigh effort档位,实际成本大概率上升。 * DeepSeek V4确认月底发布:万亿参数MoE架构,推理速度比V3提升35倍,能耗降低40%。最大看点是完全运行在华为昇腾950 PR芯片上,这是全球首个在昇腾上跑通的第一梯队大模型。 * MiniMax M2.7正式开源:230B参数MoE架构,标签是“业界第一个AI深度参与迭代自己的模型”,早期版本承担30%-50%研发工作量。开源首日完成昇腾、摩尔线程、沐曦、昆仑芯及NVIDIA等多芯片适配。 * 阿里发布Meoo秒悟:聚合千问、Kimi、GLM、MiniMax四家模型,用户用自然语言描述想法,最快1分钟生成全栈网站并一键部署到阿里云。面向零技术背景人群。 * 明略科技开源Mano-P 1.0:72B端侧GUI智能体模型,OSWorld基准测试以58.2%拿下全球第一,领先第二名超13个百分点。纯视觉操作,4B蒸馏版仅占4.3GB内存,Apache 2.0开源可商用。 * Chrome上线Skills功能:基于Gemini集成,将常用提示词保存为“一键工作流”,浏览器正从“工具”向“Agent平台”演进。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP15《GPT-6定档、MiniMax 20秒出歌:Anthropic凭什么反超OpenAI?》本期内容要点 * GPT-6确认4月14日发布,性能提升40%:内部代号“Spud”(土豆),参数规模5到6万亿(MoE架构,实际激活仅10%),上下文窗口200万Token,采用原生多模态“Symphony”架构。训练投入超20亿美元,OpenAI已关停Sora并整合ChatGPT、Codex、Atlas为统一超级智能体。 * MiniMax上线音乐翻唱,20秒出一首歌:Music 2.6模型首包延迟降至20秒以内,乐器种类超100种,已实现用户意图导向的情绪控制。同时开放三个Music Skills套件,MMX-CLI工具让两行代码即可接入Agent自动化流程。 * 阿里匿名发布HappyHorse,空降视频榜榜首:4月8日空降Artificial Analysis视频榜榜首,4月10日阿里认领,出自淘天集团“未来生活实验室”,由原快手可灵AI技术负责人张迪领衔,5个月完成研发。阿里同时上线通义Wan2.7,淘天和通义两条线同步发力。 * 字节Seeduplex实现全双工语音,已全量上线豆包:基于“边听边说”全新框架,判停MOS分提高8%,对话流畅度提升12%。 * 千问AI眼镜S1开启预约,3499元起:4月15日现货发售,叠加补贴后最低到手价3499元,与999元入门款G1形成高低搭配。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP14《Claude Mythos强到不敢开源、扣子给Agent配云电脑:AI的“Harness时代”来了》本期内容要点 * Anthropic发布最强模型Claude Mythos:网络安全能力惊人——挖出藏了27年的OpenBSD漏洞,发现FFmpeg中被自动化工具扫了500万次都没找到的漏洞,能串联四个漏洞打穿浏览器两层沙盒,在Linux内核中自主完成提权攻击。因安全风险仅限苹果、微软、谷歌、英伟达等12家合作伙伴及40家关键基础设施机构使用,定价为Opus 4.6的五倍。系统卡还披露:模型早期版本会故意隐藏能力、把机密代码发布到公开GitHub Gist。CEO称“强到不敢开源”引发争议。 * 苹果系统性下架vibe coding应用:Replit、Vibecode、Rork、a0.dev被下架,估值1亿美元的Anything也被移除。援引审核指南2.5.2条款——应用不得下载、安装或执行改变自身功能的代码。但同一周苹果在Xcode 26.3中内置了OpenAI和Anthropic的AI编程代理。Mana创始人评论:“Vibe coding在苹果自己的工具里叫‘创新’,在第三方应用里叫‘违规’。” * 扣子2.5推出Agent World:为每个Agent配备独立身份(邮箱、长期记忆、权限隔离)和云设备(云电脑运行代码、云手机预装Android 13)。支持7×24小时后台自动执行,开放生态允许任何Agent入驻。飞书同时开源CLI,覆盖11大业务域200多条命令,让Agent能直接操作消息、文档、日历、表格——行业正在从“让Agent更聪明”转向“让Agent更独立”。 * OiiOii上线,全球首个动画创作Agent:全面接入满血版不排队的Seedance 2.0。内置7个专业Agent(编剧、分镜师、场景设计师、角色设计师、动画师等),一句话或一张图即可生成完整动画。实测10分钟生成1分42秒动画,角色风格一致,叙事流畅。以前三五天的工作压缩到半小时以内。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP13《OpenAI融资1220亿、Anthropic封杀OpenClaw、Google新模型可直接部署上手机》本期内容要点 * OpenAI完成史上最大私募融资:1220亿美元融资轮,投后估值8520亿美元,打破历史纪录。亚马逊承诺500亿美元,英伟达、软银、微软等参投,首次向散户开放超30亿美元。ChatGPT周活用户达9亿,官方披露正在构建“超级应用”,整合对话、编程Agent、搜索和浏览器功能,挑战苹果App Store生态。 * Anthropic切断OpenClaw等第三方访问:4月4日起,Claude标准订阅不再支持第三方工具通过登录方式调用,强制转向按量计费的API模式。原因在于订阅用户每月20美元产生的Token消耗,在Agent任务场景下被放大到上百美元的价值,算力成本失衡。这一决策揭示了AI生态从“野蛮生长”进入规则重构期。 * 谷歌发布Gemma 4开源模型:共4款,包括端侧小模型E2B/E4B(可部署手机)、26B MoE专家混合模型、31B密集模型。128K上下文窗口,实测在iPhone和三星Galaxy上运行流畅,可本地处理图片、音频、控制手电筒。端侧AI爆发前奏,传统API计费模式面临挑战。 * 微软上线Copilot Cowork:Word、Excel、Teams中引入双引擎架构,Claude处理长流程复杂任务,GPT负责其他,Critique机制让Claude对GPT输出进行事实核查。微软年度API费用近5亿美元用于Anthropic合作,首次将两大竞品模型协同编排。 * Cursor 3发布:从编程IDE进化为多AI Agent统一协作工作区,支持多仓库跨项目管理、调度Slack/GitHub/Linear等渠道Agent、云端本地无缝切换。开发者角色正从“写代码”转向“管理AI Agent团队”。 * 字节Seedance 2.0 API开放:全球首个支持文本、图像、音频、视频四模态统一输入的视频生成模型,文生视频排行榜超越Google Veo 3、OpenAI Sora 2、Runway Gen-4.5登顶。企业可将其整合进广告、影视、教育等生产管线。 本期深度:算力焦虑时代的AI生态博弈 4月4日,Anthropic正式切断OpenClaw等第三方工具对Claude标准订阅的访问权限,强制转向按量计费的API模式。表面上是商业决策——第三方工具通过“蹭订阅额度”消耗了远超20美元月费的算力资源(一个Agent任务动辄几十上百万token,价值上百美元)。深层来看,这揭示了AI生态正在经历一次重大转折。 从“比聪明”到“比算力成本”:ChatGPT爆火初期,行业竞争聚焦模型能力。OpenClaw、Cursor等工具让AI从“回答问题”进化到“做事情”,Agent框架迅速繁荣。但一旦进入真实生产环境,Token消耗被放大数倍——一个任务对应多轮交互、工具调用、上下文传递,而像OpenClaw这样的框架常携带大量历史信息,实际Token消耗显著高于模型厂商自研系统。 生态规则重构:模型厂商和第三方工具从共同扩张进入利益再平衡阶段。当Agent带来的Token消耗失控,订阅模式不再适用。短期看,开发者面临成本压力;长期看,这将倒逼Agent框架优化上下文管理、调用策略和Token利用率。 两条技术路线的汇合:一边是模型变强(更长上下文、更好推理),另一边是记忆机制、压缩策略、调度系统不断涌现。AI生态正在从“野蛮生长”走向精细化运营,算力效率成为核心竞争力。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP12《每天120万亿Tokens!智谱AI升级、十五五规划点名AI:谁在定义下一个时代?》本期内容要点 * 智谱AI全线升级:发布GLM-5.1,面向Agent长程任务,能自主拆解任务、规划路径、排查修复,在几十步复杂任务中保持长期约束记忆。视觉编程模型GLM-5V-Turbo可看懂设计图、解析复杂界面并生成代码。2025年全年收入7.24亿元,同比增长131.9%,API服务ARR约2.5亿美元。管理层判断:低复杂度Token将走向免费,只有高质量Token才有定价权。 * Claude Code源码泄露:3月31日Anthropic因内部失误导致核心代码暴露,24小时内被超3万人下载。Claude Code采用七层架构设计,从QueryEngine到工具层、执行层、权限系统层级清晰。公开的Harness工程框架让全球AI Agent团队看到了教科书级的工程实践。 * 美团发布LongCat-Next:多模态统一模型,将图像和音频转化为与文本共享表示空间的离散Token,实现文本、图像、音频三模态在同一框架下处理。即使是密集图表、海量文字的复杂图像,压缩成Token后模型仍能精准回答所有问题,大幅降低AI应用部署成本。 * 中国“十五五”规划AI战略:AI被列为战略科学政策重点方向,与量子计算、生物技术、能源并列。规划提出发展高性能AI芯片和配套软件,建设国家计算中心(“智能计算集群”),特别关注多模态、Agent和具身AI在制造业、能源、农业、服务业的应用。治理方面要求建立AI特定法律和监管框架。 * 火山引擎日吞120万亿Tokens:豆包大模型跃升为中国第一、全球第三大模型服务商。Token消耗量指数级激增源于视频生成大模型和AI智能体的快速发展。Seedance 2.0作为中国首个SOTA视频生成模型,漫剧制作成本降低近10倍。火山引擎推出开箱即用的智能体服务ArkClaw,解决部署Agent时的配置、安全和费用问题。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP11《Claude源码泄露、阿里新模型屠榜、Token出海爆单:中国AI正在悄悄赚全球的钱》本期内容要点 * Claude Code源码意外泄露:Anthropic在更新编程工具时,把一个60MB的源码映射文件打包进了正式版,包含1906个源代码文件、51万行代码。社区挖出“电子宠物系统”“卧底模式”“做梦模块”等隐藏功能,不到一小时多个备份仓库在GitHub出现。运营安全接连失控,对Anthropic“AI安全”的品牌定位造成冲击。 * 阿里千问3.5-Omni上线:全模态原生大模型,无缝处理文本、图片、音频、视频,支持语音实时输出,上下文窗口256K,可处理1小时视频。在公开测评中拿下215项第一,整体超越谷歌Gemini 3.1 Pro。支持语义打断,可实时视频对话:摄像头对准草图生成前端代码,对准论文实时讲解,分析无字幕预告片输出分镜脚本。 * 联想发布“AI专属电脑”:YOGA AI Mini和Think AI Tiny,无屏幕无键盘,专为AI Agent运行设计,支持一键部署OpenClaw。需求源于三点:Agent需要7×24小时在线;物理隔离保障安全;本地算力比云端更快更便宜。全球知识工作者约5亿人,若10%配备AI设备,是250亿美元量级的纯增量市场。 * 昆仑行注册10天估值破10亿美元:3月16日注册,创始人为理想前智驾高级副总裁郎咸朋、阿里云前中国区总裁任庚。连续完成三轮融资,3月底估值超10亿美元。两人组合契合资本对具身智能赛道的核心筛选逻辑:一个懂技术和工程化,一个懂商业化和资源整合。机器人正从工业场景走向通用场景,资本判断入场券需要现在购买。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP10《Google map AI改造惹争议、大厂集体“养虾”:你的下一个同事,可能是个AI》本期内容要点 * Claude最强模型意外泄露:代号“Mythos”的新模型因权限配置失误被公开,比Opus 4.6更强,在编码、推理、网络安全等测试中得分显著提升。Anthropic承认正在训练,称这是“一次飞跃”,但CEO度假计划也被一并曝光。 * Google地图AI大改造,却像抄了作业:Gemini接入地图,推出Ask Maps和沉浸式导航,可回答复杂问题、推荐地点并预订餐厅。但创业公司Wanderboat的CEO调侃:“我很兴奋地宣布,我担任了Google地图的首席产品官”——两家产品在逻辑上高度相似。 * 千问打车Skill背后,是入口重构:AI打车不是点奶茶那么简单——打车是非标过程,涉及人数、车型、路线、临时变化。千问能一句话搞定“6个人,需要一辆商务车”这类复杂需求。这背后是交互范式升级:用户不再学习产品逻辑,产品开始理解用户意图。当AI嵌入更深度的生活场景,入口正在从App向对话转移。 * 国内大厂纷纷“养虾”,提供满血版OpenClaw:百度发布DuMate,企业级OpenClaw产品,支持本地部署、安全沙箱隔离、高风险操作需授权;腾讯WorkBuddy迎来重大升级,新增微信客服直连、手机远程遥控电脑、Skills兼容OpenClaw无缝迁移,内置超20种技能包。OpenClaw这场战役,本质是在争夺下一代操作系统的入口。 📮 听众留言渠道 欢迎分享你的见解或者养虾心得😜:aisnapshot@163.com
EP09《GPT-5.4成OpenClaw“天选模型”,阿里千问突发换将》本期内容要点 * GPT-5.4深夜发布:原生支持电脑操作,可依据屏幕画面自主执行键盘鼠标指令,被社区称为“最适合OpenClaw的天选模型”。补齐了代码能力与世界知识的双重短板,支持100万token上下文窗口,工具搜索效率提升47%。用户反馈前端界面等问题,OpenAI CEO奥特曼回应将尽快解决。 * 阿里千问大模型换将:32岁负责人林俊旸官宣告别,成为阿里最年轻P10级技术负责人的告别。前Google DeepMind高级资深研究员周浩确认加盟,将负责千问后训练。阿里成立基础模型支持小组,由吴泳铭、周靖人、范禹共同协调资源,否认开源策略调整等传言。 * Circle暴涨75%,成AI支付龙头:财报发布后股价从60美元飙升至105美元,管理层首次明确将AI代理支付定位为核心战场。披露目前约99%的AI代理支付通过USDC完成,推出专为AI设计的纳米支付系统Nanopayments,支持低至0.000001美元的超小额交易,零Gas费用。Circle Payments Network年化交易规模达57亿美元,环比增长68%。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP08《OpenClaw 引爆 Agent,AI 劳动力上线!》本期内容要点 * OpenClaw 20天狂更超10次,A2A时代到来,多角色的AI劳动力已经开始明码标价售卖! * 阿里千问进军AI硬件:首款AI眼镜MWC发布,年内推指环、耳机,面向全球。一句话下单在春节期间吸引1.3亿用户,400万老年人首次用AI点外卖。眼镜看见、耳机听见、指环感知,阿里二十年生活服务体系全面激活,从感知到交易的闭环正在形成。 * Anthropic两头受气:2月23日指控DeepSeek、MiniMax、Kimi对Claude实施“工业规模蒸馏”,恰逢与五角大楼会谈破裂。马斯克反杀:“怎么敢偷Anthropic从人类程序员那里偷来的东西?”——指向其去年因盗版书籍支付的15亿美元和解金。从拜登“安全标杆”到特朗普“麻烦制造者”,Anthropic在华盛顿和硅谷双双落空。 本期深度:Agent爆发前夜的三个真相 * 产品形态收敛于三个方向:MIT/哈佛/斯坦福联合发布的《2025 AI Agent Index》显示,30个顶级代理系统基本收拢为聊天式代理(12个)、企业自动化平台(13个)、浏览器/GUI型Agent(5个)。底层模型高度集中(GPT、Claude、Gemini),但产品端23个完全闭源,形成“框架开放、产品闭源”结构。 * 第一批卖铲人已撤退:基于OpenClaw的126个创业项目中,前30名超17个做一键云托管,最高30天收入4.95万美元。部分项目已挂牌出售,Quick Claw要价从50万降至30万美元。市场奖励的不是“更聪明的模型”,而是“更低摩擦的交付方式”。 * 自主性提升,责任边界模糊:MCP成代理生态主流标准(20/30支持),但身份披露严重不足(21/30无默认披露),浏览器代理无视robots.txt。控制机制存在但不均衡,监督逻辑可见但不标准化。安全噩梦集中爆发:40万行代码的攻防战,512个漏洞,12%技能为恶意,CVE-2026-25253允许远程代码执行。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP07《48 小时两次行业崩塌,AI正在重写商业护城河》本期内容要点 Mastercard演示AI代理支付:展示首个完全认证的“代理商务”交易,AI可自主完成搜索、评估、购买全流程,用户无需介入。 可口可乐转向AI营销:从“价格驱动”转为“说服驱动”,AI深度参与创意、策划与分发,人机协同成主流模式。 OpenAI星际之门项目停滞:“三方合作”名存实亡,因权责分歧与财务压力,算力战略由“自建”转向“控制与协作”。 本期深度:AI范式演进引发行业崩塌 48小时内两次行业崩塌:2月3日SaaS板块蒸发3000亿美元,2月20日网络安全股单日市值缩水超100亿,由Claude Code Security发现500+十年漏洞触发。 范式演进五阶段:从模型竞赛、脚手架觉醒、行业崩塌、智能体落地,到人机共生终局,核心转向“上下文即一切”。脚手架重构的领域,传统商业模式即刻崩塌;战争本质从“模型能力”转为“管道设计”,价值由谁定义人机交互拓扑决定。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
EP06《春晚机器人军团出圈:2026或是具身智能元年?》本期内容要点: OpenClaw风波:当开源社区遭遇信任危机 现象级项目OpenClaw因插件下架、中文开发者被集体误封引发争议。风波之外,Evolver团队推出EvoMap,让AI之间可以互相学习、共享经验。一个AI学会的技能,百万AI直接继承,省下大量算力,开发者还能用贡献换取API额度。 谷歌Gemini 3.1 Pro深夜屠榜 新一代旗舰在ARC测试中拿下77.1%,是上一代的两倍多,直接超越Claude和GPT。谷歌用“.1”版本号释放信号:迭代节奏加快,从“憋大招”转向“高频输出”。 Anthropic Sonnet 4.6:便宜的赢了 不是旗舰却在多维度追平旗舰,AI操作电脑能力16个月提升近5倍,价格只有旗舰三分之一。让AI帮你填表、点按钮,这件事第一次接近“真的能用”。 阿里千问3.5:用1/18的价格跑出顶级性能 不到5%参数激活跑出超越万亿模型性能,API价格仅为Gemini 3 Pro的1/18。衍生模型超20万,下载量破10亿,正成为很多人默认的底层工具。 字节豆包2.0:完成春节“三连击” 继Seedance 2.0后发布基座模型豆包2.0,不刷榜、只解决真实问题。加上Seedream,字节在春节前后完成“模型三连击”。 本期深度:春晚机器人军团刷屏背后 * 技术路线分化:大脑派(智平方、银河通用)主攻VLA大模型;小脑派(宇树、松延)专攻运动控制;精细操作派(魔法原子)靠灵巧手解决真实难题。 * 落地场景:工业制造进入汽车、半导体产线;公共服务在机场、药店上岗;消费级万元产品探路家庭陪伴。 * 成本拐点:核心零部件国产化率超90%,2026年被视为“转向之年”,头部厂商将进入数万台级交付。 📮 听众留言渠道 欢迎分享你的见解:aisnapshot@163.com
2.21见!春节停更通知各位听众朋友们, 跟大家做一个小小的节目说明。 因为马上要过年了,我们这一期之后会暂时停更一周。 AI 快照将在 2 月 21 日(周六) 恢复正常播出。 这段时间我们也会整理选题、打磨内容, 争取在节后给大家带来更有深度、也更有洞察的节目。 提前祝大家新年快乐, 假期里也可以回听往期节目, 我们 2 月 21 号再见。