EP19《DeepSeek V4对飙GPT-5.5:中国AI正在拆解英伟达的护城河》AI 快照——AI动态简单听

EP19《DeepSeek V4对飙GPT-5.5:中国AI正在拆解英伟达的护城河》

13分钟 ·
播放数0
·
评论数0

本期内容要点

  • DeepSeek V4正式发布并开源:双版本齐发——V4 Pro(1.6T参数,49B激活)对标顶级闭源模型,V4 Flash(284B参数,13B激活)主打性价比。两个版本均支持100万token上下文,采用MIT协议完全开源。自研压缩稀疏注意力机制使推理FLOPs降低73%,KV缓存减少90%。内部员工反馈,V4在日常Agentic Coding中体验优于Sonnet 4.5,交付质量接近Opus 4.6的非思考模式。
  • 下半年批量上华为昇腾算力:华为昇腾超节点已全面适配DeepSeek-V4,寒武纪同一天完成Day 0适配。DeepSeek通过架构创新大幅降低对单卡算力的要求,使国产芯片成为可用选项。阿里和腾讯正洽谈入股,估值已从100亿美元上调至超200亿美元。
  • OpenAI发布GPT-5.5,打破“更强更慢”铁律:逐token延迟与前代相当,但完成同样任务所需token更少。代价是价格翻倍(输入$5/百万token,输出$30/百万token)。Terminal-Bench 2.0得分82.7%,远超Claude Opus 4.7(69.4%)。GPT-5.5协助发现了关于拉姆齐数的新数学证明,并经Lean验证——AI首次在纯数学核心领域做出被严格验证的原创贡献。
  • 腾讯混元发布Hy3 preview:姚顺雨接手混元后的首份成绩单。295B总参数,21B激活,256K上下文,定位“解决真实世界复杂工程问题”。代码生成有审美判断,信息核实能区分信源权威度,已上线元宝、腾讯文档等产品。
  • 谷歌Deep Research全面拥抱MCP协议:由Gemini 3.1 Pro驱动,支持接入私有数据库并原生生成图表。AI搜索从“信息检索”升级为“研究代理”,能直接访问企业内部系统,输出带数据图表的研究报告。
  • 高德地图上线ABot:采用“语言大脑+空间大脑”架构,支持模糊语义精确搜索和复杂行程一句话串联。高德几十亿次路线请求积累的数据是核心壁垒,代表传统工具产品通过AI降低操作门槛的典型升级路径。
  • 小米发布miclaw具身智能新成果:从消费电子硬件角度切入,主要针对非结构化环境(家中客厅、办公室等)的行动能力。

本期深度:DeepSeek V4 vs GPT-5.5——两条路线,一个终局

GPT-5.5和DeepSeek V4同一天前后脚发布,两条技术路线正面相逢。

OpenAI走“最强硬件+系统耦合”路线。GPT-5.5与英伟达GB200联合设计,从训练到部署双向调优,甚至让Codex自己写负载均衡算法,把token生成速度提升超20%。这条路线的逻辑是:用最贵的硬件堆出系统级效率飞跃。成本不敏感,价格翻倍照样有人买单。

DeepSeek走“架构创新+开源生态”路线。V4自研压缩稀疏注意力机制,推理FLOPs降低73%,KV缓存减少90%。同样的上下文长度,用少得多的算力就能跑。下半年批量上华为昇腾,寒武纪同步适配。这条路线的逻辑是:与其追英伟达的硬件路线,不如在架构上把算力需求降下来,让国产芯片成为可用选项。

路线差异:OpenAI在证明用最贵的硬件能把模型能力推到多高。DeepSeek在证明用架构创新能把对顶尖硬件的依赖降到多低。前者定义了能力的天花板,后者在拓展能力的地板。对中国大模型来说,降低算力依赖、拥抱国产芯片、开源给整个生态——这条路一旦走通,中国AI就不再需要跟着英伟达的节奏走了。

📮 听众留言渠道

欢迎分享你的见解:aisnapshot@163.com