EP19《DeepSeek V4对飙GPT-5.5：中国AI正在拆解英伟达的护城河》

本期内容要点

DeepSeek V4正式发布并开源：双版本齐发——V4 Pro（1.6T参数，49B激活）对标顶级闭源模型，V4 Flash（284B参数，13B激活）主打性价比。两个版本均支持100万token上下文，采用MIT协议完全开源。自研压缩稀疏注意力机制使推理FLOPs降低73%，KV缓存减少90%。内部员工反馈，V4在日常Agentic Coding中体验优于Sonnet 4.5，交付质量接近Opus 4.6的非思考模式。

下半年批量上华为昇腾算力：华为昇腾超节点已全面适配DeepSeek-V4，寒武纪同一天完成Day 0适配。DeepSeek通过架构创新大幅降低对单卡算力的要求，使国产芯片成为可用选项。阿里和腾讯正洽谈入股，估值已从100亿美元上调至超200亿美元。

OpenAI发布GPT-5.5，打破“更强更慢”铁律：逐token延迟与前代相当，但完成同样任务所需token更少。代价是价格翻倍（输入$5/百万token，输出$30/百万token）。Terminal-Bench 2.0得分82.7%，远超Claude Opus 4.7（69.4%）。GPT-5.5协助发现了关于拉姆齐数的新数学证明，并经Lean验证——AI首次在纯数学核心领域做出被严格验证的原创贡献。

腾讯混元发布Hy3 preview：姚顺雨接手混元后的首份成绩单。295B总参数，21B激活，256K上下文，定位“解决真实世界复杂工程问题”。代码生成有审美判断，信息核实能区分信源权威度，已上线元宝、腾讯文档等产品。

谷歌Deep Research全面拥抱MCP协议：由Gemini 3.1 Pro驱动，支持接入私有数据库并原生生成图表。AI搜索从“信息检索”升级为“研究代理”，能直接访问企业内部系统，输出带数据图表的研究报告。

高德地图上线ABot：采用“语言大脑+空间大脑”架构，支持模糊语义精确搜索和复杂行程一句话串联。高德几十亿次路线请求积累的数据是核心壁垒，代表传统工具产品通过AI降低操作门槛的典型升级路径。

小米发布miclaw具身智能新成果：从消费电子硬件角度切入，主要针对非结构化环境（家中客厅、办公室等）的行动能力。

本期深度：DeepSeek V4 vs GPT-5.5——两条路线，一个终局

GPT-5.5和DeepSeek V4同一天前后脚发布，两条技术路线正面相逢。

OpenAI走“最强硬件+系统耦合”路线。GPT-5.5与英伟达GB200联合设计，从训练到部署双向调优，甚至让Codex自己写负载均衡算法，把token生成速度提升超20%。这条路线的逻辑是：用最贵的硬件堆出系统级效率飞跃。成本不敏感，价格翻倍照样有人买单。

DeepSeek走“架构创新+开源生态”路线。V4自研压缩稀疏注意力机制，推理FLOPs降低73%，KV缓存减少90%。同样的上下文长度，用少得多的算力就能跑。下半年批量上华为昇腾，寒武纪同步适配。这条路线的逻辑是：与其追英伟达的硬件路线，不如在架构上把算力需求降下来，让国产芯片成为可用选项。

路线差异：OpenAI在证明用最贵的硬件能把模型能力推到多高。DeepSeek在证明用架构创新能把对顶尖硬件的依赖降到多低。前者定义了能力的天花板，后者在拓展能力的地板。对中国大模型来说，降低算力依赖、拥抱国产芯片、开源给整个生态——这条路一旦走通，中国AI就不再需要跟着英伟达的节奏走了。

📮 听众留言渠道

欢迎分享你的见解：aisnapshot@163.com