S3番外篇: DeepSeek V4 Pro来了！中国AI又掀桌子？

大家好，欢迎回到《AI有点意思》。我是你们的老朋友，小艾。

今天是一期特别的番外篇。为什么呢？因为上周，AI圈发生了一件大事——DeepSeek发布了新一代模型V4 Pro 预览版。

你可能会问：不就是又出了个新模型吗？有什么大惊小怪的？别急，听小艾慢慢跟你说。这次DeepSeek的动作不太一样。第一，它没有发布会、没有预热海报、没有任何倒计时，就这么静悄悄地在周五上线了。第二，它一口气推出了两个版本——Pro和Flash。更重要的是，它喊了一句话，这句话可能正在改变整个AI行业的游戏规则。这句话是什么？十个字——“百万上下文，人人用得起”。

怎么回事呢？这就要从DeepSeek V4最核心的两个突破说起了。

先来说性能。DeepSeek V4 Pro的各项能力相当亮眼。在编程能力上，它达到了开源模型中的最佳水平，内部员工实际使用体验已经优于Claude Sonnet 4.5，在代码任务中的交付质量接近Claude Opus 4.6的非思考模式。在数学、STEM以及竞赛级代码推理方面，它的表现超过了目前所有公开评测的开源模型，成绩可以比肩世界顶级的闭源模型。同时，在世界知识测评中，它也大幅领先于其他开源模型，仅稍稍落后于顶尖的闭源模型Gemini Pro 3.1。

但真正让行业震动的，是它的价格。同期GPT 5.4和Claude Opus 4.6的调用成本，大约是V4的50倍。给大家换算一下，V4 Flash的输出定价是每百万token两块钱人民币，而GPT 5.4的同类服务需要上百元。说它是“价格屠夫”，一点也不夸张。所以总结起来：性能接近顶级闭源模型，但价格只有它们的几十分之一。这就是DeepSeek V4 Pro交出的答卷。

说到这里，你可能想问：这不就是一个“便宜的AI”吗？市面上便宜的模型也不少啊，V4到底有什么特别的？问得好。

V4最大的革新，在于它处理长文本的方式。想象一下，你以前想让AI帮你读一本几十万字的小说，或者在几千行代码的项目里找bug，传统模型会有两个问题：一贵，二慢。为什么？因为随着上下文变长，模型的计算成本和显存占用量会成倍飙升，贵到你舍不得用。DeepSeek V4是怎么解决的呢？它发明了一套全新的“混合注意力机制”。通俗点说，传统方法是在海量信息里“逐字逐句精读”，每增加一点长度，工作量就翻好几倍，最后算到天荒地老。而V4这套新机制，相当于先“抓重点”、“看大纲”，只在需要时才精读细节，直接把计算成本砍掉了一大截。

效果有多惊人呢？在100万token的超长上下文场景下，V4 Pro每生成一个词元所需的计算量只有上一代V3.2的27%，显存占用更是直接压缩到了10%。V4 Flash更激进，计算量只有前代的10%，显存占用压缩到了7%。这个压缩比例不是百分之几的优化——直接把算力成本打到了地板价。如果你听不太懂这些技术术语没关系，记住一句话就够了：以前一百万字的上下文只有最顶尖的闭源模型才有，而且贵得离谱。现在DeepSeek把它变成了“水电煤”一样的基本配置，人人用得起。

说到这里你可能想问：这么便宜，是不是在赔本赚吆喝？DeepSeek的答案是否定的。它不是靠资本烧钱换市场，而是靠底层架构的效率革命带来的成本降低，每一分钱的降价都有技术优化做支撑。V4的技术报告里披露，在100万token场景下，单次推理算力降到前代的27%，显存压到10%，成本结构真正变了。

更值得关注的是，DeepSeek还完成了一件国产AI领域的重要大事。V4是全球首个在华为昇腾NPU上完成训练与推理适配的万亿参数级大模型，DeepSeek的技术报告中明确写入了英伟达GPU和华为昇腾NPU两个平台的验证成果。这意味着什么？意味着中国AI产业链“芯片+模型”的协同，又往前迈了一大步。据招商证券估算，V4 Pro是目前已知最大开源权重模型，参数规模达1.6万亿，超过了Kimi K2.6的1.1万亿、GLM 5.1的7500多亿以及V3.2的近7000亿。据预计，今年下半年昇腾950超节点批量上市后，Pro的价格还会进一步大幅下调。

你可能听说过DeepSeek的创始人梁文锋。V4的发布稿结尾引用了这样一句话：“不诱于誉，不恐于诽，率道而行，端然正己。”这句话不仅是态度，更是这家公司的真实写照。梁文锋曾在接受采访时说过一句话：“首先你要忘掉自己，然后成为自己。”在他看来，DeepSeek的使命从来不是做榜单第一名，而是让最前沿的AI能力被更多人用得起。V4的技术报告里有一句话被很多人划了重点：能力水平仍落后于GPT 5.4和Gemini 3.1 Pro约3到6个月。放在国内AI圈，这种主动承认差距的姿态并不多见。但梁文锋真正想说的是——在最极致的性能上，我承认我还在追；但在把极致性能变成可用基础设施这件事上，我已经换了一条赛道。

最后小艾再给你一个生活化的比喻：V4 Pro像是你家里那台“性能猛兽”的游戏台式机，处理复杂任务时火力全开；而V4 Flash则像是你那台轻薄便携的MacBook Air，日常够用，还省电。

说到这里，小艾建议你可以做两件事：第一，登录DeepSeek官网或App，免费体验一把V4 Pro的能力——自己去试试，比听别人说一万句都管用。第二，如果你是高中生或者正在学编程，用V4来帮你分析代码、解释作业题目，你会发现一个全新的世界。

以上就是本期番外篇的全部内容。小艾下周会带着第三季第2期准时回来，继续聊AI Agent的核心技术。

这里是《AI有点意思》，我是小艾。每周和你一起，用最轻松的方式，看懂最前沿的AI。下期见。