大家好,欢迎回到《AI有点意思》。我是你们的老朋友,小艾。
今天是一期特别的番外篇。为什么呢?因为上周,AI圈发生了一件大事——DeepSeek发布了新一代模型V4 Pro 预览版。
你可能会问:不就是又出了个新模型吗?有什么大惊小怪的?别急,听小艾慢慢跟你说。这次DeepSeek的动作不太一样。第一,它没有发布会、没有预热海报、没有任何倒计时,就这么静悄悄地在周五上线了。第二,它一口气推出了两个版本——Pro和Flash。更重要的是,它喊了一句话,这句话可能正在改变整个AI行业的游戏规则。这句话是什么?十个字——“百万上下文,人人用得起”。
怎么回事呢?这就要从DeepSeek V4最核心的两个突破说起了。
先来说性能。DeepSeek V4 Pro的各项能力相当亮眼。在编程能力上,它达到了开源模型中的最佳水平,内部员工实际使用体验已经优于Claude Sonnet 4.5,在代码任务中的交付质量接近Claude Opus 4.6的非思考模式。在数学、STEM以及竞赛级代码推理方面,它的表现超过了目前所有公开评测的开源模型,成绩可以比肩世界顶级的闭源模型。同时,在世界知识测评中,它也大幅领先于其他开源模型,仅稍稍落后于顶尖的闭源模型Gemini Pro 3.1。
但真正让行业震动的,是它的价格。同期GPT 5.4和Claude Opus 4.6的调用成本,大约是V4的50倍。给大家换算一下,V4 Flash的输出定价是每百万token两块钱人民币,而GPT 5.4的同类服务需要上百元。说它是“价格屠夫”,一点也不夸张。所以总结起来:性能接近顶级闭源模型,但价格只有它们的几十分之一。这就是DeepSeek V4 Pro交出的答卷。
说到这里,你可能想问:这不就是一个“便宜的AI”吗?市面上便宜的模型也不少啊,V4到底有什么特别的?问得好。
V4最大的革新,在于它处理长文本的方式。想象一下,你以前想让AI帮你读一本几十万字的小说,或者在几千行代码的项目里找bug,传统模型会有两个问题:一贵,二慢。为什么?因为随着上下文变长,模型的计算成本和显存占用量会成倍飙升,贵到你舍不得用。DeepSeek V4是怎么解决的呢?它发明了一套全新的“混合注意力机制”。通俗点说,传统方法是在海量信息里“逐字逐句精读”,每增加一点长度,工作量就翻好几倍,最后算到天荒地老。而V4这套新机制,相当于先“抓重点”、“看大纲”,只在需要时才精读细节,直接把计算成本砍掉了一大截。
效果有多惊人呢?在100万token的超长上下文场景下,V4 Pro每生成一个词元所需的计算量只有上一代V3.2的27%,显存占用更是直接压缩到了10%。V4 Flash更激进,计算量只有前代的10%,显存占用压缩到了7%。这个压缩比例不是百分之几的优化——直接把算力成本打到了地板价。如果你听不太懂这些技术术语没关系,记住一句话就够了:以前一百万字的上下文只有最顶尖的闭源模型才有,而且贵得离谱。现在DeepSeek把它变成了“水电煤”一样的基本配置,人人用得起。
说到这里你可能想问:这么便宜,是不是在赔本赚吆喝?DeepSeek的答案是否定的。它不是靠资本烧钱换市场,而是靠底层架构的效率革命带来的成本降低,每一分钱的降价都有技术优化做支撑。V4的技术报告里披露,在100万token场景下,单次推理算力降到前代的27%,显存压到10%,成本结构真正变了。
更值得关注的是,DeepSeek还完成了一件国产AI领域的重要大事。V4是全球首个在华为昇腾NPU上完成训练与推理适配的万亿参数级大模型,DeepSeek的技术报告中明确写入了英伟达GPU和华为昇腾NPU两个平台的验证成果。这意味着什么?意味着中国AI产业链“芯片+模型”的协同,又往前迈了一大步。据招商证券估算,V4 Pro是目前已知最大开源权重模型,参数规模达1.6万亿,超过了Kimi K2.6的1.1万亿、GLM 5.1的7500多亿以及V3.2的近7000亿。据预计,今年下半年昇腾950超节点批量上市后,Pro的价格还会进一步大幅下调。
你可能听说过DeepSeek的创始人梁文锋。V4的发布稿结尾引用了这样一句话:“不诱于誉,不恐于诽,率道而行,端然正己。”这句话不仅是态度,更是这家公司的真实写照。梁文锋曾在接受采访时说过一句话:“首先你要忘掉自己,然后成为自己。”在他看来,DeepSeek的使命从来不是做榜单第一名,而是让最前沿的AI能力被更多人用得起。V4的技术报告里有一句话被很多人划了重点:能力水平仍落后于GPT 5.4和Gemini 3.1 Pro约3到6个月。放在国内AI圈,这种主动承认差距的姿态并不多见。但梁文锋真正想说的是——在最极致的性能上,我承认我还在追;但在把极致性能变成可用基础设施这件事上,我已经换了一条赛道。
最后小艾再给你一个生活化的比喻:V4 Pro像是你家里那台“性能猛兽”的游戏台式机,处理复杂任务时火力全开;而V4 Flash则像是你那台轻薄便携的MacBook Air,日常够用,还省电。
说到这里,小艾建议你可以做两件事:第一,登录DeepSeek官网或App,免费体验一把V4 Pro的能力——自己去试试,比听别人说一万句都管用。第二,如果你是高中生或者正在学编程,用V4来帮你分析代码、解释作业题目,你会发现一个全新的世界。
以上就是本期番外篇的全部内容。小艾下周会带着第三季第2期准时回来,继续聊AI Agent的核心技术。
这里是《AI有点意思》,我是小艾。每周和你一起,用最轻松的方式,看懂最前沿的AI。下期见。
