EP134 DeepSeek V4引爆中国AI效率革命:1M上下文成本砍90%,云计算成最优“卖水人”

EP134 DeepSeek V4引爆中国AI效率革命:1M上下文成本砍90%,云计算成最优“卖水人”

10分钟 ·
播放数17
·
评论数0

🔥【核心洞察】

  • 效率跃升,长上下文成本断崖式下降:DeepSeek V4通过混合注意力机制(CSA+HCA)等架构升级,在1M超长上下文下,推理FLOPs和KV缓存占用较V3.2大幅降低——Pro版分别降至27%和10%,Flash版更是降至10%和7%。这意味着长文本推理成本有望压缩到原来的十分之一以内。

  • 国产芯片适配加速商业化:V4全面支持国产AI芯片(如华为昇腾),预计2026年下半年随昇腾950超级节点大规模供货,Pro版模型将迎来显著降价,推动AI应用从“可用”走向“普及”。

  • 中国AI模型竞争进入深水区:Kimi、阿里Qwen3.6-Max、腾讯Hy3、小米V2.5等密集发布;MiniMax亦可能在5月推新。未来差异化焦点将集中在“编程/任务完成成功率”和“多模态能力”,独立AI厂商凭借灵活决策流程在方向选择上具备优势。

  • 云计算与数据中心仍是“黄金赛道”:高盛持续看好云计算和数据中心,核心逻辑是AI token需求爆炸式增长,且企业级AI代理与消费者AI助手将提升云服务的定价能力。腾讯、阿里巴巴等互联网巨头凭借主业现金流,在AI基础设施投资中占据有利位置。

🔍【章节索引】

一、DeepSeek V4模型概述与技术突破

  • 发布信息:2026年4月24日,DeepSeek开源V4 Preview,提供Pro(1.6万亿参数)Flash(2840亿参数) 两个版本。

  • 核心能力:两个版本均支持1M token超长上下文,可一次性处理三体三部曲体量的文本。

  • 架构升级亮点

    • 混合注意力机制(CSA+HCA),大幅降低长序列计算复杂度

    • mHC技术提升训练稳定性

    • 引入Muon优化器,优化参数更新效率

二、计算效率与成本优势

  • 国产芯片适配与降价预期

    • V4已针对华为昇腾等国产芯片优化

    • 2026年下半年昇腾950超级节点大规模供货后,V4 Pro预计大幅降价

    • 成本降低将直接刺激AI应用在更多场景中的采用(如长文档分析、代码库理解、多轮复杂对话等)

三、中国AI模型市场竞争格局

  • 新品密集发布:近期Kimi K2.6、阿里Qwen3.6-Max、腾讯Hy3、小米V2.5等接连亮相,MiniMax预计5月也有新品。

  • 未来差异化关键点

    • 编程/任务完成成功率:智能体时代,模型“做事”能力比纯对话更重要

    • 多模态能力:图像、视频、音频一体化理解与生成成为竞争高地

  • 独立AI厂商优势:MiniMax等非巨头厂商组织扁平、决策灵活,能更敏锐捕捉技术拐点,在方向选择上可能领先。

四、云计算与数据中心机遇

  • 高盛首选子行业:继续将云计算和数据中心列为首选,核心逻辑是AI token需求持续爆发。

  • 定价能力提升:企业级AI代理和消费者AI助手的普及,将增强云服务的议价权,服务商有望提高单价。

  • 互联网巨头的优势:腾讯、阿里巴巴等主业现金流强劲,可持续投入AI基础设施,且内部已为AI芯片/模型团队设立独立激励机制,确保业务聚焦。

五、未来展望与投资提示

  • AI普及门槛进一步降低:DeepSeek V4的效率突破与国产芯片降价将共同推动AI应用从“精英工具”走向“大众消费品”。

  • 云计算是确定性最高的“卖水人”:无论哪家模型胜出,算力和云服务需求都将持续增长。

  • 警惕模型层过度竞争:应用侧百花齐放,但模型层价格战可能挤压独立厂商利润,需关注差异化能力。

⚠️【风险提示】

  • 技术迭代超预期:若其他厂商推出效率更高的模型,DeepSeek的先发优势可能被快速追赶。

  • 国产芯片供货不确定性:昇腾950产能爬坡若不及预期,降价节奏可能推迟。

  • 模型层价格战加剧:竞争激烈可能导致API价格快速下滑,影响所有模型厂商的盈利能力。

  • 企业级AI落地慢于预期:若企业对AI代理付费意愿不足,可能拖累云服务收入增长。