vol:20国产大模型:分化与未来竞争投研不迷路

vol:20国产大模型:分化与未来竞争

36分钟 ·
播放数0
·
评论数0

本期主题:2026 大模型深度调研:DeepSeek V4、国产算力与行业格局

日期:2026.05.21

核心摘要

DeepSeek V4 整体水平接近 GPT-4.5 Turbo,长文本能力突出但幻觉率偏高,低价策略背后是服务质量的权衡。国内大模型与海外顶尖模型的差距正在拉大,Claude 4.6 实现 "最后一公里" 突破,技术代差至少半年。国产超节点以 128 卡电互联为主,全光互联面临成本与可靠性难题。当前 AI 基础设施最紧缺的是 GPU 和 DRAM,2026 年 DRAM 资本支出占比提升最快。

一、DeepSeek V4 真实能力与低价策略

  • 能力表现:短文本代码能力持平 GPT-4.5 Turbo,长文本处理更强,工具调用与 Agent 能力良好

  • 幻觉问题:幻觉率不低,C 端体验略逊于豆包,与训练数据配比有关,非激活专家数量导致

  • 低价策略:API 价格比同行便宜 2-3 倍,成本仍有下降空间

  • 服务权衡:低价 API 不保障并发、延迟等核心指标,高 SLA 企业服务价格高出数倍

二、国内大模型竞争格局:战略分化

  • 综合排名已无意义,各家聚焦垂直领域:

    • 智谱 AI:全面押注 Coding,国内代码 / Agent 能力最强

    • Kimi:通用 Agent 路线

    • 豆包:C 端用户体验最佳

    • 阿里千问:综合能力均衡,开源生态领先

    • MiniMax:多模态生成能力突出

  • 商业化真相:代码相关 API 调用占比超 51%,是 Token 消耗的核心驱动力

三、国内外差距真相:代差正在拉大

  • 用户体验差距:Claude Code+Opus 实现端到端流畅执行,国内模型任务执行卡顿 3-5 次

  • 技术代差:Claude 4.6 是质的飞跃,相当于 5.0 版本,国内模型仅达到 Opus 4.5 水平,差距至少半年

  • 核心痛点:国内重度用户仍首选海外模型,仅因封号和价格问题考虑国产替代

四、国产超节点与互联技术

  • 主流方案:128 卡纯电互联性价比最高(如阿里云盘久服务器),是当前行业顶级水平

  • 全光互联挑战:单卡成本增加 1 万 +,光模块故障率远高于电互联,系统稳定性难以保障

  • 华为 384 集群:采用 8x8x8 拓扑,互联效率低于 NVLink 全互联,大规模优势尚未验证

  • 国产芯片路径:通过多 Die 封装和大规模互联堆叠算力,是单点性能受限下的唯一选择

五、算力基础设施供需

  • 最紧缺组件:GPU(无法采购英伟达最新 GB200/300,国内依赖二手 / 翻新 H100)和 DRAM(周期性供需失衡)

  • 资本支出:2026 年 DRAM 占比提升最快,价格上涨使其利润超过英伟达

  • CPU 需求:Agent 场景带动 CPU 消耗,但未达紧缺程度,厂商无自研动力

  • 存储变化:Agent 场景下 KV Cache 存储需求比例降低一个数量级,HBM 需求不会减少

六、未来竞争展望

  • 国内厂商将集中投入 Coding 和 Agent 领域,3-6 个月内核心能力趋于同质化

  • 竞争关键变量是海外模型的技术突破,国内仍以跟进式发展为主

  • 反蒸馏措施无法从技术上阻止数据获取,法律风险是主要限制

关键数据速览

  • 代码相关 API 调用占比:>51%

  • DeepSeek API 价格优势:2-3 倍

  • Claude 4.6 技术代差:≥6 个月

  • 单卡光互联成本增加:1 万 + 元

  • 评测环节算力投入:20%