vol:20国产大模型：分化与未来竞争

投研不迷路

36分钟 ·11天前

0

·

0

本期主题：2026 大模型深度调研：DeepSeek V4、国产算力与行业格局

日期：2026.05.21

核心摘要

DeepSeek V4 整体水平接近 GPT-4.5 Turbo，长文本能力突出但幻觉率偏高，低价策略背后是服务质量的权衡。国内大模型与海外顶尖模型的差距正在拉大，Claude 4.6 实现 "最后一公里" 突破，技术代差至少半年。国产超节点以 128 卡电互联为主，全光互联面临成本与可靠性难题。当前 AI 基础设施最紧缺的是 GPU 和 DRAM，2026 年 DRAM 资本支出占比提升最快。

一、DeepSeek V4 真实能力与低价策略

能力表现：短文本代码能力持平 GPT-4.5 Turbo，长文本处理更强，工具调用与 Agent 能力良好
幻觉问题：幻觉率不低，C 端体验略逊于豆包，与训练数据配比有关，非激活专家数量导致
低价策略：API 价格比同行便宜 2-3 倍，成本仍有下降空间
服务权衡：低价 API 不保障并发、延迟等核心指标，高 SLA 企业服务价格高出数倍

二、国内大模型竞争格局：战略分化

综合排名已无意义，各家聚焦垂直领域：
- 智谱 AI：全面押注 Coding，国内代码 / Agent 能力最强
- Kimi：通用 Agent 路线
- 豆包：C 端用户体验最佳
- 阿里千问：综合能力均衡，开源生态领先
- MiniMax：多模态生成能力突出
商业化真相：代码相关 API 调用占比超 51%，是 Token 消耗的核心驱动力

三、国内外差距真相：代差正在拉大

用户体验差距：Claude Code+Opus 实现端到端流畅执行，国内模型任务执行卡顿 3-5 次
技术代差：Claude 4.6 是质的飞跃，相当于 5.0 版本，国内模型仅达到 Opus 4.5 水平，差距至少半年
核心痛点：国内重度用户仍首选海外模型，仅因封号和价格问题考虑国产替代

四、国产超节点与互联技术

主流方案：128 卡纯电互联性价比最高（如阿里云盘久服务器），是当前行业顶级水平
全光互联挑战：单卡成本增加 1 万 +，光模块故障率远高于电互联，系统稳定性难以保障
华为 384 集群：采用 8x8x8 拓扑，互联效率低于 NVLink 全互联，大规模优势尚未验证
国产芯片路径：通过多 Die 封装和大规模互联堆叠算力，是单点性能受限下的唯一选择

五、算力基础设施供需

最紧缺组件：GPU（无法采购英伟达最新 GB200/300，国内依赖二手 / 翻新 H100）和 DRAM（周期性供需失衡）
资本支出：2026 年 DRAM 占比提升最快，价格上涨使其利润超过英伟达
CPU 需求：Agent 场景带动 CPU 消耗，但未达紧缺程度，厂商无自研动力
存储变化：Agent 场景下 KV Cache 存储需求比例降低一个数量级，HBM 需求不会减少

六、未来竞争展望

国内厂商将集中投入 Coding 和 Agent 领域，3-6 个月内核心能力趋于同质化
竞争关键变量是海外模型的技术突破，国内仍以跟进式发展为主
反蒸馏措施无法从技术上阻止数据获取，法律风险是主要限制

关键数据速览

代码相关 API 调用占比：>51%
DeepSeek API 价格优势：2-3 倍
Claude 4.6 技术代差：≥6 个月
单卡光互联成本增加：1 万 + 元
评测环节算力投入：20%

在小宇宙打开