【AI创始人故事】DeepSeek梁文锋的转身: 从拒绝融资到主动融资，他经历了什么

🧠 【本期简介】

这一期，我们聊聊最近AI圈最重磅的一次发布之一——DeepSeek 的 V4，以及它背后那位一直很“反主流”的创始人——梁文锋。

从量化投资到AGI理想主义，从“拒绝融资”到主动开启200亿美元估值融资，从英伟达GPU到华为昇腾生态适配——这不仅是一次模型升级，更像是一位技术理想主义者，被现实世界推着完成的一次关键转身。

🎯 【本期你会听到】

00:00 DeepSeek V4突然发布，AI圈炸了
01:09 梁文锋是谁？一个不像AI创始人的人
02:01 幻方量化：DeepSeek真正的起点
02:49 为什么DeepSeek曾经拒绝融资？
03:24 理想主义开始付出代价：人才流失与算力账单
06:35 V4发布：一次不能输的关键战役
07:19 百万上下文、DSA注意力，V4到底强在哪
08:44 华为昇腾适配意味着什么？
10:17 为什么梁文锋终于开始融资了
12:45 ONE MORE THING：DeepSeek真正的大考还在下半年

🧠 【本期核心观点】

1. 梁文锋不是典型AI创业者

他没有大厂背景，没有做过C端产品，而是从量化金融一路走进AI世界。

从8万元本金起步，到创立幻方量化，再到提前数年疯狂囤GPU，DeepSeek其实是一次长期技术豪赌的结果。

2. DeepSeek过去最大的底气：不缺钱

依靠幻方量化的高收益，梁文锋曾经拥有中国AI创业公司里极少见的“自供血能力”。

这让DeepSeek可以：

不接受外部融资
不被商业化KPI绑架
把资源全部砸向AGI研究

但问题是：能养公司，不代表能留住最顶级的人。

3. AI行业已经进入“烧钱下半场”

R1爆红后，DeepSeek开始出现核心人才流失。

与此同时：

模型参数量从千亿迈向万亿
训练成本指数级增长
算力投入越来越夸张

AI竞争已经不只是“谁更聪明”，而是谁能长期扛住越来越贵的账单。

4. V4最重要的不是跑分，而是“系统设计”

这一代DeepSeek V4最值得关注的，不只是性能，而是：
他们开始用更聪明的方法解决长上下文与算力成本问题。

包括：

新型注意力机制
DSA 稀疏注意力
更低显存消耗
百万token上下文能力

核心逻辑其实就一句话：

不靠暴力堆GPU，也能把模型做大。

5. 华为昇腾适配，可能是更大的一步棋

V4发布当天，Huawei 宣布昇腾超节点支持 DeepSeek-V4。

如果未来DeepSeek真的能在国产算力生态里跑出接近英伟达体系的效果，那意义可能远超一个模型版本更新。

因为这意味着：中国AI公司，第一次开始尝试建立“脱离英伟达”的前沿AI路线。

6. 这次融资，本质上是在“留人”

很多人以为DeepSeek融资，是因为缺钱。

但更准确地说：不是“活不下去了”，而是“光活下去已经不够了”。

这轮200亿美元估值融资，更重要的作用其实是：
给团队期权、给研究员未来预期、给公司长期稳定性。

AI竞赛的下半场，比的不是谁更惊艳，而是谁的账单付得起。

👀 本期提到的重要人物 / 公司

梁文锋 DeepSeek 幻方量化 Huawei Anthropic OpenAI xAI Xiaomi ByteDance

🎧 关于《AI创始人系列》

这是一个从“创始人视角”切入AI行业的栏目。

我们不只聊模型、产品和融资，
也聊：

创始人的选择
技术路线背后的赌注
AI行业真实的竞争逻辑
理想主义和现实世界之间的拉扯

⏭️ 下一期预告

下一期，我们想聊聊：
为什么有人“不训练大模型”，却做出了2026年最火的AI产品？

主角是：Peter 和他的项目 —— OpenClaw。

下周五见！