【AI创始人故事】DeepSeek梁文锋的转身: 从拒绝融资到主动融资,他经历了什么AI圈儿 | 原AI圈日报

【AI创始人故事】DeepSeek梁文锋的转身: 从拒绝融资到主动融资,他经历了什么

14分钟 ·
播放数244
·
评论数3

🧠 【本期简介】

这一期,我们聊聊最近AI圈最重磅的一次发布之一——DeepSeek 的 V4,以及它背后那位一直很“反主流”的创始人——梁文锋。

从量化投资到AGI理想主义,从“拒绝融资”到主动开启200亿美元估值融资,从英伟达GPU到华为昇腾生态适配——这不仅是一次模型升级,更像是一位技术理想主义者,被现实世界推着完成的一次关键转身。


🎯 【本期你会听到】

00:00 DeepSeek V4突然发布,AI圈炸了
01:09 梁文锋是谁?一个不像AI创始人的人
02:01 幻方量化:DeepSeek真正的起点
02:49 为什么DeepSeek曾经拒绝融资?
03:24 理想主义开始付出代价:人才流失与算力账单
06:35 V4发布:一次不能输的关键战役
07:19 百万上下文、DSA注意力,V4到底强在哪
08:44 华为昇腾适配意味着什么?
10:17 为什么梁文锋终于开始融资了
12:45 ONE MORE THING:DeepSeek真正的大考还在下半年


🧠 【本期核心观点】

1. 梁文锋不是典型AI创业者

他没有大厂背景,没有做过C端产品,而是从量化金融一路走进AI世界。

从8万元本金起步,到创立幻方量化,再到提前数年疯狂囤GPU,DeepSeek其实是一次长期技术豪赌的结果。


2. DeepSeek过去最大的底气:不缺钱

依靠幻方量化的高收益,梁文锋曾经拥有中国AI创业公司里极少见的“自供血能力”。

这让DeepSeek可以:

不接受外部融资

不被商业化KPI绑架

把资源全部砸向AGI研究

但问题是:能养公司,不代表能留住最顶级的人。


3. AI行业已经进入“烧钱下半场”

R1爆红后,DeepSeek开始出现核心人才流失。

与此同时:

模型参数量从千亿迈向万亿

训练成本指数级增长

算力投入越来越夸张

AI竞争已经不只是“谁更聪明”,而是谁能长期扛住越来越贵的账单。

4. V4最重要的不是跑分,而是“系统设计”

这一代DeepSeek V4最值得关注的,不只是性能,而是:
他们开始用更聪明的方法解决长上下文与算力成本问题。

包括:

新型注意力机制

DSA 稀疏注意力

更低显存消耗

百万token上下文能力

核心逻辑其实就一句话:

不靠暴力堆GPU,也能把模型做大。


5. 华为昇腾适配,可能是更大的一步棋

V4发布当天,Huawei 宣布昇腾超节点支持 DeepSeek-V4。

如果未来DeepSeek真的能在国产算力生态里跑出接近英伟达体系的效果,那意义可能远超一个模型版本更新。

因为这意味着:中国AI公司,第一次开始尝试建立“脱离英伟达”的前沿AI路线。


6. 这次融资,本质上是在“留人”

很多人以为DeepSeek融资,是因为缺钱。

但更准确地说:不是“活不下去了”,而是“光活下去已经不够了”。

这轮200亿美元估值融资,更重要的作用其实是:
给团队期权、给研究员未来预期、给公司长期稳定性。


AI竞赛的下半场,比的不是谁更惊艳,而是谁的账单付得起。


👀 本期提到的重要人物 / 公司

梁文锋 DeepSeek 幻方量化 Huawei Anthropic OpenAI xAI Xiaomi ByteDance


🎧 关于《AI创始人系列》

这是一个从“创始人视角”切入AI行业的栏目。

我们不只聊模型、产品和融资,
也聊:

创始人的选择

技术路线背后的赌注

AI行业真实的竞争逻辑

理想主义和现实世界之间的拉扯


⏭️ 下一期预告

下一期,我们想聊聊:
为什么有人“不训练大模型”,却做出了2026年最火的AI产品?

主角是:Peter 和他的项目 —— OpenClaw。

下周五见!

展开Show Notes
lucy3215
lucy3215
2026.5.16
声音太好听啦
Kyro_Tech:哈哈 谢谢~
新料速递员-昀野
:
哦莫,开心!