#599.Nebius创始人:AI基础设施不是泡沫,但世界过度集中才是最大威胁

#599.Nebius创始人:AI基础设施不是泡沫,但世界过度集中才是最大威胁

59分钟 ·
播放数933
·
评论数1

📝 本期播客简介

本期我们克隆了:知名创投播客《20VC》在二零二六年六月的一期深度对谈 Nebius Co-Founder on AI Infrastructure Bubbles | How Price Elastic is Demand for Compute

主持人Harry Stebbings与Nebius联合创始人Roman Chernin一起拆解AI基础设施的底层逻辑。

原内容更新时间:2026-06-08

本期嘉宾是Nebius联合创始人兼首席商务官Roman Chernin。Nebius是全球增长最快的AI基础设施公司之一,市值已攀升至660亿美元,正与超大规模云服务商正面竞争。主持人Harry Stebbings是20VC的创始人,以犀利、高密度的提问风格著称。

这期节目录制于AI基础设施投资狂潮的背景下,全球资本支出计划动辄千亿美元级别。Roman在对话中系统性地拆解了Nebius的四层产品架构——从裸金属算力到托管推理再到未来的Agent层,并回应了市场最关心的问题:AI基础设施是不是泡沫?开源模型会不会摧毁OpenAI和Anthropic?与NVIDIA的权力关系如何?以及,一家资本密集型公司如何在巨头环伺中生存。

如果你正在关注AI基础设施的投资逻辑、模型经济性、企业AI采用的实际进展,或者想理解“全栈整合”在AI云服务中的真正含义,这期节目提供了来自一线建设者的高密度判断和实战洞察。

👨‍⚕️ 本期嘉宾

Roman Chernin,Nebius联合创始人兼首席商务官。Nebius是全球增长最快的AI基础设施公司之一,运营着全球最大规模的AI计算集群,服务对象涵盖前沿AI实验室、大型企业和开发者。Roman负责Nebius的商业战略、客户关系和市场拓展,深度参与公司在裸金属算力、托管云、推理服务等多层产品线的构建。他是一位典型的务实派建设者,强调“做好你的工作”和长期价值交付。

⏱️ 时间戳

开场与AI基础设施泡沫之辩

00:00 本期克隆节目介绍:20VC与Nebius联合创始人的深度对谈

00:38 主持人开场:Nebius市值已攀升至660亿美元

03:04 我们现在处在AI基础设施的哪个节点?是不是泡沫时刻?

03:24 Roman明确回应:我不认为这是泡沫

03:39 我们正处在这个了不起的时刻的开端,才刚刚开始真正的普及

04:23 任何一家大公司,AI普及程度才刚开始在1%的业务量里应用

开源模型对前沿模型的真实影响

05:22 转向开源模型、本地部署的趋势,为什么对OpenAI和Nebius不是打击?

05:49 这不是未来的事,现在已经在发生了

06:08 今天最好的构建方式是用前沿模型,但跑通用例后会寻找替代方案

06:46 从前沿闭源模型转向开源模型的关键:可调、可训练

07:07 这为什么会伤害Anthropic和OpenAI?因为他们又去攻克下一个前沿了

08:00 如果价值不断被侵蚀,这些万亿美元估值的公司日子好过吗?

08:24 大多数人的担忧恰恰相反:开源生态够不够强大

Jevons悖论与需求弹性

09:06 DeepSeek时刻:Nebius股价一周跌了40%,但迎来了史上最好的一周销售

10:08 每次智能变得更便宜,我们不会减少消耗,反而会增加消耗

10:37 你今天在哪些方面推进得还不够快?

AI基础设施的四层架构

10:48 Nebius思考建公司的四个维度:容量、产品、客户、资本

11:02 第一层:物理世界的扩张,部署兆瓦级算力

12:08 第二层:多租户云,面向成百上千个研发团队

13:19 第三层:托管推理,Nebius Token Factory

13:43 这一层对应垂直AI公司或企业客户

14:23 第四层:Agent应用和工作流,开发者不用想具体用哪个模型

15:20 第四层就是OpenRouter的直接竞品

15:52 当Agent需要规模化时,这是一个系统问题

容量与客户组合的战略选择

16:45 如果容量是现在的10倍,能一夜之间卖光吗?

16:57 关键问题不是有没有需求,而是怎么构建需求组合

17:39 裸金属层面只有十几个客户,托管基础设施有几百个,推理层有几千个

18:05 来自Meta或微软这类客户的收入集中度,多少是可以接受的?

18:25 Nebius的长期战略是服务尽可能多元化的客户组合

19:53 为了业务的长期安全,必须构建全栈

20:55 如果价格翻一倍,需求会有什么变化?

21:01 我们其实刚提过价,提了30%

产品层的核心问题与客户需求演变

23:17 在多租户这一层,核心问题是什么?

23:39 客户需要什么?客户的需求在怎么演变?

24:33 客户需求的变化里,有哪些公开讨论得比较少?

24:44 从训练转向推理意味着人们在构建具体的产品

25:25 飞轮效应:跑推理、生成数据、观察数据、改进模型

25:59 构建的门槛在降低,越来越多非AI研究员进入市场

差异化与全栈整合

26:49 当人们拿Nebius和其他Neo cloud对比,区别在哪?

27:15 我们的原则是全栈整合:全栈向下深入物理世界,全栈向上构建产品

28:08 业务集中度更低,客户组合更多元

28:23 企业市场才是大棋局

托管推理与Token Factory

28:58 第三层托管推理怎么解释?

29:15 用OpenAI跑通了用例,但利润空间不够,想用开源模型

29:54 去Hugging Face下载权重自己跑,结果发现跑不通

30:41 Token Factory提供开源模型或专用模型的托管推理服务

31:12 通过优化能把推理成本最多砍掉70%

31:20 怎么让一个token变便宜?模型蒸馏、推测解码、优化缓存

模型开发速度与企业AI采用

32:55 模型开发的这种速度能持续下去吗?

33:28 还有一整个生命科学模型、机器人模型、世界模型的世界

34:28 关于token成本和用量,有什么意外发现?

35:01 Revolut的案例:99%推理预算花在闭源模型上

35:28 他们开始转向开源模型,但切换速度并不快

35:39 被低估的事:建立用于改进和实验的基础引擎有多重要

36:19 一旦解决基础问题,增长就开始指数级爆发

37:01 企业端会出现大量爆发式增长

与NVIDIA的关系与权力动态

42:59 如果一方权力比另一方大得多,这种关系还算婚姻吗?

43:25 我们就是把自己该建的东西建好,把产品做好,把故事讲清楚

43:33 NVIDIA在很大程度上仍然是一家工程师驱动的公司

43:42 想赢得NVIDIA的尊重,最好的办法是让他们的工程师尊重你的工程师

资本、数据中心建设与公众抵触

44:58 把你该干的活干好,最难的部分是什么?

45:04 四个维度:建规模、建产品、服务客户、资本

45:46 我们玩的是资本密集型游戏,竞争对手是全球资本最雄厚的公司

46:06 今年的资本支出计划是2025亿美元,对手是我们的八到十倍

46:30 审批、监管和数据中心建设的延迟,其实反而帮了忙

46:58 未来六个月,资本帮不上忙;二十四个月,绝对可以解锁很多东西

48:18 公众对AI的抵触情绪越来越强,40%的项目在规划审批阶段通不过

48:44 我们把它当成一个项目组合来看,确保项目超额覆盖

太空数据中心与未来工作

50:44 在太空建数据中心,这想法是不是太疯了?

50:55 现在有那么多聪明人在努力让它变成现实,我有什么理由不相信

51:48 五年后会非常普遍的工作是什么?

51:53 把“开发者”这个身份民主化,每个人都可以成为开发者

52:37 教育会怎么变?怎么训练人去思考,当他们不需要想那么多的时候?

53:14 给两个十几岁女儿的建议:共情能力和创造力

Nebius的最大威胁与结尾

54:16 Nebius最大的威胁不是竞争,而是整体的整合

54:31 如果世界变成三五个超级帝国掌控一切,我们唯一的价值就是帮他们服务物理层需求

55:08 世界越民主化、越多元化,我们作为一门生意就越被需要

55:56 Leo Aschenbrenner买了公司5.3%的股份,内部怎么看?

56:23 我们把它看作是对我们做的事情的一种认可

56:39 每次有人投资我们,都是在给我们信任和机会去交付,回去干活

57:49 我们其实可以多庆祝一下,但就是没时间

58:18 就像鲨鱼一样,动起来才算活着,我们必须一直动

🌟 精彩内容

💡 “我们玩的是资本密集型游戏,竞争对手是全球资本最雄厚的公司”

Roman直言不讳地承认Nebius所处的竞争环境:公司年度资本支出计划高达2025亿美元,而超大规模云服务商的规模是他们的八到十倍。但他并不认为资本是短期内的决定性因素——未来六个月,资本帮不上忙,你有什么就用什么,得活下去。真正的差异在于全栈整合能力和客户组合的多元化。

“我们今年的资本支出计划是2025 billion dollars。而我们的对手,那些超大规模云服务商,规模是我们的八倍。”

💡 “每次智能变得更便宜,我们不会减少消耗,反而会增加消耗”

这是对Jevons悖论在AI时代的最佳诠释。Roman用DeepSeek时刻作为案例:当市场担心AI基础设施需求会因模型变便宜而下降、Nebius股价一周跌了40%的时候,公司却迎来了史上最好的一周销售业绩。因为更便宜的智能让更多用例在经济上变得可行,总消耗反而暴增。

“每次智能变得更便宜,同一单位智能的成本下降,我们不会减少消耗,反而会增加消耗,因为我们可以用同样的预算去解决更复杂的任务。”

💡 “Nebius最大的威胁不是竞争,而是世界变得过于集中”

这是整期节目最具战略深度的判断。Roman认为,如果未来世界被三五个超级模型、超级公司、超级帝国掌控,Nebius的价值就会被压缩到只能为它们提供物理基础设施。世界越民主化、越多元化,Nebius作为全栈平台就越被需要。这既是商业判断,也是对AI生态健康的底层关切。

“对Nebius这家公司来说,最大的威胁是世界会变得过于集中。”

💡 “就像鲨鱼一样,你得一直游动才能活着”

这句话浓缩了Nebius的生存哲学。在资本密集、技术迭代极快、巨头环伺的AI基础设施市场,没有什么是 guaranteed。Roman反复强调“回去干活”、“交付”、“不能停”,这种务实的紧迫感贯穿整个对话。他甚至坦言团队庆祝得不够,但确实没时间。

“就像鲨鱼一样。你得一直游动才能活着,对吧?所以,我们必须动起来。”

💡 “想赢得NVIDIA的尊重,最好的办法是让他们的工程师尊重你的工程师”

在谈到与NVIDIA的权力关系时,Roman没有回避对方手握巨大权力的事实,但给出了一个非常务实的策略:NVIDIA本质上仍是一家工程师驱动的公司,如果你能在硬件、软件、推理平台各个层面证明你的工程能力,关系自然会建立。这不是虚的“关系维护”,而是硬桥硬马的技术对话。

“如果NVIDIA的工程师尊重你的工程师,你们就有了一个很好的关系基础。”

💡 “我们做的是一门售后生意”

Roman用这句话定义了AI基础设施的本质。签单只是开始,真正重要的是让客户满意、持续交付。每一次客户签约、每一次投资人买入,都是在给Nebius信任和机会去交付。这种“售后思维”也解释了为什么Nebius如此重视构建全栈产品——只有在上层为客户创造更多价值,才能摆脱纯粹的价格竞争。

“云是售后生意。你卖的时候,卖的是一个承诺。然后你得让客户满意。”

💡 “企业AI采用有一个冷启动问题,但一旦解决,增长就指数级爆发”

通过Revolut的案例,Roman揭示了一个被市场低估的现象:非AI原生公司在采用AI时,前期需要大量基础性投入——建立评估体系、CI/CD流程、模型切换机制。这个阶段看起来增长缓慢,但一旦基础设施搭建完成,AI消费就会进入指数级增长。这意味着企业市场的爆发可能比表面看起来更近。

“我不会低估这些客户在搭建好能让他们快速交付的系统之后,增长速度能有多快。”

```

🌐 播客信息补充

本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的

使用 AI 进行翻译,因此可能会有一些地方不通顺;

如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

展开Show Notes
很及时