📝 本期播客简介
本期我们克隆了:知名创投播客《20VC》在二零二六年六月的一期深度对谈 Nebius Co-Founder on AI Infrastructure Bubbles | How Price Elastic is Demand for Compute
主持人Harry Stebbings与Nebius联合创始人Roman Chernin一起拆解AI基础设施的底层逻辑。
原内容更新时间:2026-06-08
本期嘉宾是Nebius联合创始人兼首席商务官Roman Chernin。Nebius是全球增长最快的AI基础设施公司之一,市值已攀升至660亿美元,正与超大规模云服务商正面竞争。主持人Harry Stebbings是20VC的创始人,以犀利、高密度的提问风格著称。
这期节目录制于AI基础设施投资狂潮的背景下,全球资本支出计划动辄千亿美元级别。Roman在对话中系统性地拆解了Nebius的四层产品架构——从裸金属算力到托管推理再到未来的Agent层,并回应了市场最关心的问题:AI基础设施是不是泡沫?开源模型会不会摧毁OpenAI和Anthropic?与NVIDIA的权力关系如何?以及,一家资本密集型公司如何在巨头环伺中生存。
如果你正在关注AI基础设施的投资逻辑、模型经济性、企业AI采用的实际进展,或者想理解“全栈整合”在AI云服务中的真正含义,这期节目提供了来自一线建设者的高密度判断和实战洞察。
👨⚕️ 本期嘉宾
Roman Chernin,Nebius联合创始人兼首席商务官。Nebius是全球增长最快的AI基础设施公司之一,运营着全球最大规模的AI计算集群,服务对象涵盖前沿AI实验室、大型企业和开发者。Roman负责Nebius的商业战略、客户关系和市场拓展,深度参与公司在裸金属算力、托管云、推理服务等多层产品线的构建。他是一位典型的务实派建设者,强调“做好你的工作”和长期价值交付。
⏱️ 时间戳
开场与AI基础设施泡沫之辩
本期克隆节目介绍:20VC与Nebius联合创始人的深度对谈
主持人开场:Nebius市值已攀升至660亿美元
我们现在处在AI基础设施的哪个节点?是不是泡沫时刻?
Roman明确回应:我不认为这是泡沫
我们正处在这个了不起的时刻的开端,才刚刚开始真正的普及
任何一家大公司,AI普及程度才刚开始在1%的业务量里应用
开源模型对前沿模型的真实影响
转向开源模型、本地部署的趋势,为什么对OpenAI和Nebius不是打击?
这不是未来的事,现在已经在发生了
今天最好的构建方式是用前沿模型,但跑通用例后会寻找替代方案
从前沿闭源模型转向开源模型的关键:可调、可训练
这为什么会伤害Anthropic和OpenAI?因为他们又去攻克下一个前沿了
如果价值不断被侵蚀,这些万亿美元估值的公司日子好过吗?
大多数人的担忧恰恰相反:开源生态够不够强大
Jevons悖论与需求弹性
DeepSeek时刻:Nebius股价一周跌了40%,但迎来了史上最好的一周销售
每次智能变得更便宜,我们不会减少消耗,反而会增加消耗
你今天在哪些方面推进得还不够快?
AI基础设施的四层架构
Nebius思考建公司的四个维度:容量、产品、客户、资本
第一层:物理世界的扩张,部署兆瓦级算力
第二层:多租户云,面向成百上千个研发团队
第三层:托管推理,Nebius Token Factory
这一层对应垂直AI公司或企业客户
第四层:Agent应用和工作流,开发者不用想具体用哪个模型
第四层就是OpenRouter的直接竞品
当Agent需要规模化时,这是一个系统问题
容量与客户组合的战略选择
如果容量是现在的10倍,能一夜之间卖光吗?
关键问题不是有没有需求,而是怎么构建需求组合
裸金属层面只有十几个客户,托管基础设施有几百个,推理层有几千个
来自Meta或微软这类客户的收入集中度,多少是可以接受的?
Nebius的长期战略是服务尽可能多元化的客户组合
为了业务的长期安全,必须构建全栈
如果价格翻一倍,需求会有什么变化?
我们其实刚提过价,提了30%
产品层的核心问题与客户需求演变
在多租户这一层,核心问题是什么?
客户需要什么?客户的需求在怎么演变?
客户需求的变化里,有哪些公开讨论得比较少?
从训练转向推理意味着人们在构建具体的产品
飞轮效应:跑推理、生成数据、观察数据、改进模型
构建的门槛在降低,越来越多非AI研究员进入市场
差异化与全栈整合
当人们拿Nebius和其他Neo cloud对比,区别在哪?
我们的原则是全栈整合:全栈向下深入物理世界,全栈向上构建产品
业务集中度更低,客户组合更多元
企业市场才是大棋局
托管推理与Token Factory
第三层托管推理怎么解释?
用OpenAI跑通了用例,但利润空间不够,想用开源模型
去Hugging Face下载权重自己跑,结果发现跑不通
Token Factory提供开源模型或专用模型的托管推理服务
通过优化能把推理成本最多砍掉70%
怎么让一个token变便宜?模型蒸馏、推测解码、优化缓存
模型开发速度与企业AI采用
模型开发的这种速度能持续下去吗?
还有一整个生命科学模型、机器人模型、世界模型的世界
关于token成本和用量,有什么意外发现?
Revolut的案例:99%推理预算花在闭源模型上
他们开始转向开源模型,但切换速度并不快
被低估的事:建立用于改进和实验的基础引擎有多重要
一旦解决基础问题,增长就开始指数级爆发
企业端会出现大量爆发式增长
与NVIDIA的关系与权力动态
如果一方权力比另一方大得多,这种关系还算婚姻吗?
我们就是把自己该建的东西建好,把产品做好,把故事讲清楚
NVIDIA在很大程度上仍然是一家工程师驱动的公司
想赢得NVIDIA的尊重,最好的办法是让他们的工程师尊重你的工程师
资本、数据中心建设与公众抵触
把你该干的活干好,最难的部分是什么?
四个维度:建规模、建产品、服务客户、资本
我们玩的是资本密集型游戏,竞争对手是全球资本最雄厚的公司
今年的资本支出计划是2025亿美元,对手是我们的八到十倍
审批、监管和数据中心建设的延迟,其实反而帮了忙
未来六个月,资本帮不上忙;二十四个月,绝对可以解锁很多东西
公众对AI的抵触情绪越来越强,40%的项目在规划审批阶段通不过
我们把它当成一个项目组合来看,确保项目超额覆盖
太空数据中心与未来工作
在太空建数据中心,这想法是不是太疯了?
现在有那么多聪明人在努力让它变成现实,我有什么理由不相信
五年后会非常普遍的工作是什么?
把“开发者”这个身份民主化,每个人都可以成为开发者
教育会怎么变?怎么训练人去思考,当他们不需要想那么多的时候?
给两个十几岁女儿的建议:共情能力和创造力
Nebius的最大威胁与结尾
Nebius最大的威胁不是竞争,而是整体的整合
如果世界变成三五个超级帝国掌控一切,我们唯一的价值就是帮他们服务物理层需求
世界越民主化、越多元化,我们作为一门生意就越被需要
Leo Aschenbrenner买了公司5.3%的股份,内部怎么看?
我们把它看作是对我们做的事情的一种认可
每次有人投资我们,都是在给我们信任和机会去交付,回去干活
我们其实可以多庆祝一下,但就是没时间
就像鲨鱼一样,动起来才算活着,我们必须一直动
🌟 精彩内容
💡 “我们玩的是资本密集型游戏,竞争对手是全球资本最雄厚的公司”
Roman直言不讳地承认Nebius所处的竞争环境:公司年度资本支出计划高达2025亿美元,而超大规模云服务商的规模是他们的八到十倍。但他并不认为资本是短期内的决定性因素——未来六个月,资本帮不上忙,你有什么就用什么,得活下去。真正的差异在于全栈整合能力和客户组合的多元化。
“我们今年的资本支出计划是2025 billion dollars。而我们的对手,那些超大规模云服务商,规模是我们的八倍。”
💡 “每次智能变得更便宜,我们不会减少消耗,反而会增加消耗”
这是对Jevons悖论在AI时代的最佳诠释。Roman用DeepSeek时刻作为案例:当市场担心AI基础设施需求会因模型变便宜而下降、Nebius股价一周跌了40%的时候,公司却迎来了史上最好的一周销售业绩。因为更便宜的智能让更多用例在经济上变得可行,总消耗反而暴增。
“每次智能变得更便宜,同一单位智能的成本下降,我们不会减少消耗,反而会增加消耗,因为我们可以用同样的预算去解决更复杂的任务。”
💡 “Nebius最大的威胁不是竞争,而是世界变得过于集中”
这是整期节目最具战略深度的判断。Roman认为,如果未来世界被三五个超级模型、超级公司、超级帝国掌控,Nebius的价值就会被压缩到只能为它们提供物理基础设施。世界越民主化、越多元化,Nebius作为全栈平台就越被需要。这既是商业判断,也是对AI生态健康的底层关切。
“对Nebius这家公司来说,最大的威胁是世界会变得过于集中。”
💡 “就像鲨鱼一样,你得一直游动才能活着”
这句话浓缩了Nebius的生存哲学。在资本密集、技术迭代极快、巨头环伺的AI基础设施市场,没有什么是 guaranteed。Roman反复强调“回去干活”、“交付”、“不能停”,这种务实的紧迫感贯穿整个对话。他甚至坦言团队庆祝得不够,但确实没时间。
“就像鲨鱼一样。你得一直游动才能活着,对吧?所以,我们必须动起来。”
💡 “想赢得NVIDIA的尊重,最好的办法是让他们的工程师尊重你的工程师”
在谈到与NVIDIA的权力关系时,Roman没有回避对方手握巨大权力的事实,但给出了一个非常务实的策略:NVIDIA本质上仍是一家工程师驱动的公司,如果你能在硬件、软件、推理平台各个层面证明你的工程能力,关系自然会建立。这不是虚的“关系维护”,而是硬桥硬马的技术对话。
“如果NVIDIA的工程师尊重你的工程师,你们就有了一个很好的关系基础。”
💡 “我们做的是一门售后生意”
Roman用这句话定义了AI基础设施的本质。签单只是开始,真正重要的是让客户满意、持续交付。每一次客户签约、每一次投资人买入,都是在给Nebius信任和机会去交付。这种“售后思维”也解释了为什么Nebius如此重视构建全栈产品——只有在上层为客户创造更多价值,才能摆脱纯粹的价格竞争。
“云是售后生意。你卖的时候,卖的是一个承诺。然后你得让客户满意。”
💡 “企业AI采用有一个冷启动问题,但一旦解决,增长就指数级爆发”
通过Revolut的案例,Roman揭示了一个被市场低估的现象:非AI原生公司在采用AI时,前期需要大量基础性投入——建立评估体系、CI/CD流程、模型切换机制。这个阶段看起来增长缓慢,但一旦基础设施搭建完成,AI消费就会进入指数级增长。这意味着企业市场的爆发可能比表面看起来更近。
“我不会低估这些客户在搭建好能让他们快速交付的系统之后,增长速度能有多快。”
```
🌐 播客信息补充
本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的
使用 AI 进行翻译,因此可能会有一些地方不通顺;
如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
