📌 看点简介
AI 基础设施的真正瓶颈,已经悄悄从"算力"转移到了"通信"。过去三四年,AI 算力增长了 300 倍,而光互连只增长了 30 倍——这 10 倍的 Gap 有一个直接的名字,叫通信墙。打穿这堵墙的关键技术,正在迎来高成长的超级周期。
本期,我们邀请到 TeraHop 副总裁、前中华光电学会主席于让尘(Ryan Yu)博士一起聊聊光互连行业正在经历的这场技术革命和产业格局。
从 Scale Up / Scale Out / Scale Across 的三重互连场景,到可插拔 / NPO / CPO 的三条技术路线;从 NVIDIA 斥资 40 亿美金战投 Lumentum 和 Coherent 背后的垂直绑定信号,到 OFC 上突然爆发的开放标准生态;从谷歌 Ironwood TPU v7 + OCS 构建的"最强大脑",到硅光、薄膜铌酸锂、III-V 族化合物半导体三条重要技术路线的融合演进。
⏱️ 时间戳
AI 时代的通信墙
光互连在 AI 算力中的不可替代性:脑灰质与脑白质
AI算力集群互连的Scale Up,Scale Out,Scale Across
光进铜退的经济账
可插拔 / NPO / CPO 三条技术路线深度拆解
硅谷大厂的技术选择:谷歌、Meta、亚马逊、英伟达的路线差异
光方案的技术演进路线
12.8T的带宽飞跃
英伟达 40 亿美金战投 Lumentum & Coherent 的产业信号
OFC多元协议与开放生态
OCS 光交换 vs 电交换:谷歌 10 年布局与行业机会
光模块厂商的未来布局
实现 400G per lane的重要技术路线:硅光 / 薄膜铌酸锂 / EML激光器
万亿美金级价值链重塑&发展瓶颈
5-10 年展望
💬 金句预览
"算力过去四五年发展了 300 倍,而 AI 连接只发展了 30 倍。这个差距有 10 倍的 Gap 要去填补,必须整个业内一起来努力。" ——
"Use copper when you can, use optics when you must.(能用铜就尽量用铜,必须用光就用光。)" ——
"所有的互连网公司他们是很实际的,他们不会做宗教式的选择。" ——
"可插拔模块、NPO、CPO——甚至同一个互连网公司,它三项都选,叫做成年人不做选择题。" ——
"谷歌已经走在最前面 10 年,其他互连网公司还基本是零——这对供应商来讲是一个 Greenfield 机会。" ——
"哈哈哈,这个很快变成一个万亿级别的问题。" ——
"大家应该把光互连看作算力的一部分——而不是把算力和互连看作互相争夺资源的两块,而是一个共生、共同成长、共同优化的生态。" ——
📖 专业词汇
光互连 Optical Interconnect:用光信号替代铜线中的电信号来传输数据。更高带宽、更低延迟、更少能耗。在大模型时代从"数据中心的基础设施配件"上升为"AI 算力架构的核心变量"。
通信墙 Communication Wall:AI 算力增长远远超过互连带宽增长(300x vs 30x)带来的瓶颈——芯片越来越强,但"把它们连成一个系统"的能力增长最慢。今天 AI 集群算力跑不满,很大一部分就损失在这堵墙上。
Scale Up / Scale Out / Scale Across: AI 集群互连的三重场景。Scale Up 是机柜内互连(距离最短、带宽要求最高);Scale Out 是机柜间互连(构建大训练集群);Scale Across 是跨数据中心互连(解决单个数据中心的电力/土地极限)。
可插拔(Pluggable):光模块的经典形态——像 U 盘一样插在交换机上,灵活、易维护、供应链开放。TeraHop 的 12.8T XPO 是目前最具代表性的下一代高速可插拔方案。
LPO(Linear Pluggable Optics):可插拔的"低功耗版本"——把传统可插拔模块里最耗电的 DSP 环节拿掉,保留易维护性,更适合 AI 集群。
NPO(Near-Packaged Optics):近封装光学——光模块往主芯片靠近一步,但还没完全封装在一起。是可插拔和 CPO 之间的中间路线。
CPO(Co-Packaged Optics):共封装光学——把光引擎和主芯片深度封装成一个整体。带宽密度最高、电路径最短(毫米级)、延迟最小,被公认是下一代超大规模 AI 集群的终极形态。英伟达 Rubin 架构首次采用 CPO,被视为光互连近十年来最大架构变革。
OCS(Optical Circuit Switch,光交换机):不同于传统电交换机一站站接收/判断/转发数据包,OCS 直接建立端到端的光路径,让数据沿专用通道通过。功耗低、延迟小、成本优。谷歌用 OCS 构建了 9,216 颗 TPU 的 Ironwood 超级大脑。
Coherent Light(相干光传输):一种高级光调制技术,天然具备放大作用,链路预算更高。与 OCS 是天然搭档——能弥补 OCS 的信号损耗,让光交换方案在未来更高速率下依然跑得动。
硅光 Silicon Photonics:在硅衬底上用半导体工艺(CMOS 兼容)集成光学器件的技术平台。让光器件像芯片一样在 12 英寸晶圆上大规模量产,是过去几年整个光互连行业最重要的底层变化。
TFLN(Thin-Film Lithium Niobate,薄膜铌酸锂):下一代高性能电光调制器的材料平台。可以嫁接到硅光平台上形成混合集成方案。
III-V 族化合物半导体:激光光源的主流材料(InP 系列),代表器件包括 DFB、EML 等。硅本身不发光,所以激光器至今是光互连绕不开的关键组件。
MSA(Multi-Source Agreement):行业多源协议——多家公司共同制定的开放标准,避免被单一供应商绑定。今年 OFC 出现了 LPO MSA、Open CPX MSA、SDM4 MCF 三大新标准,100+ 公司参与。
NVL72 :英伟达最新一代机架式 AI 大脑(72 颗 GPU 通过铜缆互连。
Ironwood(TPU v7):是谷歌 2025 年 4 月发布的 9,216 颗 TPU + OCS 的超级大脑。两条路线的代表作。
光进铜退:随着单通道速率向 200G/400G 迈进,铜缆物理极限(1–2 米)逼近临界点,光互连逐步取代铜互连成为确定性趋势。
脑灰质 vs 脑白质:于博士贯穿全期的类比——灰质是计算(算力),白质是连接(互连)。人类大脑两者比例接近 1:1,而 AI 数据中心今天光互连只占 10–20%。"我们还在猫的阶段。"
🗂️ 内容大纲
一、通信墙:AI 算力 300 倍 vs 光互连 30 倍增长
算力、存储、互连:AI 集群发展的三个绕不开的主题
3 万美金的 H100 为什么跑不满:互连上的限制最终变成算力上的限制
光互连已经不是配件,是必选项
二、三重互连场景:Scale Up / Scale Out / Scale Across
机柜内、机柜间、跨数据中心——三种距离对应三种解决方案
Meta 的曼哈顿规模数据中心园区:Scale Across 的极限案例
为什么 Scale Up 是光互连的最大增量
NVL72 逼近铜缆物理极限:光进铜退的拐点
三、Scale Up 技术路线的"成年人不做选择题"
可插拔 / LPO / NPO / CPO 四条路线的本质差异
大厂的真实选择逻辑:没有宗教式的信仰,只有场景化的最优组合
TeraHop 的策略:"让三条马都在跑"
四、市场信号冲突:GTC 的垂直绑定 vs OFC 的开放爆发
NVIDIA 40 亿美金战投 Lumentum & Coherent:供应链锁定背后的 CPO 野心
OFC 开放标准潮:LPO MSA、Open CPX MSA、SDM4 MCF 为何此时密集推出
100+ 公司为什么都在推开放生态:大厂不愿被任何人锁死
五、OCS 光交换:谷歌十年布局开启的产业新机会
从"每条链路跑多快"到"数据在网络里怎么走"
Ironwood(TPU v7):9,216 颗 TPU + OCS 的最强大脑
CapitalG 最新加注 Celero Communications:相干光与 OCS 的天然配对
电交换不会消失,但 OCS 的比例会持续上升
六、半导体化的必然:材料之争与万亿美金级价值链
万亿美金市场的底层共识:朝晶圆级、CMOS 兼容的光电集成走
硅光 / TFLN / III-V 三条材料路线的并行演进与相互融合
激光器晶圆生态的瓶颈:3 英寸 vs 12 英寸的量级差距
量子点激光器 & TSMC COUPE:破局的两个方向
七、5–10 年展望:从"猫"到"人"的演化
大脑的演化类比:灰质(算力)和白质(连接)的比例变化
今天的 AI 数据中心:我们还在猫的阶段
光互连未来还有 5 倍以上的增长空间
八、收尾金句:"把光互连看作算力的一部分"——共生、共同成长、共同优化
🌍硅谷坐标
立足美国硅谷, 聚焦前沿科技与科技投资趋势。在 AI 重新定义人类边界的时代,我们深入科技与资本的第一现场,为全球受众提供准确、深度、独立的专业报道。
📮 联系我们
硅谷坐标欢迎评论区留言交流,转发支持!长期招聘主持人、研究员、编辑、摄像和后期视频团队。也欢迎加入我们的志愿者团队,参与一线前沿的讨论和采访。我们的志愿者由科技从业人员、专业投资人和媒体团队组成。

