光子革命:Lightmatter如何用光速互连技术颠覆AI数据中心?硅谷前沿

光子革命:Lightmatter如何用光速互连技术颠覆AI数据中心?

4分钟 ·
播放数1
·
评论数0

大家好,我老鱼。今天我们要聊的这个话题啊,可以说是近期半导体圈最热门的新闻之一了。有一家叫做Lightmatter的公司,最近拿到了4亿美元的融资,估值直接飙升到了44亿美元。这个数字听起来是不是很惊人?

不过这家公司很有意思,它既不生产GPU,也不和台积电拼先进制程,而是专注于一个非常特别的领域 - 用光来连接芯片。说到这里可能很多听众会好奇,光连接芯片到底是什么高科技?简单来说就是用光子代替电子进行数据传输,据说能让数据中心节省一半的电费,速度还能快上10倍。

说到这里我们要先聊聊AI数据中心现在面临的最大问题。很多人以为是GPU不够用,但实际上最大的瓶颈在于GPU之间的互连速度跟不上。想象一下你手上有1000张Nvidia的H100芯片,每张都在拼命运算,但当它们需要互相传输数据时,却要排队挤在那几条铜线上。这就好比高速公路出口只有两条车道,再多的车都得乖乖排队。

现在的NVLink技术,一条链路的速度大约是1.8Tb/s,听起来很快对吧?但当你要连接上万甚至十万张卡时,这个带宽就远远不够用了。而且铜线还有个致命缺点就是功耗太高,发热严重。据统计数据中心的电力消耗有一半都花在了散热上。

正是在这个背景下,Lightmatter的出现就显得特别有意义。它的创始人Nick Harris是个很有意思的人,曾经在美光工作多年,后来跑到MIT读博研究光子计算。他发现光子在做某些计算时不仅速度快,而且几乎不发热。最初他们想做光子GPU,但很快发现这条路太难走,于是果断转向了互连技术这个更实际的方向。

现在Lightmatter有两条主要产品线:一个是Envise AI加速器,这是个混合光电的产品;另一个是真正的主打产品Passage,这是一个3D光子互连芯片。最新款的M1000频宽达到惊人的114TB/s,相当于60条NVLink的带宽总和。最关键的是它的功耗极低,这对数据中心来说简直就是福音。

不过技术再炫酷也得看商业化能力。这方面Lightmatter做得不错,谷歌和亚马逊都在测试他们的产品。谷歌从早期Envise时期就开始合作,而据说亚马逊已经在北美某个数据中心部署了几百台Passage设备。

说到这里可能有听众会问,这家公司会不会威胁到Nvidia的地位?我个人觉得短期内不会。Nvidia的CUDA生态系统太强大了,Lightmatter更像是Nvidia的补充而不是竞争对手。最理想的组合可能就是Nvidia的GPU搭配Lightmatter的Passage互连技术。

当然了,这家公司也面临着不少挑战。光子芯片的量产良率还不够高,而且互连技术很容易形成路径依赖。如果Nvidia或AMD哪天自己推出类似产品,Lightmatter的市场可能会被蚕食。不过现在他们正在筹备上市,明年可能会IPO,让我们拭目以待。

最后留给大家一个问题:在AI数据中心规模越来越大的今天,你们觉得互连技术和计算能力哪个更重要?如果是你,会优先投资更多的GPU还是更好的互连技术?欢迎在评论区分享你的看法。