

写给在算力牛中焦虑的人# 写给在算力牛中焦虑的人 最近市场交易得很极致。 在算力核心板块里的人,每天生活在上涨的恐惧里:怕卖飞,怕踏错节奏,怕今天不是顶、明天才是顶。不在核心板块里的人,又是另一种焦虑:明明是牛市,自己却像满仓踏空。仓位重的人也并不轻松,每天要面对剧烈洗盘,还要被各种自媒体情绪干扰,反复琢磨是不是该卖了。 今天这篇笔记,不想再多讲市场。关于市场,昨天直播里已经讲了很多,大家可以去看回放。我更想说说,在这种市场环境下,怎么调节焦虑。 第一类,是因为没有建立 AI 认知,或者虽然有认知但没有形成信仰,导致一直没有上车的人。
长江机械TGV玻璃基板专家会# 长江机械TGV玻璃基板专家会 如果把先进封装看成一座三层结构,上面是芯片,中间是中介层,下面是载板层,那么今天讨论的 TGV 玻璃基板,本质上是在回答一个问题:当 AI 芯片越来越大、集成度越来越高、发热和走线越来越复杂,原来的硅中介层和 ABF 有机载板,还能不能继续支撑下一轮升级? 现有 CoWoS 等 2.5D 封装里,中介层主要用硅,载板层主要用 ABF。它们的优势是成熟,但瓶颈也越来越明显。芯片尺寸继续放大后,硅中介层要做得更大,受限于十二寸硅片和高质量大尺寸硅片成本,经济性会承压。ABF 载板的问题则更多来自热膨胀系数,也就是 CTE。AI 芯片发热增加,载板容易翘曲,而封装里的线路非常细,一旦形变,就可能带来断路、短路等可靠性风险。 玻璃之所以被重新推到先进封装前台,是因为它同时击中了几个痛点。第一,玻璃作为中介层,成本相对更低,更适合承接更大面积的封装需求。第二,玻璃作为载板,热膨胀系数可调,而且可以做到比较低,发热时膨胀很小,有机会缓解 ABF 的翘曲问题。第三,玻璃信号损耗极低,在高频通信、光电共封装和光电集成场景里更有吸引力。换句话说,玻璃既可能替代中介层,也可能替代载板层,甚至在更长期里同时替代两层。 更重要的是,玻璃基板解决的不是一个单点问题,而是 AI 芯片继续放大之后的系统性问题。面积变大,意味着中介层和载板都要承载更复杂的互连;发热增加,意味着材料稳定性要更强;光信号进入封装体系,意味着低损耗能力变得更重要。也正因为如此,玻璃基板的机会不只在材料端,而会沿着封装制造链条扩散到设备、加工、检测和代工环节。
大摩LTAs对存储器行业的影响# 大摩LTAs对存储器行业的影响 如果只按老框架看 DRAM 和 NAND,市场最容易得出的结论就是:这是典型周期品,需求弱就掉价,供给紧就暴涨,所以估值天然要打折。但摩根士丹利在 2026 年 5 月 22 日的《科技脉动:LTAs——对存储器行业的影响》里给出了一个更值得重视的新判断:AI 数据中心正在把存储从“波动的标准品”,推向“被长期合约锁定的关键资源”。 报告的核心变量是 LTA,也就是长期供货协议。过去半导体景气上行期也有 LTA,但多数只是季度、年度,或者约束力较弱的多年意向;这一轮则明显不同。大摩强调,新 LTA 通常覆盖 3 到 5 年,除了锁定供货量,还可能带有预付款、价格区间、价格下限、最低利润保护、财务担保,甚至 NCNR,也就是不可取消、不可退款的条款。换句话说,它已经不只是采购承诺,而更像是 AI 客户为未来产能买的一张“供应保险”。 为什么现在这种协议会突然变得重要?因为需求结构已经变了。过去驱动存储行业的主要是 PC、手机和消费电子,现在最重要的买家正变成建设 AI 基础设施的超大规模云厂商。大摩引用台积电上调后的半导体 TAM 判断,预计 AI 半导体市场到 2030 年仍有 50% 到 60% 的增长空间;但另一边,DRAM 供给从 2027 年开始可能受到 EUV 设备瓶颈约束,比特出货年增速大约只能维持在 30% 左右。在这样的供需组合下,云厂商不再愿意临时抢货,而是更早、更深地锁定中长期供应。 这也是报告最重要的结论:LTA 可能让存储行业“没那么周期”。如果未来两到三年里,超过 50% 的供给都被多年协议锁住,那么即使行业后面再有扩产,价格和利润率也会因为长期合同覆盖而多一层缓冲。它的意思不是价格以后不波动了,而是说下行时会多一层合同保护,上行时也更容易把利润和现金流沉淀下来。厂商扩产的逻辑,也会从“押未来需求”逐步转向“响应已经确认的订单”,库存风险和过度建设风险都会下降。大摩甚至用了一个很形象的说法:AI 客户通过长期锁单获得了供应保障,但这也会对其他客户形成一层“存储器税”,因为可自由分配的产能变少了。
先进存储长什么样# 先进存储长什么样 如果把 AI 服务器拆开看,你会发现一个很有意思的变化:过去我们说“存储”,脑子里往往是内存条、硬盘、SSD;但在 AI 时代,存储正在变成一套贴着计算芯片生长出来的系统。 最靠近 GPU 的,是像“小高楼”一样堆起来的 HBM。再往外,是越来越短、越来越密、越来越低功耗的服务器内存模组。最外层,则是容量巨大、接口越来越快的企业级 SSD。它们不再只是“放数据”的地方,而是 AI 计算能不能喂饱、能不能跑快、能不能降低能耗的关键部件。  这也是为什么未来两三年的存储升级,不能只看价格周期。真正重要的是:存储正在离计算越来越近,形态越来越像系统工程,而不是标准零件。
算力以外都是熊# 算力以外都是熊 先说结论,这一轮 AI 行情最大的特点,不是所有板块轮着涨,而是景气度几乎都被算力吸走了。很多人总在等白酒、消费、地产、顺周期什么时候全面接棒,但如果你把时间拉长一点看,会发现真正持续的轮动并没有发生。外面偶尔有反弹,更多像情绪修复,真正一直在景气里的,还是 CPU、GPU、存储、PCB、整机、液冷、光通信这些算力链内部的东西。 核心原因,不是市场风格问题,而是这次科技革命的性质和以前不一样。以前像电力、互联网那种,属于赋能型革命。它们虽然也会替代掉一部分旧东西,但更重要的是会创造新的总需求。电灯替代蜡烛,但电又带来了电视机、冰箱、洗衣机,整个社会的需求是被做大的。可这次 AI 不太一样,它到现在为止,对总需求的拉动还没有那么明显,但它对供给侧的重构特别强。说白了,就是谁先用上 AI,谁就能更快抢资源、抢效率、抢利润。 这就是为什么它更像一次替代型革命,甚至可以说是掠夺型革命。AI 的壮大,本质上是在吸别的行业的资源,所以你会看到一个非常鲜明的结果:AI 里面的从业者、设备商、上游零部件公司,很多都在躺着赚;但 AI 外面的很多行业,哪怕看起来估值不高,日子也并不好过。景气度不是平均扩散,而是被集中到了少数方向上。 所以这次大家想象中的那种“先科技、再消费、再地产、再顺周期”的大轮动,很可能本来就不存在。真实发生的,是算力内部轮动。今天涨 GPU,明天涨内存,后天涨 PCB,再过几天轮到光通信或者电力,本质上都还是围绕一个主线在转。你看到外面偶尔拉一拉,更多是在诱惑你离开主线,不是真的景气切换。以前几轮行情背后多少还有地产政策和顺周期扩散,这一次更像纯技术红利,所以外部板块很难自然接棒。
算力是机器人的消费品# 算力是机器人的消费品 用传统周期股的视角看算力硬件,人是最终消费者,算力硬件只是工业品。 人的能量来源是吃喝,是日常消耗,也是持续需求。所以食品、饮料、日用品这类东西,天然有一定的抗周期属性。经济好,人要吃饭;经济不好,人也要吃饭。需求不会因为短期景气波动就消失,所以市场愿意给消费品更稳定、更高一点的估值。 但工业品不一样。 大多数工业品是同质化的,需求又受人口、产能和终端消费约束。只要行业景气起来,大家一起扩产,一旦开足马力,供给很容易跑到需求前面。最后的结果往往就是价格下跌、利润回落、库存累积,所以传统框架里,算力硬件也容易被当成周期品来看。 但是,如果从 AI agent 的角度重新看,逻辑就变了。 在 agent 时代,agent 本身就是消费者。算力不是 agent 的工具,而是 agent 的能量来源。就像吃喝对于人来说不是一次性设备,而是每天都要持续消耗的东西;算力对于 agent 来说,也不是买完就结束的资本品,而是它运行、思考、协作和完成任务所必须消耗的“口粮”。 这就是关键变化。 人类消费有一个天然限制,就是人口。一个人一天能吃多少、喝多少、用多少,终究是有上限的。但 agent 没有这样的人口限制。只要它能够替代劳动力,并且创造经济效益,它的渗透率在可预见的未来里就看不到明确瓶颈。 更重要的是,agent 不是单线程的人。 一个人同一时间通常只能处理一件主线任务,但 agent 天然可以多线程工作。一个公司可以部署十个 agent,也可以部署一百个、一千个。只要投入产出比成立,agent 的“人口数量”就可以继续扩张。它不是被出生率限制的劳动力,而是可以被算力和应用场景不断复制出来的数字劳动力。 所以,算力需求的底层逻辑也变了。 如果每天活跃的 agent 越来越多,每个 agent 又需要持续消耗算力,那么算力就不再只是某一轮资本开支周期里的工业品,而更像是机器人的日常消费品。它对应的不是一次性建设需求,而是持续运行需求;不是短期扩产后的供需波动,而是数字劳动力规模扩张带来的长期消耗。 这也是为什么,用过去那种“一两年扩产过剩”的周期宿命去理解算力,可能会低估这个行业的变化。 当然,算力硬件内部依然会有阶段性波动,也会有竞争、库存和价格压力。但从更大的框架看,只要 AI agent 的活跃数量持续增长,只要它们真的能替代人力、创造收入、提升效率,算力就会越来越像机器人世界里的消费品。 具体到算力各个赛道、各个板块,估值最低的其实是存储。未来 12 个月看,存储的估值仍然只有个位数;但如果从现在看到明年,估值提升到十几倍、业绩明年继续翻倍,都是大概率事件。 所以,存储最近的暴涨,并不是简单的抱团瞎炒,而是算力体系里最后一个低估值板块,正在进行估值切换:从过去的周期股估值,切换到成长股估值。
Figure机器人商业化开端# Figure机器人商业化开端 机器人走向商业化的开端  最近 Figure 做了一件很有意思的事:它把 F.03 人形机器人放到了物流分拣场景里,做了一场长时间直播。 这件事最值得关注的地方,不只是机器人又会搬箱子、扫条码、推包裹了,而是两个字:直播。
国金:再谈PCB的半导体化# 国金:再谈PCB的半导体化 今天这篇,我们讲国金证券一份关于 PCB 的深度报告。报告最重要的判断,不是“PCB 又到景气周期了”,而是 AI 推理架构的变化,正在把 PCB 从传统连接件,推成越来越接近半导体封装等级的核心部件。换句话说,市场以前看 PCB,更多是看服务器出货、层数升级和周期波动;但这一轮如果还是只按传统电子制造的框架去看,可能会低估它在 AI 系统里的角色重估。 为什么会出现这种变化?核心原因是,大模型推理的真正瓶颈,正在从算力本身,转向显存带宽和系统互联。报告把推理拆成两个阶段。Prefill 阶段更像计算密集型任务,GPU 算力利用率可以到九成以上,但显存带宽占用并不高;到了 Decode 阶段,情况就反过来了,GPU 很多时候在等数据,算力利用率明显掉下来,显存带宽占用却会升到八成甚至九成以上。也就是说,下一代 AI 硬件比拼的重点,不再只是单卡峰值算力,而是谁能更高效地把数据在芯片、封装、板卡和机柜之间搬运起来。 这一步非常关键,因为它直接改变了 PCB 的定位。过去大家觉得,PCB 更像承载芯片和器件的底座;现在它开始变成影响信号完整性、传输效率、电源完整性和散热协同的关键环节。报告里提到,不管是 MLA、MoBA 这样的算法优化,还是张量并行、流水线并行、跨节点并行这样的系统优化,最后都在把“高速互联”这件事的重要性抬高。AI 硬件从“单卡算力竞争”,走向“整机柜互联效率竞争”,而能承载这种复杂互联关系的,恰恰是高频高速、高层数、高精度的 PCB。 所以国金这篇报告给出的第一层结论是,PCB 的升级不是简单多做几层板,而是朝半导体级工艺逼近。高端服务器 PCB 层数从过去十层左右,往二十层、三十多层、甚至六十四层以上走;材料体系从普通覆铜板升级到更强调低损耗和高可靠性的方案;客户认证周期、阻抗控制、层间对位和热管理,也越来越像先进封装而不是传统消费电子板卡。这就是“PCB 的半导体化”真正的起点。
大摩芯片测试幕后英雄# 大摩芯片测试幕后英雄 来源:摩根士丹利(Morgan Stanley),2026-04-16 英文题目:Hidden Heroes Behind Chip Testing; Initiate Hon Precision, MPI and WinWay at OW ## 口播稿(v3,重做版) 你可能没想过,在一颗 AI 芯片里,真正决定它能不能稳定跑起来的“幕后英雄”,往往不是设计,也不是制造,而是测试。 摩根士丹利在 4 月 16 日发了一份重磅报告,核心观点很明确:半导体测试正在进入一个由 AI 驱动的结构性上行周期。以前大家把测试当成本中心,能省就省,但 AI 把这个逻辑彻底改写了。
别急着轮动:这一轮AI主线为什么仍然在算力硬件# 别急着轮动:这一轮AI主线为什么仍然在算力硬件 很多人问我,AI 算力板块已经涨了这么多年、涨了这么多,还能不能继续看?会不会轮动到消费、非 AI,或者其他更便宜的板块?我理解这种恐高。涨多了以后,人总想找一个没涨的东西,好像只要便宜就安全。但我的答案比较明确:这一轮主线还在 AI,尤其还在算力硬件。 先说宏观。现在我看不到货币宽松周期在此时此刻就结束的迹象。伊朗战争当然会把油价和通胀预期打上去,但战争、海峡、油价这些东西是事件驱动的,是非线性的。今天说缓和,油价就可能下去;如果真封到年底,那当然要重新评估。但不能因为一个事件把通胀拉起来,就直接推导出宽松周期结束、甚至重新加息。 更底层的变化是,这一轮科技革命和过去不一样。AI 不是传统意义上的赋能型科技革命,它更像是把其他行业的一部分价值抽到 AI 产业里。你会发现国外也好,国内也好,真正景气的就是 AI 相关产业,其他很多行业都偏萧条。就业也不强,因为企业扩招时会自然多想一步:这个岗位到底是招人,还是用 Agent 解决? 所以这一轮降息周期也可能比过去更长。以前房地产、消费和就业一起起来,需求很快会把通胀重新推上去。现在不是这样。AI 提高效率,但也压制就业和收入预期,消费很难真正起来。大家开始研究性价比,本质上就说明消费不好。消费最好的时候,不是人人算性价比的时候,而是大家愿意为品牌、情绪和智商税买单的时候。
一切才刚刚开始:从Mac缺货到白领渗透率拐点# 一切才刚刚开始:从Mac缺货到白领渗透率拐点 我一直觉得,桌面 Agent 这件事不是到了尾声,而是才刚刚开始。 为什么这么说?因为我们现在讨论的 Agent,和过去那种 AI 软件根本不是一类东西。AI 软件更像一个搜索框、一个聊天框,你问它,它回答你。但桌面 Agent 是能接任务、能记住规则、能调用工具、能复现流程的数字员工。这个东西要真正成立,至少要满足几个条件:它要有记忆,所以最好在 PC 端运行;它要能越来越好,所以需要一套 Skill 文档,把你的工作流程沉淀下来;它还要能稳定复现,而这背后需要更强的模型能力。 所以我不太认同“Agent 已经炒完了”这种说法。去年市场上当然也有很多叫 Agent 的东西,但里面有不少是假 Agent,更多只是把聊天机器人包装成自动化工具。真正让普通白领开始感知到桌面 Agent 的变化,我认为是从 2026 年 3 月以后才开始的。 3 月之前,这更像是工程师的玩具。很多早期工具连像样的 UI 都没有,打开之后像回到了 DOS 时代,普通人根本不知道怎么用。工程师可以忍,非工程师很难忍。到了 3 月以后,Codex 这类桌面端产品把交互门槛降下来了,界面变得更友好,使用方式也从“只适合工程师”变成了“小白也能上手”。我说的破圈,就是从秃工程师,变成秃所有人。
AI ROI争论可以结束了:Agent会把算力变成一门高毛利生意# AI ROI争论可以结束了:Agent会把算力变成一门高毛利生意 过去一年,市场反复争论 AI 的 ROI。每年投那么多钱建算力中心,最后到底能赚回来多少?如果 AI 只是一个更聪明的搜索框,这个问题确实很难回答。你问一句,它答一句,体验再好,本质上还是软件订阅。软件订阅的天花板大家都很熟,像视频会员一样,一年两三百块,贵一点也就是一个工具钱。 但 Agent 出来以后,这个账要重算。因为 Agent 交付的不是“回答”,而是“工作成果”。只要你的工作是在电脑上完成的,而且有流程、有步骤、有复现要求,Agent 就可以真的帮你干活。它不是让你少搜几分钟资料,而是像一个数字员工一样,把研究、整理、写作、审计、文件生成这些事情接过去一部分。 这时候定价逻辑就变了。你不再拿它和一个视频会员比,而是拿它和一个员工比。如果它能稳定帮你省掉一部分人力,或者让同样的人做出十倍的产出,你愿意付的钱就不是一年几百块,而是省下来工资的一部分。企业也会这么算:这个 Agent 到底帮我干了多少活?帮我省了多少成本?只要答案是确定的,它的付费意愿会非常强。 我自己的体会很直接。以前用 GPT,是一年 200 美金,我还会觉得这个账号可以几个人一起用。现在用 Codex Pro,一个月 200 美金,我第一反应不是贵,而是额度太少。我甚至会想能不能再买一个账号,一个月 400 美金,因为这样可以跑更多任务。这个心理变化非常重要。它说明 Agent 的价格锚点已经从“软件订阅”变成了“生产力工具”,甚至更接近“数字员工工资”。
Agent为什么会吃掉CPU内存和SSD# Agent为什么会吃掉CPU内存和SSD 我用了桌面 Agent 之后,第一件特别直观的事,不是感叹模型多聪明,而是去升级电脑。 原来我的内存是 64G,后来直接加到 128G。原来机器里有 2T 固态,再加一个 4T 的机械盘,后来我又补了一块 4T SSD。显卡我原来有一张 4080,先凑合用着,但内存和硬盘是真的扛不住。电脑跑着跑着,内存就 80%、90%,CPU 风扇突然呼一下起来,硬盘整宿嘎啦嘎啦响。你不用 Agent 的时候,很难理解为什么一个软件能把电脑吃成这样;真正重度用起来以后,这件事非常直观。 原因其实不复杂。Agent 时代的核心不是一个聊天框,而是多线程干活。过去你用 AI 软件,是问一句,它答一句。你停下来,它也停下来。但桌面 Agent 不是这样。你左边会有一排对话,每一个对话都像一个独立员工:有的负责数据库,有的负责算法,有的负责基本面研究,有的负责秘书和待办统筹。人的想法又很跳跃,不会老老实实等一个任务跑完再提下一个需求。你很自然地会同时给五个 Agent 安排五件事。 这还只是第一层。真正吃资源的是第二层:每个母 Agent 往往还会拆出子 Agent。比如我让它研究 PCB,它可能会把任务拆成三条线:本地数据库、研究报告库、互联网公开信息。一个需求拆成三路,五个需求就变成十五路。每一路都在读文件、写文件、调用模型、整理材料、做审计。于是本来你以为只是开了几个聊天框,实际上电脑里已经同时跑着十几个甚至二十几个任务。
Skill组长和子Agent:未来白领不是用AI,而是管理AI团队# Skill组长和子Agent:未来白领不是用AI,而是管理AI团队 很多人第一次用 AI,会把注意力放在模型是不是更聪明。我的体会正好相反:Agent 时代真正拉开差距的,不是你会不会问一个好问题,而是你能不能把工作拆成流程,写成 skill,再像管理团队一样让它复现。 所谓 skill,不需要讲得太玄。它本质上就是一份 Markdown 说明文件,把一个工作怎么做写清楚:第一步收集什么材料,第二步怎么判断,第三步要不要找反面证据,哪里容易犯错,交付前必须检查什么。它不是传统意义上的代码,但它有代码的逻辑。对不会编程的人来说,这一点特别重要,因为我们不是靠写程序来调动 Agent,而是靠自然语言把经验沉淀成流程。 如果没有 skill,Agent 很容易退回到 AI coding 工具。工程师当然可以直接让它写代码、改代码、跑程序,但大多数白领的工作不是这样。我们做研究、写文章、整理资料、申请账号、生成报告,真正的难点不是某一步多难,而是每次都有一串步骤,一串判断,一串检查。Skill 的价值,就是把这串东西固定下来,让 Agent 每次都按同一套方法做。 我现在用 Agent,一个很重要的动作就是让它“写检查”。它犯错之后,我不会只说下次注意,这句话对人都没什么用,对 Agent 更没用。我会让它复盘:这个错误是不是原来 skill 里已经写过?如果写过,为什么没有执行?如果没写过,就把新的检查项补进去。一次犯错,补一个检查;再犯另一个错,再补一个检查。三次、五次之后,这个流程就明显变稳。
AI软件只是搜索框,Agent才是数字员工# AI软件只是搜索框,Agent才是数字员工 我这一个多月最大的体会,就是桌面 Agent 和过去那一类 AI 软件,根本不是同一种东西。它们看起来都长得像一个聊天框,都可以输入一句话让它回答,但这就像拿短信去理解微信。表面上都有文字通信,真正的生态、交互方式和能完成的事情,完全不是一个层级。 过去我们用豆包、ChatGPT、Gemini,更多是在用一个更聪明的搜索框。你问它一个问题,它帮你整理信息、生成答案、写一点文案,最多再加上一些视频、音频、多模态能力。这个东西有价值,我现在也用,但它本质上还是咨询,是检索,是你问一句它答一句。它很难稳定地把一个长流程工作从头做到尾,更难保证过两天再让它跑一遍,结果还能跟上一次一致。 这也是为什么去年市场会反复讨论 AI ROI。大家看到的是大量算力投入,看到的是聊天机器人和订阅软件,直觉上就会问:一年投这么多钱,靠这些软件订阅到底怎么赚回来?如果 AI 只停留在“高级搜索引擎”,这个问题确实很尖锐。因为一个搜索框再聪明,它的付费天花板也还是软件订阅。 但到了 Agent,这个逻辑就变了。Agent 不是只给你建议,它是帮你干活的。更准确地说,它是一个数字员工。它和 AI 软件最大的区别,我理解有三点:有记忆,能变好,长流程能复现。只有这三件事同时成立,它才不是一个回答问题的工具,而是一个能被安排工作的执行者。