

Vol00147_40年未有之大变局:韩国半导体出口狂飙背后的“AI周期”真相2026年6月1日韩国官方发布的贸易数据显示,其5月份出口额同比激增53.2%,创下自1984年以来的最大单月增幅,基准股市指数(KOSPI)年内直接翻倍。这一恐怖数据的核心引擎只有一个:全球AI投资热潮对高端存储芯片(尤其是HBM和先进DRAM)的吞噬性需求。从产业逻辑来看,这揭示了AI军备竞赛已经深刻渗透到了实体制造业的最深处。三星和SK海力士的利润狂飙,证明了尽管市场上对于大模型商业变现的质疑声不断,但硅谷巨头在基础设施上的投入不仅没有减速,反而呈现出指数级增长。然而,这也暴露了巨大的结构性风险:全球芯片景气度高度绑定在少数几家万亿级北美云厂商的资本开支上,一旦推理端商业闭环无法如期承接,这种“四十年一遇”的供需错配将可能引发全产业链的剧烈周期性回调。
Vol00146_智能体AI时代到来!英伟达Vera_Rubin全栈集群,单机架效率提升数十倍?本期以6月1日英伟达GTC台北演讲为核心素材,背景是OpenAI、Anthropic全力迭代多Agent智能体模型,传统分散式GPU服务器无法适配多智能体并行调度需求,英伟达顺势推出全栈Vera Rubin集群并宣布全面量产。产业本质是Agent模型需要CPU调度、GPU计算、高速光互联协同工作,单一GPU无法满足多任务并发,算力竞争从单卡性能升级到整机柜系统协同效率。核心变化在于英伟达把交换机、CPU、GPU、存储集成统一架构,单机架组装时间从2小时压缩至5分钟,光电共封装交换机实现200Gb高速互联。受益方是大规模布局Agent大模型的头部AI企业、云服务商;受损方是仅提供单一GPU板卡的二线硬件厂商、依赖零散服务器搭建算力的中小AI公司。未来AI企业采购算力不再只看单卡算力,整机柜协同效率将成为核心采购指标。
Vol00145_苹果的AI双轨制:前台本地隐私,后台谷歌谷歌化?在2026年5月底,科技界最大的底牌被揭开:苹果在紧锣密鼓筹备‘Apple Intelligence’和新版Siri的同时,被爆出正深度依赖谷歌的Gemini模型进行‘模型蒸馏’,以此训练自己的端侧微型AI。更反常识的是,苹果未来的高级AI请求将直接接入谷歌云和英伟达的计算基础设施。这揭示了一个残酷的产业逻辑——即使强如苹果,在面对万亿参数大模型和算力黑洞时,也无法单靠‘端侧’解决所有问题。苹果正在搞一套精明的‘双轨制’:简单的、涉及隐私的活儿留在iPhone本地跑,复杂的、需要重算力的直接外包给谷歌和英伟达。这种变化的本质是端侧AI遭遇了物理算力和能耗的‘硬天花板’。在这场博弈中,谷歌云和英伟达进一步巩固了AI底层基建的垄断地位,而苹果虽然保住了终端体验的控制权,却不得不让渡出AI核心生态的半壁江山,甚至可能引发用户对‘苹果式隐私’的信任危机。
Vol00144_Anthropic估值逼近万亿美元:AI已经不是科技竞争,而是金融战争最近AI行业最惊人的变化,不是模型,而是资本。Anthropic最新估值逼近万亿美元,OpenAI、Meta、Google同时开启超大规模AI基础设施投入,全球资本市场已经把AI视为下一轮工业革命入口。问题是:AI公司现在的收入,远远支撑不起如此巨大的资本开支。于是整个行业进入一种危险但熟悉的状态——所有公司都必须继续融资、继续扩张、继续讲未来故事,因为谁停下来,谁就可能失去AI时代船票。这场战争背后真正的变化是:AI已经不再只是软件行业,它越来越像铁路、电网、石油那种“重资本基础设施行业”。而资本市场正在提前押注未来10年的全球生产力重构。
Vol00143_比亚迪造出中国第一颗4nm芯片,背后藏着一个千亿算力战争这一周的核心信号来自两个看似平行但紧密交织的战场。5月28日,比亚迪发布了中国首款自研4nm智驾芯片'璇玑A3',三芯组合算力突破2100 TOPS,已规模化量产,王传福宣布芯片投入超1000亿元,拥有5座晶圆厂和7000多名芯片研发人员——'全球唯一完全掌控辅助驾驶供应链的车企'不是一句空话。当晚,王传福还罕见地为城市领航安全兜底一年,智驾出事故全额赔付加维修。几乎同期,台积电3nm晶圆最高涨价15%,2026年下半年生效,英伟达、AMD、谷歌、AWS都在抢单,3nm产能月产16万至17.5万片仍供不应求。这意味着什么?车企自研芯片不是为了替代英伟达,而是争夺'算力主权'——谁掌控智驾芯片,谁就掌握下一个十年的车辆定义权。但讽刺的是,制造端只有台积电。先进制程产能集中化,正在成为全球算力竞争最脆弱的一环。
Vol00142_三天融了1000亿,AI公司却还在亏钱——资本的逻辑你真的看懂了吗?5月的第三周,中国AI赛道迎来了一场前所未有的资本盛宴。据彭博社援引知情人士消息,DeepSeek正在进行约700亿元人民币的融资谈判,投前估值可能达到450亿美元,投后突破500亿美元。有意思的是,DeepSeek管理层在融资过程中向潜在投资者明确表示,公司将优先进行突破性的AGI研究而非短期商业化。几乎同一时间,月之暗面20亿美元融资接近落定,阶跃星辰近25亿美元融资即将收官。三家头部大模型公司一周内合计融资规模逼近千亿元。但硬币的另一面,百度在发布文心5.1时强调的是成本控制而非技术参数。4月初至今,国内外大模型迎来'超级更新月',同时商业化全面提速,豆包宣布三档付费计划,Anthropic年化收入进一步突破。大模型企业千亿估值与百亿亏损并存的局面,让整个市场的定价逻辑充满张力。
Vol00141_价格砍掉75%还永久生效!大模型正在沦为‘工业自来水’,谁会被拧干?这几天AI圈最重磅的炸弹,莫过于DeepSeek在5月22日宣布将其V4-Pro模型的75%限时折扣转为永久定价。每百万Token的输入和输出价格直接被钉死在不到1美元的极低水平。这不仅仅是一场简单的降价促销,而是宣告了大模型‘去溢价化’时代的提前到来。过去两年里,大家总觉得大模型是高不可攀的尖端科技,但现在的产业逻辑变了:大模型正在被迅速‘商品化’,变成像电力和自来水一样的基础设施。在这种趋势下,那些纯粹靠‘套壳’、卖基础模型API差价的中间商将直接被清洗;而对于像阿里Qwen3.7-Max这类主打长文本、高客单价的闭源旗舰模型,也必须在极致的‘智能价值’和‘性价比’之间做出痛苦的抉择。这场价格战迫使整个行业把视线从‘参数崇拜’转向‘应用落地’,谁能把这便宜的算力转化为真正的商业生产力,谁才是下一阶段的赢家。
Vol00140_搜索引擎正在消失:AI开始重写互联网入口Google在I/O 2026上第一次明确提出:“Search is AI Search”。这不是功能升级,而是商业模式革命。过去20年,Google的核心逻辑是给用户“链接”;现在它开始直接给“答案”和“执行结果”。AI搜索意味着用户不再需要点击网站、阅读网页,而是直接在Agent中完成总结、购物、预订甚至任务执行。这会重构整个互联网流量体系。媒体网站、SEO产业、内容平台都可能受到冲击,因为AI正在成为新的信息中间层。Google推出Universal Cart、Ask YouTube等产品,本质是在把互联网内容封装进自己的AI闭环。最大的矛盾是:AI需要互联网内容训练,但AI搜索又在削弱内容网站的生存能力。未来互联网会不会变成“只有AI平台,没有开放网页”?
Vol00139_华为‘韬定律’与几何缩微的全球范式转移5月25日,华为在ISCAS 2026上高调抛出了震惊业界的‘韬(τ)定律’。它的核心逻辑极具颠覆性:不再死磕传统的几何晶体管微缩,而是以‘特征时间常数τ’作为统一优化目标,用‘时间缩微’替代‘空间缩微’。过去几十年,全球半导体都被台积电、英特尔等主导的摩尔定律推着走,通过把线条做细来提升性能,但现在每往前一步都是万丈深渊、成本呈指数级通胀。华为由于众所周知的技术封锁,最先撞上了这面墙,也率先逼出了这个‘逻辑折叠’的第二曲线。其本质是将芯片优化从单纯的硬件制造工艺,强行拉到了器件、电路、芯片到系统的跨十二个数量级协同层面。这打破了西方由ASML光刻机制程定义的传统权力结构,宣告芯片竞赛正式从‘空间内卷’跨入‘时间重构’的新时代。
Vol00138_自动驾驶进入“开源时刻”:Tesla开始遭遇真正的生态围剿自动驾驶行业正在发生一次非常像智能手机时代的变化。过去Tesla最大的优势,是拥有完整闭环:芯片、数据、算法、车辆全部自己做。但NVIDIA最近开始推动另一种模式——开放式自动驾驶平台。其Drive Hyperion与Alpamayo Vision-Language-Action模型,正在吸引BYD、Uber、现代等大量合作伙伴。核心逻辑是:不是每家车企都能像Tesla一样自研AI,但几乎所有车企都需要自动驾驶能力。于是NVIDIA试图扮演“自动驾驶Android”的角色,把芯片、模型、工具链全部打包输出。这意味着未来自动驾驶竞争可能从“单车智能”转向“生态规模”。Tesla依然领先,但行业第一次出现了真正意义上的联盟化反击。
Vol00137_参数越大越没用?AI行业正在抛弃“堆算力”内卷!最新数据显示,中国AI大模型周调用量7.94万亿Token,是美国的2.11倍,全球AI应用格局彻底改写。近期谷歌I/O全面押注AI Agent生态,OpenAI、百度纷纷转向高效模型研发,国家发改委加码AI+政策落地,推动大模型适配国产算力。过去两年行业疯狂比拼参数规模,现在推理成本、部署效率、场景落地成为核心指标,MoE架构、小模型快速崛起,AI从被动工具转向自主智能体。资本不再追捧超大模型,而是聚焦企业级落地、降本增效,开源与闭源模型差距快速缩小。未来AI的核心价值,不再是技术炫技,而是深度融入实体经济,Agent将成为下一代AI产品的标配,算力效率、场景适配能力决定企业生死。
Vol00136_AI智能体的终极一公里:从‘只会聊天’到‘替你花钱’的隐私代价在刚过去的2026年Google I/O大会上,Sundar Pichai全面展示了具备跨应用自动化能力的AI Agent‘Gemini Spark’,宣告‘Agentic AI’正式迎来爆发期。紧接着,OpenAI通过接入Plaid,允许ChatGPT Pro用户直接连接全球超1.2万家金融机构,推出个人理财预览功能。这标志着AI的竞争本质发生了结构性变化:从过去卷模型参数、卷Benchmark,变成了卷谁能真正帮用户‘干活和花钱’。这种变化让AI真正具备了生产力属性,但代价也是颠覆性的——AI现在拥有了你最敏感的实时资产数据。虽然目前宣称是‘只读权限’,但‘帮用户写邮件、清空购物车、管理财务’的越权风险已经近在咫尺。谁能保障AI在多Agent协同中不被恶意引导?更可怕的是,监管机构在此类产品上线时竟然处于集体失声状态,这正在把用户推向隐私裸奔的边缘。
Vol00135_李想、马斯克同时改口:自动驾驶只是“上半场”,下半场更可怕过去一周,李想与罗永浩的对话引爆全网,“自动驾驶是具身智能的上半场,通用人形机器人是下半场”迅速成为科技圈热门话题。理想同步发布搭载自研5nm马赫M100芯片的理想L9 Livis,小鹏宣布自研图灵AI芯片L4级Robotaxi量产,蔚来自研神玑芯片同步上车。但同一条新闻里,也出现了特斯拉被迫公开17份奥斯汀Robotaxi碰撞报告、马方指出全球L4级事故率高于人类驾驶员,以及中国官方澄清并未“暂停发放”L3牌照。这一系列事件折射出一个深层逻辑:当L3/L4自动驾驶的监管、安全、商业化节奏普遍低于预期时,头部玩家需要一个新的叙事来吸引资本和产业注意力。人形机器人共享自动驾驶的芯片、大模型和感知技术,成为最合理的“故事延伸”。地平线在同一周开源了HoloMotion-1人形机器人控制大模型,理想将自研芯片、VLA大模型和线控底盘打包为“具身智能体”,这表明技术底层正在融合,但商业变现的节奏仍高度不确定。
Vol00134_传统SaaS的末日?谷歌、微软、OpenAI五月疯狂更新,正在把中间商逼上绝路在2026年5月中旬,科技界正经历一场无声却残酷的降维打击。OpenAI、谷歌和微软在这一周内密集发布了其旗舰AI(如GPT、Gemini、Copilot)的最新商业化和多模态进展,AI正在全面像素级地融入操作系统和日常办公。更让人震惊的是,AI已经不再局限于冷冰冰的问答,Meta最新开源的TRIBE v2模型甚至能作为“人类大脑的数字双胞胎”,高精度预测人类对视觉和语言的神经反应。这种向“数字化人类”进化的趋势,给整个科技生态带来了巨大的挤压效应。行业高管警告,随着底层大模型对推理、工作流以及人类意图的理解越来越深,原本作为中间商的中间件和传统SaaS公司正面临灭顶之灾,整个SaaS市场空间可能会被压缩掉三分之二。AI不再是软件的附加功能,AI正在吞噬软件本身。
Vol00133_小鹏纯视觉Robotaxi下线,激光雷达真的要被淘汰了?5月18日小鹏首台纯视觉量产Robotaxi正式下线,搭载4颗自研图灵AI芯片,完全放弃激光雷达,依靠大模型+高算力实现L4级自动驾驶,计划下半年在广州运营;几乎同期英伟达发布Alpamayo智驾平台,绑定奔驰等车企,主推激光雷达+多传感器融合方案。另一边Waymo因极端天气感知失效召回自动驾驶车队,暴露纯视觉路线的安全短板;国产千线级AI激光雷达实现毫秒级边缘计算,成本大幅下降。行业正进入路线抉择时刻:纯视觉靠自研芯片压缩硬件成本、快速落地,多传感器靠冗余保障极端场景安全,两种路线的胜负,将直接改写未来出行市场的商业格局。