2025年9月27日 每天5min了解前沿AI动态

欢迎收听AI一日谈。大家好！我是Frankie。我们一起快速扫下今天最值得关注的几条新闻。

先从今天最受关注的一条开始。谷歌 DeepMind 把“会想的机器人”往前推了一大步，发布了 Gemini Robotics 1.5 系列：GR-ER 1.5 负责高层推理、规划与进度监控，GR 1.5 直接把多模态理解变成动作输出。官方展示了跨平台“零样本迁移”：在 ALOHA 上学的技能无缝迁到 Franka、再到类人形 Apollo；并宣称在 230 项任务上全面提升，且在 ASIMOV-2.0 安全基准更稳健。开发者已可在 Google AI Studio 通过 Gemini API 使用 GR-ER 1.5，而 GR 1.5 暂只向少量合作伙伴开放。如果这套“规划+执行”的双模型闭环真能稳定跑在更多第三方硬件上，机器人通用化的门槛会被显著压低，但跨设备、跨场景的第三方复现实证还需要时间。

腾讯混元团队抛出一个少见但很“工程化”的方向：原生 3D 组件生成。今天公开的 Hunyuan3D-Part 由两部分组成：原生 3D 分割模型 P3-SAM 和工业级组件生成 X-Part。团队不仅释出代码与权重，还给了体验入口，强调“先按部件拆，再按部件生”的生产级链路，对游戏资产管线与 3D 打印都更友好。技术细节里，P3-SAM基于大规模 3D 部件监督训练，并构建了 370 万级别的部件掩码数据；X-Part 则用包围盒提示与特征扰动做结构一致的形状分解。这类“可分、可控、可编辑”的 3D 生成比“一体化网格”更贴近产业落地。

检索增强生成 RAG 方向也有新招。来自北航、北大与中关村实验室的 DRAG（Lexical Diversity-aware RAG）提出把“词汇多样性”显式纳入检索与生成两端：先用 DRA 模块对查询中的不变/可变/补充成分分路打分，再用“风险引导稀疏校准”在生成时只对高风险 token 动态干预。团队称在多个数据集平均准确率提升，尤其在 HotpotQA、2WikiMultiHopQA 上+10.6%，并拿下若干基准 SOTA。对实际产品价值在于“读懂言外之意”的询问与表述变体，但也要留意不同基座模型迁移的一致性。

对齐方向今天也有一条“训练时零改动”的方法引发讨论：Token-Aware Editing（TAE）。核心思路是用互信息引导的图聚合找更准确的编辑方向，再在推理时按 token 的“错位风险”自适应调整干预强度，做到“该推就推、能不动就不动”。作者在 TruthfulQA 上报告相对原始基线真实性指标提升 25.8%，且优于既有编辑方法；毒性与偏见指标也显著改善。方法即插即用、训练零改动的属性，对生产系统尝鲜的门槛很低，但在复杂开放域对话里的长期副作用与风格漂移仍需观察。

更“底层”的一则：SGLang 团队联合清华 THUDM 的 slime 团队，宣布开源了“100% 可复现”的稳定 RL 训练路径，并把 LLM 推理里的不确定性几乎清零，给出“两次运行曲线完全重合”的复现实例。实现点包括批次不变算子、确定性采样种子、与分块预填充、CUDA Graph、Radix Cache 的兼容；代价是非确定性模式下约三成的性能损失（文中测得平均 ~34.35%）。对于做在线/闭环强化学习与需要高可信 A/B 的团队，这是把“可复现”从口号落到工程的一步，但在极限吞吐与 MoE 支持上还有路要走。

大模型应用侧，Kimi 推出名为“OK Computer”的 Agent 模型，量子位今天做了一轮上手：能搭网站、做 PPT、跑数据分析，还展示了过程可观测的 Todo 与自检。对普通用户，这类“可见的任务分解+自动素材搜集/生成”会是入门门槛很低的形态；对企业侧，则取决于它的工具生态、数据权限与合规边界。

资本与方法论层面，Thinking Machines（外界常以“OpenAI 前 CTO Mira Murati 创立实验室”标签称呼）今天被量子位追踪了它的第二篇论文：提出“Modular Manifolds”，试图把离散操作放进“近似连续的状态空间”，以便在显存压力更小的前提下拓展自回归建模的可扩展性。这与其前作“克服 LLM 推理不确定性”的工程路线相呼应，指向“为更强推理能力做系统工程”的长期主线。

国内大厂的 Agent 平台之争也在升温。36 氪今天从云栖大会延伸报道：阿里云百炼发布高代码框架 ModelStudio-ADK，强调“从预定义编排转向自主决策/循环执行”，并打包了工具调用、记忆、RAG、沙箱、全链路可观测与与支付宝合作的支付通道等“企业级七件套”。“高代码+低代码”双轨思路，意在让 Demo 能跨过“跑进生产”的那道坎。对企业听众而言，评估重点会是它与现有 IT 系统的耦合成本、可观测与回滚安全网，以及异构模型/私有化部署的运维复杂度。

宏观科技进展里还有一条：我国在 03:28 用长征四号丙成功发射风云三号 08 星（H 星），定位于极轨业务卫星，侧重气候变化监测，搭载 9 台遥感载荷。这意味着数值预报、气象减灾、气候研究的上游观测将再加一颗“眼睛”，对下游诸如农业、能源与保险定价的 AI 模型训练都是长期利好。

最后是一条可能引发争议的投融资消息。36 氪欧洲站今日刊文称，多方消息显示，ASML 参与了对 Mistral AI 的最新一轮融资，这轮 C 轮规模或达 17 亿欧元；舆论一边认为“光刻龙头+开源大模型”是战略协同，另一边担心供应链与地缘风险的叠加敞口，欧洲监管的态度也会被持续放大镜审视。考虑到消息仍在“来源称/报道称”的阶段，保留观望是理性选择。

以上是今天AI一日谈的十条快讯：从具身智能的“规划+执行”双模闭环，到 3D 原生组件生成的产业化范式。每天我都会精选AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。感谢收听，我们明天见。