欢迎收听AI一日谈。大家好!我是Frankie。我们一起快速扫下今天最值得关注的几条新闻。
先从今天最受关注的一条开始。谷歌 DeepMind 把“会想的机器人”往前推了一大步,发布了 Gemini Robotics 1.5 系列:GR-ER 1.5 负责高层推理、规划与进度监控,GR 1.5 直接把多模态理解变成动作输出。官方展示了跨平台“零样本迁移”:在 ALOHA 上学的技能无缝迁到 Franka、再到类人形 Apollo;并宣称在 230 项任务上全面提升,且在 ASIMOV-2.0 安全基准更稳健。开发者已可在 Google AI Studio 通过 Gemini API 使用 GR-ER 1.5,而 GR 1.5 暂只向少量合作伙伴开放。如果这套“规划+执行”的双模型闭环真能稳定跑在更多第三方硬件上,机器人通用化的门槛会被显著压低,但跨设备、跨场景的第三方复现实证还需要时间。
腾讯混元团队抛出一个少见但很“工程化”的方向:原生 3D 组件生成。今天公开的 Hunyuan3D-Part 由两部分组成:原生 3D 分割模型 P3-SAM 和工业级组件生成 X-Part。团队不仅释出代码与权重,还给了体验入口,强调“先按部件拆,再按部件生”的生产级链路,对游戏资产管线与 3D 打印都更友好。技术细节里,P3-SAM基于大规模 3D 部件监督训练,并构建了 370 万级别的部件掩码数据;X-Part 则用包围盒提示与特征扰动做结构一致的形状分解。这类“可分、可控、可编辑”的 3D 生成比“一体化网格”更贴近产业落地。
检索增强生成 RAG 方向也有新招。来自北航、北大与中关村实验室的 DRAG(Lexical Diversity-aware RAG)提出把“词汇多样性”显式纳入检索与生成两端:先用 DRA 模块对查询中的不变/可变/补充成分分路打分,再用“风险引导稀疏校准”在生成时只对高风险 token 动态干预。团队称在多个数据集平均准确率提升,尤其在 HotpotQA、2WikiMultiHopQA 上+10.6%,并拿下若干基准 SOTA。对实际产品价值在于“读懂言外之意”的询问与表述变体,但也要留意不同基座模型迁移的一致性。
对齐方向今天也有一条“训练时零改动”的方法引发讨论:Token-Aware Editing(TAE)。核心思路是用互信息引导的图聚合找更准确的编辑方向,再在推理时按 token 的“错位风险”自适应调整干预强度,做到“该推就推、能不动就不动”。作者在 TruthfulQA 上报告相对原始基线真实性指标提升 25.8%,且优于既有编辑方法;毒性与偏见指标也显著改善。方法即插即用、训练零改动的属性,对生产系统尝鲜的门槛很低,但在复杂开放域对话里的长期副作用与风格漂移仍需观察。
更“底层”的一则:SGLang 团队联合清华 THUDM 的 slime 团队,宣布开源了“100% 可复现”的稳定 RL 训练路径,并把 LLM 推理里的不确定性几乎清零,给出“两次运行曲线完全重合”的复现实例。实现点包括批次不变算子、确定性采样种子、与分块预填充、CUDA Graph、Radix Cache 的兼容;代价是非确定性模式下约三成的性能损失(文中测得平均 ~34.35%)。对于做在线/闭环强化学习与需要高可信 A/B 的团队,这是把“可复现”从口号落到工程的一步,但在极限吞吐与 MoE 支持上还有路要走。
大模型应用侧,Kimi 推出名为“OK Computer”的 Agent 模型,量子位今天做了一轮上手:能搭网站、做 PPT、跑数据分析,还展示了过程可观测的 Todo 与自检。对普通用户,这类“可见的任务分解+自动素材搜集/生成”会是入门门槛很低的形态;对企业侧,则取决于它的工具生态、数据权限与合规边界。
资本与方法论层面,Thinking Machines(外界常以“OpenAI 前 CTO Mira Murati 创立实验室”标签称呼)今天被量子位追踪了它的第二篇论文:提出“Modular Manifolds”,试图把离散操作放进“近似连续的状态空间”,以便在显存压力更小的前提下拓展自回归建模的可扩展性。这与其前作“克服 LLM 推理不确定性”的工程路线相呼应,指向“为更强推理能力做系统工程”的长期主线。
国内大厂的 Agent 平台之争也在升温。36 氪今天从云栖大会延伸报道:阿里云百炼发布高代码框架 ModelStudio-ADK,强调“从预定义编排转向自主决策/循环执行”,并打包了工具调用、记忆、RAG、沙箱、全链路可观测与与支付宝合作的支付通道等“企业级七件套”。“高代码+低代码”双轨思路,意在让 Demo 能跨过“跑进生产”的那道坎。对企业听众而言,评估重点会是它与现有 IT 系统的耦合成本、可观测与回滚安全网,以及异构模型/私有化部署的运维复杂度。
宏观科技进展里还有一条:我国在 03:28 用长征四号丙成功发射风云三号 08 星(H 星),定位于极轨业务卫星,侧重气候变化监测,搭载 9 台遥感载荷。这意味着数值预报、气象减灾、气候研究的上游观测将再加一颗“眼睛”,对下游诸如农业、能源与保险定价的 AI 模型训练都是长期利好。
最后是一条可能引发争议的投融资消息。36 氪欧洲站今日刊文称,多方消息显示,ASML 参与了对 Mistral AI 的最新一轮融资,这轮 C 轮规模或达 17 亿欧元;舆论一边认为“光刻龙头+开源大模型”是战略协同,另一边担心供应链与地缘风险的叠加敞口,欧洲监管的态度也会被持续放大镜审视。考虑到消息仍在“来源称/报道称”的阶段,保留观望是理性选择。
以上是今天AI一日谈的十条快讯:从具身智能的“规划+执行”双模闭环,到 3D 原生组件生成的产业化范式。每天我都会精选AI与科技公司最新动态,帮你在碎片化的信息流中,抓住最值得关注的趋势与观点。感谢收听,我们明天见。
