2025年9月26日 每天5min了解前沿AI动态

欢迎收听AI一日谈。大家好！我是Frankie。我们一起快速扫下9月26日最值得关注的十条新闻，用五分钟帮你把这个行业脉络梳顺。

第一条，OpenAI抛出一个全新的评测基准GDPval，用“经济价值工作”的真实任务去比对模型与行业专家的表现。36氪的报道里写到，在首版GDPval-v0中，GPT-5（高算力版本）在约40.6%的任务上被评为不输专家，Anthropic的Claude Opus 4.1约为49%，但OpenAI也强调目前只覆盖了部分职业场景，后续会扩展流程化、交互式工作链路。对于“模型要不要替代人”的讨论，这更像是一份“离目标还有多远”的里程碑。

第二条，清华自动化系团队发布面向医疗信息学的全自主科研框架“OpenLens AI”，号称能从文献检索到可投稿论文“零人工”跑通全链路，并把科研周期从“月级”压缩到“小时级”。系统由主管、文献综述者、数据分析者、编码器、LaTeX写作器五个智能体协作完成，强调可追溯与质量控制。这类“自动化研究员”路线，正在从口号走向工程化。

第三条，华为诺亚方舟实验室的多模态推理加速算法ViSpec入选NeurIPS 2025，主打“在不牺牲生成质量的前提下，让VLM推理加速最高3.2倍”。如果持续落地到端侧和车端，多模态交互的“流畅度”会是很直观的用户红利。

第四条，医学影像顶会MICCAI的最高荣誉“持久影响力奖”（EIA）今年由华人科学家、联影智能联席CEO沈定刚获得。报道回顾了其在深度学习医学影像方向的长期贡献与引用影响，这一奖项每年仅颁给一位在领域长期产生深远影响的学者。

第五条，地平线宣布通过“先旧后新”的配股方式募资，净得约58亿港元，明确将加码Robotaxi相关投入。结合其与哈啰出行的战略合作与L4全栈方案，这笔资金被视为“冲刺无人化商业闭环”的弹药补给。

第六条，京东物流发布“超脑大模型2.0”与具身智能机械臂“异狼”。官方口径称，2.0版本走向Agentic自主决策，能把千万级变量的规划求解压到2小时内，并在一线作业效率、标准化水平和人机协同上带来两位数提升；“异狼”针对非标包裹自动码笼，强调“感知-决策-执行-进化”的闭环。对供应链自动化，这是把大模型从“数字脑”推到“机械手”的典型尝试。

第七条，ChatGPT的“晨报式”主动服务今天刷屏：国内多家媒体的日更汇总里提到，Pro用户已能体验到无需提问就推送个性化简报的更新。无论你把它看作“Agent先手”还是“信息闹钟”，这一步意味着从“问答式AI”迈向“持续服务式AI”。

第八条，谷歌发布了机器人方向的最新“大脑”模型Gemini Robotics 1.5，侧重更强的“思考/协作”与跨形态学习。若后续在真实机器人平台验证足够稳，这会把“具身智能”的话题从演示视频推到更多垂直场景的可用性讨论。

第九条，OpenAI两位核心负责人接受最新采访，明确“终极目标是自动化研究员”，也谈到在评估趋于饱和后如何“破圈”的思路：让系统更加面向复杂真实任务、与外部工具协作，并接受来自现实世界的反馈。这与今天GDPval基准的推出，彼此呼应。

第十条，机器人学习再添一把火：清华与上海AI Lab联合工作被媒体以“缺数据也能拿SOTA？破解机器人RL两大瓶颈”为题报道，强调端到端在线训练方案在样本效率与稳定性上的进展。对工业端的机器人落地来说，“少标注、快收敛”的方向极具吸引力。

以上就是今天AI一日谈的十条快讯。把它们串起来，主线很清晰：一边是“自动化研究员”从评测到工具链的合围，一边是“具身智能”在物流和机器人上加速落地。每天我都会精选AI与科技公司最新动态，帮你在碎片化的信息流中，抓住最值得关注的趋势与观点。感谢收听，我们明天见。