欢迎收听AI一日谈。大家好!我是Frankie。我们一起快速扫下9月26日最值得关注的十条新闻,用五分钟帮你把这个行业脉络梳顺。
第一条,OpenAI抛出一个全新的评测基准GDPval,用“经济价值工作”的真实任务去比对模型与行业专家的表现。36氪的报道里写到,在首版GDPval-v0中,GPT-5(高算力版本)在约40.6%的任务上被评为不输专家,Anthropic的Claude Opus 4.1约为49%,但OpenAI也强调目前只覆盖了部分职业场景,后续会扩展流程化、交互式工作链路。对于“模型要不要替代人”的讨论,这更像是一份“离目标还有多远”的里程碑。
第二条,清华自动化系团队发布面向医疗信息学的全自主科研框架“OpenLens AI”,号称能从文献检索到可投稿论文“零人工”跑通全链路,并把科研周期从“月级”压缩到“小时级”。系统由主管、文献综述者、数据分析者、编码器、LaTeX写作器五个智能体协作完成,强调可追溯与质量控制。这类“自动化研究员”路线,正在从口号走向工程化。
第三条,华为诺亚方舟实验室的多模态推理加速算法ViSpec入选NeurIPS 2025,主打“在不牺牲生成质量的前提下,让VLM推理加速最高3.2倍”。如果持续落地到端侧和车端,多模态交互的“流畅度”会是很直观的用户红利。
第四条,医学影像顶会MICCAI的最高荣誉“持久影响力奖”(EIA)今年由华人科学家、联影智能联席CEO沈定刚获得。报道回顾了其在深度学习医学影像方向的长期贡献与引用影响,这一奖项每年仅颁给一位在领域长期产生深远影响的学者。
第五条,地平线宣布通过“先旧后新”的配股方式募资,净得约58亿港元,明确将加码Robotaxi相关投入。结合其与哈啰出行的战略合作与L4全栈方案,这笔资金被视为“冲刺无人化商业闭环”的弹药补给。
第六条,京东物流发布“超脑大模型2.0”与具身智能机械臂“异狼”。官方口径称,2.0版本走向Agentic自主决策,能把千万级变量的规划求解压到2小时内,并在一线作业效率、标准化水平和人机协同上带来两位数提升;“异狼”针对非标包裹自动码笼,强调“感知-决策-执行-进化”的闭环。对供应链自动化,这是把大模型从“数字脑”推到“机械手”的典型尝试。
第七条,ChatGPT的“晨报式”主动服务今天刷屏:国内多家媒体的日更汇总里提到,Pro用户已能体验到无需提问就推送个性化简报的更新。无论你把它看作“Agent先手”还是“信息闹钟”,这一步意味着从“问答式AI”迈向“持续服务式AI”。
第八条,谷歌发布了机器人方向的最新“大脑”模型Gemini Robotics 1.5,侧重更强的“思考/协作”与跨形态学习。若后续在真实机器人平台验证足够稳,这会把“具身智能”的话题从演示视频推到更多垂直场景的可用性讨论。
第九条,OpenAI两位核心负责人接受最新采访,明确“终极目标是自动化研究员”,也谈到在评估趋于饱和后如何“破圈”的思路:让系统更加面向复杂真实任务、与外部工具协作,并接受来自现实世界的反馈。这与今天GDPval基准的推出,彼此呼应。
第十条,机器人学习再添一把火:清华与上海AI Lab联合工作被媒体以“缺数据也能拿SOTA?破解机器人RL两大瓶颈”为题报道,强调端到端在线训练方案在样本效率与稳定性上的进展。对工业端的机器人落地来说,“少标注、快收敛”的方向极具吸引力。
以上就是今天AI一日谈的十条快讯。把它们串起来,主线很清晰:一边是“自动化研究员”从评测到工具链的合围,一边是“具身智能”在物流和机器人上加速落地。每天我都会精选AI与科技公司最新动态,帮你在碎片化的信息流中,抓住最值得关注的趋势与观点。感谢收听,我们明天见。
