今日AI大事件:谷歌教育AI、阿里GUI Agent、DeepSeek-V3.1发布

今日AI大事件:谷歌教育AI、阿里GUI Agent、DeepSeek-V3.1发布

6分钟 ·
播放数2
·
评论数0

今日AI大事件速览

2025年8月21日-22日,全球AI领域重磅消息不断:谷歌全面升级Gemini教育系统与搜索AI Agent能力,阿里发布第三代GUI Agent框架Mobile-Agent-v3,DeepSeek推出V3.1新模型并支持Claude API,同时大模型训练新范式DuPO、金融认知诊断框架FinCDM等前沿研究也相继亮相。本文为你详细梳理今日最值得关注的AI科技动态。

谷歌双线出击:教育+搜索全面AI化

Gemini变身完整AI教学系统

AIGCLINK 报道,谷歌已将Gemini打造为一套完整的AI教育教学系统,面向使用Google Workspace教育版的用户免费开放,且不会使用聊天数据训练模型。

教师端功能强大:

  • 辅助制定教学计划,自动生成词汇表、教案等
  • 可创建专属“AI专家”,如基于课程材料的交互式模拟助手
  • 集成NotebookLM的“视频概述”功能,一键将学习资源转为教学视频
  • 支持用Veo 3生成短视频,用Gemini表单自动生成测验

学生端体验升级:

  • 可用Gemini Canvas生成个性化测验
  • 未来将支持交互式图表解释复杂概念
  • 接收老师分享的AI专家和笔记
  • 内置内容过滤机制,保障学习环境安全

管理员还可管理AI应用权限,查看使用报告,标志AI正深度融入教育全流程。

搜索AI Mode新增Agent能力

谷歌搜索的AI Mode也迎来重大升级,具备了AI Agent能力,可主动执行任务:

  • 订餐厅:搜索多个平台,提供实时信息并导航至预订页
  • 买门票/预约服务:即将上线
  • 个性化推荐:结合搜索历史、地图互动等推荐餐厅、咖啡厅
  • 内容分享:可分享旅游攻略等,对方可接续AI对话

AI模式已扩展至180多个新国家和地区,信息检索从被动响应走向主动服务。

阿里发布Mobile-Agent-v3:GUI自动化新突破

阿里推出第三代GUI Agent框架 Mobile-Agent-v3,在10+GUI基准测试中取得SOTA性能,在AndroidWorld上得分73.3,OSWorld上达37.7。

该框架基于新开源的多模态跨平台GUI虚拟层模型 GUI-Owl,具备以下能力:

  • 理解GUI界面布局与元素
  • 将指令转化为屏幕坐标与操作
  • 完成端到端GUI操作流程

Mobile-Agent-v3在此基础上实现了任务分解、规划、进度管理、异常处理与关键信息记录,支持跨应用复杂任务执行,是迈向通用AI Agent的重要一步。

DeepSeek-V3.1发布:强化Agent能力,支持Claude API

DeepSeek正式发布 V3.1 版本,定位为“迈向Agent时代的第一步”。据 karminski-牙医 拆解,主要更新包括:

  • 增强Agent能力(任务规划、反思、异常处理)
  • 编程与数学能力提升
  • 新增“Think & Non-Think”混合推理模式
  • 通用能力略有下降(如GPQA-Diamond降0.9分)

在Aider Polyglot榜单中,DeepSeek-V3.1-Thinking以76.3%的分数超越Gemini和Claude Opus,登顶开源模型编程能力榜首。

ClaudeCode现已支持DeepSeek

开发者可通过Anthropic风格API直接调用DeepSeek-V3.1,无需转换器。这意味ClaudeCode用户可“无缝切换”至DeepSeek,极大拓展使用场景。不过据 mrfakename 指出,DeepSeek API价格将上调并取消折扣,可能影响性价比。

前沿研究:从3D建模到金融诊断

MeshCoder:从点云生成Blender脚本

新框架 MeshCoder 可将3D点云重建为可编辑的Blender Python脚本,提升形状到代码的转换能力,并增强大模型对3D形状的理解。

Tinker:高保真3D编辑新框架

Tinker 利用预训练扩散模型实现高质量3D编辑,仅需1-2张图像即可生成多视角一致的编辑结果,无需每场景微调,降低3D内容创作门槛。

DuPO:无标注反馈的双学习框架

DuPO 提出一种双学习框架,通过“泛化对偶性”生成无标注反馈,已在翻译、数学推理等任务上实现显著提升,为大模型优化提供新范式。

FinCDM:金融大模型认知诊断

FinCDM 是首个面向金融LLM的认知诊断框架,基于CPA考试构建CPA-QKA数据集,可识别模型在税法、监管推理等领域的知识盲区,推动更可信的金融AI发展。

其他重要动态

  • Google Pixel 10 搭载新Tensor G5芯片与AI拍照教练,提升摄影体验(The Verge
  • 微软Xbox Ally 测试“我的应用”功能,整合Steam、Battle.net等第三方应用,打造掌机友好界面(The Verge
  • DECA-AI发布4744B超大模型,需1TB内存运行,采用DynAMoE架构,暂仅支持专用引擎(karminski-牙医
  • Qwen推出Deep Research功能,支持免费深度论文分析(Qwen

结语

AI正从“工具”向“协作者”进化。无论是谷歌的教育AI、阿里的GUI Agent,还是DeepSeek的编程突破,都预示着AI将更深度地融入工作、学习与创造。未来属于那些能与AI协同进化的人。

参考资料