

阿里通义正式开源“通义 DeepResearch”:30B 模型媲美 OpenAI Deep Research昨晚,阿里通义正式开源“通义 DeepResearch”,这是首个性能对标 OpenAI Deep Research 的开源 Web Agent,仅 30B 参数(激活 3B),在多项基准测试中超越或接近热门 AI 模型,实现了高效规模与顶尖性能的统一。 🌍 开源与定位 1.全球首个开源 Web Agent,可与 OpenAI Deep Research 对标。 2.模型规模 30B(激活 3B),实现“小体量,大性能”。 📊 性能表现 1.在多项基准中超越或接近 o3。 🧠 训练范式 1.端到端训练流程:Agentic CPT → SFT → RL。 2.采用 on-policy RL,在高稳定性模拟环境中试错学习。 🔄 数据策略 1.全自动合成数据,无需人工标注。 2.从 WebWalker、WebSailor、WebShaper 到 IterResearch,构建“数据飞轮”。 3.提供“超人难度”数据,用于持续预训练和后训练。 ⚙️ 推理模式 1.ReAct 模式:简洁通用,检验模型内在能力。 2.Heavy 模式:基于 IterResearch + Research-Synthesis,多智能体并行研究,提升复杂任务表现。 📱 应用场景 1.高德 Mate:支持多日旅行规划,结合路线、景点与酒店。 2.通义法睿:法律研究助手,检索案例与法规,提供可验证引用。 📖 看法 OpenAI 的 Deep Research 展示了闭源系统的可能性,而阿里这次直接把它 开源、可复现。 通义 DeepResearch 可能就是 AI 研究员的 “Linux 时刻”。
AI Agent 也能支付结账了!Google 推出开放支付协议 AP2Google 宣布发布 AI Agent 支付协议(AP2),这是一个开放、共享的支付规范,旨在解决 AI 代理主导结账时的信任问题,让代理和商家之间的交易更安全、合规、可验证。 AP2 为 AI Agent 提供跨商家、跨钱包的互操作支付能力,用密码学证明用户意图,消除代理结账的信任鸿沟。 🔑 什么是 AP2 1.开放协议:由 Google 牵头,与 60+ 机构合作(包括万事达、Visa、Paypal、银联、蚂蚁国际等),面向全球商家和钱包。 2.建立在现有标准之上:扩展了 A2A 协议(Agent-to-Agent)和 MCP(模型上下文协议)。 3.核心机制:在 “意图 → 购物车 → 支付” 流程中,代理、商家和支付处理方之间交换 可验证的证据。 🛡️ 解决的问题 1.责任归属:避免 Agent 误操作(如 $499 升级为 $49)带来的责任模糊。 2.信任缺口:通过密码学验证 + 审计证明,让用户意图被清晰记录。 3.生态兼容:不破坏现有支付体系,与传统支付通道共存。 🌍 行业支持 1.金融机构:美国运通、蚂蚁国际、JCB、万事达、银联国际等 2.支付处理:Paypal、Revolut、Worldpay、Ayden 等 3.科技平台:Coinbase、Salesforce、ServiceNow、Intuit 等 4.电商平台:Etsy 等 💡 看法 AI Agent 能帮用户自动购物、订阅、支付,但缺乏一套“可信的交易语言”。AP2 正是补上了这块拼图,可以说是 AI 走向真实商业流通的关键基础。 未来,如果 AP2 被广泛采用,AI Agent 可能成为用户的“数字 CFO”,在各大平台上安全无缝消费,期待一波~