昨晚,阿里通义正式开源“通义 DeepResearch”,这是首个性能对标 OpenAI Deep Research 的开源 Web Agent,仅 30B 参数(激活 3B),在多项基准测试中超越或接近热门 AI 模型,实现了高效规模与顶尖性能的统一。
🌍 开源与定位
1.全球首个开源 Web Agent,可与 OpenAI Deep Research 对标。
2.模型规模 30B(激活 3B),实现“小体量,大性能”。
📊 性能表现
1.在多项基准中超越或接近 o3。
🧠 训练范式
1.端到端训练流程:Agentic CPT → SFT → RL。
2.采用 on-policy RL,在高稳定性模拟环境中试错学习。
🔄 数据策略
1.全自动合成数据,无需人工标注。
2.从 WebWalker、WebSailor、WebShaper 到 IterResearch,构建“数据飞轮”。
3.提供“超人难度”数据,用于持续预训练和后训练。
⚙️ 推理模式
1.ReAct 模式:简洁通用,检验模型内在能力。
2.Heavy 模式:基于 IterResearch + Research-Synthesis,多智能体并行研究,提升复杂任务表现。
📱 应用场景
1.高德 Mate:支持多日旅行规划,结合路线、景点与酒店。
2.通义法睿:法律研究助手,检索案例与法规,提供可验证引用。
📖 看法
OpenAI 的 Deep Research 展示了闭源系统的可能性,而阿里这次直接把它 开源、可复现。
通义 DeepResearch 可能就是 AI 研究员的 “Linux 时刻”。


阿里通义正式开源“通义 DeepResearch”:30B 模型媲美 OpenAI Deep Research
9分钟 ·
1·
0