阿里通义正式开源“通义 DeepResearch”：30B 模型媲美 OpenAI Deep Research

昨晚，阿里通义正式开源“通义 DeepResearch”，这是首个性能对标 OpenAI Deep Research 的开源 Web Agent，仅 30B 参数（激活 3B），在多项基准测试中超越或接近热门 AI 模型，实现了高效规模与顶尖性能的统一。

🌍 开源与定位
1.全球首个开源 Web Agent，可与 OpenAI Deep Research 对标。
2.模型规模 30B（激活 3B），实现“小体量，大性能”。

📊 性能表现
1.在多项基准中超越或接近 o3。

🧠 训练范式
1.端到端训练流程：Agentic CPT → SFT → RL。
2.采用 on-policy RL，在高稳定性模拟环境中试错学习。

🔄 数据策略
1.全自动合成数据，无需人工标注。
2.从 WebWalker、WebSailor、WebShaper 到 IterResearch，构建“数据飞轮”。
3.提供“超人难度”数据，用于持续预训练和后训练。

⚙️ 推理模式
1.ReAct 模式：简洁通用，检验模型内在能力。
2.Heavy 模式：基于 IterResearch + Research-Synthesis，多智能体并行研究，提升复杂任务表现。

📱 应用场景
1.高德 Mate：支持多日旅行规划，结合路线、景点与酒店。
2.通义法睿：法律研究助手，检索案例与法规，提供可验证引用。

📖 看法
OpenAI 的 Deep Research 展示了闭源系统的可能性，而阿里这次直接把它开源、可复现。
通义 DeepResearch 可能就是 AI 研究员的 “Linux 时刻”。