【第551期】AgentSkiller:面向通用智能体的全自动大规模合成数据框架Seventy3

【第551期】AgentSkiller:面向通用智能体的全自动大规模合成数据框架

22分钟 ·
播放数3
·
评论数0

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。

如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。合作邮箱:zhiwudazhanjiangshi#gmail.com

今天的主题是:

AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis

Summary

大语言模型(LLM)代理在通过工具解决现实世界问题方面展现出巨大潜力,但通用智能的进一步提升却受限于高质量、长程(long-horizon)数据的匮乏。现有方法要么收集受隐私限制的 API 日志,要么生成缺乏多样性的脚本化交互,难以产生扩展模型能力所需的数据。

我们提出了 AgentSkiller:一个全自动化的框架,用于在真实的、语义关联的领域中合成多轮交互数据。它采用基于 DAG(有向无环图) 的架构,具有明确的状态转换,以确保确定性和可恢复性。

该流水线的工作流程如下:

  • 环境构建:构建领域本体和“以人为中心的实体图”(Person-Centric Entity Graph)。
  • 接口定义:通过“服务蓝图”为 Model Context Protocol (MCP) 服务器定义工具接口。
  • 数据填充:使用一致的数据库和严格的领域策略填充环境。
  • 跨域融合:利用跨域融合机制链接不同服务,以模拟复杂任务。
  • 任务生成:通过验证解决方案路径、执行验证过滤,并使用“基于画像的模拟器”(Persona-based Simulator)生成查询进行自动演练,从而创建用户任务。

这一流程产生了具有清晰状态变化的可靠环境。为了证明其有效性,我们合成了约 1.1 万条交互样本;实验结果表明,在该数据集上训练的模型在函数调用(function calling)能力上较基准模型有显著提升,在参数规模较大的模型中表现尤为突出。

原文链接:arxiv.org