【第551期】AgentSkiller：面向通用智能体的全自动大规模合成数据框架

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。

如果你想要解读自己的论文，获得更多曝光度。请联系小助手微信：seventy3_podcast 加群。合作邮箱：zhiwudazhanjiangshi#gmail.com

今天的主题是：

AgentSkiller: Scaling Generalist Agent Intelligence through Semantically Integrated Cross-Domain Data Synthesis

Summary

大语言模型（LLM）代理在通过工具解决现实世界问题方面展现出巨大潜力，但通用智能的进一步提升却受限于高质量、长程（long-horizon）数据的匮乏。现有方法要么收集受隐私限制的 API 日志，要么生成缺乏多样性的脚本化交互，难以产生扩展模型能力所需的数据。

我们提出了 AgentSkiller：一个全自动化的框架，用于在真实的、语义关联的领域中合成多轮交互数据。它采用基于 DAG（有向无环图） 的架构，具有明确的状态转换，以确保确定性和可恢复性。

该流水线的工作流程如下：

任务生成：通过验证解决方案路径、执行验证过滤，并使用“基于画像的模拟器”（Persona-based Simulator）生成查询进行自动演练，从而创建用户任务。

这一流程产生了具有清晰状态变化的可靠环境。为了证明其有效性，我们合成了约 1.1 万条交互样本；实验结果表明，在该数据集上训练的模型在函数调用（function calling）能力上较基准模型有显著提升，在参数规模较大的模型中表现尤为突出。

原文链接：arxiv.org