【第558期】Trace-Free+:大语言模型智能体工具描述改写框架Seventy3

【第558期】Trace-Free+:大语言模型智能体工具描述改写框架

22分钟 ·
播放数2
·
评论数0

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。

如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。合作邮箱:zhiwudazhanjiangshi#gmail.com

今天的主题是:

Learning to Rewrite Tool Descriptions for Reliable LLM-Agent Tool Use

Summary

基于 LLM 的代理性能不仅取决于代理本身,还取决于其调用的工具接口质量。尽管此前的工作主要集中在代理微调上,但包括自然语言描述和参数架构在内的工具接口仍主要面向人类设计,往往成为性能瓶颈,尤其是在代理必须从大规模候选工具集中进行选择时。

现有的工具接口优化方法依赖于执行轨迹(execution traces),但在冷启动或受隐私限制的场景中,这些轨迹通常难以获取;此外,这些方法通常独立优化每个工具,限制了其扩展性以及对未知工具的泛化能力。

我们提出了 Trace-Free+:一个课程学习框架,该框架将监督信号逐步从轨迹丰富的场景转移到无轨迹的部署环境,鼓励模型抽象出可复用的接口使用模式和工具使用结果。为了支持这一方法,我们通过结构化工作流针对多种工具构建了一个大规模的高质量工具接口数据集。

在 StableToolBench 和 RestBench 上的实验结果表明:

  • 在未知工具上取得了持续的性能提升;
  • 展现出强大的跨领域泛化能力;
  • 当候选工具规模扩展至 100 个以上时,依然保持稳健。

这证明了工具接口优化是代理微调的一种实用且可部署的补充手段。

原文链接:arxiv.org