【第608期】记忆迁移学习:编程代理的跨域经验共享Seventy3

【第608期】记忆迁移学习:编程代理的跨域经验共享

23分钟 ·
播放数0
·
评论数0

Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。

如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com

今天的主题是:

Memory Transfer Learning: How Memories are Transferred Across Domains in Coding Agents

Summary

基于记忆的自我进化(memory-based self-evolution)已成为代码智能体(coding agents)中的一种有前景的范式。然而,现有方法通常将记忆的使用限制在同质化任务领域中,未能充分利用现实世界中不同编程问题之间共享的基础设施基础,例如运行时环境和编程语言。

为了解决这一局限,我们研究了“记忆迁移学习(Memory Transfer Learning, MTL)”,通过利用来自异构领域的统一记忆池来实现跨领域知识迁移。

我们在 6 个代码基准测试上进行了评估,并比较了四种不同的记忆表示形式,其范围从具体执行轨迹(concrete traces)到抽象洞见(abstract insights)。

实验结果表明:

  • 跨领域记忆可使平均性能提升 3.7%;

  • 性能提升主要来源于元知识(meta-knowledge)的迁移,例如验证流程(validation routines),而非任务特定代码的直接复用。

更重要的是,我们发现:抽象程度决定了迁移能力。

  • 高层次洞见具有良好的泛化性;

  • 而低层次执行轨迹由于过于具体,往往会导致负迁移(negative transfer)。

此外,我们还发现:

  • 迁移效果会随着记忆池规模的扩大而提升;

  • 记忆甚至可以在不同模型之间进行迁移。

我们的工作为如何突破单一领域孤岛、扩展记忆利用方式,建立了经验性的设计原则。

原文链接:arxiv.org