Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
Memory Transfer Learning: How Memories are Transferred Across Domains in Coding Agents
Summary
基于记忆的自我进化(memory-based self-evolution)已成为代码智能体(coding agents)中的一种有前景的范式。然而,现有方法通常将记忆的使用限制在同质化任务领域中,未能充分利用现实世界中不同编程问题之间共享的基础设施基础,例如运行时环境和编程语言。
为了解决这一局限,我们研究了“记忆迁移学习(Memory Transfer Learning, MTL)”,通过利用来自异构领域的统一记忆池来实现跨领域知识迁移。
我们在 6 个代码基准测试上进行了评估,并比较了四种不同的记忆表示形式,其范围从具体执行轨迹(concrete traces)到抽象洞见(abstract insights)。
实验结果表明:
跨领域记忆可使平均性能提升 3.7%;
性能提升主要来源于元知识(meta-knowledge)的迁移,例如验证流程(validation routines),而非任务特定代码的直接复用。
更重要的是,我们发现:抽象程度决定了迁移能力。
高层次洞见具有良好的泛化性;
而低层次执行轨迹由于过于具体,往往会导致负迁移(negative transfer)。
此外,我们还发现:
迁移效果会随着记忆池规模的扩大而提升;
记忆甚至可以在不同模型之间进行迁移。
我们的工作为如何突破单一领域孤岛、扩展记忆利用方式,建立了经验性的设计原则。
原文链接:arxiv.org

