Seventy3:借助NotebookLM的能力进行论文解读,专注人工智能、大模型、机器人算法、crypto方向,让大家跟着AI一起进步。
如果你想要解读自己的论文,获得更多曝光度。请联系小助手微信:seventy3_podcast 加群。
合作邮箱:zhiwudazhanjiangshi#gmail.com
今天的主题是:
MEMCOLLAB: Cross-Agent Memory Collaboration via Contrastive Trajectory
Distillation
Summary
基于大语言模型(LLM)的智能体通常依赖记忆机制来复用以往解决问题的经验。然而,现有的方法大多是“各自为战”的——它们为每个智能体单独构建记忆,将存储的知识与单一模型的推理风格死死绑定。
在如今异构智能体协同部署的时代,一个灵魂拷问随之而来:不同的模型能不能共享同一个记忆系统?
我们发现,如果简单粗暴地在智能体之间“跨服”迁移记忆,往往会导致性能翻车。因为原始记忆把“任务核心知识”和“特定模型的专属偏好(私货)”死死纠缠在了一起。
为了打破这种“生殖隔离”,我们提出了 MemCollab——一个协作式记忆框架。
核心技术突破
MemCollab 的目标是构建一种模型无关(agent-agnostic)的通用记忆:
交叉对比与提炼(Contrastive Process): 通过对比不同智能体在同一任务上生成的推理轨迹,系统能够“大浪淘沙”,提炼出抽象的推理约束。这一过程精准抓住了任务层面的通用底层逻辑,同时过滤掉了特定智能体自带的冗余特征或偏见。
任务感知检索(Task-aware Retrieval): 我们进一步引入了基于任务类别的记忆访问机制。这保证了智能体在推理时,只会精准调用与当前任务相关的约束经验,绝不乱用。
实验结果
在数学推理和代码生成的基准测试中,MemCollab 的表现非常亮眼:
无论是针对哪种智能体,甚至是跨模型家族(cross-modal-family)的极端设定,它都能稳定且一致地提升准确率和推理阶段的效率。
总结: 实验结果证明,通过协作构建的记忆库,完全可以成为各类 LLM 智能体共享的“公共智慧池”。既然能汇聚所有优等生的解题思路,自然也就没必要让每个模型再闭门造车了。
原文链接:arxiv.org

