【第587期】CAID：基于软件工程原语的异步多智能体协作

Seventy3：借助NotebookLM的能力进行论文解读，专注人工智能、大模型、机器人算法、crypto方向，让大家跟着AI一起进步。

如果你想要解读自己的论文，获得更多曝光度。请联系小助手微信：seventy3_podcast 加群。
合作邮箱：zhiwudazhanjiangshi#gmail.com

今天的主题是：

Effective Strategies for Asynchronous Software Engineering Agents

Summary

AI 智能体在处理孤立的软件工程（SWE）任务（如解决 GitHub 上的 Issue）方面已愈发强大。然而，涉及多个相互依赖子任务的长程任务（Long-horizon tasks），在准确性和完成时效上依然面临巨大挑战。

虽然“多智能体异步协作”是提升效率的直观方案，但在实际应用中却异常困难：多个智能体同时编辑会产生干扰、依赖项难以同步，且将零散的进度整合为统一的整体也极具挑战。

CAID 架构：回归人类开发者的智慧

受人类开发者成熟协作基础设施的启发，我们提出了 CAID（中心化异步隔离委托）。这一多智能体协调范式基于三大核心 SWE 原语：

中心化任务委托 (Centralized Delegation)：通过中心管理器构建具备“依赖感知”能力的任务计划。
异步执行 (Asynchronous Execution)：多任务并行，显著缩短完成时间。
隔离工作区 (Isolated Workspaces)：确保各智能体在独立环境中运行，互不干扰。

核心机制： CAID 采用结构化集成方式整合进度，并结合基于测试的可执行验证。研究发现，“分支与合并（Branch-and-merge）”是多智能体协作的核心协调机制，而 git worktree、git commit 和 git merge 等工具是实现该机制最可靠、且可执行的手段。

实验评估结果

在实证评估中，CAID 相比单智能体基准表现出了显著的优势：

论文复现任务 (PaperBench)：准确率绝对值提升了 26.7%。
Python 库开发任务 (Commit0)：准确率绝对值提升了 14.3%。

总结： CAID 证明了解决复杂 AI 工程问题的答案或许就藏在人类使用了几十年的工具箱里。通过引入 Git 式的协作原语，多智能体系统终于不再是“笨拙的合唱”，而能够像一支训练有素的工程团队一样高效协作。

原文链接：arxiv.org