AI Agent 论文播报 6/16：把 Agent 当系统造

当 Agent 不再只追求更聪明的模型，而是开始像分布式系统一样被认真设计——这一期我们挑了三篇代表作，从 runtime、评测到手机端动作面，看看 Agent 工程化这条线今天走到了哪。

本期重点

多 Agent 并发控制（CoAgent: Concurrency Control for Multi-Agent Systems）：把传统数据库里的 2PL/OCC 换掉，用 LLM 的语义判断当并发控制新原语，提出 MTPO 协议，让冲突时 Agent 自己打补丁，10 个高竞争场景下接近串行正确率却拿到 1.4× 加速。
Web Agent 过程级评测（Where Did It Go Wrong? Process-Level Evaluation of Web Agents with Semantic State Tracking）：给网页挂一个语义 MDP 影子，把成功率拆成探索、执行、技能三层，还能在共享状态上对齐成功/失败轨迹，精确定位每个 Agent 是栽在哪一步。
手机 Agent 混合动作面（PhoneHarness: Harnessing Phone-Use Agents through Mixed GUI, CLI, and Tool Actions）：让手机 Agent 像懂 adb 的工程师，GUI/CLI/工具混合路由，确定性优先；评测只认真实副作用，安全策略嵌进执行协议而不是事后审查。

今日趋势

欢迎在评论区聊聊你最想看哪条线继续展开。本期内容由 AI 自动整理生成，如有疏漏欢迎指正，我们下期见。