这份报告通过 Anthropic 的最新研究,探讨了 AI 智能体在现实场景中的自主性,指出用户并非仅关注模型能力,更在乎人机协作的动态过程。研究发现,虽然技术上 AI 已能处理长达数小时的任务,但目前大多数用户的实际操作时间极短,且随着使用经验的增加,用户对 AI 的信任度与干预频率同步提升。通过分析 Claude Code 等工具的使用数据,文章揭示了 AI 智能体正从纯粹的编程辅助走向更广泛的通用任务领域,并强调了主动澄清与授权管理在建立“胜任自主性”中的核心作用。这标志着 AI 评估标准正从理想化的技术指标,转向研究人类如何通过持续的互动与纠偏来引导智能体完成复杂工作。

![[Anthropic]AI Agent在现实应用中自主性](https://image.xyzcdn.net/Fs7EBVP-4TJEc-_XdceL6ioLKk3-.png@small)
