【Andrej Karpathy】智能体循环，一种新的工作方式

一、核心概念：什么是「智能体循环」

这张图介绍了由 Andrej Karpathy（前 OpenAI 科学家）提出的 **「自动研究」项目 **——智能体循环（Smart Agent Loop），它是一种全新的工作方式：让 AI 智能体在人类设定的规则下，自主完成「设计→编码→实验→评估」的闭环迭代，替代人类完成大量重复性、探索性工作，最终实现科研与业务的自动化突破。

二、核心循环：自动研究的 4 步运作机制

整个流程像一个永不停歇的闭环，核心是人类定规则，AI 自主跑实验：

人类用 Markdown 编写指令，定义研究问题、实验方向、行为准则（比如「优化模型准确率」「降低算力成本」），相当于给 AI 划定「游戏规则」和「目标」。第一步：人类设计竞技场（program.md）

AI 智能体（如 Claude）读取人类指令，自动修改模型架构、超参数或优化器代码，尝试不同方案。第二步：智能体自主迭代代码（train.py）

每次实验被严格限制在 5 分钟内，确保成本可控、迭代高效，让 AI 能在公平且低成本的条件下快速试错。第三步：固定预算的实验运行

系统自动计算「迹逊比率」等客观指标，对实验结果打分：第四步：客观评分与决策若得分提升 → 提交 Git 记录，作为新基准
整个过程无需人工干预，循环往复直到达成目标。
若得分下降 → 撤销本次尝试，重新迭代

三、智能体循环的成功五要素

要让这套机制稳定运行，必须满足 5 个关键条件：

表格

要素核心要求1. 客观的评分系统必须有无需人工干预即可判断优劣的数字指标（如准确率、成本、效率），避免主观偏差2. 快速且廉价的迭代失败代价以「分钟」计量，而非「月」，让 AI 能高频试错、快速收敛3. 受限的行动空间给 AI 明确的工作边界和工具集，避免无效探索，聚焦核心问题4. 容错性高单次实验失败不会导致灾难性后果（如数据丢失、系统崩溃），允许 AI 大胆尝试5. 可追踪的痕迹所有代码修改、实验日志都留下 Git 记录，方便人类事后审计、复盘优化

四、从科研到业务：广泛的应用场景

这套模式不局限于 AI 研究，已经能落地到各行各业：

营销自动化：智能体循环可自动调整广告素材和指标，每周完成上万次广告创意实验

软件工程（Ralph Loop）：智能体自动读取需求文档、修改代码并通过测试，实现持续交付

金融分析：在预设条件下，智能体循环测试投资组合分配，寻找最优产出

法律与招聘：律师用风险清单引导智能体审核合同；招聘者用评分标准让智能体筛选上百份简历

五、人类角色的进阶：从执行者到「规则设计者」

在智能体循环中，人类不再是重复劳动的执行者，而是升级为高价值的规则制定者，核心技能变为：

竞技场设计（Arena Design）：编写 program.md，通过上下文和框架引导智能体，明确目标与边界

评估器构建（Evaluator Construction）：核心挑战是把人类主观的「好 / 坏」，转化为智能体能理解、可执行的客观评分系统

总结

「智能体循环」本质是把人类从繁琐的试错、执行中解放出来，让 AI 成为高效的「自动研究员」，而人类专注于更高维度的目标定义、规则设计和价值判断，这将是未来各行各业的基础工作方式。