EP75：Andrej Karpathy开源的AutoResearch究竟是什么？当AI学会自我进化，世界将会怎样

当AI学会自我进化，世界将会怎样？想象一下，在你睡觉时，一个不知疲倦的AI代理正为你自动运行上百次实验，不断优化代码、改进策略，并最终交付出超越人类极限的结果。在本期节目中，AI专家David Ondrej将为你带来全网最清晰的“自主研究”（AutoResearch）实战指南，他将揭示这项由前特斯拉AI总监Andrej Karpathy开源的技术，不仅是AI领域的终极之战，更是即将颠覆各行各业的强大工具。

“自主研究”源于一个颠覆性的想法：为何要由人类来手动优化模型，而不是让AI自己来做？基于此，Andrej Karpathy创造了一个简单的框架，让AI代理在一个循环中不断提出假设、修改代码、评估结果，然后保留有效改进、抛弃无效尝试。David Ondrej在节目中强调，这绝非仅仅是AI研究者的玩具。他指出，这项技术最大的误解在于人们将其局限于模型训练，而实际上，任何可以被量化的领域——从市场营销的A/B测试、金融领域的交易策略，到优化网站性能——都可以构建类似的“自主研究”循环。未来，执行任务将变得廉价，而真正决定成败的，将是定义正确衡量指标与约束条件的能力。

**您将了解到：**

如何让AI在你睡觉时自动运行上百次实验，并不断实现自我改进？

除了优化AI模型，“自主研究”这项技术将如何颠覆市场营销、金融交易甚至你的个人生活？

构建一个能自动优化网站性能的AI代理需要哪三个核心文件？即使是新手也能在五分钟内学会吗？

**💡时点内容 | Key Topics**

* 01:25 自主研究的核心循环：David Ondrej 解释了“自主研究”是由安德烈·卡帕西发起的开源项目，它能让AI代理通过循环实验实现自我提升。他指出，这个循环包括提出假设、修改代码、运行评估，并总结其工作原理是“如果结果变好了，它就会把这次修改提交到你的Git历史记录里。如果结果变差了，它就会撤销修改”。

* 04:53 超越模型训练的应用：David Ondrej 强调，“自主研究”的应用远不止训练AI模型，它可以对生活和业务的方方面面产生巨大影响。他认为，只要事物可以被量化，就能构建自我改进的循环，并指出“真正有价值的能力，变成了……知道该衡量什么，选择正确的指标，以及设定恰当的约束”。

* 05:28 “三文件”核心架构：David Ondrej 详细介绍了“自主研究”的“三文件”架构，这是理解其工作原理的关键。他解释道，`program.md`由人类设定目标，`train.py`是AI唯一可修改的文件，而`prepare.py`是评估标准，并强调“AI代理绝对不能碰这个文件，永远不能，因为这是衡量最终结果的标准”。

* 08:21 商业领域的实战应用：David Ondrej 分享了“自主研究”在商业领域的两个实际应用案例。他以交易为例，说明AI代理可以测试成百上千种策略以找出回报率最高的方案，并以市场营销为例，指出该技术能自动化A/B测试，并预测“下一代团队将进行……整整36000次（实验），也就是……差不多每天100次！”

* 11:50 成功的三个条件与局限：David Ondrej 明确指出了成功运行“自主研究”循环必须满足的三个条件：清晰的指标、自动化的评估系统和唯一可修改的文件。他同时警告称，该技术不适用于标准主观的领域，并强调“如果你给它一个错误的指标，它会非常自信地……把事情往错误的方向上优化”。

* 12:24 从零搭建优化循环：David Ondrej 提供了一个详细的实操演示，向观众展示如何从零开始搭建自己的“自主研究”循环。他利用GitHub仓库、编码AI和评估脚本，以优化一个简单网站的加载时间为例，并宣称“只要跟着我接下来的五分钟，你就能超越……整整90%到95%的AI从业者！”

* 22:14 自动化研究的惊人效果：David Ondrej 在现场演示中展示了“自主研究”的强大威力，其AI代理在几分钟内就将一个网站的加载时间缩短了一半。他观察到性能在不到一分钟内就提升了34%，并惊叹道：“这就是自动化研究的力量。再看看这个，又优化到了28毫秒，这又是一个15%的提升！”

本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来怪怪的。如想了解更多信息，请关注微信公众号"西经东译"获取AI最新资讯。如有后续想要听的其他外文播客，也欢迎联系微信：mayday2303。