Karpathy autoresearch：当AI学会自己做科学研究

Andrej Karpathy开源了autoresearch——一个仅630行Python代码的框架，让AI Agent自主运行机器学习研究循环：

读取策略、修改代码、跑实验、评估结果、只保留改进。

两天跑了数百个实验，在已经优化到位的项目上又提升了11%。

本期播客深度拆解这个项目的原理、实践和它带来的深层启示。

【时间线】

Part 1 · 项目介绍与原理分析

00:00　开场 · 一支烟花社区播客介绍

01:30　Karpathy是谁——从OpenAI到Tesla到Eureka Labs

03:00　autoresearch是什么——630行极简框架的定位

05:00　The Karpathy Loop——读取策略→修改代码→限时实验→评估→提交

07:00　program.md——用Markdown编程，Programming the Why not the How

09:00　极简设计哲学——为什么630行就够了

Part 2 · 应用实践与真实效果

10:30　两天数百个实验，11%效率提升意味着什么

13:00　Agent发现了人类研究者遗漏的优化

15:00　递归自我改进——距离真正的AGI有多远

17:00　超越ML的通用性——营销文案、交易策略、家居自动化

19:00　开源社区的爆发式反应

20:30　Eureka Labs与AI原生教育

Part 3 · 启示与思考

21:30　从写代码到编排Agent——Manifesting取代Coding

23:00　研究者角色转变——从做实验到设计实验规则

25:00　Karpathy Loop作为通用设计模式

26:30　对AI创业者的启示——设计让AI自主运转的系统

28:00　一个人+正确架构 = 过去一个团队

29:30　autoresearch是Agency的技术化实现

30:00　总结 · 加入一支烟花社区交流

【核心观点】

· The Karpathy Loop：定义目标→设定约束→Agent沙箱自主探索→只保留改进——这是一种通用设计模式

· program.md是革命性创新：不写Python编程，用Markdown定义Why，Agent负责How

· 630行代码的极简哲学——复杂不等于强大，少即是多

· 两天跑数百个实验提升11%——AI发现了人类研究者遗漏的优化方向

· 通用性远超ML：任何有可编辑资产+可度量输出+限时评估的系统都适用

· 人的角色从实验者变成实验设计者——从写代码到编排Agent

· autoresearch是Agency概念的技术化实现——把人的主观能动性编码到系统架构中

========================================

【提到的关键概念】

autoresearch — Karpathy开源的自动化ML研究框架（630行Python）

The Karpathy Loop — 自主研究循环的设计模式

program.md — 用Markdown定义研究目标和约束的配置文件

Recursive Self-Improvement — AI递归自我改进

Eureka Labs — Karpathy创办的AI原生教育公司

Dobby — Karpathy实验的家居自动化Agent

Agency — 主观能动性，autoresearch的底层哲学

========================================

【关于一支烟花】

一支烟花是一个关注AI前沿动态的创作者社区

追踪硅谷最新AI技术趋势，用犀利视角解读行业变化

公众号：一支烟花AI

欢迎加入社群交流