通往 AGI 的必经之路：Agent 自进化到底是在“进化”什么？

AI AMA是由青稞社区、魔搭社区、知乎联合发起的AI前沿技术对话栏目。每期邀请领域学者、开发者、KOL围绕热点技术主题展开"多视角群聊"，以深度对谈的形式，打破信息茧房，拆解技术细节、碰撞前沿观点、探讨落地实践。

首期AI AMA 聚焦“Agent自进化”专场，邀请了 6 位在该领域做出标杆性工作的青年学者，展开一场多视角的深度对谈直播，不设边界地探讨 Agent 自进化的核心逻辑与实践挑战：

如何定义“自进化”？其核心判据与理解框架应如何建立？

自进化系统真正学到的是什么？能力提升更倾向于环境适应性，还是可泛化的通用策略？

关于反馈系统，自进化应该靠什么信号驱动？

如何评估自进化的实现程度？是否需要建立新的评价体系与测试场景？

不同学习范式（如SFT、RL与训练之外的进化机制）之间应如何协同与定位？

具备规划、调用子智能体、文件系统与长程状态等能力的Deep Agent，是否显著增加了自进化的实现难度？

在工业实践中，自进化如何被可控地转化为业务价值？

嘉宾：

翟云鹏，阿里巴巴通义实验室研究员，魔搭社区AgentEvolver项目负责人,研究兴趣包括：自我进化的智能体学习系统、复杂场景下的智能体强化学习、大语言模型后训练技术等。24年于北京大学获得计算机博士学位，在AI领域累计发表Top期刊和会议论文二十余篇。

陈兆润，芝加哥大学计算机科学专业博士二年级，Scaling Agent Learning via Experience Synthesis 一作，师从 UIUC 的 Bo Li 教授和 UC Berkeley 的 Dawn Song 教授。他的研究聚焦于约束条件下的 AI 智能体强化学习与自进化，以及智能体安全问题，包括自主化的 red-teaming 与 guardrail 机制设计。其研究成果曾多次发表于 NeurIPS、ICML、ICLR、NAACL、EMNLP 等计算机领域顶级会议，并获得 Oral 与 Spotlight 报告。

黄呈松，圣路易斯华盛顿大学博士生三年级，R-Zero: Self-Evolving Reasoning LLM from Zero Data 一作，本科毕业于复旦大学，研究方向集中于模型自提升，代表作包括LoraHub，R-Zero, Benchmark^2。

刘博，新加坡国立大学计算机科学系博士生，SPICE : Self-Play In Corpus Environments Improves Reasoning 一作，研究兴趣主要集中在强化学习、推理与机器学习系统及其在复杂真实环境中的应用。

近期在Meta FAIR担任Research Scientist Intern，与Jason Weston以及华盛顿大学的Natasha Jaques教授合作，研究大语言模型的可扩展自我改进与自博弈方法，发表了SPIRAL和SPICE系列工作。此前，在DeepSeek担任Student Researcher，参与了DeepSeek-LLM、DeepSeek-V2、DeepSeek-VL和DeepSeek-Prover等基础模型的研发工作。研究目标是探索可扩展的自我改进方法，构建能够在任何未知环境中智能行动的自主决策系统。

在此之前，曾在汪军教授指导下担任研究助理，并有幸与杨耀东老师密切合作。于2020年获得北京大学智能科学与技术专业和经济学专业的双学士学位，师从卢宗青老师。

孙泽一，上海交通大学博士三年级，SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience 一作，研究方向为多摸态LLM强化学习，Agent后训练。以第一/共同第一作者身份在NeurIPS, CVPR, ICCV等学术会议上发表7篇论文。Google scholar citation 700多次，github项目3k+ star。其中SEAgent作为Computer Use Agent的早期自主进化的探索得到学术界较高关注。

张凯，美国俄亥俄州立大学博士四年级，Agent Learning via Early Experience一作，师从苏煜和孙欢教授，研究方向聚焦于数据在基础模型与智能体中的作用。他已在顶级NLP/CV/ML会议发表多篇论文，其中多篇论文获得或入围Best Paper Award（3篇），或者被选为Oral（8次）和Spotlight（3次）。代表作包括MMMU, MagicLens, MagicBrush, Early Experience等。他曾在Microsoft Research、Meta Superintelligence Labs以及Google DeepMind 实习。

文字实录

mp.weixin.qq.com

加入 AI AMA 交流群