AI AMA是由青稞社区、魔搭社区、知乎联合发起的AI前沿技术对话栏目。每期邀请领域学者、开发者、KOL围绕热点技术主题展开"多视角群聊",以深度对谈的形式,打破信息茧房,拆解技术细节、碰撞前沿观点、探讨落地实践。
首期AI AMA 聚焦“Agent自进化”专场,邀请了 6 位在该领域做出标杆性工作的青年学者,展开一场多视角的深度对谈直播,不设边界地探讨 Agent 自进化的核心逻辑与实践挑战:
- 如何定义“自进化”?其核心判据与理解框架应如何建立?
- 自进化系统真正学到的是什么?能力提升更倾向于环境适应性,还是可泛化的通用策略?
- 关于反馈系统,自进化应该靠什么信号驱动?
- 如何评估自进化的实现程度?是否需要建立新的评价体系与测试场景?
- 不同学习范式(如SFT、RL与训练之外的进化机制)之间应如何协同与定位?
- 具备规划、调用子智能体、文件系统与长程状态等能力的Deep Agent,是否显著增加了自进化的实现难度?
- 在工业实践中,自进化如何被可控地转化为业务价值?
嘉宾:
翟云鹏,阿里巴巴通义实验室研究员,魔搭社区AgentEvolver项目负责人,研究兴趣包括: 自我进化的智能体学习系统、复杂场景下的智能体强化学习、大语言模型后训练技术等。24年于北京大学获得计算机博士学位,在AI领域累计发表Top期刊和会议论文二十余篇。
陈兆润,芝加哥大学计算机科学专业博士二年级,Scaling Agent Learning via Experience Synthesis 一作,师从 UIUC 的 Bo Li 教授和 UC Berkeley 的 Dawn Song 教授。他的研究聚焦于约束条件下的 AI 智能体强化学习与自进化,以及智能体安全问题,包括自主化的 red-teaming 与 guardrail 机制设计。其研究成果曾多次发表于 NeurIPS、ICML、ICLR、NAACL、EMNLP 等计算机领域顶级会议,并获得 Oral 与 Spotlight 报告。
黄呈松,圣路易斯华盛顿大学博士生三年级,R-Zero: Self-Evolving Reasoning LLM from Zero Data 一作,本科毕业于复旦大学,研究方向集中于模型自提升,代表作包括LoraHub,R-Zero, Benchmark^2。
刘博,新加坡国立大学计算机科学系博士生,SPICE : Self-Play In Corpus Environments Improves Reasoning 一作,研究兴趣主要集中在强化学习、推理与机器学习系统及其在复杂真实环境中的应用。
近期在Meta FAIR担任Research Scientist Intern,与Jason Weston以及华盛顿大学的Natasha Jaques教授合作,研究大语言模型的可扩展自我改进与自博弈方法,发表了SPIRAL和SPICE系列工作。此前,在DeepSeek担任Student Researcher,参与了DeepSeek-LLM、DeepSeek-V2、DeepSeek-VL和DeepSeek-Prover等基础模型的研发工作。研究目标是探索可扩展的自我改进方法,构建能够在任何未知环境中智能行动的自主决策系统。
在此之前,曾在汪军教授指导下担任研究助理,并有幸与杨耀东老师密切合作。于2020年获得北京大学智能科学与技术专业和经济学专业的双学士学位,师从卢宗青老师。
孙泽一,上海交通大学博士三年级,SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience 一作,研究方向为多摸态LLM强化学习,Agent后训练。以第一/共同第一作者身份在NeurIPS, CVPR, ICCV等学术会议上发表7篇论文。Google scholar citation 700多次,github项目3k+ star。其中SEAgent作为Computer Use Agent的早期自主进化的探索得到学术界较高关注。
张凯,美国俄亥俄州立大学博士四年级,Agent Learning via Early Experience一作,师从苏煜和孙欢教授,研究方向聚焦于数据在基础模型与智能体中的作用。他已在顶级NLP/CV/ML会议发表多篇论文,其中多篇论文获得或入围Best Paper Award(3篇),或者被选为Oral(8次)和Spotlight(3次)。代表作包括MMMU, MagicLens, MagicBrush, Early Experience等。他曾在Microsoft Research、Meta Superintelligence Labs以及Google DeepMind 实习。
文字实录
加入 AI AMA 交流群

