在本期播客中,我们将深入探讨来自UC Berkeley、Stanford等机构的最新研究GEPA。我们将讨论为什么基于自然语言反思和多目标遗传算法的提示词优化器,能够在效率和性能上全面超越目前火热的强化学习方法GRPO。准备好迎接一场关于大模型系统优化的头脑风暴吧!

GEPA: 反思性提示词进化超越强化学习的突破
13分钟 ·
1·
1
邬勇
2026.4.15
0
https://podcast-997.pages.dev/podcast/ecfbac5bf5294a34a98392b638aaed99