2025.07.25 | GSPO解决大模型训练崩溃；MUR提升LLM推理效率。 - HuggingFace 每日AI论文速递

本期的 15 篇论文如下：

00:24 🚀 Group Sequence Policy Optimization（组序列策略优化）

00:53 🧠 MUR: Momentum Uncertainty guided Reasoning for Large Language Models（MUR：面向大型语言模型的动量不确定性引导推理）

01:30 🧠 LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization（LAPO：内化推理效率的长度自适应策略优化）

02:09 🎬 Captain Cinema: Towards Short Movie Generation（电影队长：迈向短片电影生成）

02:58 📈 TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation（TTS-VAR：一种用于视觉自回归生成的测试时缩放框架）

03:36 🌍 EarthCrafter: Scalable 3D Earth Generation via Dual-Sparse Latent Diffusion（EarthCrafter：通过双稀疏潜在扩散实现可扩展三维地球生成）

04:23 💡 Hierarchical Budget Policy Optimization for Adaptive Reasoning（用于自适应推理的分层预算策略优化）

04:48 🔄 DriftMoE: A Mixture of Experts Approach to Handle Concept Drifts（DriftMoE：一种处理概念漂移的混合专家方法）

05:17 🚀 Technical Report of TeleChat2, TeleChat2.5 and T1（TeleChat2、TeleChat2.5和T1技术报告）

06:00 📈 DMOSpeech 2: Reinforcement Learning for Duration Prediction in Metric-Optimized Speech Synthesis（DMOSpeech 2：度量优化语音合成中时长预测的强化学习）

06:31 ✨ A New Pair of GloVes（新一代GloVe模型）

07:10 🚀 GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface（GLiNER2：一个高效多任务模式驱动的信息抽取系统）

07:38 ⚡ TeEFusion: Blending Text Embeddings to Distill Classifier-Free Guidance（TeEFusion：融合文本嵌入以蒸馏无分类器引导）

08:22 ⚕ SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging（SegDT：一个基于扩散Transformer的医学影像分割模型）

08:52 🧩 Discovering and using Spelke segments（发现与应用 Spelke 分割）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递