2025.07.25 | GSPO解决大模型训练崩溃;MUR提升LLM推理效率。

2025.07.25 | GSPO解决大模型训练崩溃;MUR提升LLM推理效率。

10分钟 ·
播放数116
·
评论数0

本期的 15 篇论文如下:

00:24 🚀 Group Sequence Policy Optimization(组序列策略优化)

00:53 🧠 MUR: Momentum Uncertainty guided Reasoning for Large Language Models(MUR:面向大型语言模型的动量不确定性引导推理)

01:30 🧠 LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization(LAPO:内化推理效率的长度自适应策略优化)

02:09 🎬 Captain Cinema: Towards Short Movie Generation(电影队长:迈向短片电影生成)

02:58 📈 TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation(TTS-VAR:一种用于视觉自回归生成的测试时缩放框架)

03:36 🌍 EarthCrafter: Scalable 3D Earth Generation via Dual-Sparse Latent Diffusion(EarthCrafter:通过双稀疏潜在扩散实现可扩展三维地球生成)

04:23 💡 Hierarchical Budget Policy Optimization for Adaptive Reasoning(用于自适应推理的分层预算策略优化)

04:48 🔄 DriftMoE: A Mixture of Experts Approach to Handle Concept Drifts(DriftMoE:一种处理概念漂移的混合专家方法)

05:17 🚀 Technical Report of TeleChat2, TeleChat2.5 and T1(TeleChat2、TeleChat2.5和T1技术报告)

06:00 📈 DMOSpeech 2: Reinforcement Learning for Duration Prediction in Metric-Optimized Speech Synthesis(DMOSpeech 2:度量优化语音合成中时长预测的强化学习)

06:31 ✨ A New Pair of GloVes(新一代GloVe模型)

07:10 🚀 GLiNER2: An Efficient Multi-Task Information Extraction System with Schema-Driven Interface(GLiNER2:一个高效多任务模式驱动的信息抽取系统)

07:38 ⚡ TeEFusion: Blending Text Embeddings to Distill Classifier-Free Guidance(TeEFusion:融合文本嵌入以蒸馏无分类器引导)

08:22 ⚕ SegDT: A Diffusion Transformer-Based Segmentation Model for Medical Imaging(SegDT:一个基于扩散Transformer的医学影像分割模型)

08:52 🧩 Discovering and using Spelke segments(发现与应用 Spelke 分割)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递