【月末特辑】5月最火AI论文 | 多智能体世界建模；开源机器人VLA模型 - HuggingFace 每日AI论文速递

【目录】
本期的 10 篇论文如下：
[00:45] TOP1(🔥407) | 🌍 Gamma-World: Generative Multi-Agent World Modeling Beyond Two Players（Gamma-World：超越双玩家的生成式多智能体世界建模）
[03:09] TOP2(🔥347) | 🤖 MolmoAct2: Action Reasoning Models for Real-world Deployment（MolmoAct2：面向实际部署的動作推理模型）
[05:30] TOP3(🔥269) | 🔍 CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence（CiteVQA：为可信文档智能建立证据归因基准）
[07:51] TOP4(🔥231) | 🧠 Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers（均值模式尖叫：面向千层扩散Transformer的均值-方差分裂残差）
[10:04] TOP5(🔥219) | 🏗 MinT: Managed Infrastructure for Training and Serving Millions of LLMs（MinT：用于训练和服务数百万大语言模型的托管基础设施）
[11:59] TOP6(🔥217) | 🧠 Heterogeneous Scientific Foundation Model Collaboration（异构科学基础模型协作）
[14:17] TOP7(🔥210) | 🤖 Code as Agent Harness（代码作为智能体框架）
[16:26] TOP8(🔥210) | 🧠 SkillOpt: Executive Strategy for Self-Evolving Agent Skills（SkillOpt：面向自进化智能体技能的执行策略）
[18:39] TOP9(🔥204) | 🎯 DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards（DelTA：面向可验证奖励强化学习的判别性令牌信用分配）
[20:25] TOP10(🔥195) | 🧠 Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information（基于点互信息的反自蒸馏用于推理强化学习）

【关注我们】
您还可以在以下平台找到我们，获得播客内容以外更多信息
小红书: AI速递