【月末特辑】5月最火AI论文 | 多智能体世界建模;开源机器人VLA模型HuggingFace 每日AI论文速递

【月末特辑】5月最火AI论文 | 多智能体世界建模;开源机器人VLA模型

23分钟 ·
播放数113
·
评论数0

【目录】
本期的 10 篇论文如下:
[00:45] TOP1(🔥407) | 🌍 Gamma-World: Generative Multi-Agent World Modeling Beyond Two Players(Gamma-World:超越双玩家的生成式多智能体世界建模)
[03:09] TOP2(🔥347) | 🤖 MolmoAct2: Action Reasoning Models for Real-world Deployment(MolmoAct2:面向实际部署的動作推理模型)
[05:30] TOP3(🔥269) | 🔍 CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence(CiteVQA:为可信文档智能建立证据归因基准)
[07:51] TOP4(🔥231) | 🧠 Mean Mode Screaming: Mean--Variance Split Residuals for 1000-Layer Diffusion Transformers(均值模式尖叫:面向千层扩散Transformer的均值-方差分裂残差)
[10:04] TOP5(🔥219) | 🏗 MinT: Managed Infrastructure for Training and Serving Millions of LLMs(MinT:用于训练和服务数百万大语言模型的托管基础设施)
[11:59] TOP6(🔥217) | 🧠 Heterogeneous Scientific Foundation Model Collaboration(异构科学基础模型协作)
[14:17] TOP7(🔥210) | 🤖 Code as Agent Harness(代码作为智能体框架)
[16:26] TOP8(🔥210) | 🧠 SkillOpt: Executive Strategy for Self-Evolving Agent Skills(SkillOpt:面向自进化智能体技能的执行策略)
[18:39] TOP9(🔥204) | 🎯 DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards(DelTA:面向可验证奖励强化学习的判别性令牌信用分配)
[20:25] TOP10(🔥195) | 🧠 Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information(基于点互信息的反自蒸馏用于推理强化学习)

【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递