2026.06.17 | 梯度视角破解RLVR崩塌；游戏引擎端到端生成挑战 - HuggingFace 每日AI论文速递

【赞助商】
OpenClaw快报
每天五分钟，听听 OpenClaw 快报，带你了解最新动态和业内讨论
传送门 www.xiaoyuzhoufm.com

【目录】
本期的 9 篇论文如下：

[00:32] 🏆 A Gradient Perspective on RLVR Stability and Winner Advantage Policy Optimization（关于RLVR稳定性的梯度视角及胜者优势策略优化）
[01:28] 🎮 GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?（GameCraft-Bench：智能体能否在真实游戏引擎中端到端构建可玩游戏？）
[02:20] 🏥 TRIAGE: Dialectical Reasoning for Explainable Risk Prediction on Irregularly Sampled Medical Time Series with LLMs（TRIAGE：基于辩证推理的可解释风险预测框架，用于大语言模型处理不规则采样的医疗时间序列）
[03:20] 🤖 LectūraAgents: A Multi-Agent Framework for Adaptive Personalized AI-Assisted Learning and Embodied Teaching（LectūraAgents：面向自适应个性化AI辅助学习与具身教学的多智能体框架）
[04:02] 🌍 ActWorld: From Explorable to Interactive World Model via Action-Aware Memory（ActWorld：通过动作感知记忆从可探索到可交互的世界模型）
[04:57] 🖼 Unified Multimodal Autoregressive Modeling with Shared Context-Visual Tokenizer is Key to Unification（统一多模态自回归建模：共享上下文-视觉分词器是实现统一的关键）
[06:01] 🔬 Aligning Quantum Operators with Large Language Models（将量子算子与大语言模型对齐）
[06:54] 🔄 Looped World Models（循环世界模型）
[07:50] 🌐 Beyond Monolingual Deep Research: Evaluating Agents and Retrievers with Cross-Lingual BrowseComp-Plus（超越单语深度研究：使用跨语言BrowseComp-Plus评估智能体与检索器）

【关注我们】
您还可以在以下平台找到我们，获得播客内容以外更多信息
小红书: AI速递