2025.05.22 | Web导航效率提升;量化误差优化。

2025.05.22 | Web导航效率提升;量化误差优化。

11分钟 ·
播放数77
·
评论数0

本期的 15 篇论文如下:

00:25 🤖 Web-Shepherd: Advancing PRMs for Reinforcing Web Agents(Web-Shepherd:用于增强Web代理的PRM的进步)

01:13 🧮 Scaling Law for Quantization-Aware Training(量化感知训练的缩放法则)

01:53 🤖 UniVG-R1: Reasoning Guided Universal Visual Grounding with Reinforcement Learning(基于强化学习和推理引导的通用视觉定位)

02:28 🎨 MMaDA: Multimodal Large Diffusion Language Models(MMaDA:多模态大型扩散语言模型)

03:04 🔄 Diffusion vs. Autoregressive Language Models: A Text Embedding Perspective(扩散模型 vs. 自回归语言模型:文本嵌入的视角)

03:44 💻 Efficient Agent Training for Computer Use(用于计算机使用的高效Agent训练)

04:26 🧠 Learn to Reason Efficiently with Adaptive Length-based Reward Shaping(基于自适应长度奖励塑造的高效推理学习)

05:08 💡 When to Continue Thinking: Adaptive Thinking Mode Switching for Efficient Reasoning(何时继续思考:用于高效推理的自适应思考模式切换)

05:39 🤖 Vid2World: Crafting Video Diffusion Models to Interactive World Models(Vid2World:构建交互式世界模型的视频扩散模型)

06:16 🖼 IA-T2I: Internet-Augmented Text-to-Image Generation(互联网增强的文本到图像生成)

06:49 🧠 Deliberation on Priors: Trustworthy Reasoning of Large Language Models on Knowledge Graphs(基于先验知识的审慎:大型语言模型在知识图谱上的可信推理)

07:31 🎮 lmgame-Bench: How Good are LLMs at Playing Games?(lmgame-Bench:大型语言模型在玩游戏方面表现如何?)

08:18 🏙 Constructing a 3D Town from a Single Image(从单张图像构建三维城镇)

08:58 🚀 dKV-Cache: The Cache for Diffusion Language Models(dKV-Cache:扩散语言模型的缓存)

09:40 🛡 How Should We Enhance the Safety of Large Reasoning Models: An Empirical Study(我们应该如何提升大型推理模型的安全性:一项实证研究)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递