【目录】
本期的 5 篇论文如下:
[] TOP1(🔥263) | 🔍 CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence(CiteVQA:为可信文档智能建立证据归因基准)
[] TOP2(🔥199) | 🤖 Code as Agent Harness(代码作为智能体框架)
[] TOP3(🔥191) | 🎯 DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards(DelTA:面向可验证奖励强化学习的判别性令牌信用分配)
[] TOP4(🔥189) | 🧠 Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information(基于点互信息的反自蒸馏用于推理强化学习)
[] TOP5(🔥167) | 🚌 TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation(TransitLM: 面向无地图公交路线生成的大规模数据集与基准)

【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递

