【赞助商】
通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事
传送门 🔗www.xiaoyuzhoufm.com
【目录】
本期的 5 篇论文如下:
00:39 TOP1(🔥491) | 🧠 A Very Big Video Reasoning Suite(一个超大规模视频推理套件)
02:33 TOP2(🔥246) | 💭 Does Your Reasoning Model Implicitly Know When to Stop Thinking?(你的推理模型是否隐含地知道何时停止思考?)
04:48 TOP3(🔥215) | ⚖ VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training(VESPO:用于稳定离策略LLM训练的变分序列级软策略优化)
07:29 TOP4(🔥187) | 🌍 The Trinity of Consistency as a Defining Principle for General World Models(一致性三位一体:作为通用世界模型定义原则)
09:43 TOP5(🔥146) | 🔍 From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models(从盲点到增益:诊断驱动的迭代训练用于大型多模态模型)

【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
