【月末特辑】1月最火AI论文 | mHC稳梯度;GDPO解多奖励HuggingFace 每日AI论文速递

【月末特辑】1月最火AI论文 | mHC稳梯度;GDPO解多奖励

22分钟 ·
播放数65
·
评论数0

【赞助商】

通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事

传送门 🔗www.xiaoyuzhoufm.com

【目录】

本期的 10 篇论文如下:

00:42 TOP1(🔥292) | 🧠 mHC: Manifold-Constrained Hyper-Connections(mHC:流形约束的超连接)

03:06 TOP2(🔥212) | 📈 GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization(GDPO:面向多奖励强化学习优化的组奖励解耦归一化策略优化)

04:45 TOP3(🔥209) | 🔍 Watching, Reasoning, and Searching: A Video Deep Research Benchmark on Open Web for Agentic Video Reasoning(观察、推理与搜索:面向智能体视频推理的开放网络视频深度研究基准)

06:59 TOP4(🔥193) | 👶 BabyVision: Visual Reasoning Beyond Language(BabyVision:超越语言的视觉推理)

08:57 TOP5(🔥190) | 🚀 STEP3-VL-10B Technical Report(STEP3-VL-10B 技术报告)

10:39 TOP6(🔥186) | 🤖 Agentic Reasoning for Large Language Models(大语言模型的智能体推理)

12:58 TOP7(🔥181) | 🧹 Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs(大语言模型能否清理你的数据?基于LLM的应用就绪数据准备综述)

15:19 TOP8(🔥171) | 🧠 LongCat-Flash-Thinking-2601 Technical Report(LongCat-Flash-Thinking-2601 技术报告)

17:22 TOP9(🔥165) | 🗺 Thinking with Map: Reinforced Parallel Map-Augmented Agent for Geolocalization(借助地图思考:用于地理定位的强化并行地图增强智能体)

19:17 TOP10(🔥158) | 🧠 Idea2Story: An Automated Pipeline for Transforming Research Concepts into Complete Scientific Narratives(Idea2Story:将研究概念转化为完整科学叙事的自动化流程)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递