2025.11.20 | 视频模型拍推理链,迷宫百发百中;无标注左右互搏,视觉模型自学跃升

2025.11.20 | 视频模型拍推理链,迷宫百发百中;无标注左右互搏,视觉模型自学跃升

4分钟 ·
播放数95
·
评论数0

本期的 4 篇论文如下:

00:23 🎬 Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving Tasks(通过视频进行推理:基于走迷宫任务对视频模型推理能力的首次评测)

01:17 🔄 VisPlay: Self-Evolving Vision-Language Models from Images(VisPlay:基于无标注图像自我进化的视觉-语言模型)

01:54 📚 ARC-Chapter: Structuring Hour-Long Videos into Navigable Chapters and Hierarchical Summaries(ARC-Chapter:将超长视频结构化导航章节与分层摘要)

02:45 🦴 MHR: Momentum Human Rig(MHR:动量人体绑定模型)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递