2026.03.19 | 事件链预演视频未来;在线进化模型不掉队

2026.03.19 | 事件链预演视频未来;在线进化模型不掉队

13分钟 ·
播放数116
·
评论数0

【赞助商】

通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事

传送门 🔗www.xiaoyuzhoufm.com

【目录】

本期的 15 篇论文如下:

00:30 🔮 Video-CoE: Reinforcing Video Event Prediction via Chain of Events(Video-CoE:通过事件链强化视频事件预测)

01:13 🧬 MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild(MetaClaw:只需对话——一种在真实环境中元学习与进化的智能体)

02:01 🧠 MosaicMem: Hybrid Spatial Memory for Controllable Video World Models(MosaicMem:用于可控视频世界模型的混合空间记忆)

02:55 ⚖ Alignment Makes Language Models Normative, Not Descriptive(对齐使语言模型趋于规范性,而非描述性)

03:42 🧠 Complementary Reinforcement Learning(互补强化学习)

04:33 🤖 Look Before Acting: Enhancing Vision Foundation Representations for Vision-Language-Action Models(先看后动:增强视觉-语言-动作模型的视觉基础表征)

05:24 🤖 GigaWorld-Policy: An Efficient Action-Centered World--Action Model(GigaWorld-Policy:一种高效的动作中心化世界-动作模型)

06:07 🎬 Temporal Gains, Spatial Costs: Revisiting Video Fine-Tuning in Multimodal Large Language Models(时间增益,空间代价:重新审视多模态大语言模型中的视频微调)

06:54 🤖 When AI Navigates the Fog of War(当AI穿越战争迷雾:基于2026年中东冲突早期阶段的时序性案例研究)

07:49 🧩 LoST: Level of Semantics Tokenization for 3D Shapes(LoST:面向三维形状的语义层级分词方法)

08:21 🧠 BenchPreS: A Benchmark for Context-Aware Personalized Preference Selectivity of Persistent-Memory LLMs(BenchPreS:面向持久记忆大语言模型上下文感知个性化偏好选择性的基准测试)

09:09 🧠 ESPIRE: A Diagnostic Benchmark for Embodied Spatial Reasoning of Vision-Language Models(ESPIRE:面向视觉语言模型的具身空间推理诊断基准)

09:47 🤖 Conservative Offline Robot Policy Learning via Posterior-Transition Reweighting(通过后验转移重加权实现保守的离线机器人策略学习)

10:46 🎥 Stereo World Model: Camera-Guided Stereo Video Generation(立体世界模型:相机引导的立体视频生成)

11:32 🧠 AdaMem: Adaptive User-Centric Memory for Long-Horizon Dialogue Agents(AdaMem:面向长程对话代理的自适应用户中心记忆)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递