2026.03.19 | 事件链预演视频未来；在线进化模型不掉队 - HuggingFace 每日AI论文速递

【赞助商】

通勤路上就听AI每周谈。AI每周谈，每周带你回顾上周AI大事

传送门 🔗www.xiaoyuzhoufm.com

【目录】

本期的 15 篇论文如下：

00:30 🔮 Video-CoE: Reinforcing Video Event Prediction via Chain of Events（Video-CoE：通过事件链强化视频事件预测）

01:13 🧬 MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild（MetaClaw：只需对话——一种在真实环境中元学习与进化的智能体）

02:01 🧠 MosaicMem: Hybrid Spatial Memory for Controllable Video World Models（MosaicMem：用于可控视频世界模型的混合空间记忆）

02:55 ⚖ Alignment Makes Language Models Normative, Not Descriptive（对齐使语言模型趋于规范性，而非描述性）

03:42 🧠 Complementary Reinforcement Learning（互补强化学习）

04:33 🤖 Look Before Acting: Enhancing Vision Foundation Representations for Vision-Language-Action Models（先看后动：增强视觉-语言-动作模型的视觉基础表征）

05:24 🤖 GigaWorld-Policy: An Efficient Action-Centered World--Action Model（GigaWorld-Policy：一种高效的动作中心化世界-动作模型）

06:07 🎬 Temporal Gains, Spatial Costs: Revisiting Video Fine-Tuning in Multimodal Large Language Models（时间增益，空间代价：重新审视多模态大语言模型中的视频微调）

06:54 🤖 When AI Navigates the Fog of War（当AI穿越战争迷雾：基于2026年中东冲突早期阶段的时序性案例研究）

07:49 🧩 LoST: Level of Semantics Tokenization for 3D Shapes（LoST：面向三维形状的语义层级分词方法）

08:21 🧠 BenchPreS: A Benchmark for Context-Aware Personalized Preference Selectivity of Persistent-Memory LLMs（BenchPreS：面向持久记忆大语言模型上下文感知个性化偏好选择性的基准测试）

09:09 🧠 ESPIRE: A Diagnostic Benchmark for Embodied Spatial Reasoning of Vision-Language Models（ESPIRE：面向视觉语言模型的具身空间推理诊断基准）

09:47 🤖 Conservative Offline Robot Policy Learning via Posterior-Transition Reweighting（通过后验转移重加权实现保守的离线机器人策略学习）

10:46 🎥 Stereo World Model: Camera-Guided Stereo Video Generation（立体世界模型：相机引导的立体视频生成）

11:32 🧠 AdaMem: Adaptive User-Centric Memory for Long-Horizon Dialogue Agents（AdaMem：面向长程对话代理的自适应用户中心记忆）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递