2025.11.17 | RoPE去噪救长文本；AI速筛离子液体 - HuggingFace 每日AI论文速递

本期的 13 篇论文如下：

00:24 🧹 DoPE: Denoising Rotary Position Embedding（DoPE：面向旋转位置嵌入的去噪处理）

00:58 🧪 AIonopedia: an LLM agent orchestrating multimodal learning for ionic liquid discovery（AIonopedia：面向离子液体发现的LLM智能体多模态学习编排）

01:44 🖼 UI2Code^N: A Visual Language Model for Test-Time Scalable Interactive UI-to-Code Generation（UI2Code^N：面向测试时可扩展交互式UI转代码生成的视觉语言模型）

02:20 🚀 Virtual Width Networks（虚拟宽度网络）

02:56 ⚡ LiteAttention: A Temporal Sparse Attention for Diffusion Transformers（LiteAttention：面向扩散Transformer的时序稀疏注意力机制）

03:32 🌐 Simulating the Visual World with Artificial Intelligence: A Roadmap（用人工智能模拟视觉世界：路线图）

04:12 📐 GGBench: A Geometric Generative Reasoning Benchmark for Unified Multimodal Models（GGBench：面向统一多模态模型的几何生成推理基准）

05:00 🧏 HI-TransPA: Hearing Impairments Translation Personal Assistant（HI-TransPA：面向听障者的语音-唇形翻译个人助手）

05:35 🚀 MarsRL: Advancing Multi-Agent Reasoning System via Reinforcement Learning with Agentic Pipeline Parallelism（MarsRL：基于智能体流水线并行强化学习的多智能体推理系统进阶研究）

06:38 🎭 EmoVid: A Multimodal Emotion Video Dataset for Emotion-Centric Video Understanding and Generation（EmoVid：面向情感中心视频理解与生成的大规模多模态情感视频数据集）

07:18 🧭 SpatialThinker: Reinforcing 3D Reasoning in Multimodal LLMs via Spatial Rewards（SpatialThinker：用空间奖励强化多模态大模型的3D推理）

07:55 📊 Workload Schedulers -- Genesis, Algorithms and Differences（工作负载调度器——起源、算法与差异）

08:51 🚗 CATS-V2V: A Real-World Vehicle-to-Vehicle Cooperative Perception Dataset with Complex Adverse Traffic Scenarios（CATS-V2V：面向复杂恶劣交通场景的真实车车协同感知数据集）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递