当推荐系统进入大模型时代,真正卡住工业界的不再是新算法范式,而是如何把异构、稀疏、带噪声的信号高效塞进模型。今天三篇来自 Google、Zalando、快手的工作从不同层面回答了这个问题,勾勒出 LRM 时代推荐系统的三条工程化主线。
本期重点
- VCG: A Multimodal Retrieval Framework for E-Commerce Video Feeds under Extreme Cold-Start Conditions——电商沉浸式视频 feed 面临极端冷启动,VCG 用时尚领域微调 CLIP 做视觉协同检索,零样本即可上线,A/B 测试深度完播率提升约五成;还揭示了一个反直觉结论:更大的生成式模型(如 Qwen-VL)在检索场景下向量区分度反而不如对比学习模型。
- Token Factory: Efficiently Integrating Diverse Signals into Large Recommendation Models——Google 提出为每类异构信号配一个 Token Maker,将数值/类别特征编码为定长 soft token 直接接入 Transformer,避免文本化带来的序列膨胀与效率灾难。对广告大模型的 prompt 设计有高度同构性启发。
- Denoising Implicit Feedback for Cold-start Recommendation(快手)——指出冷 item 比热 item 更易受隐式反馈噪声影响,将去噪建模与冷启动统一到同一框架,为推荐/广告冷启动场景的信号质量问题提供新范式。
- PACMS(上下文子模优化压缩)——与 Token Factory 形成有趣张力:一个主张多塞高质量 soft token,一个主张主动压缩上下文。"上下文该膨胀还是该收缩"是当下尚未收敛的设计争议,值得持续关注。
今日趋势
- 全量 366 篇,Agent 与多智能体方向 81 篇明显抬升,研究界不再迷信"纯 scaling agent",转向用外部约束(环境、规则、权限、上下文)提升能力。
- 广告直连信号仅 4 篇,绝大多数业务相关工作通过推荐/检索迁移渗透,LRM 工程化仍是离广告最近的前沿。
📎 今日日报归档:GitHub 完整版
欢迎在评论区留言交流。本期内容由 AI 辅助生成与编辑,如有疏漏欢迎指正。下期见!
