2025.01.17 | OmniThink提升机器写作深度与新颖性，扩散模型推理扩展提升生成质量。 - HuggingFace 每日AI论文速递

本期的 12 篇论文如下：

00:26 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking（OmniThink：通过思考扩展机器写作的知识边界）

01:06 🔍 Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps（扩散模型推理时扩展：超越去噪步骤的扩展）

01:37 🩺 Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators（探索高级患者模拟器中的问诊与诊断关系）

02:09 🎨 SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces（SynthLight：基于扩散模型的人像重光照技术——通过重新渲染合成人脸学习）

02:48 🤖 FAST: Efficient Action Tokenization for Vision-Language-Action Models（FAST：视觉-语言-动作模型的高效动作标记化方法）

03:23 🔍 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation（从视觉分词器的扩展中学习重建与生成）

04:01 🧠 Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models（迈向大型推理模型：基于大语言模型的强化推理研究综述）

04:35 🧹 The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating Large Language Models（堆：一个无污染的多语言代码数据集用于评估大型语言模型）

05:15 🤖 RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation（RLHS：通过事后模拟缓解RLHF中的错位问题）

05:54 🎨 AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation（AnyStory：面向统一单主体与多主体个性化的文本到图像生成）

06:36 🎨 CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation（CaPa：用于高效4K纹理网格生成的雕刻与绘制合成框架）

07:18 🎥 Do generative video models learn physical principles from watching videos?（生成视频模型是否通过观看视频学习物理原理？）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递