你有没有想过,AI变聪明,除了靠“大力出奇迹”的蛮力,还能不能靠“四两拨千斤”的巧劲?本期节目,我们将一起探寻几篇最新论文带来的奇妙思路:看AI如何用更精巧的大脑结构深度思考,如何拥有一把防止跑偏的多维度“罗盘”,又如何像我们一样分身“脑暴”探索多种可能。我们甚至会看到,AI如何学会“过日子”,成为一个既懂创作又懂节约的默契搭档,这一切,都要从一块小小的玻璃说起。
AI新物种,有一种聪明,不是靠“蛮力”
AI对齐的“罗盘”,如何让模型不跑偏?
不想只走一条路?AI的“概率性思考”新玩法
鱼和熊掌,计算机如何看清一块玻璃?
你的音乐搭档,不止会创作,更会“过日子”
本期介绍的几篇论文:
[CL] HRM-Text: Efficient Pretraining Beyond Scaling
[Sapient Intelligence & MIT]
---
[LG] General Preference Reinforcement Learning
[Stanford University & The University of Oklahoma]
---
[AI] Generative Recursive Reasoning
[KAIST]
---
[CV] RT-Splatting: Joint Reflection-Transmission Modeling with Gaussian Splatting
[Peking University]
---
[AS] Stable Audio 3
[Stability AI]
![[人人能懂AI前沿] AI的思考艺术:从深度循环、多维罗盘到概率分身](https://image.xyzcdn.net/FqWpK8fpivLboaqBbRHUe_BCOvxu.png@small)