[人人能懂AI前沿] 从推理生成、对齐博弈到共识学习

[人人能懂AI前沿] 从推理生成、对齐博弈到共识学习

31分钟 ·
播放数255
·
评论数0

今天,我们将一起探索几篇极具启发性的最新论文。我们将看到,AI如何不再满足于“吃”数据,而是学会“讲道理”,从零推理出知识;我们也会探讨,该如何分辨AI是在“真心思考”还是在“演戏给我们看”。我们还会发现,一个小应用如何拜“云师傅”学到跨界智慧,一个“虚拟宝宝”又如何颠覆我们对双语教育的认知。最后,我们将揭示AI像神枪手一样,通过瞄准“共识”而非“最新目标”来高效学习的秘密。

00:00:37 喂养AI,光有大米还不够

00:06:23 管好AI,我们有了新地图

00:12:13 小应用的大智慧,如何请个“云师傅”?

00:18:03 养“双语娃”,最关键的不是方法,而是……

00:00 AI训练场上的神枪手,如何瞄准一个移动的未来?

本期介绍的几篇论文:

[CL] Reasoning-Driven Synthetic Data Generation and Evaluation  

[EPFL & Google]  

arxiv.org 

---

[LG] Aligned, Orthogonal or In-conflict: When can we safely optimize Chain-of-Thought?  

[Google DeepMind]  

arxiv.org 

---

[IR] Zero-shot Cross-domain Knowledge Distillation: A Case study on YouTube Music  

[Google LLC]  

arxiv.org 

---

[CL] Bringing Up a Bilingual BabyLM: Investigating Multilingual Language Acquisition Using Small-Scale Models  

[The Harker School & Stanford University]  

arxiv.org 

---

[LG] Target-Aligned Reinforcement Learning  

[Technical University of Munich & Google Research]  

arxiv.org