[人人能懂AI前沿] 从统一优化、系统约束到学会谦逊

[人人能懂AI前沿] 从统一优化、系统约束到学会谦逊

30分钟 ·
播放数131
·
评论数0

你是否想过,AI不仅能找到一把优化万物的“万能扳手”,还能从“垃圾”数据中炼出真金?这一期,我们将一同见证AI如何跳出“训练好人”的思维陷阱,用“好制度”保障安全,甚至学会谦虚地向人类专家请教。让我们一起探索这些最新论文背后,令人拍案叫绝的智慧!

00:00:27 找到那把能优化万物的“万能扳手”

00:06:04 AI训练的秘密,为什么“垃圾”也能变黄金?

00:11:16 从AI安全,看“好制度”如何战胜“好人

00:16:03 如何用“笨”问题,精准定位一个“看不见”的目标?

00:24:06 AI也懂谦虚?让机器学会“请教”的智慧

本期介绍的几篇论文:

[CL] optimize_anything: A Universal API for Optimizing any Text Parameter

[UC Berkeley]

arxiv.org

---

[LG] A Bitter Lesson for Data Filtering

[Stanford University]

arxiv.org

---

[AI] Agent Security is a Systems Problem

[Google & University of California San Diego]

arxiv.org

---

[LG] Optimal Reconstruction from Linear Queries

[Technion – Israel Institute of Technology]

arxiv.org

---

[LG] Density-Ratio Losses for Post-Hoc Learning to Defer

[KTH & Google Research]

arxiv.org