本课探讨旨在缩小泛化差距的正则化技术。主要分为在损失函数中添加惩罚项的显式正则化（如L2、L1），以及由GD和SGD算法特性产生的隐式正则化。
第16课完整讲义：https://zhuanlan.zhihu.com/p/2020954117183382744
00:00 开篇语
00:28 正则化技术
04:03 作为贝叶斯先验的正则化
05:33 L2 正则化
07:25 正则化变体与权重衰减
10:55 梯度下降中的隐式正则化
15:43 随机梯度下降中的隐式正则化
18:22 习题
21:40 结束语

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

教科书《Understanding Deep Learning， Simon J.D. Prince，May 29, 2025》

由 Simon J.D. Prince 编写，专注于深度学习的核心思想而非编程实操。内容涵盖监督学习、各类生成模型（如 GAN、扩散模型）、强化学习及 AI 伦理。该书旨在帮助读者通过掌握基本原理，灵活应对各种新场景。

AI_SUMMARIZE_EPISODE

理解深度学习

《理解深度学习》第16课-深度学习正则化：缩小泛化差距的艺术

695b1aac8fedd92f48a53b2d/lulaF5ckvyytBkLCs8mvhhgLulVj.m4a