《理解深度学习》第16课-深度学习正则化:缩小泛化差距的艺术理解深度学习

《理解深度学习》第16课-深度学习正则化:缩小泛化差距的艺术

23分钟 ·
播放数5
·
评论数0

本课探讨旨在缩小泛化差距的正则化技术。主要分为在损失函数中添加惩罚项的显式正则化(如L2、L1),以及由GD和SGD算法特性产生的隐式正则化。

第16课完整讲义:zhuanlan.zhihu.com

00:00 开篇语

00:28 正则化技术

04:03 作为贝叶斯先验的正则化

05:33 L2 正则化

07:25 正则化变体与权重衰减

10:55 梯度下降中的隐式正则化

15:43 随机梯度下降中的隐式正则化

18:22 习题

21:40 结束语