第8课视频的主要内容: 介绍了构建损失函数的通用框架。其核心是将模型视为计算条件概率分布,通过最大似然准则推导出负对数似然损失。书中详述了构建损失的四个步骤:选择分布、预测参数、最小化损失及推理。通过回归与二元分类示例,证明了最小二乘法和交叉熵损失分别源于对不同概率分布的建模。
第8课完整讲义:zhuanlan.zhihu.com
00:00 开篇语



01:44 新视角:模型预测的是一个概率分布

04:09 最大似然:选择让观测数据最可能的参数

06:41 从“概率连乘”到“对数累加”

08:36 将最大化问题转化成最小化损失

09:42 将最大化问题转化成最小化损失

11:10 案例:单变量回归

12:14 从负对数似然到最小二乘

14:48 推理 方差估计 异方差回归


17:53 案例:二元分类

19:50 二元交叉熵损失函数的由来

20:54 模型学到了什么? -- 类别的概率

21:22 结束语



