

13-聚类:机器学习的自我发现之旅快来一起探索无监督学习中的聚类技术!从基础概念到算法原理,揭秘聚类如何让数据自动分类,以及在市场细分、用户推荐等场景的应用,还有k-means等算法的优缺点解析。 快速收听 介绍节目并引出无监督学习中的聚类技术 0:00 解释聚类概念及市场细分等应用场景 0:29 阐述聚类的三大价值:插补、压缩、隐私保护 1:36 介绍聚类算法的四大类型及适用场景 2:17 讲解聚类工作流的四步及数据准备方法 3:39 详细说明k-means算法原理、优缺点及注意事项 5:25 介绍相似度衡量方法及聚类结果评估指标 6:42 讲解监督式相似性度量及嵌入相似度衡量方法 10:39 总结聚类知识及应用价值,结束节目 12:51
12-决策树进阶:森林与实战秘籍本期继续机器学习系列,承接上期决策树入门内容,深入讲解决策树条件类型、随机森林原理(含Bagging和属性抽样)、GBDT等核心算法,结合美国人口普查数据集案例,以对话形式呈现,通俗易懂。 快速收听 介绍上期决策树内容及决策树条件类型 0:00 解释决策森林概念及随机森林特点 1:24 说明随机森林的评估方法及GBDT原理 3:29 讲解美国人口普查数据集及实战应用 5:11 列举决策森林其他应用及初学者学习路径 6:40 说明决策森林处理数据类型及优缺点 7:59 总结决策森林内容及下期预告 9:23
11-一文读懂决策树:从入门到实战本期播客聚焦决策树,详解其简介、模型结构、条件类型、训练过程、过拟合与剪枝、变量重要性及实践示例,助你全面掌握这一高效可解释的机器学习模型。 快速收听 介绍决策树概念及应用场景 0:00 阐述决策树核心优势与适用数据 0:39 讲解决策树模型结构与条件类型 1:25 说明决策树训练过程与拆分器 2:49 分析决策树过拟合问题及解决方法 4:07 解释变量重要性及实践应用4:50 总结决策树局限性、学习意义及面试重点 6:25 总结决策树知识点并给出实践建议 8:32
10-大语言模型:AI的全能语言管家本期播客科普大语言模型!从token、N-gram等基础概念,到Transformer架构、自注意力机制等核心技术,再到LLM的优势、问题及优化方法,最后探讨负责任使用的重要性,带你轻松入门LLM。 快速收听 介绍本期主题为大语言模型 0:00 解释token及早期语言模型局限 0:25 讲解Transformer自注意力机制 1:11 对比大语言模型优势与问题 2:06 讨论大语言模型优化方法2:43 强调负责任使用大语言模型3:16 总结大语言模型核心技术与未来方向3:38 总结本期内容并结束对话4:55
09-嵌入式:数据的隐形密码本从餐点推荐看嵌入式如何破解稀疏数据陷阱,解析嵌入空间的多维奥秘,对比静态与上下文嵌入技术,揭秘word2vec和BERT背后的原理与局限。 快速收听 介绍嵌入式概念及贴近生活的例子 0:00 独热编码的五大陷阱 0:46 编码与嵌入的区别及嵌入空间 1:38 Word2vec算法原理、特点与局限 2:48 嵌入技术在图像领域的应用 3:55 获取嵌入的方法及神经网络训练例子 4:15 上下文嵌入解决一词多义问题 4:53 位置编码作用及上下文嵌入其他应用5:33 总结嵌入式的作用及未来发展6:16
08-神经网络:机器学习的智慧大脑本期轻松活泼的科技科普对话,从回顾前三篇内容入手,引出神经网络作为机器学习的'大脑',用生活化比喻介绍其作用,涵盖基础架构、激活函数、训练过程与反向传播及实战演示等内容,适合机器学习初学者。 快速收听 介绍神经网络,类比接力运动员 0:00 早期线性模型局限,隐藏层解决非线性问题 0:50 神经元计算方式及激活函数作用 1:18 常见激活函数Sigmoid、Tanh、ReLU的区别 2:19 反向传播及训练中的梯度问题解决 3:52 Dropout正则化及超参数调整案例 5:12 多类别分类方法及Softmax原理 5:45 神经网络局限性及初学者建议 6:43 神经网络学习非线性特征交互及总结 7:35 总结机器学习各部分关系及下期预告 9:18
07-数据集与泛化:机器学习的试金石本期将聚焦数据集、泛化和过拟合,聊聊数据集的四大特征、标签类型、类别不平衡问题及解决方案,还有数据拆分、转换,以及泛化、过拟合、欠拟合的概念和检测方法等知识点。 快速收听 介绍机器学习小课堂主题为数据集与泛化 0:00 强调数据重要性及数据处理耗时 0:45 阐述好数据集的四个特征:类型、数量、质量、可靠性 1:01 分析数据不可靠原因:遗漏值、重复数据等 2:21 讲解标签类型:直接标签与代理标签 2:49 对比标签生成方式:人工与自动及其优缺点 3:44 讨论类别不平衡问题及解决方法:降采样与上调权重 4:36 说明数据集拆分注意事项:大小、代表性等 5:54 讲解泛化与过拟合概念及检测方法 6:49 解释欠拟合及导致原因 7:49 分析过拟合原因及避免方法:正则化、早停法 8:06 解读损失曲线异常情况及应对措施 9:51 总结机器学习模型构建要点11:07 鼓励听众动手实践学习内容11:45
06-分类数据:机器学习的语言翻译官一起来了解机器学习中分类数据处理的奥秘!从分类数据与数值数据的区别,到索引编号、独热编码等实用编码方法,再到稀疏表示、嵌入、离群值处理、标注质量评估及特征组合等进阶技巧,手把手教你搞定数据处理难题,让模型听得懂“人话”! 快速收听 介绍分类数据概念及与数值数据区别 0:00 讲解分类数据编码方法及问题 2:25 讨论高维特征问题及解决方法 4:44 分析分类数据离群值及标注问题 6:18 介绍分类数据高级处理技巧 8:32 总结分类数据处理的重要性 10:39
05-数值数据:机器学习的隐形引擎揭秘数值数据在机器学习中的核心作用!从特征向量构建到归一化技巧,再到数据清洗秘诀,手把手带你玩转数据预处理,让模型预测更精准! 快速收听 介绍数值数据及其与分类数据的核心区别 0:00 解释特征向量及特征工程的重要性 1:38 阐述特征工程步骤:数据探索、归一化方法 2:29 说明分箱方法及其在特征工程中的作用 5:23 讲解数据清洗的方法及处理缺失值等问题 6:35 介绍多项式转换、过拟合避免及实际应用 8:06 总结数值数据和特征工程的核心地位 12:43
04-机器学习分类模型评估指标轻松学本期博客稍长一点,主要为初学者讲解机器学习分类模型核心评估指标。涵盖分类与阈值、混淆矩阵与基础指标、ROC与AUC、预测偏差、多类别分类等章节,用通俗语言和实际例子辅助理解复杂概念。 快速收听 介绍分类模型评估指标主题及整体讲解思路 0:00 解释分类概念及阈值作用与示例 0:36 通过混淆矩阵解释关键评估指标 2:05 详解准确率、精确率、召回率及其关系 2:55 介绍ROC曲线、AUC值及样本不平衡下的优势 4:39 分析预测偏差成因、影响及避免方法 6:01 讲解多类别分类评估指标及扩展方法 7:14 总结分类模型评估指标并预告下期 9:47
03-逻辑回归入门:从概率到分类本期播客带你快速掌握逻辑回归!揭秘它如何预测下雨、垃圾邮件等分类问题,对比线性回归差异,详解Sigmoid函数计算概率,拆解对数损失与正则化要点,零基础也能听懂的AI知识! 快速收听 介绍逻辑回归的重要性及应用场景 0:00 解释逻辑回归与线性回归的区别 0:33 讲解逻辑回归的核心函数Sigmoid 1:12 说明逻辑回归的计算步骤 2:06 解析对数几率与训练方法3:04 对比损失函数与正则化方法3:50 总结逻辑回归核心概念与学习建议5:51
02-零基础学线性回归:从入门到实战本期播客带您轻松掌握线性回归核心知识!从基础概念、损失函数,到参数练习、梯度下降,再到超参数调优,用通俗易懂的语言讲解机器学习入门必备技能,适合新手快速上手。 快速收听 介绍线性回归的基础概念与用途 0:00 讲解单/多特征线性回归方程 0:44 解释损失函数及MSE、MAE区别 1:39 举例计算L2损失及梯度下降 2:59 说明超参数及学习速率等设置 5:25 总结线性回归重要性及实践建议 7:15
01-机器学习入门:零基础也能懂带你轻松走进机器学习世界!揭秘机器学习的定义、四大类型(监督式、非监督式、强化学习、生成式AI),用生活案例讲清核心概念,还有入门必备知识清单哦! 快速收听 * 主持人开场及引入机器学习话题 0:00 * 机器学习的基本定义及与传统方法区别 0:22 * 机器学习主要类型及核心概念 2:15 * 监督式学习的核心概念(数据、模型等)5:00 * 学习机器学习所需基础与学习路径 8:16 * 机器学习未来发展及播客结束 11:12