一起机器学习 | 小宇宙 - 听播客，上小宇宙

54已订阅

一起机器学习

叶莜落

单集更新

节目详情

13-聚类：机器学习的自我发现之旅
快来一起探索无监督学习中的聚类技术！从基础概念到算法原理，揭秘聚类如何让数据自动分类，以及在市场细分、用户推荐等场景的应用，还有k-means等算法的优缺点解析。快速收听介绍节目并引出无监督学习中的聚类技术 0:00 解释聚类概念及市场细分等应用场景 0:29 阐述聚类的三大价值：插补、压缩、隐私保护 1:36 介绍聚类算法的四大类型及适用场景 2:17 讲解聚类工作流的四步及数据准备方法 3:39 详细说明k-means算法原理、优缺点及注意事项 5:25 介绍相似度衡量方法及聚类结果评估指标 6:42 讲解监督式相似性度量及嵌入相似度衡量方法 10:39 总结聚类知识及应用价值，结束节目 12:51
13分钟 · 2个月前
46
0
12-决策树进阶：森林与实战秘籍
本期继续机器学习系列，承接上期决策树入门内容，深入讲解决策树条件类型、随机森林原理（含Bagging和属性抽样）、GBDT等核心算法，结合美国人口普查数据集案例，以对话形式呈现，通俗易懂。快速收听介绍上期决策树内容及决策树条件类型 0:00 解释决策森林概念及随机森林特点 1:24 说明随机森林的评估方法及GBDT原理 3:29 讲解美国人口普查数据集及实战应用 5:11 列举决策森林其他应用及初学者学习路径 6:40 说明决策森林处理数据类型及优缺点 7:59 总结决策森林内容及下期预告 9:23
10分钟 · 2个月前
17
0
11-一文读懂决策树：从入门到实战
本期播客聚焦决策树，详解其简介、模型结构、条件类型、训练过程、过拟合与剪枝、变量重要性及实践示例，助你全面掌握这一高效可解释的机器学习模型。快速收听介绍决策树概念及应用场景 0:00 阐述决策树核心优势与适用数据 0:39 讲解决策树模型结构与条件类型 1:25 说明决策树训练过程与拆分器 2:49 分析决策树过拟合问题及解决方法 4:07 解释变量重要性及实践应用4:50 总结决策树局限性、学习意义及面试重点 6:25 总结决策树知识点并给出实践建议 8:32
10分钟 · 2个月前
24
0
10-大语言模型：AI的全能语言管家
本期播客科普大语言模型！从token、N-gram等基础概念，到Transformer架构、自注意力机制等核心技术，再到LLM的优势、问题及优化方法，最后探讨负责任使用的重要性，带你轻松入门LLM。快速收听介绍本期主题为大语言模型 0:00 解释token及早期语言模型局限 0:25 讲解Transformer自注意力机制 1:11 对比大语言模型优势与问题 2:06 讨论大语言模型优化方法2:43 强调负责任使用大语言模型3:16 总结大语言模型核心技术与未来方向3:38 总结本期内容并结束对话4:55
5分钟 · 2个月前
24
0
09-嵌入式：数据的隐形密码本
从餐点推荐看嵌入式如何破解稀疏数据陷阱，解析嵌入空间的多维奥秘，对比静态与上下文嵌入技术，揭秘word2vec和BERT背后的原理与局限。快速收听介绍嵌入式概念及贴近生活的例子 0:00 独热编码的五大陷阱 0:46 编码与嵌入的区别及嵌入空间 1:38 Word2vec算法原理、特点与局限 2:48 嵌入技术在图像领域的应用 3:55 获取嵌入的方法及神经网络训练例子 4:15 上下文嵌入解决一词多义问题 4:53 位置编码作用及上下文嵌入其他应用5:33 总结嵌入式的作用及未来发展6:16
7分钟 · 2个月前
17
0
08-神经网络：机器学习的智慧大脑
本期轻松活泼的科技科普对话，从回顾前三篇内容入手，引出神经网络作为机器学习的'大脑'，用生活化比喻介绍其作用，涵盖基础架构、激活函数、训练过程与反向传播及实战演示等内容，适合机器学习初学者。快速收听介绍神经网络，类比接力运动员 0:00 早期线性模型局限，隐藏层解决非线性问题 0:50 神经元计算方式及激活函数作用 1:18 常见激活函数Sigmoid、Tanh、ReLU的区别 2:19 反向传播及训练中的梯度问题解决 3:52 Dropout正则化及超参数调整案例 5:12 多类别分类方法及Softmax原理 5:45 神经网络局限性及初学者建议 6:43 神经网络学习非线性特征交互及总结 7:35 总结机器学习各部分关系及下期预告 9:18
10分钟 · 2个月前
28
0
07-数据集与泛化：机器学习的试金石
本期将聚焦数据集、泛化和过拟合，聊聊数据集的四大特征、标签类型、类别不平衡问题及解决方案，还有数据拆分、转换，以及泛化、过拟合、欠拟合的概念和检测方法等知识点。快速收听介绍机器学习小课堂主题为数据集与泛化 0:00 强调数据重要性及数据处理耗时 0:45 阐述好数据集的四个特征：类型、数量、质量、可靠性 1:01 分析数据不可靠原因：遗漏值、重复数据等 2:21 讲解标签类型：直接标签与代理标签 2:49 对比标签生成方式：人工与自动及其优缺点 3:44 讨论类别不平衡问题及解决方法：降采样与上调权重 4:36 说明数据集拆分注意事项：大小、代表性等 5:54 讲解泛化与过拟合概念及检测方法 6:49 解释欠拟合及导致原因 7:49 分析过拟合原因及避免方法：正则化、早停法 8:06 解读损失曲线异常情况及应对措施 9:51 总结机器学习模型构建要点11:07 鼓励听众动手实践学习内容11:45
12分钟 · 2个月前
30
0
06-分类数据：机器学习的语言翻译官
一起来了解机器学习中分类数据处理的奥秘！从分类数据与数值数据的区别，到索引编号、独热编码等实用编码方法，再到稀疏表示、嵌入、离群值处理、标注质量评估及特征组合等进阶技巧，手把手教你搞定数据处理难题，让模型听得懂“人话”！快速收听介绍分类数据概念及与数值数据区别 0:00 讲解分类数据编码方法及问题 2:25 讨论高维特征问题及解决方法 4:44 分析分类数据离群值及标注问题 6:18 介绍分类数据高级处理技巧 8:32 总结分类数据处理的重要性 10:39
11分钟 · 3个月前
32
0
05-数值数据：机器学习的隐形引擎
揭秘数值数据在机器学习中的核心作用！从特征向量构建到归一化技巧，再到数据清洗秘诀，手把手带你玩转数据预处理，让模型预测更精准！快速收听介绍数值数据及其与分类数据的核心区别 0:00 解释特征向量及特征工程的重要性 1:38 阐述特征工程步骤：数据探索、归一化方法 2:29 说明分箱方法及其在特征工程中的作用 5:23 讲解数据清洗的方法及处理缺失值等问题 6:35 介绍多项式转换、过拟合避免及实际应用 8:06 总结数值数据和特征工程的核心地位 12:43
14分钟 · 3个月前
44
0
04-机器学习分类模型评估指标轻松学
本期博客稍长一点，主要为初学者讲解机器学习分类模型核心评估指标。涵盖分类与阈值、混淆矩阵与基础指标、ROC与AUC、预测偏差、多类别分类等章节，用通俗语言和实际例子辅助理解复杂概念。快速收听介绍分类模型评估指标主题及整体讲解思路 0:00 解释分类概念及阈值作用与示例 0:36 通过混淆矩阵解释关键评估指标 2:05 详解准确率、精确率、召回率及其关系 2:55 介绍ROC曲线、AUC值及样本不平衡下的优势 4:39 分析预测偏差成因、影响及避免方法 6:01 讲解多类别分类评估指标及扩展方法 7:14 总结分类模型评估指标并预告下期 9:47
10分钟 · 3个月前
58
1
03-逻辑回归入门：从概率到分类
本期播客带你快速掌握逻辑回归！揭秘它如何预测下雨、垃圾邮件等分类问题，对比线性回归差异，详解Sigmoid函数计算概率，拆解对数损失与正则化要点，零基础也能听懂的AI知识！快速收听介绍逻辑回归的重要性及应用场景 0:00 解释逻辑回归与线性回归的区别 0:33 讲解逻辑回归的核心函数Sigmoid 1:12 说明逻辑回归的计算步骤 2:06 解析对数几率与训练方法3:04 对比损失函数与正则化方法3:50 总结逻辑回归核心概念与学习建议5:51
7分钟 · 3个月前
73
0
02-零基础学线性回归：从入门到实战
本期播客带您轻松掌握线性回归核心知识！从基础概念、损失函数，到参数练习、梯度下降，再到超参数调优，用通俗易懂的语言讲解机器学习入门必备技能，适合新手快速上手。快速收听介绍线性回归的基础概念与用途 0:00 讲解单/多特征线性回归方程 0:44 解释损失函数及MSE、MAE区别 1:39 举例计算L2损失及梯度下降 2:59 说明超参数及学习速率等设置 5:25 总结线性回归重要性及实践建议 7:15
8分钟 · 3个月前
101
3
01-机器学习入门：零基础也能懂
带你轻松走进机器学习世界！揭秘机器学习的定义、四大类型（监督式、非监督式、强化学习、生成式AI），用生活案例讲清核心概念，还有入门必备知识清单哦！快速收听 * 主持人开场及引入机器学习话题 0:00 * 机器学习的基本定义及与传统方法区别 0:22 * 机器学习主要类型及核心概念 2:15 * 监督式学习的核心概念（数据、模型等）5:00 * 学习机器学习所需基础与学习路径 8:16 * 机器学习未来发展及播客结束 11:12
12分钟 · 3个月前
117
0

通俗易懂、深入浅出的机器学习课程，一起打卡学习吧~