
《业务可视化分析》新版第十二章 地理空间分布这是为您准备的第十二章播客简介,包含图书作者介绍与本章核心亮点,适合用作单集 Shownotes 或开场速览: 【播客简介】第十二期:特殊的分布——当地理遇上数据 📚 图书与作者速览:本节目解读自 Tableau Visionary(全球远见者)喜乐君 与 姜斌 合著的**《业务可视化分析(第 2 版)》**。这本书不教你死记硬背软件菜单,而是通过“业务-数据-分析”的底层逻辑,教你如何把模糊的业务问题翻译成精准的可视化图形,是分析师从“做报表”进阶到“辅助决策”的必读指南。 🎙️ 本期核心内容:商业世界中,几乎所有交易都发生在特定的地点。**第十二章《特殊的分布:地理空间分析》**将带我们进入一个特殊的坐标系——经纬度空间。本期节目,我们将打破“地图就是看哪里卖得好”的刻板印象。 本期高能要点: * 【地图的本质】:为什么说地图只是散点图的特殊变体?墨卡托投影是如何“欺骗”我们视觉的? * 【图形选择】:从微观的点图(Where)到宏观的热力图(Density),以及如何利用符号地图与填充地图的多图层叠加实现“既要又要”。 * 【空间黑科技】:解锁 MAKEPOINT 和 BUFFER 函数,在地图上瞬间画出“门店3公里覆盖圈”,辅助商业选址决策。 * 【脑洞大开】:为什么化学元素周期表也可以用做地图的逻辑画出来?只要有坐标,万物皆可“地图化”。 准备好,让我们从平面的图表起飞,俯瞰数据的地理全景!
《业务可视化分析》新版第十一章 相关性分析📚 图书与作者速览: 本节目解读自 Tableau Visionary 喜乐君 的力作《业务可视化分析(第 2 版)》。这不是一本枯燥的软件说明书,而是被无数分析师奉为案头宝典的“业务实战指南”。作者主张“工具是手段,业务是核心”,教你如何将模糊的业务问题转化为精准的可视化图形,从“做图表”进阶为“做决策”。 【播客介绍】第十一期:寻找隐秘的关系——相关性分析与因果探索 📄 内容简介:如果说上一章的分布分析让我们看清了“你是谁”(特征),那么本章将带我们探索“你和谁有关系”(连接)。这是从“描述现状”迈向“解释原因”的关键一步。 我们将探讨: * 如何从散点图的视觉直觉进阶到**“皮尔逊系数”**的精准量化? * 如何利用波士顿矩阵(BCG)的参考线,把散点图变成资源分配的决策地图? * 第 2 版重构核心:为什么说**“双轴折线图”**不仅是为了省空间,更是发现“趋势相关性”的神器? * 如何用桑基图轻松搞定资金流向与客户迁徙分析? * 侦探思维:不要被表面数据的同步涨跌所迷惑。让我们一起通过严谨的反证法,透过“相关性”的迷雾,锁定真正的“因果关系”。 🎙️ 时间轴内容要点 (Time Stamps) * 【00:00】 开篇:从“看特征”到“找关系” 章节使命:如果说第 10 章是在看“你是谁”,第 11 章就是看“你和谁有关系”。 核心价值:商业决策往往建立在对变量关系的假设之上,这是探索因果关系的起点。 * 【04:30】 散点图与皮尔逊系数:直觉与量化 工具解析:向右上聚集是正相关,向右下聚集是负相关(赔本赚吆喝)。 量化指标:引入**“皮尔逊相关系数”**(r值),将模糊的图形关系变成精确的数字,一眼看穿“最佳拍档”。 * 【09:00】 波士顿矩阵:把“散点”变成“决策” 经典模型:通过添加平均值参考线,将散点图切分为四个象限。 决策依据:直接识别明星产品(双高)、瘦狗产品(双低)与问题产品,为资源分配提供铁证。 * 【13:30】 第 2 版重磅升级:双轴折线图与“趋势相关性” 思维迭代:双轴图不是为了省空间,而是为了发现时间维度上的**“剪刀差”背离**(如销售涨、利润率跌)。 技术陷阱:警惕**“同步轴”**的重要性,避免因刻度不同造成的巨大视觉欺骗。 * 【22:00】 警示:相关性 ≠ 因果关系 侦探思维:通过**“霍乱地图”**与约翰·斯诺的故事,揭示分析师的底线。 核心逻辑:不要因夏天“冰淇淋销量”与“溺水人数”同步上涨就强加因果,分析始于相关性,但必须终于因果性。
《业务可视化分析》新版第十章 高级分析的转折点:分布分析【播客介绍】第十期:大数据转折点——逃离平均值的陷阱 📄 内容简介:这是全书的分水岭。我们正式告别“三图一表”的确定性世界,跨入大数据分析的门槛。面对海量数据,单纯的“平均值”往往会掩盖真相(我和马云平均身家千亿)。本期我们将像统计学家一样思考,不再纠结于具体的“人”,而是关注整体数据的概率、异常与结构。 🎙️ 核心要点速览: * 【00:00】 思维跃迁:从“你是谁”到“你属于哪一类”大数据分析的核心在于**关注特征(Feature)**而非个体。 从呈现结果(Result)转向探索不确定性(Uncertainty)。 * 【04:30】 直方图(Histogram):切分连续世界的“面包刀”它是通往高级分析的第一道门槛。 利用**数据桶(Bin)将连续数值切分,揭示隐藏在数据背后的高斯分布(正态分布)**规律。 * 【10:00】 箱线图(Box Plot):抓出平均值背后的“坏人”审计与风控的最爱:同时展示数据的集中度与异常值(Outliers)。 硬核逻辑:理解**“二次聚合”**(在聚合的基础上再次聚合)是掌握箱线图的关键。 * 【16:30】 帕累托图(Pareto):资源分配的上帝视角二八法则的可视化:用双轴图一眼看穿“20%的产品贡献80%的业绩”。 指导决策:区分核心资产与长尾“鸡肋”。 * 【21:00】 进阶监控:六西格玛与质量控制利用标准差构建安全通道。 当数据跳出“平均值±3个标准差”时,如何触发业务报警?
《业务可视化分析》新版第九章 交叉表与可视化【播客介绍】第九期:表格的逆袭——如何用“旧瓶”装下可视化的“新酒”? 内容简介:在数据分析的世界里,存在一个永恒的矛盾:分析师热衷于炫酷的散点图和桑基图,但老板和财务总监却总是说:“图挺好看,但能不能给我一张带具体数字的大表?” 本期节目,我们将挑战数据可视化的“鄙视链”,为被误解的**交叉表(Cross-tab)正名。喜乐君将深度解析为什么表格是商业分析中不可替代的“信息密度之王”,并传授将枯燥表格改造成“超级表格”**的独门秘籍。 我们将探讨: * 如何打破“一列变色、全表变色”的尴尬? * 如何利用**“双轴占位符”**(Min(0))黑客技巧,在表格单元格里画出迷你图和红绿灯? * Tableau 2024.3 新出的**“Tableau Table”**扩展如何一键实现 Excel 级的条件格式? * 为什么说文字云和气泡图是“华而不实”的形式主义? 不要试图消灭表格,而是学会“改造”它。让我们一起把旧瓶装上新酒,让表格成为不仅老板爱看、而且专业度极高的分析利器。 🎙️ 时间轴内容要点 (Time Stamps) * 【00:00】 灵魂拷问:为什么老板总是只想要一张表? 表格真的是可视化的倒退吗? 为交叉表正名:它是信息密度的王者,精准决策(如财务)离不开确切数字,。 * 【05:00】 基础修饰:别让“度量值”糊成一团 新手痛点:想把“利润”标红,结果“销售额”也红了。 解决方案:使用**“单独的图例”**(Separate Legends),拆解颜色控制,引导视觉注意力,。 * 【07:30】 进阶黑客技巧:双轴占位符与自定义坐标轴 如何在表格里塞进进度条和红绿灯? 揭秘**“造0法”**(Min(0)):通过创建虚拟坐标轴,为每一列打造独立的“装修风格”。 * 【10:30】 官方大招:Tableau Table“超级表格”扩展 告别繁琐的拖拽:Tableau 2024.3 推出的官方扩展。 一键实现迷你条形图(Data Bars)、色阶背景和表内搜索,还原 Excel 的便捷体验。 * 【15:00】 交互逻辑:从“看结果”到“查原因” 表格的短板是“只见树木不见森林”。 **“总分结构”**最佳实践:用箱线图/散点图发现异常(如离群点),点击联动下方明细表查证细节(审计案例)。 * 【19:00】 避坑指南:警惕“形式主义”图表 被点名批评的图形:文字云(Word Cloud)和气泡图。 为什么说它们“华而不实”?在专业管理驾驶舱中,内容永远大于形式。 * 【21:00】 总结:表格不死,只是在进化 掌握颜色独立、占位符技巧与图表结合,让枯燥的表格进化为高信息密度的分析展板。
《业务可视化分析》新版第八章 占比背后的“二次聚合”别再只盯着那个圆圈了:占比分析背后的“二次聚合” 欢迎来到《喜乐君的分享播客》。我是小 A。在数据分析的世界里,饼图大概是被误解最深的图形。老板觉得它直观、好看、像个完整的交代;专业分析师觉得它低效、不精确、甚至有点“土”。但今天,喜乐君告诉我:占比分析,其实是通往高级分析的一扇“窗”。 如果你只看到了 30% 或 70% 这个数字,你可能还没入门。真正的洞察在于,你是否理解了那个“整体”是如何被定义的。 本期,我们聊聊书中的第八章,拆解那个让无数人头秃却又极其迷人的概念——二次聚合。 🪁 时间轴 * 04:10 为什么饼图处于数据分析“鄙视链”的底端? * 09:35 环形图的“空心”哲学:那个洞里到底藏着什么核心机密? * 14:50 二次聚合:从“只会算数”到“懂分析”的分水岭。 * 21:20 树形图:当切片太多时,如何优雅地展示“森林”? * 27:15 为什么说掌握了占比,你就掌握了 L.O.D. 的入门钥匙? 📖 相关书籍 * 《业务可视化分析:从问题到图形的分析方法(第 2 版)》 🛒 购买渠道想要看清楚占比背后的计算公式和业务模型?点击下方喜乐君视频号橱窗,或前往京东搜索“喜乐君”,把这份“分析内功”带回家。
《业务可视化分析》新版第七章 趋势分析:折线图《业务可视化分析(第2版)》时间趋势分析的核心精髓,引导读者超越简单的折线图去理解数据的哲学。 作者喜乐君强调,分析师必须区分时间的**“连续性”与“离散性”,因为这直接决定了是观察宏观趋势还是剖析周期规律。 文中通过双轴图、堆叠面积图以及甘特图等变体,展示了如何通过视觉结构的调整来揭示业务中的结构变化与相关性背离**。最核心的进阶思想在于构建**“公共基准”,即通过将绝对日期转化为相对时间轴**,实现不同生命周期对象在同一赛道上的公平对等,从而洞察深层业务真相。 这是为您生成的第六章《“无对比,不分析”:排序分析》的播客关键要点大纲,对应于脚本的逻辑流: 【04:30】 第一部分:条形图的“七十二变”——矩阵、堆叠与并排 为什么说条形图是数据界的“白衬衫”?从简单的长短对比,演化为看结构的堆叠图(咖啡案例)、看分面的矩阵图(日历矩阵)和看组内PK的并排图,,。 【08:15】 第二部分:双轴图的陷阱——同步轴与“虚假的满分” 解决“既要看销售额又要看利润”的难题。揭秘双轴图的**“刻度欺骗”:为什么同质指标(如金额)必须同步轴?以及如何用“重叠条形图”**(Bar-in-Bar)优雅地展示包含关系。 【11:40】 第三部分:靶心图与棒棒糖——可视化的“狙击镜”与“美颜术” 告别臃肿的仪表盘,靶心图(Bullet Graph)如何像狙击镜一样精准打击目标达成率?棒棒糖图(Lollipop Chart)又是如何通过“虚拟双轴”为高密度图表“美颜”的,。 【15:00】 第四部分:避坑指南——坐标轴的“谎言”与倒序的智慧 数据不会撒谎,但坐标轴会。为什么**“不包含零点”是条形图的死罪?遇到“越小越好”的指标(如排名、折扣率),如何利用“坐标轴倒序”**符合直觉,。 【19:00】 总结与升华:简单是终极的复杂 条形图虽然简单,却是排序与对比的王者。从绝对值(条形)到比率(圆点),再到结构化(堆叠),掌握了条形图,就掌握了商业分析 70% 的场景,。
《业务可视化分析》新版第六章 无对比、不分析:排序分析【播客介绍】第六期:“无对比,不分析”——把“土气”的条形图玩出花儿来 📄 内容简介:在可视化分析的武器库中,条形图(柱状图)常常被认为是最基础、甚至有点“土气”的存在。很多人觉得它不如桑基图炫酷,不如雷达图新颖。 但第六章是全书实战的起点,喜乐君将为你颠覆认知:条形图不仅不是“入门款”,反而是“白衬衫”和“牛仔裤”——它是最经典、最百搭、也最考验分析师功力的“排序王者”。 本期节目,我们将深入探讨: * 条形图的进化:如何从简单的长短对比,演化为看结构的堆叠图(咖啡案例)、看分面的矩阵图(日历矩阵)? * 双轴图的陷阱:为什么说“双轴不同步”是数据分析的死罪?如何用**“重叠条形图”**优雅地展示包含关系? * 高级变体:如何用**“靶心图”替代臃肿的仪表盘,像狙击镜一样精准打击目标?如何用“棒棒糖图”**给高密度图表“美颜”? * 坐标轴的谎言:为什么条形图必须包含零点?遇到“排名”这种越小越好的指标,坐标轴该怎么倒序? 这一期不讲复杂的代码,只讲如何把简单的图形用到极致。 🎙️ 时间轴内容要点 (Time Stamps) * 【00:00】 开篇:为“土气”的条形图正名 “无对比,不分析”:商业分析的核心是比较。条形图利用人类视觉对**“长度”**最敏感的特性,是实现精确对比的王者。 核心隐喻:如果说桑基图是偶尔穿一次的“晚礼服”,那条形图就是永远不过时的**“白衬衫”**。 【05:00】 条形图的“七十二变”:矩阵、堆叠与并排 * 矩阵(Matrix):解决多维对比。比如**“日历矩阵”**,在日历格子里塞进条形图,一眼看穿每天的产量波动。 * 堆叠(Stacked):解决结构问题。用**“咖啡”**做比喻,拿铁是浓缩、牛奶、奶泡的堆叠,颜色代表原料,高度代表比例。 * 并排(Side-by-side):解决组内 PK 问题。 【10:30】 双轴图的魔力与陷阱 * 场景:既要看销售额(柱状),又要看利润率(折线/圆点)。 * “天坑”:坐标轴同步。同质指标(如销售额与利润)如果不同步轴,会造成巨大的视觉欺骗(利润看起来和销售额一样高)。 * 进阶:“重叠条形图”(Bar-in-Bar)。用细条叠加在粗条上,完美展示“实际 vs 目标”的包含关系。 【15:00】 可视化的“狙击镜”与“美颜术”靶心图(Bullet Graph):仪表盘的“瘦身版”。用深色条形代表实际,竖线代表目标,色块代表区间。像**“狙击镜”**一样精准锁定 KPI。 * 棒棒糖图(Lollipop Chart):条形图的“美颜版”。当条形太密时,把矩形变成细线加圆点,视觉更轻盈,强调末端数值。 【19:00】 避坑指南:坐标轴的谎言与倒序 铁律:条形图必须包含零点。截断坐标轴会夸大差异,是数据撒谎的典型手段。 技巧:坐标轴倒序。对于“折扣率”、“排名”等越小越好的指标,反转坐标轴,让“短”或“靠右”依然代表“好”,符合直觉。 【24:00】 总结与预告掌握了条形图,就掌握了商业分析 70% 的场景。 下期预告:第七章《时间趋势分析:折线图“家族”》。我们将穿越时空,去看看如何用**“公共基准”**把不同发布时间的产品拉到同一起跑线上 PK。
《业务可视化分析》新版第五章 问题分类及增强可视化分析《业务可视化分析(第2版)》第五章的深度解读 这一章起到了承上启下的关键作用:它既是对前四章理论的收束,又是后半本书实操的索引。作者在这里构建了一个“从问题到图形”的完整导航图,帮助读者在面对纷繁复杂的图表时,能迅速找到对的那一个。 【深度播客·读书会】《业务可视化分析(第2版)》 通过“点菜”与“做饭”的生动比喻,确立了图形语法优于固定模板的“世界观”,强调分析应从业务问题而非数据本身出发。作者系统性地梳理了七种基本问题类型,指出通过识别字段的维度与度量属性,即可精准锁定如条形图、折线图或散点图等“分析武器”。 这是为您生成的**《业务可视化分析(第 2 版)》第五章**的播客介绍文稿与详细时间轴。 这份文稿提炼了第五章作为“全书总索引”的核心地位,融合了**“点菜 vs 做饭”、“改装车间”**等精彩隐喻,旨在帮助听众建立从字段到图形的底层逻辑。 【播客介绍】第五期:别再“乱点鸳鸯谱”——业务分析的导航图与改装术 📄 内容简介:很多从 Excel 或 Power BI 转型的分析师都有一个共同的痛点:面对 Tableau 这种“白板”工具,手里攥着一堆数据字段,却不知道该拖出个什么图,往往陷入“乱点鸳鸯谱”的试错循环。第五章是全书的“全景导航图”,也是告别“选择困难症”的解药。 本期节目,喜乐君将带你破解可视化构建的**“达芬奇密码”**: * 认知突围:为什么说 Excel 是“去饭店点菜”(图形库),而 Tableau 是“去超市买菜做饭”(图形语法)?这两种模式决定了你分析的上限。 * 万能公式:别再死记硬背图表了!看一眼手里的字段角色(维度/度量,离散/连续),“七种武器”(7 大问题类型)的选择就已经注定了。 * 可视化的“改装车间”:如何通过标记修饰(搞装修)、空间扩展(扩建)、双轴扩展(加倍镜)和参考线(加准星),把一个普通的条形图改装成业务洞察的“狙击枪”? 这一章不讲具体的一个图,而是讲所有图的生成法则。掌握了它,你就拿到了通往高阶分析的钥匙。 🎙️ 时间轴内容要点 (Time Stamps) 【00:00】 认知突围:点菜还是做饭?(图形库 vs 图形语法) * 痛点:习惯了“选模板填数据”的人,为什么觉得敏捷 BI 难上手? * 核心隐喻:图形库(Chart Library):像“点菜”。标准化、快,但不能改口味(如 Power BI/Excel)。 * 图形语法(Grammar of Graphics):像“玩乐高”。给你积木(坐标系、标记),你想搭什么搭什么(如 Tableau)。 结论:业务分析千变万化,不能被菜单框死,必须掌握“积木搭建法” [Source 106, 107]。 * 【06:30】 降维打击:用“字段角色”锁定 7 种武器万能公式:不是数据决定图形,是问题决定图形。看一眼字段,图表类型就注定了。 离散维度 + 连续度量 = 排序(条形图) 连续时间 + 连续度量 = 趋势(折线图) 两个连续度量 = 相关性(散点图) 进阶阶梯:从看结果(三图一表)到看特征(分布/相关),再到看结构(多维分析),直方图是通往高级分析的转折点 [Source 108, 248, 249]。 * 【12:00】 进阶绝招:可视化的“改装车间”(增强分析)基础图表只是“毛坯房”或“普通步枪”,增强分析赋予其灵魂。 四条改装路径:标记修饰(Layers):“搞装修”。用颜色区分亏损,用标签显示极值 [Source 265]。 空间扩展(Matrix):“扩建房子”。利用离散字段构建矩阵(如日历矩阵) [Source 261]。 坐标轴扩展(Dual Axis):“加装倍镜”。双轴图解决“既要看销售又要看利润率”的难题 [Source 271]。 参考线(Reference):“加准星”。没有参考线(平均值/目标),数据就没有好坏之分 [Source 273]。 * 【18:30】 终极目标:为业务而探索分层绘制心法:主视图构建框架,颜色/大小增加信息密度,工具提示/注释提供业务背景。 金句:“可视化图形只是业务分析的开始,而远非结束。不要为 PPT 而忙碌,要为业务而探索。” [Source 277]。 预告:下期进入实战篇第六章《“无对比,不分析”:排序分析》,看条形图如何七十二变。
《业务可视化分析》新版第四章 启程:可视化构建方法《业务可视化分析(第2版)》第四章的深度解读播客 这一章被作者称为**“启程”**,因为它标志着我们从纯粹的思维方法论(前三章)正式进入了可视化图形构建的实操领域。 这一章不仅解释了Tableau和Power BI等工具在底层逻辑上的根本差异,还提出了全书最著名的金句之一:“离散生成标题,连续创建坐标轴”。 【深度播客·读书会】《业务可视化分析(第2版)》 第四期:启程——解密可视化构建的底层逻辑 【场景设定】 * 主持人(小A):代表急于上手操作软件,但经常对“为什么这个图拖出来是这样”感到困惑的业务人员。 * 领读人(老B):资深数据专家,擅长剖析工具背后的原理,帮助读者打通任督二脉。 01. 开篇:可视化世界的“左派”与“右派” 【背景音:充满探索感的电子音乐,渐弱】 主持人小A:大家好,欢迎回到“数据读书会”。在前三期节目里,我们聊了业务分析的思维、价值和本质。很多听众在后台留言说:“道理我都懂了,到底什么时候开始画图啊?” 今天我们要聊的第四章《启程:可视化构建方法与扩展路径》,是不是终于要教我们怎么画图了? 领读人老B:没错,这一章叫“启程”,意味着我们正式踏上了构建图形的旅途。但是,作者并没有急着教你“怎么画一个柱状图”,而是先抛出了一个非常宏大的视角:可视化世界的两条路线。小A,你平时用Tableau和Power BI的时候,有没有觉得这两个软件的操作逻辑完全不一样? 主持人小A:太有了!Power BI 给我的感觉像是在“点菜”,菜单里有什么图我就选什么图,然后把数据填进去;但Tableau给我的感觉像是在“搭积木”,我得自己决定横轴放什么、纵轴放什么,有时候拖着拖着就出来一个我没见过的图。 领读人老B:你的感觉非常敏锐!这正是本章开篇提到的两种可视化路径: * 第一种叫“图形库”模式(Chart Library):这就是Power BI、ECharts或者D3.js的逻辑。它们提供了预设好的模板(比如柱状图模板、饼图模板),你**“先选图表,后填数据”**。这就像是用预制件盖房子,效率高、标准化,但灵活性差,你想改个花样很难,,。 * 第二种叫“图形语法”模式(Grammar of Graphics):这就是Tableau的逻辑,源于Leland Wilkinson的经典著作。它没有预设图表,而是给你坐标系、标记、颜色这些基础元素,让你**“根据数据属性自动生成图形”**。这就像是用乐高积木搭房子,灵活性极高,你想搭成什么样都行,,。 主持人小A:原来如此!作者用“Power BI向左(IT技术方向),Tableau向右(业务敏捷方向)”来形容这种差异。那对于我们业务分析师来说,哪种更好呢? 领读人老B:作者认为,“图形库”适合IT做标准化报表,而“图形语法”更适合业务人员做探索式分析。因为业务问题是千变万化的,你不能被模板框死。Tableau的这种逻辑让你能顺着思路走,而不是顺着模板走。 02. 图形的骨架:笛卡儿坐标系与点线面 主持人小A:那既然要自己“搭积木”,我们得知道积木有哪些吧?书中这一章提到了“笛卡儿空间”,这听起来像是在上数学课。 领读人老B:哈哈,其实原理很简单。所有的可视化,本质上都是把数据放到一个空间里。绝大多数商业图表(柱状图、折线图、散点图)都是建立在X轴和Y轴构成的直角坐标系里的,这就是笛卡儿坐标系。还有一种特殊的,比如饼图,它是建立在极坐标系里的,用角度来代表大小。就像我们的钟表,其实就是极坐标的完美应用。 主持人小A:有了坐标系这个“画布”,接下来怎么画呢? 领读人老B:这就涉及可视化的三个基本视觉模式:点、线、面。 * 点:比如散点图,用来表示具体的位置。 * 线:比如折线图,点连成线,用来表示趋势。 * 面:比如条形图(其实是矩形面积)、饼图(扇形面积),用来表示大小或占比。作者总结了一个公式:字段分类 + 可视化视觉要素 = 可视化视图。你只要把数据扔进坐标轴,然后告诉软件用“点”还是“面”来展示,图就出来了。 03. 核心心法:连续与离散(绿与蓝) 主持人小A:说到字段分类,我看这一章里反复强调了**“连续”和“离散”,还有Tableau里那个让人头疼的“绿色胶囊”和“蓝色胶囊”**。这部分内容感觉是这一章的“大魔王”,老B能不能帮我们彻底拆解一下? 领读人老B:这一段确实是全书的技术内核,也是Tableau最反直觉但又最精彩的设计。大家一定要记住书中的这句“真理”:“离散生成标题(Header),连续创建坐标轴(Axis)。” 主持人小A:这就有点抽象了。什么叫生成标题,什么叫创建坐标轴? 领读人老B:我们举个例子。 * 离散(Discrete,蓝色):就像是把数据分门别类。比如“地区”(东、南、西、北),或者“月份”(1月、2月...12月)。当你把离散字段拖进去,软件会给每个分类列出一个标题,把数据切成一块一块的,。 * 连续(Continuous,绿色):就像一把尺子。比如“销售额”(0到无穷大),或者“时间轴”(从过去到未来)。当你把连续字段拖进去,软件会画出一根带刻度的坐标轴,。 主持人小A:那我怎么知道一个字段该用连续还是离散呢? 领读人老B:大部分情况下,文本是离散的,数字是连续的。但最妙的是日期。日期既可以是连续的(比如从2010年一直连到2024年,画一条长长的折线),也可以是离散的(比如只看每年的“1月、2月...”,用来对比不同年份的季节性)。书中特别提醒:Tableau里的颜色(蓝/绿)代表的是离散/连续,而不是维度/度量! 很多人用了好几年软件都没搞清楚这一点。 04. 进阶:可视化的“洋葱”结构 主持人小A:听你这么一说,我好像有点开窍了。画图其实就是在摆弄坐标轴和标题。那除了这两个,还有什么别的要素吗? 领读人老B:当然。构建好坐标系(主视图)只是第一步,作者把可视化绘制过程比作“画油画”或者“化妆”,是分层绘制的。书中提出了一个**“可视化增强路径”**: 1. 构建主视图:用行和列决定是用柱状图还是折线图。 2. 标记修饰:用颜色、大小、标签来增加信息密度。比如,在柱状图上用颜色代表利润率的高低。 3. 坐标轴扩展:比如双轴图(把销售额和利润画在一起)、组合轴。 4. 参考线与注释:加上平均线、目标线,或者写上“这里为什么跌了”的注释。这才是赋予图形业务意义的关键,。 主持人小A:这就像是剥洋葱一样,一层一层地把信息加上去,但又不能太乱。 领读人老B:对。作者强调:可视化图形只是业务分析的开始,而远非结束。不要为了做漂亮的PPT而画图,要为了探索业务问题而画图。这一章其实是在教大家“怎么用工具说话”。你掌握了“离散/连续”、“点/线/面”、“坐标轴/标记”这些语法,你就能写出(画出)任何你想要的图形,而不仅仅是去套用别人的模板。 主持人小A:非常精彩!总结一下第四章的核心: 1. 我们选择的是**“图形语法”**这条路,虽然上手稍难,但灵活性无穷。 2. 笛卡儿坐标系是我们的画布,点线面是我们的笔触。 3. “离散生成标题,连续创建坐标轴”,这是控制图形结构的终极口诀。 4. 要学会用分层绘制的思路,从主视图到细节修饰,逐步完善业务表达。 领读人老B:总结得非常到位。既然我们已经掌握了构建图形的“语法”和“积木”,下一期,我们将正式进入本书的第二篇——《问题的7种基本类型与可视化方法》。我们将从最基础的**“排序分析”**(第五章、第六章)开始,去看看那些看似简单的条形图,能玩出什么样的高级花样。 主持人小A:好,我已经迫不及待想去试一试“蓝色胶囊”和“绿色胶囊”的魔力了。感谢老B的解读,我们下期见! 【结束音乐淡入,渐强】
《业务可视化分析》新版第三章 业务分析框架与分析基础这一章被作者称为“全书的理论硬核”,它揭示了Excel、SQL和Tableau这些看似不同的工具背后完全一致的底层逻辑**。如果您想让读者明白“为什么学了Excel透视表就能秒懂BI”,这一章的内容至关重要。 【深度播客·读书会】《业务可视化分析(第2版)》 第三期:心法——看透所有分析工具的本质 【场景设定】 * 主持人(小A):代表一名深陷工具学习焦虑的职场人,觉得Excel、SQL、BI都要学,压力很大。 * 领读人(老B):资深数据专家,擅长拨开工具迷雾,直击分析本质。 01. 开篇:大一统的“万能钥匙” 【背景音:充满科技感与节奏感的开场音乐,渐弱】 主持人小A:大家好,欢迎回到“数据读书会”。前两期我们聊了业务分析的宏观思维和可视化价值。今天我们要进入第三章《方法论:业务分析框架与分析基础》。老B,说实话,这一章的标题哪怕只看一眼都让人觉得“劝退”。什么“框架”、“基础”,感觉像是枯燥的教科书。这章真的很重要吗? 领读人老B:小A,你千万别被标题骗了。这一章其实是整本书的**“万能钥匙”**。很多读者会有这样的焦虑:我是用Excel的,我要不要学SQL?Tableau或者Power BI是不是另一套全新的逻辑?这一章的核心就在于告诉你:不管工具怎么变,Excel也好,SQL也好,Tableau也好,它们背后的逻辑只有一套,是完全通用的。 主持人小A:哦?这听起来很颠覆啊。Excel和写代码的SQL怎么可能是一样的逻辑呢? 领读人老B:作者在书中用了一个非常精彩的词叫**“异中之同”。他指出,所有分析工具的本质过程只有一个,那就是“聚合”**。这一章就是要教你拆解“问题的结构”,一旦你掌握了这套结构,你换任何工具都像换件衣服一样简单。 02. 硬核隐喻:钱包、银行与ATM机 主持人小A:那我们先来聊聊这个“异中之同”。作者是怎么解释不同工具之间的关系的? 领读人老B:书中用了一组非常生动的比喻——金融资产的管理。 * Excel 就像你的随身钱包。它“存取一体”,既能装钱(存数据)又能花钱(做透视表)。它简单、方便,但缺点是容量有限,你不可能把几百万现金装在钱包里。 * 数据库和SQL 就像银行柜台。钱(数据)都存在金库里,很安全、容量无限。但你要取钱(查数据),不能直接冲进金库,你得填单子、按规范跟柜员说话,这个“标准话术”就是SQL语言。它专业、严谨,但门槛高。 * Tableau/敏捷BI 就像ATM机或手机银行。它背后连着银行金库(海量数据),但操作界面却是傻瓜式的“点击和拖拽”。它结合了Excel的便捷和SQL的强大。 主持人小A:这个比喻绝了!所以说,不管是用钱包、去柜台还是用ATM,我们的目的都是“取钱/花钱”,也就是“做分析”。 领读人老B:没错。而这个“取钱”的过程,在数据世界里就叫**“从明细到聚合”。不管你用什么工具,分析永远是从“数据底表”(几万行明细)变成“问题答案”(几行汇总数据)的过程。理解了“分析即聚合”**,你就打通了任督二脉。 03. 拆解问题:5W2H与字段角色 主持人小A:那具体怎么操作呢?书中提到了一套拆解问题的方法,好像是把问题分成了三个部分? 领读人老B:对,这是一个非常实用的**“问题解剖学”**。任何一个业务问题,比如“2024年各产品类别的销售额是多少”,都可以拆解为: 1. 样本范围(Filter):比如“2024年”,这是筛选条件。 2. 问题描述(Dimension):比如“各产品类别”,这是维度,决定了分析的颗粒度。 3. 问题答案(Measure):比如“销售额(求和)”,这是度量,是聚合计算的结果。 主持人小A:这听起来就是我们做透视表时的“筛选器、行/列、值”啊! 领读人老B:完全正确!所以说逻辑是通用的。但这本书的高明之处在于,它不仅教你拆解,还教你**“重新认识字段”。作者提出了“三类字段角色”**,这是专业分析师的内功心法: * 第一类角色(业务视角):维度 vs 度量。维度是用来描述“是谁、在哪里”(定性),度量是用来回答“有多少”(定量)。 * 第二类角色(可视化视角):离散 vs 连续。这决定了画出来的图是什么样。离散生成标题(像表头),连续生成坐标轴(像尺子)。这个我们下一章会细聊。 * 第三类角色(数据视角):物理字段 vs 逻辑字段。这是进阶关键。物理字段是数据库里本来就有的(比如订单日期),逻辑字段是你为了分析算出来的(比如利润率、年同比增长)。 主持人小A:哇,这么一分类,感觉原本一团乱麻的字段瞬间清晰了。尤其是物理和逻辑的区分,以前我总搞不清哪些是原数据,哪些是算出来的。 04. 进阶核心:明细与聚合的“双重世界” 主持人小A:书中还花了很多篇幅讲“详细级别”(LOD)和“聚合”。这部分好像有点难懂? 领读人老B:这部分确实是全书的**“深水区”,但也是含金量最高的地方。你可以把数据想象成“两个平行世界”**: * 底层世界(明细层):这里是**“业务发生的地方”**。每一行记录代表一次真实的交易(Who, When, Where, What)。在这里,只有物理字段是真实的,比如这一单卖了100块钱。 * 上层世界(聚合层):这里是**“管理思考的地方”**。领导不会看每一笔交易,他看的是“华东区总销售额”。这里的数字是抽象的、计算出来的。 主持人小A:那这跟我们做表有什么关系呢? 领读人老B:关系太大了!很多新手的错误就出在混淆了这两个世界。比如算“利润率”。 * 在底层世界算(行级别计算):是“每一笔订单的利润率”然后求平均。这在业务上往往是错的,因为小订单的波动会拉偏整体。 * 在上层世界算(聚合计算):是“总利润 ÷ 总销售额”。这才是财务认可的利润率。作者强调:数据准备是在底层世界(行级别)做加减法,而业务分析是在上层世界(聚合级别)做除法和统计。 分不清这个,做出来的数据就是骗人的。 05. 总结:从统计到大数据的跨越 主持人小A:听完这章,我感觉我以前只是在“操作软件”,而现在开始“理解数据”了。 领读人老B:是的。这一章最后还点出了数据分析发展的三个阶段: 1. 小数据时代:看明细,用Excel透视一下就够了。 2. 统计时代:看汇总,关注总和、平均值。 3. 大数据时代:看分布和结构。随着数据量爆炸,光看“平均值”会掩盖很多问题(比如“我和马云平均身家千亿”)。所以,分析师必须掌握方差、中位数、百分位这些更高级的聚合方式,去洞察数据的分布和结构。这正是这本书后面章节要展开的精彩内容——如何用箱线图、帕累托图去抓出那些藏在平均值背后的“魔鬼”。 主持人小A:太期待了!既然“心法”已经练成,下一期我们就该正式练“招式”了。下一章,我们将进入第四章《启程:可视化构建方法与扩展路径》,去看看那些点、线、面是如何组合成千变万化的商业图表的。 领读人老B:没错,下期我们就要开始“画图”了,但不是瞎画,是带着逻辑去画。我们下期见! 【结束音乐淡入,渐强】
《业务可视化分析》新版第二章 业务分析的价值与形式【播客介绍】第二期:奠基——数据如何驱动大脑?业务分析的价值与进化 📄 内容简介:为什么我们要做数据分析?是为了画出漂亮的图表吗?不,图表只是手段,决策才是终点。第二章是全书的理论基石,融合了DIKW模型、快慢思考、钟表进化史以及结构化分析等核心概念,旨在揭示可视化背后的认知心理学基础和业务价值进阶之路。 本期节目,喜乐君将带你回到可视化的原点,从认知心理学和历史演变的角度,重新审视我们每天都在做的事情。 我们将探讨: * 数据的炼金术:从冰冷的数字(Data)到救命的智慧(Wisdom),DIKW 模型如何解释新冠治疗方案的决策过程? * 大脑的偷懒机制:丹尼尔·卡尼曼的**“快思考与慢思考”**理论,如何成为可视化的底层逻辑?为什么说好的图表是让大脑“少干活”? * 进化的胜利:为什么阿拉伯数字战胜了罗马数字?钟表的发明为何是可视化的巅峰? * 分析的三重境界:如何从“看结果”的简单图表,进阶到“验证假设”的交互分析,最终抵达**“结构化分析”**的深水区? 这一期不讲操作,讲**“内功”**。理解了这些,你才能明白为什么有些图表一眼就能看懂,而有些却让人云里雾里。 🎙️ 时间轴内容要点 (Time Stamps) 【00:00】 开篇:数据的力量在于解读数据的人 核心观点:数据本身没有价值,只有被人解读并转化为决策时才有价值 [Source 148]。 DIKW 模型实战:以新冠肺炎治疗为例。看到“3.7%和13.2%”是数据;知道这是“西医与中西医结合的治愈率对比”是信息;结合成本和死亡率形成推广方案,才是智慧与决策 [Source 150-153]。 【05:00】 脑科学:可视化是为“快思考”服务的理论 * 引用:《思考,快与慢》。大脑有两套系统:系统1(直觉/快)和系统2(理性/慢)。 * 可视化原理:可视化的首要目的是利用**“前注意属性”**(如长度、颜色、位置)激活系统1,让领导者瞬间获取信息,从而把宝贵的脑力留给系统2去“做出判断” [Source 153-155, 158]。 【10:00】 历史演变:罗马数字与钟表的启示 * 数字的战争:为什么罗马数字(基于形状)输给了阿拉伯数字(基于位置)? 因为“位置”是人类视觉感知最敏感的要素 [Source 155-157]。 * 钟表的智慧:钟表完美结合了坐标系(表盘循环)和分类(长短针),它让我们无须计算就能直观感知时间。这是可视化设计的典范 [Source 157-158]。 【15:00】 进阶之路:从简单展示到结构化洞察 * 第一阶段(简单可视化):使用“三图一表”展示结果,目的是**“看见”** [Source 159]。 * 第二阶段(交互可视化):利用筛选和联动进行**“假设验证”**(What-if)。比如,器具亏损是因为促销还是定价?点一下就知道 [Source 160-161]。 * 第三阶段(结构化可视化):这是高级分析的皇冠。不仅看宏观趋势(销售额涨了),更要引入微观结构(是由老客户复购拉动,还是新客户增长?) [Source 163-166]。 * 【22:00】 总结:工具是为了让思考跟上手速结构化分析不是一种图形,而是一种思维。 敏捷 BI(如 Tableau)的价值在于它缩短了“提问-验证”的周期,让业务人员可以像搭积木一样,快速构建多详细级别的分析视图,从而辅助复杂的商业决策 [Source 167-168]。
《业务可视化分析》新版第一章 实践方法论喜乐君与姜斌合著的《业务可视化分析(第2版)》,旨在帮助读者构建从业务问题到数据洞察的分析思维。内容核心聚焦于“业务-数据-分析”的普适性方法论,强调通过结构化分析突破传统报表的局限,实现从单纯“看见数据”到“驱动决策”的进阶。 作者通过引入企业数据地图和字段角色等原创概念,详细阐述了如何利用 Tableau 等工具处理复杂的业务逻辑,如供应链动态平衡和航空预测性维修。 【深度播客·读书会】《业务可视化分析(第2版)》 【播客介绍】第一期:打破数据僵局——重塑业务分析的底层逻辑 📄 内容简介:很多企业买了昂贵的 BI 软件,建了数据中台,却依然深陷“数字化的泥沼”:IT 部门沦为疲于奔命的“取数机”,业务部门则因为拿不到想要的数据而满腹牢骚。第一章是全书的“心法”,旨在打破这种僵局。 本期节目,喜乐君将带你重塑对“业务-数据-分析”的认知: * 为什么说业务是水、数据是冰、分析是水气?这个隐喻如何揭示了决策的本质? * “物理模型与逻辑模型分离”:为什么 IT 应该负责“盖房子的钢筋混凝土”,而业务应该负责“室内的装修和布局”? * 指标体系的秘密:如何区分原子指标、派生指标和衍生指标? * 工具观:在大数据时代坚持只用 Excel 做分析,为什么会被比喻为“义和团用刀剑对抗洋枪洋炮”? 这一章不讲具体的操作,只讲认知。因为工具是能力的天花板,而认知是天花板之上的天空。 🎙️ 时间轴内容要点 (Time Stamps) * 【00:00】 开篇:深陷“数字化的泥沼” * 痛点直击:IT 掌握数据特权但不懂业务,业务创造数据却无权使用。 “学然后知不足,教然后知困”:数字化转型的困境往往源于认知错位。 三种常见的错误策略:全盘外包、设立 IT BP(业务伙伴)、激进的“人人都是分析师” [Source 9, 10]。 * 【05:00】 核心隐喻:水、冰与水气(蒸汽) * 业务是水:鲜活、灵动,是数据的源头。 * 数据是冰:是对业务过程的冻结和记录(Record),遵守数据库规则而非业务规则。 * 分析是汽:将冰升华为水气(洞察),最终降雨滋润大地(辅助决策)。 * 结论:脱离业务、不能辅助决策的分析,只是“堆砌冰块”,没有灵魂 [Source 15, 16]。 * 【10:00】 方法论:像“盖房子”一样构建数据模型 * 物理模型(IT 负责):房子的钢筋混凝土结构。追求稳固、真实、标准化(清洗、ETL)。 * 逻辑模型(业务负责):室内的装修和功能分区。追求灵活、多变,适应分析主题。 * 关键心法:指标应当落在灵活的逻辑模型上,而不是固化在底层的物理表中 [Source 18, 19]。 * 【15:00】 指标体系:原子、派生与衍生 * 如何理清一团乱麻的指标? 原子指标(基础积木)、派生指标(加修饰词,如2024年华东区销售额)、衍生指标(比率计算,如毛利率)。 汇报逻辑:先看规模(原子/派生),再看质量和效率(衍生) [Source 20]。 * * 【20:00】 工具观:义和团的刀剑 vs 洋枪洋炮 * Excel 是小数据时代的神器,但在大数据时代是“存算一体”的瓶颈 * Tableau/Power BI 等敏捷 BI 是“洋枪洋炮”,实现了技术的平民化。 * “我们塑造了工具,工具也在塑造我们”:工具的升级本质是解放大脑,让你从处理 Excel 行列的繁琐中跳出来,去思考业务的逻辑 [Source 22, 23]。 * 【24:00】 总结与预告 * 第一章打好了“心法”的地基,下一期我们将进入第二章《奠基:业务分析的价值与形式》,去看看那些五花八门的图表,到底是为了解决什么决策问题而存在的。
《数据可视化分析》第2版-第10章解读第3篇 以有限字段做无尽分析:Tableau、SQL函数与计算体系 本篇的关键是计算,基于详细级别构建了由浅入深的层次体系,是读者理解Tableau和通用分析的关键。 第8章 计算的底层框架:行级别计算与聚合计算 行级别计算完成数据准备、聚合计算完成业务分析,二者构成了计算的基础。本章结合Excel、SQL和Tableau的讲解,并介绍了Tableau的对应函数。字符串函数、日期函数是行级别的,而算术计算、逻辑函数是通用的。 第9章 高级分析函数:Tableau表计算/SQL窗口函数 分析即抽象,抽象聚合,“聚合的二次聚合或行间计算”是高级抽象的典型,典型案例是合计百分比、同/环比差异。本章介绍排序、移动平均、窗口合计等典型计算场景和函数,并介绍了表计算嵌套应用,以及“合计利润率”、标杆分析、帕累托分析等案例。 第10章 结构化问题分析:LOD表达式与SQL聚合子查询 LOD表计算用于在视图中引用预先聚合值,这和SQL聚合子查询异曲同工。本章介绍了它的原理、类型与函数,并深入介绍了客户分析、购物篮分析等典型案例。 第11章 从数据管理到数据仓库:敏捷分析的基石 Tableau不仅是可视化分析工具,更是企业级的大数据分析平台,本章介绍Tableau Server的数据管理相关功能,并介绍ETL流程。建议企业把Tableau视为DW/BI平台,构建敏捷的分析体系。 —————— 第10章 结构化问题分析:LOD表达式与SQL聚合子查询 421 10.1 业务解析:理解LOD表达式的逻辑和本质 421 10.1.1 简单详细级别:“不同购买频次的客户数量” 421 10.1.2 多维详细级别:“各年度、不同矩阵年度的销售额贡献” 424 10.2 LOD表达式的“详细级别”及其与视图关系 428 10.2.1 从问题详细级别出发,理解高级问题的构成 428 10.2.2 主视图引用“更高聚合度”的详细级别聚合:占比分析 429 10.2.3 主视图引用“更低聚合度”的详细级别之聚合:购买力分析 432 10.2.4 主视图引用独立详细级别的聚合:客户矩阵分析 433 10.3 相对指定的LOD表达式及运算优先级 435 10.3.1 绝对指定和相对指定的LOD表达式 435 10.3.2 INCLUDE LOD引用更低聚合级别的聚合及优先级 437 10.3.3 EXCLUDE LOD引用更高聚合级别的聚合,以及优先级对比 439 10.4 超越LOD:计算的详细级别体系及其优先级 441 10.4.1 不同计算类型的应用场景与作用 442 10.4.2 层次分析法:理解计算的运算逻辑及其组合形式 443 10.4.3 Tableau计算、筛选、数据关系的优先级 445 10.5 走向实践:多遍聚合问题与结构化分析方法 446 10.5.1 方法论:高级问题分析的4个步骤 446 10.5.2 LOD多遍聚合:客户购买力分析的嵌套LOD计算 447 10.5.3 嵌套LOD的语法和SQL表示 452 10.6 客户分析专题:客户RFM相关案例分析 454 10.6.1 客户分析概论与常见指标体系 454 10.6.2 使用Tableau完成 RFM主题分析 457 10.6.3 单维度的分布案例:客户频次分布和生命周期分布 460 10.6.4 多维度的结构分析:与“客户获客时间”相关的分析案例 461 10.6.5 复购间隔:行级别计算和LOD计算的结合 464 10.6.6 客户留存分析:LOD表达式、表计算的结合 465 10.6.7 客户矩阵分析:客户价值分类 468 10.7 产品分析高级专题:购物篮分析的多个角度 470 10.7.1 购物篮比率:任意子类别相对于所有订单的比率 471 10.7.2 支持度、置信度和提升度分析:类别之间的关联推荐 472 10.7.3 指定类别的关联比率:筛选中包含“引用详细级别” 475 10.8 总结:高级计算的最佳实践 480 10.8.1 问题的3大构成与计算的4种类型 480 10.8.2 如何选择计算类型 482 练习题目 484
《数据可视化分析》第2版-第9章解读第3篇 以有限字段做无尽分析:Tableau、SQL函数与计算体系 本篇的关键是计算,基于详细级别构建了由浅入深的层次体系,是读者理解Tableau和通用分析的关键。 第8章 计算的底层框架:行级别计算与聚合计算 行级别计算完成数据准备、聚合计算完成业务分析,二者构成了计算的基础。本章结合Excel、SQL和Tableau的讲解,并介绍了Tableau的对应函数。字符串函数、日期函数是行级别的,而算术计算、逻辑函数是通用的。 第9章 高级分析函数:Tableau表计算/SQL窗口函数 分析即抽象,抽象聚合,“聚合的二次聚合或行间计算”是高级抽象的典型,典型案例是合计百分比、同/环比差异。本章介绍排序、移动平均、窗口合计等典型计算场景和函数,并介绍了表计算嵌套应用,以及“合计利润率”、标杆分析、帕累托分析等案例。 第10章 结构化问题分析:LOD表达式与SQL聚合子查询 LOD表计算用于在视图中引用预先聚合值,这和SQL聚合子查询异曲同工。本章介绍了它的原理、类型与函数,并深入介绍了客户分析、购物篮分析等典型案例。 第11章 从数据管理到数据仓库:敏捷分析的基石 Tableau不仅是可视化分析工具,更是企业级的大数据分析平台,本章介绍Tableau Server的数据管理相关功能,并介绍ETL流程。建议企业把Tableau视为DW/BI平台,构建敏捷的分析体系。 —————— 第3篇 以有限字段做无尽分析:Tableau、SQL函数与计算体系 本篇的关键是计算,基于详细级别构建了由浅入深的层次体系,是读者理解Tableau和通用分析的关键。 第8章 计算的底层框架:行级别计算与聚合计算 行级别计算完成数据准备、聚合计算完成业务分析,二者构成了计算的基础。本章结合Excel、SQL和Tableau的讲解,并介绍了Tableau的对应函数。字符串函数、日期函数是行级别的,而算术计算、逻辑函数是通用的。 第9章 高级分析函数:Tableau表计算/SQL窗口函数 分析即抽象,抽象聚合,“聚合的二次聚合或行间计算”是高级抽象的典型,典型案例是合计百分比、同/环比差异。本章介绍排序、移动平均、窗口合计等典型计算场景和函数,并介绍了表计算嵌套应用,以及“合计利润率”、标杆分析、帕累托分析等案例。 第10章 结构化问题分析:LOD表达式与SQL聚合子查询 LOD表计算用于在视图中引用预先聚合值,这和SQL聚合子查询异曲同工。本章介绍了它的原理、类型与函数,并深入介绍了客户分析、购物篮分析等典型案例。 第11章 从数据管理到数据仓库:敏捷分析的基石 Tableau不仅是可视化分析工具,更是企业级的大数据分析平台,本章介绍Tableau Server的数据管理相关功能,并介绍ETL流程。建议企业把Tableau视为DW/BI平台,构建敏捷的分析体系。 —————— 第3篇 以有限字段做无尽分析:Tableau、SQL函数和计算体系 第8章 计算的底层框架:行级别计算与聚合计算 286 8.1 计算的演进及分类:从Excel、SQL到Tableau 287 8.1.1 计算的本质及其与业务过程的关系 287 8.1.2 以Excel理解详细级别与计算的两大分类 288 8.1.3 从Excel“存取一体”到“数据库-SQL”的存取分离 292 8.1.4 集大成者Tableau:将查询、计算和展现融为一体 294 8.2 计算的两大分类:分析是聚合的抽象过程 297 8.2.1 行级别计算、聚合计算的差异和关系 297 8.2.2 从业务角度理解计算的结果:业务字段VS分析字段 300 8.3 数据准备类函数(上):字符串函数、日期函数 302 8.3.1 字符串函数:截取、查找替换等清理函数 302 8.3.2 日期函数:日期独特性与转换、计算 306 8.3.3 数据类型转换函数 315 8.4 数据准备类函数(下):正则表达式 316 8.5 分析函数:从明细到问题的“直接聚合” 318 8.5.1 描述规模:总和、计数、平均值 319 8.5.2 描述数据的波动程度:方差和标准差 320 8.5.3 关注个体,走向分布:百分位函数及最大值、最小值、中位数 322 8.5.4 ATTR属性——针对维度字段的聚合判断 324 8.6 通用型计算:算术函数和逻辑函数 325 8.6.1 算术运算、精度控制函数 325 8.6.2 逻辑表达式和逻辑判断符 329 8.7 行级别计算与聚合计算的区别与结合 332 8.7.1 案例:各子类别的利润与盈利结构分析 332 8.7.2 复习:行级别计算和聚合计算的差异 334 8.7.3 SUMIF条件聚合:将行级别筛选和聚合分析合二为一 335 8.8 专题:地理空间分析之“空间函数” 338 参考资料 345 练习题目 345
《数据可视化分析》第2版-第8章解读第3篇 以有限字段做无尽分析:Tableau、SQL函数与计算体系 本篇的关键是计算,基于详细级别构建了由浅入深的层次体系,是读者理解Tableau和通用分析的关键。 第8章 计算的底层框架:行级别计算与聚合计算 行级别计算完成数据准备、聚合计算完成业务分析,二者构成了计算的基础。本章结合Excel、SQL和Tableau的讲解,并介绍了Tableau的对应函数。字符串函数、日期函数是行级别的,而算术计算、逻辑函数是通用的。 第9章 高级分析函数:Tableau表计算/SQL窗口函数 分析即抽象,抽象聚合,“聚合的二次聚合或行间计算”是高级抽象的典型,典型案例是合计百分比、同/环比差异。本章介绍排序、移动平均、窗口合计等典型计算场景和函数,并介绍了表计算嵌套应用,以及“合计利润率”、标杆分析、帕累托分析等案例。 第10章 结构化问题分析:LOD表达式与SQL聚合子查询 LOD表计算用于在视图中引用预先聚合值,这和SQL聚合子查询异曲同工。本章介绍了它的原理、类型与函数,并深入介绍了客户分析、购物篮分析等典型案例。 第11章 从数据管理到数据仓库:敏捷分析的基石 Tableau不仅是可视化分析工具,更是企业级的大数据分析平台,本章介绍Tableau Server的数据管理相关功能,并介绍ETL流程。建议企业把Tableau视为DW/BI平台,构建敏捷的分析体系。 —————— 第3篇 以有限字段做无尽分析:Tableau、SQL函数和计算体系 第8章 计算的底层框架:行级别计算与聚合计算 286 8.1 计算的演进及分类:从Excel、SQL到Tableau 287 8.1.1 计算的本质及其与业务过程的关系 287 8.1.2 以Excel理解详细级别与计算的两大分类 288 8.1.3 从Excel“存取一体”到“数据库-SQL”的存取分离 292 8.1.4 集大成者Tableau:将查询、计算和展现融为一体 294 8.2 计算的两大分类:分析是聚合的抽象过程 297 8.2.1 行级别计算、聚合计算的差异和关系 297 8.2.2 从业务角度理解计算的结果:业务字段VS分析字段 300 8.3 数据准备类函数(上):字符串函数、日期函数 302 8.3.1 字符串函数:截取、查找替换等清理函数 302 8.3.2 日期函数:日期独特性与转换、计算 306 8.3.3 数据类型转换函数 315 8.4 数据准备类函数(下):正则表达式 316 8.5 分析函数:从明细到问题的“直接聚合” 318 8.5.1 描述规模:总和、计数、平均值 319 8.5.2 描述数据的波动程度:方差和标准差 320 8.5.3 关注个体,走向分布:百分位函数及最大值、最小值、中位数 322 8.5.4 ATTR属性——针对维度字段的聚合判断 324 8.6 通用型计算:算术函数和逻辑函数 325 8.6.1 算术运算、精度控制函数 325 8.6.2 逻辑表达式和逻辑判断符 329 8.7 行级别计算与聚合计算的区别与结合 332 8.7.1 案例:各子类别的利润与盈利结构分析 332 8.7.2 复习:行级别计算和聚合计算的差异 334 8.7.3 SUMIF条件聚合:将行级别筛选和聚合分析合二为一 335 8.8 专题:地理空间分析之“空间函数” 338 参考资料 345 练习题目 345