可视化的分析 形福 实用案例分析 6赵卫是著 复旦大学赵卫东博士 zhao@fudan.edu.cn 軍大出社
可视化的分析 复旦大学 赵卫东 博士 wdzhao@fudan.edu.cn
章节介绍 数据分析中,可通过各种可视化的图形,从多个维度、多个层次展示企业 商务的执行情况,发现可能存在的问题或潜在危机,并预测未来业务发展 的趋势。也可以发现数据的一些质量问题、分布特点,可以为进一步数据 挖掘做预处理 常用工具 Tableau Humira Chart
章节介绍 • 数据分析中,可通过各种可视化的图形,从多个维度、多个层次展示企业 商务的执行情况,发现可能存在的问题或潜在危机,并预测未来业务发展 的趋势。也可以发现数据的一些质量问题、分布特点,可以为进一步数据 挖掘做预处理 • 常用工具 – Tableau – Lumira – Echart
可视化 可视化是指通过丰富的信息图形对 2字体 数据进行描述,以视觉更易理解的 3稀色使用 形式展示数据内在的信息和规律, 设计原则 4色压配 促进数据信息的传播和应用 5同类生的数密同列 6图类生多样化,注重 可视化是数据空间到图形空间的映 7保持视觉一致 射,是抽象数据的具象表达。 视化设计指南 1户问遇,求 2了种物理大屏,碘定尺了 4重有局您分 设计步5计图型 6重义设计格
可视化 • 可视化是指通过丰富的信息图形对 数据进行描述,以视觉更易理解的 形式展示数据内在的信息和规律, 促进数据信息的传播和应用。 • 可视化是数据空间到图形空间的映 射,是抽象数据的具象表达
章节结构 箱图 雷达图 中国各省国际旅游外汇收入分位数专题图 数摆来源:国家统计届 标签页 199年 气泡云 树图 地图 高低图 柔段区 双轴图 关系图 i留 热图
章节结构 • 箱图 • 雷达图 • 标签页 • 气泡云 • 树图 • 地图 • 高低图 • 双轴图 • 关系图 • 热图
箱图 箱图是一种显示数据离散状态的分 析图形 箱图主要包含6个数据节点:上限、 下限、上四分位、中位数、下四分 位和异常值 在箱图中,箱子占据了样本数据的 商群值 半,因而箱子的宽度在一定程度 o。。 上反映了数据的波动程度 Q3+1.5.IQR 箱图更容易识别数据异常 e-8oo导 中位数(Q20QR 箱图将多批数据放在同一数据轴上 ,并排排列进行对比,使得样本数 据特征的分析变得更加容易
箱图 • 箱图是一种显示数据离散状态的分 析图形 • 箱图主要包含6个数据节点:上限、 下限、上四分位、中位数、下四分 位和异常值 • 在箱图中,箱子占据了样本数据的 一半,因而箱子的宽度在一定程度 上反映了数据的波动程度 • 箱图更容易识别数据异常 • 箱图将多批数据放在同一数据轴上 ,并排排列进行对比,使得样本数 据特征的分析变得更加容易
箱图 香水价格的箱图 240000 下限:99 1007 下四分位:200 7000 中位数:385 上四分位:600 上限:1189 异常值:大于上限的圆圈点 温和异常值:994-1005 极端异常值:1006-1009
箱图 • 香水价格的箱图 • 下限:9.9 • 下四分位:200 • 中位数:385 • 上四分位:600 • 上限:1189 • 异常值:大于上限的圆圈点 • 温和异常值:994—1005 • 极端异常值:1006--1009
箱图 不同品牌香水的评价量箱图 380223 数据未进行预处理 8o0o00 378192 60000 659744 832214 07目796 博柏利 范思哲菲拉格多古弛卡文克莱香奈 商品名称
箱图 • 不同品牌香水的评价量箱图 • 数据未进行预处理
箱图 对数变换后不同品牌香水 的评价量箱图 商品名称
箱图 • 对数变换后不同品牌香水 的评价量箱图
达图 ·雷达图是一种应用于多维数据分析的图形,通过对多维数据进行分析,来 探索问题的相关状态。通常维度应大于或等于四维 雷达图主要应用于财务分析,对企业经营状况的5类指标(流动性、生产性 安全性、收益性和成长性)进行评价,来综合评估企业的经营状况 使用雷达图之前,一般需要进行数据预处理,首先计算出所需分析维度的 占比,然后进行绘图分析 雷达图使用的样本数据,应该由一个或多个定性变量和多个连续型变量组 成,因而雷达图能够进行多元多维度比较,更加形象直观地反映出数据特 征。如果只是一组连续型变量,则更适合选择箱图来绘制图形
雷达图 • 雷达图是一种应用于多维数据分析的图形,通过对多维数据进行分析,来 探索问题的相关状态。通常维度应大于或等于四维 • 雷达图主要应用于财务分析,对企业经营状况的5类指标(流动性、生产性 、安全性、收益性和成长性)进行评价,来综合评估企业的经营状况 • 使用雷达图之前,一般需要进行数据预处理,首先计算出所需分析维度的 占比,然后进行绘图分析 • 雷达图使用的样本数据,应该由一个或多个定性变量和多个连续型变量组 成,因而雷达图能够进行多元多维度比较,更加形象直观地反映出数据特 征。如果只是一组连续型变量,则更适合选择箱图来绘制图形
达图 香水案例中,选取中 中国、美国、法国、英国意大利(按维度) 国、美国、法国、意 大利及英国5国,分敬 析其销售量、品牌数鬈 产品质量、评价评墨 价数和评价价格5个 销售量 品牌数 维度相关特性 ●天国 平均计价数
雷达图 • 香水案例中,选取中 国、美国、法国、意 大利及英国5国,分 析其销售量、品牌数 、产品质量、评价评 价数和评价价格5个 维度相关特性