简介 1.2 多元数据的可视化 2 1.3 可视化技术.。 6 1.3.1几何投影方法.. 6 1.3.2基于像素的可视化技术 29 1.3.3 层次化可视化技术 33 1.3.4基于图标的可视化技术.... 41 Previous Next First Last Back Forward 1
简介 1.2 多元数据的可视化 . . . . . . . . . . . . . . . 2 1.3 可视化技术 . . . . . . . . . . . . . . . . . . . 6 1.3.1 几何投影方法 . . . . . . . . . . . . . . 6 1.3.2 基于像素的可视化技术 . . . . . . . . . 29 1.3.3 层次化可视化技术 . . . . . . . . . . . 33 1.3.4 基于图标的可视化技术 . . . . . . . . . 41 Previous Next First Last Back Forward 1
1.2 多元数据的可视化 Motivations ·人们相信大量的数据中隐藏着有价值的信息 ,从文字或表格中挖掘有用的信息是非常困难的.但是人类具有 强大的视觉能力,能够迅速发现图形中的特征,因此对数据进行 有效的图示化是流行的做法 ·信息可视化是通过使用计算机图像表达数据来增强人类的识别 能力,以发现数据中预期或未预期的特征, ·多元数据可视化中涉及的数据集往往是高维数据,而且数据的 各变量之间具有某种相关性 ·多元数据的广泛性使得人们需要对数据分布进行整体上的认识, 以及了解各属性之间的关系 Previous Next First Last Back Forward 2
1.2 多元数据的可视化 Motivations • 人们相信大量的数据中隐藏着有价值的信息 • 从文字或表格中挖掘有用的信息是非常困难的. 但是人类具有 强大的视觉能力, 能够迅速发现图形中的特征, 因此对数据进行 有效的图示化是流行的做法 • 信息可视化是通过使用计算机图像表达数据来增强人类的识别 能力, 以发现数据中预期或未预期的特征. • 多元数据可视化中涉及的数据集往往是高维数据, 而且数据的 各变量之间具有某种相关性 • 多元数据的广泛性使得人们需要对数据分布进行整体上的认识, 以及了解各属性之间的关系. Previous Next First Last Back Forward 2
Challenges ·构造一个问题的良好的可视化表示有些时候是非常困难且不明 确的。 ·映射问题:将高维数据合适的映射到2D上往往比较困难.一 般来说这依赖于数据的本身结构.而且,将数据属性和图像元 素联系起来也是需要特别注意的,不合适的联系会对观察者造 成误导. 。维数问题:多元数据往往数据量很大且维数较大,因此将这种 数据的所有特点在一个图中表达是很困难的,从而对用户直观 的和交互的探索数据空间带来挑战.维数的顺序也是可视化中 的重要因素 ·设计上的权衡:多元数据可视化总是在信息量,简单性和精确 性之间进行权衡. Previous Next First Last Back Forward 3
Challenges • 构造一个问题的良好的可视化表示有些时候是非常困难且不明 确的. • 映射问题: 将高维数据合适的映射到 2D 上往往比较困难. 一 般来说这依赖于数据的本身结构. 而且, 将数据属性和图像元 素联系起来也是需要特别注意的, 不合适的联系会对观察者造 成误导. • 维数问题: 多元数据往往数据量很大且维数较大, 因此将这种 数据的所有特点在一个图中表达是很困难的, 从而对用户直观 的和交互的探索数据空间带来挑战. 维数的顺序也是可视化中 的重要因素. • 设计上的权衡: 多元数据可视化总是在信息量, 简单性和精确 性之间进行权衡. Previous Next First Last Back Forward 3
·评价可视化工具发现的结果往往不容易:我们事先并不知道数 据中含有什么样的有用信息.但是不管怎么样,如果对数据一 无所知,则我们就根本没有办法评价发现的结果是否具有价值. Previous Next First Last Back Forward 4
• 评价可视化工具发现的结果往往不容易: 我们事先并不知道数 据中含有什么样的有用信息. 但是不管怎么样, 如果对数据一 无所知, 则我们就根本没有办法评价发现的结果是否具有价值. Previous Next First Last Back Forward 4
维数 ·数据中的属性个数(number of attributes) -1:一维1D/univariate -2:二维2D/bivariate -3:三维3D/trivariate -≥3:多维(multidimensional/hypervariate/multivariate) ·低维与高维之间的界限是不明确的,一般高维有≥4变量 Dimensions 相互独立的属性(attribute) Variables 。一些术语: 相互关联的属性 Multidimensional 独立维的维数 multivariate 相关变量的维数 Previous Next First Last Back Forward
维数 • 数据中的属性个数 (number of attributes) – 1: 一维 1D/ univariate – 2: 二维 2D/ bivariate – 3: 三维 3D/ trivariate – ≥ 3: 多维 (multidimensional/hypervariate/multivariate) • 低维与高维之间的界限是不明确的, 一般高维有 ≥ 4 变量 • 一些术语: Dimensions 相互独立的属性 (attribute) Variables 相互关联的属性 Multidimensional 独立维的维数 multivariate 相关变量的维数 Previous Next First Last Back Forward 5
1.3 可视化技术 根据Keim and Kriegel(1996,1997),我们将多元数据的可视化 技术分为4类:几何投影方法,基于像素(Pixel-oriented)的可视化 技术,层次化可视化(Hierarchical display)和基于图标方法(Iconog- raphy) 1.3.1几何投影方法 ·寻找将高维数据集在低维空间显示的有效投影和变换方法 ·将数据的属性映射到2D平面(例如散点图)或者任意的空间 (例如平行坐标图) ·这种方法有利于发现异常点和不同维数之间的相关性 ·坐标的展示顺序可能会影响我们的视觉发现, Previous Next First Last Back Forward 6
1.3 可视化技术 根据 Keim and Kriegel (1996, 1997), 我们将多元数据的可视化 技术分为 4 类: 几何投影方法, 基于像素 (Pixel-oriented) 的可视化 技术, 层次化可视化 (Hierarchical display) 和基于图标方法 (Iconography) 1.3.1 几何投影方法 • 寻找将高维数据集在低维空间显示的有效投影和变换方法 • 将数据的属性映射到 2D 平面 (例如散点图) 或者任意的空间 (例如平行坐标图) • 这种方法有利于发现异常点和不同维数之间的相关性 • 坐标的展示顺序可能会影响我们的视觉发现. Previous Next First Last Back Forward 6
·当数据量或者维数较大时可能会出现观测值或者类的重叠,从 而对视觉发现造成困难 Scatter plot ·散点图(scatterplot)用来展示二元离散数据. ·可以适当的扩展,以显示更多的信息或者推广到3维数据 二维数据: Previous Next First Last Back Forward
• 当数据量或者维数较大时可能会出现观测值或者类的重叠, 从 而对视觉发现造成困难 Scatter plot • 散点图 (scatterplot) 用来展示二元离散数据. • 可以适当的扩展, 以显示更多的信息或者推广到 3 维数据 二维数据: Previous Next First Last Back Forward 7
Scatterplot E三ampw Car Previous Next First Last Back Forward F
2 3 4 5 10 15 20 25 30 Scatterplot Example Car Weight Miles Per Gallon 2 3 4 5 10 15 20 25 30 wt mpg Chrysler Imperial Toyota Corolla Fiat 128 Previous Next First Last Back Forward 8
三维数据: US airpollution: amperature,802 and No.of manufacturing enrprise Iris Data ⊙ ⊙ ⊙ 0 5 Previous Next First Last Back Forward 9
三维数据: 45 50 55 60 65 70 75 20 40 60 80 100 US airpollution: temperature, SO2 and No. of manufacturing enterprise Temp SO2 Petal.Length Petal.Width Sepal.Length Iris Data setosa versicolor virginica Previous Next First Last Back Forward 9
Previous Next First Last Back Forward 10
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Previous Next First Last Back Forward 10