正在加载图片...
下面是另外一个例子,这张图统计了每一年在美国的高速公路上因为车祸致 死的人数与美国从墨西哥进口的新鲜柠檬的数量之间的关系。我们可以看到,这 些散点经过拟合得到了一条递减的直线,貌似这两者之间存在着负线性相关关系, 但是这种相关关系并不能揭示因果关系,也就是说我们不能认为从墨西哥进口的 新鲜柠檬的数量增加,可以降低高速公路上因事故致死的人数。 16 1996 R2=0.97 15.8 1997 15.6 15.4 MyB!H 1998● ● 1999 15.2 Sources: 15 U.S.NHTSA.DOT HS 810 780 U.S.Department of Agriculture 2000 14.8 200 250 300 350 400 450 500 550 Fresh Lemons Imported to USA from Mexico (Metric Tons) 二、数据可视化的基本类型 最常见的就是直方图。直方图分成很多种,第一种是可以统计一列数据的直 方图,例如Salary,我们将整列Salary的取值范围划分成很多小的范围,然后对 每一个小的范围统计数据行的数量,或者是统计数据行的数量所在整个数据集中 所占的百分比,这就类似于我们之前谈到的分类统计。 Salary Person 1 20000 Person 2 40000 15 Person 3 40000 Person 4 40000 10. Person 6 60000 Person 7 80000 Person 8 100000 20.000 40,000 60.00080,000100.000120,000 140.000 Salary下面是另外一个例子,这张图统计了每一年在美国的高速公路上因为车祸致 死的人数与美国从墨西哥进口的新鲜柠檬的数量之间的关系。我们可以看到,这 些散点经过拟合得到了一条递减的直线,貌似这两者之间存在着负线性相关关系, 但是这种相关关系并不能揭示因果关系,也就是说我们不能认为从墨西哥进口的 新鲜柠檬的数量增加,可以降低高速公路上因事故致死的人数。 二、数据可视化的基本类型 最常见的就是直方图。直方图分成很多种,第一种是可以统计一列数据的直 方图,例如 Sa濿ary,我们将整列 Sa濿ary 的取值范围划分成很多小的范围,然后对 每一个小的范围统计数据行的数量,或者是统计数据行的数量所在整个数据集中 所占的百分比,这就类似于我们之前谈到的分类统计
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有