第4章数据的概括性度量 授课教师:刘俊娟
授课教师:刘俊娟 第 4 章 数据的概括性度量
第4章数据的概括性度量 4.1集中趋势的度量 4.2离散程度的度量 4.3偏态与峰态的度量
第 4 章 数据的概括性度量 ◼ 4.1 集中趋势的度量 ◼ 4.2 离散程度的度量 ◼ 4.3 偏态与峰态的度量 2
学习目标 1.集中趋势各测度值的计算方法 2集中趋势各测度值的特点及应用场合 3.离散程度各测度值的计算方法 4.离散程度各测度值的特点及应用场合 5.偏态与峰态的测度方法
学习目标 ◼ 1.集中趋势各测度值的计算方法 ◼ 2.集中趋势各测度值的特点及应用场合 ◼ 3.离散程度各测度值的计算方法 ◼ 4.离散程度各测度值的特点及应用场合 ◼ 5. 偏态与峰态的测度方法 3
4.1集中趋势的度量 4.1.1分类数据:众数 4.1.2顺序数据:中位数和分位数 4.1.3数值型数据:平均数 414众数、中位数和平均数的比较
4.1 集中趋势的度量 ◼ 4.1.1 分类数据:众数 ◼ 4.1.2 顺序数据:中位数和分位数 ◼ 4.1.3 数值型数据:平均数 ◼ 4.1.4 众数、中位数和平均数的比较 4
集中趋势( central tendency) 一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中 心点的位置所在。 测度集中趋势就是寻找数据水平的代表值或中心值。 不同类型的数据用不同的集中趋势测度值。 ■低层次数据的测度值适用于高层次的测量数据,但高层次数据 的测度值并不适用于低层次的测量数据
集中趋势(central tendency) ◼ 一组数据向其中心值靠拢的倾向和程度,它反映了一组数据中 心点的位置所在。 ◼ 测度集中趋势就是寻找数据水平的代表值或中心值。 ◼ 不同类型的数据用不同的集中趋势测度值。 ◼ 低层次数据的测度值适用于高层次的测量数据,但高层次数据 的测度值并不适用于低层次的测量数据。 5
41.1分类数据:众数(mode) 组数据中出现次数最多的变量值,用M。表示 适合于数据量较多时使用 3.不受极端值的影响; 4一组数据可能没有众数或有几个众数; 5.主要用于分类数据,也可用于顺序数据和数值型数据
4.1.1 分类数据:众数(mode) 1. 一组数据中出现次数最多的变量值,用Mo 表示; 2. 适合于数据量较多时使用; 3. 不受极端值的影响; 4. 一组数据可能没有众数或有几个众数; 5. 主要用于分类数据,也可用于顺序数据和数值型数据。 6
众数(不惟一性) 众数:始终是一组数 据分布的最高峰值。 1.无众数 口原始数据:10591268 2.一个众数 口原始数据659855 3.多于一个众数 口原始数据:252828364242
众数(不惟一性) ◼1. 无众数 原始数据: 10 5 9 12 6 8 ◼2. 一个众数 原始数据: 6 5 9 8 5 5 ◼3. 多于一个众数 原始数据: 25 28 28 36 42 42 7 众数:始终是一组数 据分布的最高峰值
分类数据的众数(例题分析) 解: 不同品牌饮料的频数分布 这里的变量为“饮料品牌 饮料品牌频数比例百分比(%) ,这是个分类变量,不 同类型的饮料是变量值。 果汁 6 0.12 12 所调查的50人中,购买碳 矿泉水 100.20 20 酸饮料的人数最多,为15 绿茶 110.22 22 其他 80.16 16 人,占总被调查人数的 碳酸饮料150.30 30 30%,因此众数为“可口 可乐”这一品牌,即 合计 50 1 100 石。=碳酸饮料
分类数据的众数(例题分析) 不同品牌饮料的频数分布 饮料品牌 频数 比例 百分比(%) 果汁 矿泉水 绿茶 其他 碳酸饮料 6 10 11 8 15 0.12 0.20 0.22 0.16 0.30 12 20 22 16 30 合计 50 1 100 解: 这里的变量为“饮料品牌 ” ,这是个分类变量,不 同类型的饮料是变量值。 所调查的50人中,购买碳 酸饮料的人数最多,为15 人 , 占 总 被 调 查 人 数 的 30%,因此众数为“可口 可乐”这一品牌,即 Mo=碳酸饮料 8
顺序数据的众数(例题分析) 甲城市家庭对住房状况评价的频数分布解 甲城市 这里的数据为顺序数据, 回答类别 变量为“回答类别”。 户数(户)百分比(% 非常不满意 24 8 甲城市中对住房表示不满 不满意 108 36 意的户数最多,为108户 一般 93 31 ,因此众数为“不满意 满意 45 15 这一类别,即 非常满意 30 10 M。=不满意 合计 300 100.0
顺序数据的众数 (例题分析) 解: 这里的数据为顺序数据, 变量为“回答类别” 。 甲城市中对住房表示不满 意的户数最多,为108户 ,因此众数为“不满意” 这一类别,即 Mo=不满意 甲城市家庭对住房状况评价的频数分布 回答类别 甲城市 户数 (户) 百分比 (%) 非常不满意 不满意 一般 满意 非常满意 24 108 93 45 30 8 36 31 15 10 合计 300 100.0 9
41.2顺序数据:中位数( median) 排序后处于中间位置上的值。 50% 50o 1.不受极端值的影响; 2.主要用于顺序数据,也可用数值型数据,但不能用于分类数据 3.各变量值与中位数的离差绝对值之和最小,即: X;一e = min 10
4.1.2 顺序数据:中位数(median) ◼ 排序后处于中间位置上的值。 Me 50% 50% 1. 不受极端值的影响; 2. 主要用于顺序数据,也可用数值型数据,但不能用于分类数据; 3. 各变量值与中位数的离差绝对值之和最小,即: 10 min 1 − e = = n i x i M