第七章调査数据的分析 第一节数据集中趋势的测定 第二节数据离散程度的测定 第三节动态数据的分析 第四节相关与回归分析
第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析
第一节数据集中趋势的测度 均值 二、中位数 众数
第一节 数据集中趋势的测度 一、均值 二、中位数 三、众数
均值 mean 1、集中趋势的最常用测度值 易受极端值的影响 3、用于数值型数据,不能用于分类数据 和顺序数据
一、均值 (mean) 1、集中趋势的最常用测度值 2、易受极端值的影响 3、 用于数值型数据,不能用于分类数据 和顺序数据
简单均值 (simple mean) 设一组数据为:x1,x2,…,xn,W xX1+X+…+X
(一)简单均值 (simple mean) 设一组数据为: x1 ,x2 ,… ,xn,则 n x n x x x x n i i n = = + + + = 1 2 1
二)加权均值 weighted mean 设一组数据为:x1,x2,…,x 相应的频数为:f,,…,f, x1f1+x22+…+xkF f1+f2+…+fk
(二) 加权均值 (weighted mean) 设一组数据为: x1 ,x2 ,… ,xk 相应的频数为: f1 , f2 ,… ,fk,则 1 1 2 2 1 1 2 1 1 k i i k k i k k i i k i i i i x f x f x f x f x f f f f f x f = = = + + + = = + + + =
加权均值例题1 按年龄分组 人数 270 ∑x X k 19 33 627 ∑f 20 240 1347 21 210 19,2岁) 70 合计 70 1347
加权均值例题1 按年龄分组 (岁)xi 人数 fi Xi fi 18 15 270 19 33 627 20 12 240 21 10 210 合计 70 1347 19.(岁) 2 70 1347 1 1 = = = = = k i i k i i i f x f x
加权均值例题2 按加工数组中值数量 量分组月 80-9085 223x=2 90-10095 665 ∑f 1001101105 1365 3110 10367(件) 110120115 575 30 120-10125 30 3110
加权均值例题2 ⚫ 103.67(件) 30 3110 1 1 = = = = = k i i k i i i f x f x
中位数 (median) 1、将数据排序后处于中间位置上的值 50% 50% 2、不受极端值的影响 3、可以用于顺序数据和数值型数据,但 不能用于分类数据
二、中位数 (median) 1、将数据排序后处于中间位置上的值。 Me 50% 50% 2、不受极端值的影响 3、可以用于顺序数据和数值型数据,但 不能用于分类数据
未分组数值型数据的中位数 【例】9个家庭的人均月收入数据 原始数据:15007507801080850960200012501630 排序:75078085096010801250150016302000 位置:123456789 个 位置 n+19+1 中位数=1080
未分组数值型数据的中位数 【例】 9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 中位数 = 1080 5 2 9 1 2 1 = + = + = n 位置
分组数据中位数的确定 首先确定中位数 组,然后用下列M=Z+2Sm 公式计算: 或 m+ M ×L
分组数据中位数的确定 首先确定中位数 组,然后用下列 公式计算: 或 i N U f s M m m e − = − +1 2 i N L f s M m m e − = + −1 2