第五章离中趋势测量法 789 789 主要内容:(1)变异指标;(2)全距和四 分位差;(3)平均差、标准差和标准分;(4) 绝对离势和相对离势;(5)偏度(及峰度)
第五章 离中趋势测量法 主要内容:(1)变异指标; (2)全距和四 分位差; (3)平均差、标准差和标准分; (4) 绝对离势和相对离势;(5)偏度(及峰度)
所谓离中趋势,是指数列中各变量值 之间的差距和离散程度。离势小,平均数 的代表性高;离势大,平均数代表性低。 例如有A、B、C、D四组学生各5人的成绩如下 A组:60,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均 数不同,离势可能相同
所谓离中趋势,是指数列中各变量值 之间的差距和离散程度。离势小,平均数 的代表性高;离势大,平均数代表性低。 例如有A、B、C、D四组学生各5人的成绩如下: A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均 数不同,离势可能相同
变异指标用以反映总体各单位标志值的变动范围或参 差程度,与平均指标相对应,从另一个侧面反映了总体的 特征。 变异指标如按数量关系来分有以下两类 凡用绝对数来表达的变异指标,统称绝对离势; 主要有极差、平均差、四分位差、标 准差等。 凡用相对数来表达的变异指标,统称相对离势; 主要有异众比率、标准差系数、平均 差系数和一些常用的偏态系数
变异指标如按数量关系来分有以下两类; ◼ 凡用绝对数来表达的变异指标,统称绝对离势; ◼ 凡用相对数来表达的变异指标,统称相对离势; 主要有极差、平均差、四分位差、标 准差等。 主要有异众比率、标准差系数、平均 差系数和一些常用的偏态系数。 变异指标用以反映总体各单位标志值的变动范围或参 差程度,与平均指标相对应,从另一个侧面反映了总体的 特征
第一节全距与四分位差 1全距( Range) 全距(R):最大值和最小值之差。也叫极 差。全距越大,表示变动越大。 R=X nax mn 「例]求74,84,69,91,87,74,69这些数字 的全距。 解]把数字按顺序重新排列:69,69,74 74,84,87,91,显然有 R=Xmax -Xmin=91-69=22
第一节 全距与四分位差 1.全距(Range) R =Xmax - Xmin [例] 求74,84,69,91,87,74,69这些数字 的全距。 [解] 把数字按顺序重新排列:69,69,74, 74,84,87,91,显然有 R =Xmax - Xmin =91 - 69=22 全距(R):最大值和最小值之差。也叫极 差。全距越大,表示变动越大
D对分组资料,不能确知最大值和最小值,求全距: 用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限; 或最大组的上限减去最小组的组中值 组距 150~156 3 156~162 运用上述方 162~168 法计算左边 168~174 34°○ 数列的全距 174~180 20 180~186 186-192 192~198 合计 100
运用上述方 法计算左边 数列的全距 对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限; 或最大组的上限减去最小组的组中值
计算简单、直观。 优点: (1)受极端值影响大; (2)没有量度中间各个单位间的差 异性,数据利用率低,信息丧失严重; (3)受抽样变动影响大,大样本全距 缺点: 比小样本全距大
优点: 缺点: 计算简单、直观。 (1)受极端值影响大; (2) 没有量度中间各个单位间的差 异性,数据利用率低,信息丧失严重; (3)受抽样变动影响大,大样本全距 比小样本全距大
四分位差( Quartile deviation) 第三四分位数和第一四分位数的半距 避免全距受极端值影响大的缺点 请大家计 D 算下,看 能否算对 求下列两组成绩的四分位差: A:788082858987908679888481 B:5568788899100989085838481
2. 四分位差(Quartile deviation) 第三四分位数和第一四分位数的半距。 避免全距受极端值影响大的缺点。 求下列两组成绩的四分位差: A: 78 80 82 85 89 87 90 86 79 88 84 81 B: 55 68 78 88 99 100 98 90 85 83 84 81 请大家计 算下,看 能否算对
第二节平均差 lean absolute deviation) 要测定变量值的离中趋势,尤其是要测定各变量 值相对于平均数的差异情况,一个很自然的想法就是计 算各变量值与算术平均数的离差。平均差是离差绝对值 的算术平均数。( mean deviation) 1对于未分组资料 A D= 2Ix-X N 2对于分组资料 A·D ∑fx 3平均差的性质 在受抽样变动、极端值影响,处理不确定组 距方面均同于算术平均数;不适于代数运算,其 理论意义不易阐述
第二节 平均差(Mean absolute deviation) 要测定变量值的离中趋势,尤其是要测定各变量 值相对于平均数的差异情况,一个很自然的想法就是计 算各变量值与算术平均数的离差。平均差是离差绝对值 的算术平均数。(mean deviation) 1.对于未分组资料 A ·D= 2.对于分组资料 A ·D= 3.平均差的性质 在受抽样变动、极端值影响,处理不确定组 距方面均同于算术平均数;不适于代数运算,其 理论意义不易阐述
「例1试分别以算术平均数为基准,求85,69 69,74,87,91,74这些数字的平均差 例2试以算术平均数为基准,求下表所示数据 的平均差。 组距 150~156 156~162 f-39 计算左边 162~168 25 数列的平 168~174 34 均差 174180 20 180~186 186~192 192~198 711 合计 100
[例1] 试分别以算术平均数为基准,求85,69, 69,74,87,91,74这些数字的平均差。 [例2] 试以算术平均数为基准,求下表所示数据 的平均差。 计算左边 数列的平 均差
第三节标准差( standard deviation) 各变量值对其算术平均数的离差平方的算术平均 数的平方根,均方差,又称用S表示 即克服平均差带有绝对值的缺点,又保留其综合 平均的优点。 1.对于未分组资科 ∑X=x)2 X N X=N N
第三节 标准差(standard deviation) 1. 对于未分组资科 各变量值对其算术平均数的离差平方的算术平均 数的平方根,均方差,又称用S表示。 即克服平均差带有绝对值的缺点,又保留其综合 平均的优点