第四章集中趋势和离中趋势 4.1集中趋势的计量 4.2离中趋势的计量 4.3数据的分布形状
第四章 集中趋势和离中趋势 4.1 集中趋势的计量 4.2 离中趋势的计量 4.3 数据的分布形状
41集中趋势的计算 集中趋势反映一组数据中各数据所具有的共同 趋势,即资料中各数据聚集的位置。 、算术平均(也叫均值) 1.简单算术平均数 计算公式 x=X1+X2+…+X=分 它是反映数据集中的主要测度
▪ 1.简单算术平均数 计算公式: 它是反映数据集中的主要测度。 N X N X X X X N i i N = = + + + = 1 2 1 ...... 4.1 集中趋势的计算 集中趋势反映一组数据中各数据所具有的共同 趋势,即资料中各数据聚集的位置。 一、算术平均(也叫均值 )
算术平均的统计含义:算术平均数是同质总体各 数据偶然性、随机性特征互相抵消后的稳定数值。反映 数据集中的特征。 例某生产班组11个工人的日产零件数分别为:15,17,19, 20,22,…26,30。求该生产班组工人的平均日产零件数。 解:X=22 ■■■ 22
算术平均的统计含义:算术平均数是同质总体各 数据偶然性、随机性特征互相抵消后的稳定数值。反映 数据集中的特征。 例 某生产班组11个工人的日产零件数分别为:15,17,19, 20,22,…26,30。求该生产班组工人的平均日产零件数。 X = 22 22 * * * * * * * … 解:
算术平均值的性质一:数据观察值与均值的离差值 之和为零 此性质表明均值是各数值的重心 ∑(X-X)=0 算术平均值的性质二:观察值与均值的离差平方 和最小。 X为任意数∑(X-X0)2>∑(X-X 故用算术平均值来预测作为估计值,误差平方和 最小
算术平均值的性质一:数据观察值与均值的离差值 之和为零. ▪ 此性质表明均值是各数值的重心 1 ( ) 0 N i i X X = − = 算术平均值的性质二:观察值与均值的离差平方 和最小。 ▪ 为任意数 2 1 1 2 0 ( ) ( ) = = − − N i i N i Xi X X X X0 故用算术平均值来预测作为估计值,误差平方和 最小
均值的缺点:均值易受极端值的影响,某个极端大值 或极端小值都会影响均值的代表性。同时还影响其对 集中趋势测度的准确性。 数列:1,2,2,3平均数为2 数列:1,2,2,5平均数为25 数列:1,2,2,7平均数为3
数列:1,2,2,3 平均数为2 数列:1,2,2,5 平均数为2.5 数列:1,2,2,7 平均数为3 ▪ 均值的缺点:均值易受极端值的影响,某个极端大值 或极端小值都会影响均值的代表性。同时还影响其对 集中趋势测度的准确性
2加权算术平均数 如果数据是分组资料,经过整理形成了次数分配, 由于各组次数不同,要用次数作权数计算加权算术平 均数。 则均值的计算公式为: X1f+X22+…+Xkf X;, ∫1+∫2+…+fk ∑x, ∑f∑ 其中X表示第i组的组中值,f表示第组的次数
2.加权算术平均数 如果数据是分组资料,经过整理形成了次数分配, 由于各组次数不同,要用次数作权数计算加权算术平 均数。 则均值的计算公式为: 1 1 2 2 1 1 2 1 1 1 .... .... k i i k K k i i k k i k i i i i i X f X f X f X f f X X f f f f f = = = = + + + = = = + + + 其中Xi 表示第i 组的组中值,fi表示第i组的次数
例:某单位80工人一周生产零件数的分组统计资料如下表: 工人一周生产零件数工人数f组中值x x: f 60以下 7 55 385 60-70 21 65 1365 70-80 25 75 1875 80-90 85 1615 90以上 95 760 合计 80 6000 则加权算术平均为:x=x+x+…+x==2600 75 f+/2+…+fk ∑ 80
工人一周生产零件数 工人数fi 组中值xi xi fi 60以下 7 55 385 60-70 21 65 1365 70-80 25 75 1875 80-90 19 85 1615 90以上 8 95 760 合计 80 --- 6000 例:某单位80工人一周生产零件数的分组统计资料如下表: 1 1 2 2 1 1 2 1 6000 : 75 80 k i i k k i k k i i x f x f x f x f X f f f f = = + + + = = = = + + + 则加权算术平均为
二、中位数 将数据观察值x1,x2,…,xn按其变量值由小到 大的顺序排列,处于数列中点位置的数值就是中位 数(M)。 中位数的确定方法: ①如果数据个数为奇数,则处于(n+1)/2位置的 标志值是中位数。 ②如果数据个数为偶数,则处于n/2、n/2+1的两 个标志值的平均数为中位数
二、中位数 将数据观察值x1,x2,…,xn按其变量值由小到 大的顺序排列,处于数列中点位置的数值就是中位 数(Me)。 中位数的确定方法: ①如果数据个数为奇数,则处于(n+1)/2位置的 标志值是中位数。 ②如果数据个数为偶数,则处于n/2、n/2+1的两 个标志值的平均数为中位数
③如果是组距分组资料,公式为: L.+ f 向上累积 M=U1-2F…-1;) 向下累积 f 中位数是n/2位置上的数值,设落在第i组, L;是中位数所在组的下限,f1是中位数所在组的次数。 F1-1是中位数所在组的前一组的累积次数 U1L1是中位数所在组的组距=上限下限
③如果是组距分组资料,公式为: 中位数是n/2位置上的数值,设落在第i组, Li是中位数所在组的下限, fi是中位数所在组的次数。 Fi-1是中位数所在组的前一组的累积次数 Ui-Li是中位数所在组的组距 =上限-下限 1 1 2 ( ) 2 ( ) i e i i i i i e i i i i n F M L U L f n F M U U L f − + − = + − − = − − 向上累积 向下累积
某单位80工人一周生产零件数分组统计资料如下: 工人一周生工人数f组中值x x向上累计频向下累计频 产零件数 数 数 60以下 55 385 7 80 60-70 21 65 1365 73 70-80 25 75 1875 53 2 80-90 19 85 1615 72 27 90以上 95 760 80 合计80 6000
某单位80工人一周生产零件数分组统计资料如下: 工人一周生 产零件数 工人数fi 组中值xi xi fi 向上累计频 数 向下累计频 数 60以下 7 55 385 7 80 60-70 21 65 1365 28 73 70-80 25 75 1875 53 52 80-90 19 85 1615 72 27 90以上 8 95 760 80 8 合计 80 --- 6000 --- ---