第3章集中趋势和离散趋势 集中趋势的测度 平均指标反映同类现象的一般水平,是总体 内各单位参差不齐的标志值的代表值,也是对变 量分布集中趋势的测定。 数据集中区 变量x
第 3章 集中趋势和离散趋势 集中趋势的测度 平均指标反映同类现象的一般水平,是总体 内各单位参差不齐的标志值的代表值,也是对变 量分布集中趋势的测定。 数据集中区 x 变量x
常用的平均指标 指标名称简单平均数公式 加权平均数公式 算术平均数 X X X N X 调和平均数 X X 几何平均数x。=冂X x=Σ5/x 中位数将总体标志值按大小顺序排列,处于中间位置的标志值 众数 总体中出现次数最多的标志值
常用的平均指标 指标名称 简单平均数 公式 加权平均数公式 算术平均数 调和平均数 几何平均数 中位数 将总体标志值按大小顺序排列,处于中间位置的标志值 众数 总体中出现次数最多的标志值 N X X N i i = = 1 = = = N i i N i i i f X f X 1 1 = = N i i H X N X 1 1 = = = N i i i N i i H X m m X 1 1 N X G = Xi = i i f f X G Xi
例:求某种商品三地零售价格的平均值 价格(元)销售量(斤) 价格(元)销售额(元) 10 10 2.0 2.0 合计 合计 算术平均 调和平均 ∑x3.3×3+2.5×4+2.0×5 ∑m 10+10+10 3+4+5 ∑-m33 10+—×10 10 5005t() 30 12.03
价格(元) 3.3 2.5 2.0 合计 销售量(斤) 3 4 5 12 价格(元) 3.3 2.5 2.0 合计 销售额(元) 10 10 10 30 例:求某种商品三地零售价格的平均值 算术平均 3 4 5 3.3 3 2.5 4 2.0 5 + + + + = = i i i f x f x 调和平均 10 2.0 1 10 2.5 1 10 3.3 1 10 10 10 1 + + + + = = i i i H m x m x 2.492(元) 12 29.9 = = 2.494(元) 12.03 30 = =
例:求95%、93%、90%的几何平均数 395%×93%×90% 30.79515=92.64% (2)bgxG=(og0.95+bg093+bg0.90) 8912+8561+7.943)=845 92.71% (计算误差:0.0007)
例: 求95%、93%、90%的几何平均数 0.79515 92.64% (1) 95% 93% 90% 3 3 = = xG = ( ) (8.912 8.561 7.943) 8.455 3 1 log 0.95 log 0.93 log 0.90 3 1 (2) log = + + = xG = + + xG = 92.71% (计算误差:0.0007)
例:某市500户居民人均月收入数据如下,计算其中位数 分组 500<800<1100<1400<1700<2000 频数 40901101057050 累让频数40130240345415465500 中位数位置:500/2=250 下限公式 ①求比例:250-240/(345-240)=0.095 ②分割中位数组的组距(1400-1100)×0.095=285 ③加下限,即Me=1100+28.5=1128.5(元)
① 求比例:250-240/(345-240)=0.095 ② 分割中位数组的组距(1400-1100)×0.095=28.5 下限公式 ③ 加下限,即 Me=1100+28.5=1128.5(元) 例:某市500户居民人均月收入数据如下,计算其中位数。 分组 <500 <800 <1100 <1400 <1700 <2000 频数 40 90 110 105 70 50 35 累计频数 40 130 240 345 415 465 500 中位数位置:500/2=250
例:某市500户居民人均月收入数据如下,计算其众数 分组 <500<800<1100<1400<1700<2000 频数4090110105705035 众数组800~1100 d1=20d2=5 下限公式 ①求比例:d1/(d1+d2)=20/(20+5)=0.8 ②分割众数组的组距:0.8×(1100-800)=240(元) ③加下限,即M=800+240=1040(元)
分组 <500 <800 <1100 <1400 <1700 <2000 频数 40 90 110 105 70 50 35 d1=20 d2=5 众数组800~1100 ① 求比例:d1 /(d1+d2)=20/(20+5)=0.8 ② 分割众数组的组距:0.8×(1100-800)=240(元) 下限公式 ③ 加下限,即M0=800+240=1040(元) 例:某市500户居民人均月收入数据如下,计算其众数
离散趋势的测度 标志变异指标是反映变量分布离散趋势、 与平均指标相匹配的指标。 作用 反映变量分布的离散趋势 是对平均数的代表性程度的量度 是对事物发展均衡性的量度
离散趋势的测度 标志变异指标是反映变量分布离散趋势、 与平均指标相匹配的指标。 • 反映变量分布的离散趋势 • 是对事物发展均衡性的量度 • 是对平均数的代表性程度的量度 作 用
常用的标志变异指标 指标名称概念 计算公式 特点 优点:容易理解 极差数列中最大值R=最大值最小值计算方便 (R) 与最小值之差 缺点:不能反映全 部数据分布状况 平均差各标志值与均值简单AD 优点:反映全部数 (AD)离差绝对值的算 据分布状况 术平均 加权MDx-C缺点:取绝对值数 字上不尽合理
指标名称 概 念 计算公式 特 点 数列中最大值 与最小值之差 极 差 (R) R=最大值-最小值 优点:容易理解 计算方便 缺点:不能反映全 部数据分布状况 平均差 (A.D.) 各标志值与均值 离差绝对值的算 术平均 i i i f X X f A D − . . = N X X A D i − 简单 . . = 加权 优点:反映全部数 据分布状况 缺点:取绝对值数 字上 不尽合理 常用的标志变异指标
指标名称概念 计算公式 特点 X 方差 各标志值与其平简单 优点:反映全部数据分 (2)均数离差平方的 布状况,数字上合理 平均 加权a2 Elx-xF. 缺点:受计量单位和 平均水平影响不便于 标准差方差的平方根 比较 0) (取正根) 标准差系数标准差与平均数 优点:适宜不同数据 之商,是无量 集的比较 纲的系数 Vo=X化反应不灵敏 缺点:对数据结构变 方差(∞2)和标准差(o)是应用最广的标志变异指标
指标名称 概 念 计算公式 特 点 各标志值与其平 均数离差平方的 平均 方差的平方根 (取正根) 方差 (σ 2) 标准差 (σ) 优点:反映全部数据分 布状况,数字上合理 缺点:受计量单位和 平均水平影响不便于 比较 标准差系数 (Vσ) 标准差与平均数 之商,是无量 纲的系数 优点:适宜不同数据 集的比较 缺点:对数据结构变 化反应不灵敏 X V = 简单 加权 ( ) f X X f − = 2 2 ( ) N Xi X 2 2 − = 2 = 方差(σ 2)和标准差(σ)是应用最广的标志变异指标
d2和G的简易计算公式 简单 N N 加权:a2= ∑X·f(ΣXf
2 2 2 2 2 : ; − = − = N X N X N X N Xi i i i 简单 2 2 2 2 : ; − = − = i i i i i i i i i i i z i f X f f X f f X f f X f 加权 σ 2和σ的简易计算公式