第5章数据分布特征的描述 【学习目标】 本章主要介绍了数据分布特征的描述的基本理论,包括平均指标 和变异指标的基本概念、种类以及各种计算方法,计算和应用平均指 标应注意的问题等。通过学习,使学习者能够掌握数据分布的集中趋 势和离散特征,为经济管理服务。 【学习要求】 通过本章的学习,要求理解并掌握平均指标和变异指标的基本概 念,熟练掌握各种计算方法,明确计算和运用平均指标应注意的问题 等等。 【学习内容】 统计数据分布的特征,可以从三个方面进行测度和描述:一是分 布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平 均数:二是分布的离中趋势,反映各数据远离其中心值的程度,如标 准差:三是分布的偏态和峰度,反映数据分布的形状。这三个方面分 别反映了数据分布特征的不同侧面,第一、二方面是主要的。本章重 点讨论第一、第二两方面代表值的计算方法、特点及其应用场合 51集中趋势——数值平均数 集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也 就是寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方 法通常有两种:一是从总体各单位变量值中抽象出具有一般水平的量, 这个量不是各个单位的具体变量值,但又要反映总体各单位的一般水 平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平 均数、几何平均数等形式。二是先将总体各单位的变量值按一定顺序 排列,然后取某一位置的变量值来反映总体各单位的一般水平,把这
第 5 章 数据分布特征的描述 【学习目标】 本章主要介绍了数据分布特征的描述的基本理论,包括平均指标 和变异指标的基本概念、种类以及各种计算方法,计算和应用平均指 标应注意的问题等。通过学习,使学习者能够掌握数据分布的集中趋 势和离散特征,为经济管理服务。 【学习要求】 通过本章的学习,要求理解并掌握平均指标和变异指标的基本概 念,熟练掌握各种计算方法,明确计算和运用平均指标应注意的问题 等等。 【学习内容】 统计数据分布的特征,可以从三个方面进行测度和描述:一是分 布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平 均数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标 准差;三是分布的偏态和峰度,反映数据分布的形状。这三个方面分 别反映了数据分布特征的不同侧面,第一、二方面是主要的。本章重 点讨论第一、第二两方面代表值的计算方法、特点及其应用场合。 5.1 集中趋势——数值平均数 集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也 就是寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方 法通常有两种:一是从总体各单位变量值中抽象出具有一般水平的量, 这个量不是各个单位的具体变量值,但又要反映总体各单位的一般水 平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平 均数、几何平均数等形式。二是先将总体各单位的变量值按一定顺序 排列,然后取某一位置的变量值来反映总体各单位的一般水平,把这
个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有 众数、中位数、四分位数等形式 51.1算术平均数 算术平均数,是集中趋势测度中最重要的一种,它是所有平均数 中应用最广泛的平均数。因为它的计算方法是与许多社会经济现象中 个别现象与总体现象之间存在的客观数量关系相符合的。 例如,企业职工的工资总额就是各个职工工资额的总和,职工的 平均工资必等于职工的工资总额与职工总人数之比。所以,算术平均 数的基本公式应该是 算术平均数= 总体标志总量(变量值总量) 总体单位总量(变量值个数) 算术平均数一般就称为平均数(mean)。其定义是:观察值的总和 除以观察值个数的商。在已知研究对象的总体标志总量及总体单位总 量时,可直接利用上式计算。例如,某企业某月的工资总额为680000 元,职工总数为1000人,则: 该企业职工月平均工资=8009680(元) 1000 利用上式计算时,要求各变量值必须是同质的,分子与分母必须 属于同一总体,即公式的分子是分母具有的标志值,分母是分子的承 担者。在实际工作中,就手工计算而言,由于所掌握的统计资料的不 同,利用上述公式进行计算时,可分为简单算术平均数和加权算术平 均数两种 1.简单算术平均数( Simple Arithmetic Mean) 根据未经分组整理的原始数据计算的均值。设一组数据为 xn,则简单算术平均数的计算公式如下 Fx1+x2+…+xn_∑x (5-1) 例5-1据南方人才服务中心调查,从事IT行业的从业人员年薪 在400005000元之间,表5-1的数据是IT从业人员年薪的一个样本 表5-1 24名∏从业人员年薪资料表 00486004995048800 499005135054600
个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有 众数、中位数、四分位数等形式。 5.1.1 算术平均数 算术平均数,是集中趋势测度中最重要的一种,它是所有平均数 中应用最广泛的平均数。因为它的计算方法是与许多社会经济现象中 个别现象与总体现象之间存在的客观数量关系相符合的。 例如,企业职工的工资总额就是各个职工工资额的总和,职工的 平均工资必等于职工的工资总额与职工总人数之比。所以,算术平均 数的基本公式应该是: 算术平均数= ( ) ( ) 总体单位总量 变量值个数 总体标志总量 变量值总量 算术平均数一般就称为平均数(mean)。其定义是:观察值的总和 除以观察值个数的商。在已知研究对象的总体标志总量及总体单位总 量时,可直接利用上式计算。例如,某企业某月的工资总额为 680000 元,职工总数为 1000 人,则: 该企业职工月平均工资= 1000 680000 =680(元) 利用上式计算时,要求各变量值必须是同质的,分子与分母必须 属于同一总体,即公式的分子是分母具有的标志值,分母是分子的承 担者。在实际工作中,就手工计算而言,由于所掌握的统计资料的不 同,利用上述公式进行计算时,可分为简单算术平均数和加权算术平 均数两种。 1. 简单算术平均数(Simple Arithmetic Mean) 根据未经分组整理的原始数据计算的均值。设一组数据为 x1,x1,… xn,则简单算术平均数的计算公式如下: n x n x x x x n = + + + = 1 2 (5–1) 例 5–1 据南方人才服务中心调查,从事 IT 行业的从业人员年薪 在 40000-55000 元之间,表 5–1 的数据是 IT 从业人员年薪的一个样本: 表 5–1 24 名 IT 从业人员年薪资料表 49100 48600 49950 48800 47200 49900 51350 54600
49300512005100 51400518004960053400 4870050300490 48900486505130051900 计算IT从业人员的平均年薪。 根据公式计算如下: x 平均年薪x=2 49100+49300+…+53400+51900 =5021458(元) 2.加权算术平均数( Weighted Arithmetic Mean) 根据分组整理的数据计算的算术平均数。其计算公式为: x=x+x2/2+…+xn/=2可 (5-2) f1+/2 A 式中:∫代表各组变量值出现的频数 例5-2以表5-2为例,计算人均日产量。计算表见表5-2 解: 表5-2某企业50名工人加工零件均值计算表 频数∫ 105~110 322.5 12.5 115~120 117.5 940.0 120~125 17150 1275 12750 132.5 795.0 135~140 137.5 550.0 平均日产量∑x_6160 ∑50=1232件) 这种根据已分组整理的数据计算的算术平均数就称为加权算术平 均数。这时,算术平均数的大小,不仅取决于研究对象的变量值,而 且受各变量值重复出现的频数(f)或频率(f/∑f)大小的影响,如 果某一组的频数或频率较大,说明该组的数据较多,那么该组数据的 大小对算术平均数的影响就大,反之则小。可见各组频数的多少(或
49300 48700 51200 50300 51000 49000 49400 49800 51400 48900 51800 48650 49600 51300 53400 51900 计算 IT 从业人员的平均年薪。 根据公式计算如下: 50214.58( ) 24 1 49100 49300 53400 51900 平均年薪 = 元 + + + + = = = n x n i i x 2. 加权算术平均数(Weighted Arithmetic Mean) 根据分组整理的数据计算的算术平均数。其计算公式为: f xf f f f x f x f x f x n n n = + + + + + + 1 2 = 1 1 2 2 (5–2) 式中:f 代表各组变量值出现的频数。 例 5–2 以表 5–2 为例,计算人均日产量。计算表见表 5–2。 解: 表 5–2 某企业 50 名工人加工零件均值计算表 按零件数分组 组中值 x 频数 f xf 105~110 110~115 115~120 120~125 125~130 130~135 135~140 107.5 112.5 117.5 122.5 127.5 132.5 137.5 3 5 8 14 10 6 4 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 合 计 –– 50 6160.0 平均日产量= = =123.(件) 2 50 6160 f xf 这种根据已分组整理的数据计算的算术平均数就称为加权算术平 均数。这时,算术平均数的大小,不仅取决于研究对象的变量值,而 且受各变量值重复出现的频数(f)或频率(f/∑f)大小的影响,如 果某一组的频数或频率较大,说明该组的数据较多,那么该组数据的 大小对算术平均数的影响就大,反之则小。可见各组频数的多少(或
频率的高低)对平均的结果起着一种权衡轻重的作用,因而这一衡量 变量值相对重要性的数值称为权数。这里所谓权数的大小,并不是以 权数本身值的大小而言的,而是指各组单位数占总体单位数的比重 即权数系数(f/∑f)。权数系数亦称为频率,是一种结构相对数 当然,利用组中值作为本组平均值计算算术平均数,是在各组内 的标志值分布均匀的假定下。计算结果与未分组数列的相应结果可能 会有一些偏差,应用时应予以注意。在统计分析过程中,如果搜集到 的是经过初步整理的次级数据,或数据要求不很精确的原始数据资料 可用此法计算均值。如果要求结果十分精确,那么需用原始数据的全 部实际信息,如果计算量很大,可借助计算机的统计功能。 如果是计算相对数的平均数,则应符合所求的相对数本身的公式, 将分子视为总体标志总量,分母视为总体单位总量 例5-3某季度某工业公司18个工业企业产值计划完成程序资料 如表5-3,计算平均产值计划完成程度。 平均产值计划完成程度实际完成产值∑x 计划产值∑f 26175 =10512% 24900 表5-3某工业公司产值完成情况表 组中值 计划产值实际产值 值计划完成程度 (%)企业数(个(万元)(万元) 2 2500 110~120 115 5060 合计 24900 26175 计划完成相对数的计算公式是实际完成数与计划任务数之比,因 此,平均计划完成程度的计算只能是所有企业的实际完成数与其计划 任务数之比,不能把各个企业的计划完成百分数简单平均 3.算术平均数性质 算术平均数在统计学中具有重要的地位,它是进行统计分析和统 计推断的基础。首先,从统计思想上看,它是一组数据的重心所在
频率的高低)对平均的结果起着一种权衡轻重的作用,因而这一衡量 变量值相对重要性的数值称为权数。这里所谓权数的大小,并不是以 权数本身值的大小而言的,而是指各组单位数占总体单位数的比重, 即权数系数(f/∑f)。权数系数亦称为频率,是一种结构相对数。 当然,利用组中值作为本组平均值计算算术平均数,是在各组内 的标志值分布均匀的假定下。计算结果与未分组数列的相应结果可能 会有一些偏差,应用时应予以注意。在统计分析过程中,如果搜集到 的是经过初步整理的次级数据,或数据要求不很精确的原始数据资料 可用此法计算均值。如果要求结果十分精确,那么需用原始数据的全 部实际信息,如果计算量很大,可借助计算机的统计功能。 如果是计算相对数的平均数,则应符合所求的相对数本身的公式, 将分子视为总体标志总量,分母视为总体单位总量。 例5–3 某季度某工业公司18个工业企业产值计划完成程序资料 如表 5–3,计算平均产值计划完成程度。 = = % = 计划产值 实际完成产值 平均产值计划完成程度= 105.12 24900 26175 f xf 表 5–3 某工业公司产值完成情况表 产值计划完成程度 (%) 组中值 (%) x 企业数(个) 计划产值 (万元) f 实际产值 (万元) xf 80~90 90~100 100~110 110~120 85 95 105 115 2 3 10 3 800 2500 17200 4400 680 2375 18060 5060 合计 - 18 24900 26175 计划完成相对数的计算公式是实际完成数与计划任务数之比,因 此,平均计划完成程度的计算只能是所有企业的实际完成数与其计划 任务数之比,不能把各个企业的计划完成百分数简单平均。 3. 算术平均数性质 算术平均数在统计学中具有重要的地位,它是进行统计分析和统 计推断的基础。首先,从统计思想上看,它是一组数据的重心所在
是数据误差相互抵消后的必然性结果。比如对同一事物进行多次测量, 若所得结果不一致,可能是由于测量误差所致,也可能是其他因素的 偶然影响,利用算术平均数作为其代表值,则可以使误差相互抵消, 反映出事物必然性的数量特征。其次,它具有下面一些重要的数学性 质,这些数学性质在实际工作中有着广泛的应用(如在相关性分析和 方差分析及建立回归方程中),同时也体现了算术平均数的统计思想 1.各变量值与其算术平均数的离差之和等于零,即∑(x-x)f=0 2.各变量值与其算术平均数的离差平方和最小,即∑ -min 4.利用计算工具求算术平均数 (1).利用计算器计算 对于未整理的原始数据或已整理分组的数列,均可利用计算器的 统计功能计算算术平均数。需要特别注意的是,当资料为变量数列时 定要遵循以下输入顺序:先输入变量值,然后输入乘号键,接下来 输入频数值,绝对不能颠倒次序 (2).利用计算机计算 运用计算机技术,不但能使人们从大量繁杂的手工处理数据的工 作中解脱出来,而且还可能大大提高对统计数据的利用率。虽然功能 强大的统计软件包在一般人使用的电脑上没有安装,但使用“ofce 软件的用户超过90%,而用“offe”软件中的“ excel”组件足可以及 时、准确、完整地将有关统计常用的基本统计量(如本章的算术平均 数)等迅速提供给人们 下面举一个简单的例子说明利用“ excel”计算算术平均数的步骤。 如,计算某班上学期期末考试各科平均成绩。 方法 第一步打开“ excel”,输入全班每位同学各科考试成绩(一般以 每行记录一名学生的各科成绩,也可以每列记录一名学生的各科成 绩) 第二步选择(单击)“工具”下拉菜单; 第三步选择(单击)“数据分析”选项 第四步从弹出的“分析工具”中选择(单击)“描述统计”并单 击“确定 第五步在对话框中的“输入区域”框内键入要计算的单元格区
是数据误差相互抵消后的必然性结果。比如对同一事物进行多次测量, 若所得结果不一致,可能是由于测量误差所致,也可能是其他因素的 偶然影响,利用算术平均数作为其代表值,则可以使误差相互抵消, 反映出事物必然性的数量特征。其次,它具有下面一些重要的数学性 质,这些数学性质在实际工作中有着广泛的应用(如在相关性分析和 方差分析及建立回归方程中),同时也体现了算术平均数的统计思想。 1.各变量值与其算术平均数的离差之和等于零,即∑ (x − x) f =0; 2 .各变量值与其算术平均数的离差平方和最小,即∑ x x f 2 ( − ) =min。 4. 利用计算工具求算术平均数 (1).利用计算器计算 对于未整理的原始数据或已整理分组的数列,均可利用计算器的 统计功能计算算术平均数。需要特别注意的是,当资料为变量数列时, 一定要遵循以下输入顺序:先输入变量值,然后输入乘号键,接下来 输入频数值,绝对不能颠倒次序。 (2).利用计算机计算 运用计算机技术,不但能使人们从大量繁杂的手工处理数据的工 作中解脱出来,而且还可能大大提高对统计数据的利用率。虽然功能 强大的统计软件包在一般人使用的电脑上没有安装,但使用“office” 软件的用户超过 90%,而用“office”软件中的“excel”组件足可以及 时、准确、完整地将有关统计常用的基本统计量(如本章的算术平均 数)等迅速提供给人们。 下面举一个简单的例子说明利用“excel”计算算术平均数的步骤。 如,计算某班上学期期末考试各科平均成绩。 方法一: 第一步 打开“excel”,输入全班每位同学各科考试成绩(一般以 每行记录一名学生的各科成绩,也可以每列记录一名学生的各科成 绩); 第二步 选择(单击)“工具”下拉菜单; 第三步 选择(单击)“数据分析”选项; 第四步 从弹出的“分析工具”中选择(单击)“描述统计”并单 击“确定”; 第五步 在对话框中的“输入区域”框内键入要计算的单元格区
域(如果包括字段行,则须选中“标志位于第一行”复选框。若分组 方式为逐行,则该复选框选定标志位于第一列):在“输出选项”中选 择输出区域;选择“汇总统计”(该选项给出全部描述统计量):单击 确定”。 第一步打开“ excel”,输入全班每位同学各科考试成绩(一般以 每行记录一名学生的各科成绩,也可以每列记录一名学生的各科成 绩) 第二步在适当的单元格内输入计算公式(以每行记录一名学生 的各科成绩为例,假设第一行依次为姓名及各考试科目名称,最后 名学生第一科的成绩所在单元格为B45,则可在B46单元格输入计算 公式“: average(b2:b45)”),然后回车;或者在适当的单元格内插 入函数(选择“插入”下拉菜单,然后选择“函数”,接下来从弹出的 对话框左边的函数类别中选择“统计”,再从对话框右边的函数名中选 择“ Average”,最后单击“确定”) 第三步选定第二步计算结果所在单元格,复制其他考试科目的 平均成绩。 51.2调和平均数( Harmonic mean) 1.调和平均数的计算方法 与算术平均数类似,调和平均数也有简单的和加权的两种形式 其计算公式分别为 H (5-3) 1s1 H=m+m2+…+m (5-4) 由于调和平均数也可以看成是变量x的倒数的算术平均数的倒数 故有时也被称作“倒数平均数 例5-4假定有A、B两家公司员工的月工资资料如表5-4的前 三列。试分别计算其平均工资
域(如果包括字段行,则须选中“标志位于第一行”复选框。若分组 方式为逐行,则该复选框选定标志位于第一列);在“输出选项”中选 择输出区域;选择“汇总统计”(该选项给出全部描述统计量);单击 “确定”。 方法二: 第一步 打开“excel”,输入全班每位同学各科考试成绩(一般以 每行记录一名学生的各科成绩,也可以每列记录一名学生的各科成 绩); 第二步 在适当的单元格内输入计算公式(以每行记录一名学生 的各科成绩为例,假设第一行依次为姓名及各考试科目名称,最后一 名学生第一科的成绩所在单元格为 B45,则可在 B46 单元格输入计算 公式“:average(b2:b45)”),然后回车;或者在适当的单元格内插 入函数(选择“插入”下拉菜单,然后选择“函数”,接下来从弹出的 对话框左边的函数类别中选择“统计”,再从对话框右边的函数名中选 择“Average”,最后单击“确定”); 第三步 选定第二步计算结果所在单元格,复制其他考试科目的 平均成绩。 5.1.2 调和平均数(Harmonic Mean) 1. 调和平均数的计算方法 与算术平均数类似,调和平均数也有简单的和加权的两种形式, 其计算公式分别为: = = + + + = n n i i x n x x x n H 1 2 1 1 1 1 1 (5–3) = = = + + + + + + = n i i i n i i n n n x m m x m x m x m m m m H 1 1 2 2 1 1 1 2 (5–4) 由于调和平均数也可以看成是变量 x 的倒数的算术平均数的倒数, 故有时也被称作“倒数平均数”。 例 5–4 假定有 A、B 两家公司员工的月工资资料如表 5–4 的前 三列。试分别计算其平均工资
表5-4两公司员工工资情况表 月工资x(元) 工资总额m(元 员工人数fmx(人) A公司 B公司 A公司 B公司 48000 40000 1000 0000 40000 32000 40000 150000 120000 150 115 在这里,平均工资作为“单位标志平均数”仍然必须是标志总量 (工资总额)与单位总数(员工总数)之比。依据给出的月工资水平 和工资总额的分组资料,可以首先用前者来除后者,得到各组的员工 人数,进而加总得到全公司的员工总数(表中后两列),这样就很容易 计算出两个公司各自的平均工资。将这些计算过程归纳起来,就是运 用了调和平均数的公式。 现在,我们计算A公司的平均工资,得到: 48000+70000+32000 H= 48000700003200 0001600 =150000/150=10000元) 对于B公司,固然也可以采用加权调和平均数公式来计算其平均 工资 ∑m 40000+40000 ∑m4000400 001000 120000 ≈1043.48(元) 然而在这里,由于各组的权数(工资总额)相同,实际上并没有 真正起到加权的作用。我们采用简单调和平均数的公式来计算,可以 得到完全相同的结果,而计算过程却大大简化了 3.48(元) x180010001600
表 5–4 两公司员工工资情况表 月工资 x (元) 工资总额 m(元) 员工人数 f=m/x(人) A 公司 B 公司 A 公司 B 公司 800 1000 1600 合计 48000 70000 32000 150000 40000 40000 40000 120000 60 70 20 150 50 40 25 115 在这里,平均工资作为“单位标志平均数”仍然必须是标志总量 (工资总额)与单位总数(员工总数)之比。依据给出的月工资水平 和工资总额的分组资料,可以首先用前者来除后者,得到各组的员工 人数,进而加总得到全公司的员工总数(表中后两列),这样就很容易 计算出两个公司各自的平均工资。将这些计算过程归纳起来,就是运 用了调和平均数的公式。 现在,我们计算 A 公司的平均工资,得到: 150000 /150 1000( ) 1600 32000 1000 70000 800 48000 48000 70000 32000 3 1 3 1 = = 元 + + + + = = = = i i i i i A x m m H 对于 B 公司,固然也可以采用加权调和平均数公式来计算其平均 工资: 1600 40000 1000 40000 800 40000 40000 40000 40000 3 1 3 1 + + + + = = = = i i i i i B x m m H 1043.48(元) 115 120000 = 然而在这里,由于各组的权数(工资总额)相同,实际上并没有 真正起到加权的作用。我们采用简单调和平均数的公式来计算,可以 得到完全相同的结果,而计算过程却大大简化了: 1043.48( ) 1600 1 1000 1 800 1 3 1 3 3 1 元 + + = = i= i B x H
2.由相对数或平均数计算平均数 例5-5设有某行业150个企业的有关产值和利润资料如表5 表5-5某行业产值和利润情况表 产值利润率 季度 %)企业数(个实际产值(万元企业数个实际利润(万元 48700 6474 表中给出的是按产值利润率分组的企业个数、实际产值和实际利 润资料。应该注意,产值利润是一个相对指标,而不是平均指标。为 了计算全行业的平均产值利润率,必须以产值利润率的基本公式为依 据 产值利润率=实际利润 100% 实际产值 并选择适当的权数资料,适当的平均数形式,对各组企业的产值利润 率进行加权平均。容易看出,计算第一季度的平均产值利润率,应该 采用实际产值加权,进行算术平均,即有: 季度平均_Σy0.075×5700+0.15×20500+0.25×22500 产值利润率x 5700+20500+22500 91275 =18.74% 48700 而计算第二季度的平均产值利润率,则应该采用实际利润加权, 进行调和平均,即有: 二季度平均∑m710+3514+2250 产值利润率sm7104351442250 0.0750.150.25 6474 =1545% 41893.3 由上例可见,对于同一问题的研究,算术平均数和调和平均数的 实际意义是相同的,计算公式也可以相互推算,采用哪一种方法完全 取决于所掌握的实际资料。一般的做法是,如果掌握的是基本公式中
2. 由相对数或平均数计算平均数 例 5–5 设有某行业 150 个企业的有关产值和利润资料如表 5– 5。 表 5–5 某行业产值和利润情况表 产值利润率 (%) 一 季 度 二 季 度 企业数(个) 实际产值(万元) 企业数(个) 实际利润(万元) 5-10 10-20 20-30 30 70 50 5700 20500 22500 50 80 20 710 3514 2250 合 计 150 48700 150 6474 表中给出的是按产值利润率分组的企业个数、实际产值和实际利 润资料。应该注意,产值利润是一个相对指标,而不是平均指标。为 了计算全行业的平均产值利润率,必须以产值利润率的基本公式为依 据: = 100% 实际产值 实际利润 产值利润率 并选择适当的权数资料,适当的平均数形式,对各组企业的产值利润 率进行加权平均。容易看出,计算第一季度的平均产值利润率,应该 采用实际产值加权,进行算术平均,即有: 18.74% 48700 9127.5 5700 20500 22500 0.075 5700 0.15 20500 0.25 22500 = = + + + + = = f xf 产值利润率 一季度平均 而计算第二季度的平均产值利润率,则应该采用实际利润加权, 进行调和平均,即有: 15.45% 41893.3 6474 0.25 2250 0.15 3514 0.075 710 710 3514 2250 = = + + + + = = x m m 产值利润率 二季度平均 由上例可见,对于同一问题的研究,算术平均数和调和平均数的 实际意义是相同的,计算公式也可以相互推算,采用哪一种方法完全 取决于所掌握的实际资料。一般的做法是,如果掌握的是基本公式中
的分母资料,则采用算术平均数,如果掌握的是基本公式中的分子资 料,则采用调和平均数的计算公式。 3.调和平均数特点 (1)调和平均数易受极端值的影响,且受极小值的影响比受极大 值的影响更大。 (2)只要有一个变量值为零,就不能计算调和平均数。 (3)当组距数列有开口组时,其组中值即使按相邻组距计算了 假定性也很大,这时,调和平均数的代表性就很不可靠。 (4)调和平均数应用的范围较小。 5.13几何平均数( Geometric mean) 几何平均数也称几何均值,它是n个变量值乘积的n次方根。根 据统计资料的不同,几何平均数也有简单几何平均数和加权几何平均 数之分 1.简单几何平均数( Simple Geometric Mean) 直接将n项变量连乘,然后对其连乘积开n次方根所得的平均数 即为简单几何平均数。它是几何平均数的常用形式。计算公式为 G (5-5) 式中:G代表几何平均数,∏代表连乘符号 例5-6某流水生产线有前后衔接的五道工序。某日各工序产品的 合格率分别为95%92%、90%、85%80%,整个流水生产线产品的 平均合格率为 G=√0.95×0.92×090×0.85×0.80 0.5349=8824% 2.加权几何平均数( Weighted Geometric Mean) 与算术平均数一样,当资料中的某些变量值重复出现时,相应地, 简单几何平均数就变成了加权几何平均数。计算公式为: XG
的分母资料,则采用算术平均数,如果掌握的是基本公式中的分子资 料,则采用调和平均数的计算公式。 3. 调和平均数特点 (1)调和平均数易受极端值的影响,且受极小值的影响比受极大 值的影响更大。 (2)只要有一个变量值为零,就不能计算调和平均数。 (3)当组距数列有开口组时,其组中值即使按相邻组距计算了, 假定性也很大,这时,调和平均数的代表性就很不可靠。 (4)调和平均数应用的范围较小。 5.1.3 几何平均数(Geometric Mean) 几何平均数也称几何均值,它是 n 个变量值乘积的 n 次方根。根 据统计资料的不同,几何平均数也有简单几何平均数和加权几何平均 数之分。 1. 简单几何平均数(Simple Geometric Mean) 直接将 n 项变量连乘,然后对其连乘积开 n 次方根所得的平均数 即为简单几何平均数。它是几何平均数的常用形式。计算公式为: n n i n i n G x x x x x = = = 1 1 2 3 (5–5) 式中:G 代表几何平均数, 代表连乘符号 例 5–6 某流水生产线有前后衔接的五道工序。某日各工序产品的 合格率分别为 95%、92%、90%、85%、80%,整个流水生产线产品的 平均合格率为: 0.5349 88.24% 0.95 0.92 0.90 0.85 0.80 5 5 = = G = 2. 加权几何平均数(Weighted Geometric Mean) 与算术平均数一样,当资料中的某些变量值重复出现时,相应地, 简单几何平均数就变成了加权几何平均数。计算公式为: f n i f i f f n f f f G n i x x x x x x = = = 1 1 2 3 1 2 3
(5-6) 式中:f代表各个变量值出现的次数。 例5-7某工商银行某项投资年利率是按复利计算的。20年的利 率分配如表5-6,计算20年的平均年利率。 表5-6 投资年利率分组表 年限 年利率(%)本利率(%)x年数(个)厂 第1年 105 第2年至第4年 3 第5年至第15年 第16年至第20年 118 按公式计算20年的平均年利率: xG=V105×108×115×1.18=11414% 即20年的平均年利率为11414%-1=1414% 3.几何平均数特点 (1)几何平均数受极端值的影响较算术平均数小 (2)如果变量值有负值,计算出的几何平均数就会成为负数或虚 数 (3)它仅适用于具有等比或近似等比关系的数据。 (4)几何平均数的对数是各变量值对数的算术平均数 52集中趋势——位置平均数 位置平均数,就是根据总体中处于特殊位置上的个别单位或部分 单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观 的代表性,因此,常用来反映分布的集中趋势。常用的众数、中位数 52.1众数(Mode 1.众数的含义 某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货 商场某季度男皮鞋的销售情况,得到资料如表5-7
(5–6) 式中:fi 代表各个变量值出现的次数。 例 5–7 某工商银行某项投资年利率是按复利计算的。20 年的利 率分配如表 5–6,计算 20 年的平均年利率。 表 5–6 投资年利率分组表 年限 年利率(%) 本利率(%)xi 年数(个)fi 第 1 年 5 105 1 第 2 年至第 4 年 8 108 3 第 5 年至第 15 年 15 115 11 第 16 年至第 20 年 18 118 5 合 计 — — 20 按公式计算 20 年的平均年利率: 1.05 1.08 1.15 1.18 114.14% 20 1 3 11 5 xG = = 即 20 年的平均年利率为 114.14%-1=14.14% 3. 几何平均数特点 (1)几何平均数受极端值的影响较算术平均数小。 (2)如果变量值有负值,计算出的几何平均数就会成为负数或虚 数。 (3)它仅适用于具有等比或近似等比关系的数据。 (4)几何平均数的对数是各变量值对数的算术平均数。 5.2 集中趋势——位置平均数 位置平均数,就是根据总体中处于特殊位置上的个别单位或部分 单位的标志值来确定的代表值,它对于整个总体来说,具有非常直观 的代表性,因此,常用来反映分布的集中趋势。常用的众数、中位数。 5.2.1 众数(Mode) 1. 众数的含义 某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货 商场某季度男皮鞋的销售情况,得到资料如表 5–7