BINZHOU VOCAT IONAL COLLEGE 精品课程 《统计基础》 经济管理系课题组 版权所有:马如武王桂芳
精品课程 《统计基础》 经济管理系课题组 版权所有:马如武 王桂芳
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE ·第5章数据分布特征的描述 【学习目标】 ·本章主要介绍了数据分布特征的描述的基本理论, 包括平均指标和变异指标的基本概念、种类以及 各种计算方法,计算和应用平均指标应注意的问 题等。通过学习,使学习者能够掌握数据分布的 集中趋势和离散特征,为经济管理服务 【学习要求】 通过本章的学习,要求理解并掌握平均指标和 变异指标的基本概念,熟练掌握各种让算方法 明确计算和运用平均指标应注意的问题等
• 第5章 数据分布特征的描述 • 【学习目标】 • 本章主要介绍了数据分布特征的描述的基本理论, 包括平均指标和变异指标的基本概念、种类以及 各种计算方法,计算和应用平均指标应注意的问 题等。通过学习,使学习者能够掌握数据分布的 集中趋势和离散特征,为经济管理服务。 • 【学习要求】 • 通过本章的学习,要求理解并掌握平均指标和 变异指标的基本概念,熟练掌握各种计算方法, 明确计算和运用平均指标应注意的问题等等
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE 【学习内容】 统计数据分布的特征,可以从三个方面进行测度和描述:一是分布 的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均 数差 是分布的离中趋势,反映各数据远离其中心值的程度,如标准 是分布的偏态和峰度,反映数据分布的形状。这三个方面分别 反映了数据分布特征的不同侧面,第 瘟是要留本章重点 讨论第一、第二两方面代表值的计算方法、特点及其应用玚 51集中趋势——数值平均数 集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是 寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方法通 常有两种:一是从总体各单位变量值中抽象出具有一般水平的量,这 个量不是各个单位的具体变量值,但又要反映总体各单位的一般水平 这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数 几何平均数等形式。二是先将总体各单位的变量值按一定顺序排列 然后取某一位置的变量值来反映总体各单位的一般水平,把这个特殊 位置上的数值看作是平均数,称作位置平均数。位置平均数有众数 中位数、四分位数等形式
• 【学习内容】 • 统计数据分布的特征,可以从三个方面进行测度和描述:一是分布 的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均 数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标准 差;三是分布的偏态和峰度,反映数据分布的形状。这三个方面分别 反映了数据分布特征的不同侧面,第一、二方面是主要的。本章重点 讨论第一、第二两方面代表值的计算方法、特点及其应用场合。 • • 5.1 集中趋势——数值平均数 • 集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是 寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方法通 常有两种:一是从总体各单位变量值中抽象出具有一般水平的量,这 个量不是各个单位的具体变量值,但又要反映总体各单位的一般水平, 这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、 几何平均数等形式。二是先将总体各单位的变量值按一定顺序排列, 然后取某一位置的变量值来反映总体各单位的一般水平,把这个特殊 位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、 中位数、四分位数等形式
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE ·5.1.1算术平均数 算术平均数,是集中趋势测度中最重要的一种 它是所有平均数中应用最广泛的平均数 总体标志总量(变量值总量) ·算术平均数=总体单位总量(变量值个数) 1.简单算术平均数( Simple arithmetic Mean) ·根据未经分组整理的原始数据计算的均值。设 组数据为X1,X1,…x,则简单算术平均数的计 算公式如下: 1+x2+…=2x 1
• 5.1.1算术平均数 • 算术平均数,是集中趋势测度中最重要的一种, 它是所有平均数中应用最广泛的平均数。 • 算术平均数= • 1. 简单算术平均数(Simple Arithmetic Mean) • 根据未经分组整理的原始数据计算的均值。设一 组数据为x1,x1,…xn,则简单算术平均数的计 算公式如下: ( ) ( ) 总体单位总量 变量值个数 总体标志总量 变量值总量 n x n x x x x n = + + + = 1 2
滴b菜了 BINZHOU VOCAT IONAL COLLEGE ·例5-1据南方人才服务中心调查,从事「行业的 从业人员年薪在40000-55000元之间,表5-1的 数据是从业人员年薪的一个样本: ·计算「从业人员的平均年薪。 ·根据公式计算如下: 49100+49300+…+53400+51900 平均年薪x =5021458(元) 24 表5-124名IT从业人员年薪资料表 49004860049904886 47200 51350 54600 49300 51200 51000 49400 51400 51800 49600 53400 48700 50300 49000 49800 48900 48650 51300 51900
• 例5–1 据南方人才服务中心调查,从事IT行业的 从业人员年薪在40000-55000元之间,表5–1的 数据是IT从业人员年薪的一个样本: • 计算IT从业人员的平均年薪。 • 根据公式计算如下: 49100 48600 49950 48800 47200 49900 51350 54600 49300 51200 51000 49400 51400 51800 49600 53400 48700 50300 49000 49800 48900 48650 51300 51900 表5–1 24名IT从业人员年薪资料表 50214.58( ) 24 1 49100 49300 53400 51900 平均年薪 = 元 + + + + = = = n x n i i x
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE °2.加权算术平均数( Weighted Arithmetic ean 根据分组整理的数据计算的算术平均数 其计算公式为: x=1+x2/2+…+xnn_Σx52) f1+∫2+…+fn ∑f 式中:f代表各组变量值出现的频数 ·例5-2以表5-2为例,计算人均日产量。计 算表见表52
• 2. 加权算术平均数(Weighted Arithmetic Mean) • 根据分组整理的数据计算的算术平均数。 其计算公式为: • (5–2) • 式中:f 代表各组变量值出现的频数。 • 例5–2 以表5–2为例,计算人均日产量。计 算表见表5–2。 f xf f f f x f x f x f x n n n = + + + + + + 1 2 = 1 1 2 2
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE 表5-2某企业50名工人加工零件均值计算表 按零件数分 组 组中值x频数xf 平均日产量= 053~1101075 110-15125 5625 ∑x6160 123,2(件)1501038 ∑f50 120~-1251225 141715 125~1301275 10 1275 130~1351325 795 135~-1401375 合计 50
按零件数分 组 组中值x 频数f xf 105~110 107.5 3 322.5 110~115 112.5 5 562.5 115~120 117.5 8 940 120~125 122.5 14 1715 125~130 127.5 10 1275 130~135 132.5 6 795 135~140 137.5 4 550 合 计 –– 50 6160 表5–2 某企业50名工人加工零件均值计算表 平均日产量= = =123.(件) 2 50 6160 f xf
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE ·3.算术平均数性质 算术平均数在统计学中具有重要的地位,它是进行统计 分析和统计推断的基础。首先,从统计思想上看,它是 组数据的重心所在,是数据误差相互抵消后的必然性结果 其次,它具有下面一些重要的数学性质,这些数学性质在 实际工作中有着广泛的应用(如在相关性分析和方差分析 及建立回归方程中),同时也体现了算术平均数的统计思 想 1.各变量值与其算术平均数的离差之和等于零,即 2(x-x)f=0; 2.各变量值与其算术平均数的离差平方和最小,即 ∑(x-x)2′=min
• 3. 算术平均数性质 • 算术平均数在统计学中具有重要的地位,它是进行统计 分析和统计推断的基础。首先,从统计思想上看,它是一 组数据的重心所在,是数据误差相互抵消后的必然性结果 • 其次,它具有下面一些重要的数学性质,这些数学性质在 实际工作中有着广泛的应用(如在相关性分析和方差分析 及建立回归方程中),同时也体现了算术平均数的统计思 想。 • 1.各变量值与其算术平均数的离差之和等于零,即 • ∑ = 0; • 2.各变量值与其算术平均数的离差平方和最小,即 • ∑ =min。 (x − x) f x x f 2 ( − )
◎嘀b菜孓 BINZHOU VOCATIONAL COLLEGE 4.利用计算工具求算术平均数 (1)利用计算器计算 对于未整理的原始数据或已整理分组的数列,均可利用计算器的统计功能计算算术平均数。需要特别注意的是, 当资料为变量数列时,一定要遵循以下输入顺序:先输入变量值,然后输入乘号键,接下来输入频数值,绝对不能 颠倒次 (2)利用计算机计算 运用计算机技术,不但能使人们从大量繁杂的手工处理数据的工作中解脱出来 还可能大大提高对统计数据 将的维楚废时企翻纯整地绕计常角含是本9日款知的的单米为数 等迅速提供给人们。 下面举一个简单的例子说明利用“exce计算算术平均数的步骤。如,计算某班上学期期末考试各科平均成绩。 方法 第一步打开“ excel,输入全班每位同学各科考试成绩(一般以每行记录一名学生的各科成绩,也可以每列记录 名学生的各科成绩) 第二步选择(单击)“工具”下拉菜单 第三步选择(单击)“数据分析”选项 第四步从弹出的“分析工具”中选择(单击)“描述统计”并单击“确定”; 第五步在对话框中的“输入区域”框内键入要计算的单元格区域(如果包括字段行,则须选中“标志位于第 复选框。若分组方式 则该复选框选定标志位于第一列);在“输出选项”中选择输出区域;选择 统计”(该选项给出全部描述统计量);单击 方法二: 第一步打开“exce『,输入全班每位同学各科考试成绩(一般以每行记录一名学生的各科成绩,也可以每列记录 名学生的各科成绩); 试目若称适的季第计Q在凭45则青含46轴入餐式依次为名 各考 b45 然后回车;或者在适当的单元格内插入函数(选择“插入”下拉菜单,然后 选择“函数”,接下来从 弹出的对话框左边的函数类别中选择 再从对话框右边的函数名中选择“ Average",最后单击“确定”) 第三步选定第二步计算结果所在单元格,复制其他考试科目的平均成绩
• 4. 利用计算工具求算术平均数 • (1)利用计算器计算 • 对于未整理的原始数据或已整理分组的数列,均可利用计算器的统计功能计算算术平均数。需要特别注意的是, 当资料为变量数列时,一定要遵循以下输入顺序:先输入变量值,然后输入乘号键,接下来输入频数值,绝对不能 颠倒次序。 • (2)利用计算机计算 • 运用计算机技术,不但能使人们从大量繁杂的手工处理数据的工作中解脱出来,而且还可能大大提高对统计数据 的利用率。虽然功能强大的统计软件包在一般人使用的电脑上没有安装,但使用“office”软件的用户超过90%,而 用“office”软件中的“excel”组件足可以及时、准确、完整地将有关统计常用的基本统计量(如本章的算术平均数) 等迅速提供给人们。 • 下面举一个简单的例子说明利用“excel”计算算术平均数的步骤。如,计算某班上学期期末考试各科平均成绩。 • 方法一: • 第一步 打开“excel”,输入全班每位同学各科考试成绩(一般以每行记录一名学生的各科成绩,也可以每列记录 一名学生的各科成绩); • 第二步 选择(单击)“工具”下拉菜单; • 第三步 选择(单击)“数据分析”选项; • 第四步 从弹出的“分析工具”中选择(单击)“描述统计”并单击“确定”; • 第五步 在对话框中的“输入区域”框内键入要计算的单元格区域(如果包括字段行,则须选中“标志位于第一 行”复选框。若分组方式为逐行,则该复选框选定标志位于第一列);在“输出选项”中选择输出区域;选择“汇 总统计”(该选项给出全部描述统计量);单击“确定”。 • 方法二: • 第一步 打开“excel”,输入全班每位同学各科考试成绩(一般以每行记录一名学生的各科成绩,也可以每列记录 一名学生的各科成绩); • 第二步 在适当的单元格内输入计算公式(以每行记录一名学生的各科成绩为例,假设第一行依次为姓名及各考 试科目名称,最后一名学生第一科的成绩所在单元格为B45,则可在B46单元格输入计算公式“:average(b2: b45)”),然后回车;或者在适当的单元格内插入函数(选择“插入”下拉菜单,然后选择“函数”,接下来从 弹出的对话框左边的函数类别中选择“统计”,再从对话框右边的函数名中选择“Average”,最后单击“确定”); • 第三步 选定第二步计算结果所在单元格,复制其他考试科目的平均成绩
◎瘡b業了 BINZHOU VOCATIONAL COLLEGE ·5.12调和平均数( Harmonic mean) ·1.调和平均数的计算方法 与算术平均数类似,调和平均数也有简单的和加 权的两种形式,其计算公式分别为: 7 x5-3) 1+m2十·十mn x”54) ·由于调和平均数也可以看成是变量ⅹ的倒数的算术 平均数的倒数,故有时也被称作“倒数平均数
• 5.1.2 调和平均数(Harmonic Mean) • 1. 调和平均数的计算方法 • 与算术平均数类似,调和平均数也有简单的和加 权的两种形式,其计算公式分别为: • (5–3) • (5–4) • 由于调和平均数也可以看成是变量x的倒数的算术 平均数的倒数,故有时也被称作“倒数平均数”。 = = + + + = n n i xi n x x x n H 1 2 1 1 1 1 1 = = = + + + + + + = n i i i n i i n n n x m m x m x m x m m m m H 1 1 2 2 1 1 1 2