第三章数据整理 按照研究的目的,将搜集到的原始数据进 行整理加工,从中提取有用的信息,并搜索其 中的数量规律性。 31数据分组 32次数分配 33统计指标 34统计表和统计图
第三章 数据整理 按照研究的目的,将搜集到的原始数据进 行整理加工,从中提取有用的信息,并搜索其 中的数量规律性。 3.1 数据分组 3.2 次数分配 3.3 统计指标 3.4 统计表和统计图
31数据分组 、统计数据分组的目的及原则 分组是将总体所有单位按一定的标准区分为若干部分 分组的目的:概括数据,清晰条理 25% 33% ◇ 42% 分组前 分组后
3.1 数据分组 ▪ 一、统计数据分组的目的及原则 分组是将总体所有单位按一定的标准区分为若干部分 分组前 分组后 25% 33% 42% 分组的目的:概括数据,清晰条理
分组时注意 将具有共性的个体归入同一组 将总体内部个体间的差异通过组别区分开 来 分组的原则:保证总体中的任何一个个体或原 始数据都能归于某一个组且仅能归于某一个组,即 保证不重、不漏。 统计分组的关键是分组标志的选择
分组时注意: •将具有共性的个体归入同一组 •将总体内部个体间的差异通过组别区分开 来 分组的原则:保证总体中的任何一个个体或原 始数据都能归于某一个组且仅能归于某一个组,即 保证不重、不漏。 统计分组的关键是分组标志的选择
二、统计分组的种类 1、按分组标志的多少不同分 简单分组:分组仅按一个标志来进行 复合分组:分组按两个或两个以上的标志进行,并 且层叠在一起
1、按分组标志的多少不同分: ▪ 简单分组:分组仅按一个标志来进行 ▪ 复合分组:分组按两个或两个以上的标志进行,并 且层叠在一起。 二、统计分组的种类
例如:对全国的工业企业进行 简单分组: 按经济类型分:全民所有制企业、集体所有制企 业、城乡个体企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型 企业 复合分组: 大型企业 重工业中型企业 全民所有制 小型企业 轻工业 集体所有制重工业 轻工业
例如:对全国的工业企业进行 简单分组: 按经济类型分:全民所有制企业、集体所有制企 业、城乡个体企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型 企业 复合分组: 全民所有制 集体所有制 重工业 轻工业 重工业 轻工业 大型企业 中型企业 小型企业
2、按分组标志的性质不同分: 品质分组:按品质标志进行的分组 如人口总体按性别分组、高校教师按职 称分组。 变量分组:按数量标志进行的分组 如企业按职工人数分———1000人以下、 1000-5000人、5000人以上
2、按分组标志的性质不同分: ▪ 品质分组:按品质标志进行的分组 如人口总体按性别分组、高校教师按职 称分组。 ▪ 变量分组:按数量标志进行的分组 如企业按职工人数分------1000人以下、 1000-5000人、5000人以上
分组标志与分组体系的选择 1、根据统计研究的目的,在对现象进行分析的基础 上,抓住具有本质性的区别及反映现象内在联系的 标志来作为分组标志。 2、在统计整理中,为了全面认识被研究现象总体, 常常需要运用多个分组标志对总体进行分组,形成 系列相互联系、相互补充的分组体系
三、分组标志与分组体系的选择 1、根据统计研究的目的,在对现象进行分析的基础 上,抓住具有本质性的区别及反映现象内在联系的 标志来作为分组标志。 2、在统计整理中,为了全面认识被研究现象总体, 常常需要运用多个分组标志对总体进行分组,形成 一系列相互联系、相互补充的分组体系
四、统计分组方法 1、品质分组的方法 分组标志一经确定,组名称和组数也就确定,不 存在组与组之间界限区分的困难。 复杂的情况下,各组界限不易划分,从这一组到 另一组存在各种过度状态,边缘不清 2、变量分组的方法 变量分组的目的并不是单纯确定各组在数量 上的差别,而是要通过数量上变化来区分各组的 不同类型和性质
四、统计分组方法 1、品质分组的方法 ▪ 分组标志一经确定,组名称和组数也就确定,不 存在组与组之间界限区分的困难。 ▪ 复杂的情况下,各组界限不易划分,从这一组到 另一组存在各种过度状态,边缘不清。 2、变量分组的方法: 变量分组的目的并不是单纯确定各组在数量 上的差别,而是要通过数量上变化来区分各组的 不同类型和性质
单项式分组:是依次将每一个变量值作为一组 (适用于离散型变量且变量取值不多的情况) 例如,居民家庭人口数,其取值不可能很多,且每一个 取值都可视为一种类型。 按家庭人口数分组 人人人人人 6人
▪ 单项式分组:是依次将每一个变量值作为一组。 (适用于离散型变量且变量取值不多的情况) ▪ 例如,居民家庭人口数,其取值不可能很多,且每一个 取值都可视为一种类型。 按家庭人口数分组 1人 2人 3人 4人 5人 6人
组距式分组:把整个变量值依次划分为几个区间, 各个变量值按其大小确定所归并的区间,区间的距离 称组距。 包括等距分组和不等距分组 适用于连续型变量或虽为离散型变量但取值很多 不便一一列举的情况。 1)连续型变量的组距式分组 如对商店按销售额进行分组 按销售额分组(万元) °50以下;50-200;200-400;400-600 °600-800;800以上
▪ 组距式分组:把整个变量值依次划分为几个区间, 各个变量值按其大小确定所归并的区间,区间的距离 称组距。 包括等距分组和不等距分组 适用于连续型变量或虽为离散型变量但取值很多, 不便一一列举的情况。 1)连续型变量的组距式分组 如对商店按销售额进行分组 : •按销售额分组(万元) •50以下;50—200;200—400;400—600 •600—800;800以上