第3章统计数据的整理与显示 【学习目标】 本章主要介绍了统计整理是统计调査的继续,又是统计分析的前 提。介绍了统计整理的概念和内容,统计分组的方法,分配数列的概 念、种类以及编制分配数列的基本步骤。统计资料汇总的组织形式和 具体方法。 【基本要求】 学习本章内容,要求学习者注意统计资料整个工作过程的有关问 题,掌握统计资料整理的程序、步骤和方法,绘制统计图,编制统计 通过各种渠道将统计数据搜集上来之后,首先应对这些数据进行 加工整理,使之系统化、条理化,以符合分析的需要。通过整理可以 大大简化数据,使我们更容易理解和分析。数据整理通常包括数据的 预处理、分类或分组、汇总等几个方面的内容,它是统计分析之前的 必要步骤 【学习内容】 3.1数据的预处理 数据的预处理是数据整理的先前步骤,是在对数据分类或分组之 前所做的必要处理,包括数据的审核、筛选、排序等。 3.1.1数据的审核与筛选 在对统计数据进行整理时,首先要进行审核,以保证数据的质量 为进一步的整理与分析打下基础。从不同渠道取得的统计数据,其审 核内容和方法有所不同,不同类型的统计数据在审核内容和方法上也 有所差异。 对于通过直接调查取得的原始数据,应主要从完整性和准确性两 个方面去审核。完整性审核主要是检查应调查的单位或个体是否有遗
第 3 章 统计数据的整理与显示 【学习目标】 本章主要介绍了统计整理是统计调查的继续,又是统计分析的前 提。介绍了统计整理的概念和内容,统计分组的方法,分配数列的概 念、种类以及编制分配数列的基本步骤。统计资料汇总的组织形式和 具体方法。 【基本要求】 学习本章内容,要求学习者注意统计资料整个工作过程的有关问 题,掌握统计资料整理的程序、步骤和方法,绘制统计图,编制统计 表。 通过各种渠道将统计数据搜集上来之后,首先应对这些数据进行 加工整理,使之系统化、条理化,以符合分析的需要。通过整理可以 大大简化数据,使我们更容易理解和分析。数据整理通常包括数据的 预处理、分类或分组、汇总等几个方面的内容,它是统计分析之前的 必要步骤。 【学习内容】 3.1 数据的预处理 数据的预处理是数据整理的先前步骤,是在对数据分类或分组之 前所做的必要处理,包括数据的审核、筛选、排序等。 3.1.1 数据的审核与筛选 在对统计数据进行整理时,首先要进行审核,以保证数据的质量, 为进一步的整理与分析打下基础。从不同渠道取得的统计数据,其审 核内容和方法有所不同,不同类型的统计数据在审核内容和方法上也 有所差异。 对于通过直接调查取得的原始数据,应主要从完整性和准确性两 个方面去审核。完整性审核主要是检查应调查的单位或个体是否有遗
漏,所有的调査项目或指标是否填写齐全等。准确性审核主要包括两 个方面:一是检査数据资料是否真实地反映了客观实际情况,内容是 否符合实际:二是检査数据是否有错误,计算是否正确等。审核数据 准确性的方法主要有逻辑检查和计算检查。逻辑检查主要是从定性角 度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相 互矛盾的现象。比如中学文化程度的人所填的职业是大学教师,对于 这种违背逻辑的项目应予以纠正。逻辑检查主要用于对定类数据和定 序数据的审核。计算检査是检查调查表中的各项数据在计算结果和计 算方法上有无错误。比如各分项数字之和是否等于相应的合计数,各 结构比例之和是否等于1或100%,出现在不同表格上的同一指标数值 是否相同,等等。计算检查主要用于对定距数据和定比数据的审核 对于通过其他渠道取得的第二手数据,除了对其完整性和准确性 进行审核外,还应首重审核数据的适用性和时效性。第二手数据可以 来自多种渠道,有些数据可能是为特定目的通过专门调查而取得的, 或者是已经按特定目的的需要做了加工整理。对于使用者来说,首先 应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这 些数据是否符合分析研究的需要,是否需要重新加工整理等,不能盲 目生搬硬套。此外,还要对数据的时效性进行审核,有些时效性较强 的问题,如果所取得的数据过于滞后,就失去了研究的意义。一般来 说,应尽可能使用最新的统计数据。数据经过审核后,确认适合实际 需要,才有必要做进一步的加工整理。 对审核过程中发现的错误应尽可能予以纠正。调查结束后,当数 据中发现的错误不能予以纠正,或者有些数据不符合调查的要求而又 无法弥补时,就需要对数据进行筛选。数据筛选包括两方面内容: 是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符 合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除 数据的筛选在市场调查中是十分重要的 3.12.数据的排序 数据排序是按一定顺序将数据排列,以便于研究者通过游览数据 发现一些明显的特征或趋势,找到解决问题的线索。除此之外,排序 还有助于对数据检査纠错,为重新归类或分组等提供依据。在某些场 合,排序本身就是分析的目的之一。例如,了解究竟谁是中国家电生 产的三巨头,对于家电厂商而言是很有用的信息。美国的《财富》杂 志每年都要排出世界500强企业,通过这一信息,经营者不仅可以了 解自己企业所处的地位,清楚自己的差距,还可了解到竞争对手的状
漏,所有的调查项目或指标是否填写齐全等。准确性审核主要包括两 个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是 否符合实际;二是检查数据是否有错误,计算是否正确等。审核数据 准确性的方法主要有逻辑检查和计算检查。逻辑检查主要是从定性角 度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相 互矛盾的现象。比如中学文化程度的人所填的职业是大学教师,对于 这种违背逻辑的项目应予以纠正。逻辑检查主要用于对定类数据和定 序数据的审核。计算检查是检查调查表中的各项数据在计算结果和计 算方法上有无错误。比如各分项数字之和是否等于相应的合计数,各 结构比例之和是否等于 1 或 100%,出现在不同表格上的同一指标数值 是否相同,等等。计算检查主要用于对定距数据和定比数据的审核。 对于通过其他渠道取得的第二手数据,除了对其完整性和准确性 进行审核外,还应首重审核数据的适用性和时效性。第二手数据可以 来自多种渠道,有些数据可能是为特定目的通过专门调查而取得的, 或者是已经按特定目的的需要做了加工整理。对于使用者来说,首先 应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这 些数据是否符合分析研究的需要,是否需要重新加工整理等,不能盲 目生搬硬套。此外,还要对数据的时效性进行审核,有些时效性较强 的问题,如果所取得的数据过于滞后,就失去了研究的意义。一般来 说,应尽可能使用最新的统计数据。数据经过审核后,确认适合实际 需要,才有必要做进一步的加工整理。 对审核过程中发现的错误应尽可能予以纠正。调查结束后,当数 据中发现的错误不能予以纠正,或者有些数据不符合调查的要求而又 无法弥补时,就需要对数据进行筛选。数据筛选包括两方面内容:一 是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符 合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。 数据的筛选在市场调查中是十分重要的。 3.1.2. 数据的排序 数据排序是按一定顺序将数据排列,以便于研究者通过游览数据 发现一些明显的特征或趋势,找到解决问题的线索。除此之外,排序 还有助于对数据检查纠错,为重新归类或分组等提供依据。在某些场 合,排序本身就是分析的目的之一。例如,了解究竟谁是中国家电生 产的三巨头,对于家电厂商而言是很有用的信息。美国的《财富》杂 志每年都要排出世界 500 强企业,通过这一信息,经营者不仅可以了 解自己企业所处的地位,清楚自己的差距,还可了解到竞争对手的状
况,从而有效制定企业发展的规划和战略目标 对于定类数据,如果是字母型数据,排序有升序与降序之分,但 习惯上升序使用得更普遍,因为升序与字母的自然排列相同:如果是 汉字型数据,排序方式很多,比如按汉字的首位拼音字母排列,这与 字母型数据的排序完全一样,也可按笔画排序,其中也有笔画多少的 升序降序之分。交替运用不同方式排序,在汉字型数据的检查纠错过 程中十分有用。 定距数据和定比数据的排序只有两种,即递增和递减。设一组数 据为X1,X2,…XN,递增排序后可表示为:X(1X(2)>…>X(N排序后的数据也称为顺序统计 量( Order statistics)。无论是品质数据还是数值型数据,排序均可借助 于计算机完成 3.2品质数据的整理与显示 数据经过预处理后,可进一步做分类或分组整理。在对数据进行 整理时,首先要弄清数据的类型,因为对于不同类型的数据所采取的 处理方式和所适用的处理方法是不同的。对品质数据主要是做分类整 理,对数值型数据则主要是做分组整理。 3.21定类数据的整理与显示 定类数据本身就是对事物的一种分类,因此,在整理时除了要列 出所分的类别外,还要计算出每一类别的频数、频率或比例、比率, 同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了 1.频数与频数分布 (1)频数( Frequency)。频数也称次数,是落在各类别中的数据 个数。我们把各个类别及其相应的频数全部列出来就是频数分布或称 次数分布( Frequency distribution)。将频数分布用表格的形式表现出来 就是频数分布表 例3-1为研究广告市场的状况,一家广告公司在某城市随机抽 取200人就广告问题做了邮寄问卷调查,其中的一个问题是:“您比较 关心下列哪一类广告?” a商品广告:b.服务广告;c.金融广告:d.房地产广告:e.招生
况,从而有效制定企业发展的规划和战略目标。 对于定类数据,如果是字母型数据,排序有升序与降序之分,但 习惯上升序使用得更普遍,因为升序与字母的自然排列相同;如果是 汉字型数据,排序方式很多,比如按汉字的首位拼音字母排列,这与 字母型数据的排序完全一样,也可按笔画排序,其中也有笔画多少的 升序降序之分。交替运用不同方式排序,在汉字型数据的检查纠错过 程中十分有用。 定距数据和定比数据的排序只有两种,即递增和递减。设一组数 据为 X1,X2,…XN,递增排序后可表示为:X(1)X(2)>…>X(N)。排序后的数据也称为顺序统计 量(Order statistics)。无论是品质数据还是数值型数据,排序均可借助 于计算机完成。 3.2 品质数据的整理与显示 数据经过预处理后,可进一步做分类或分组整理。在对数据进行 整理时,首先要弄清数据的类型,因为对于不同类型的数据所采取的 处理方式和所适用的处理方法是不同的。对品质数据主要是做分类整 理,对数值型数据则主要是做分组整理。 3.2.1 定类数据的整理与显示 定类数据本身就是对事物的一种分类,因此,在整理时除了要列 出所分的类别外,还要计算出每一类别的频数、频率或比例、比率, 同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了 解。 1. 频数与频数分布 (1)频数(Frequency)。频数也称次数,是落在各类别中的数据 个数。我们把各个类别及其相应的频数全部列出来就是频数分布或称 次数分布(Frequency distribution)。将频数分布用表格的形式表现出来 就是频数分布表。 例 3–1 为研究广告市场的状况,一家广告公司在某城市随机抽 取 200 人就广告问题做了邮寄问卷调查,其中的一个问题是:“您比较 关心下列哪一类广告?” a 商品广告;b. 服务广告;c. 金融广告;d. 房地产广告;e. 招生
招聘广告:f.其他广告。 这里的变量就是“广告类别”,不同类型的广告就是变量值。调查 数据经分类整理后形成频数分布表。见表3-1 表3-1某城市居民关注广告类型的频数分布表 广告类型 人数(人) 商品广告 金融广告 房地产广告 招生招聘广告 其他广告 0.010 很显然,如果不做分类整理,观察200个人对不同广告的关注情 况,既不便于理解,也不便于分析。经分类整理后,可以大大简化数 据,很容易看出关注“商品广告”的人数最多,而关注“其他广告 的人数最少。 (2)比例( Proportion)。比例是一个总体中各个部分的数量占总体 数据的比重,通常用于反映总体的构成或结构。假定总体数量N被分 成K个部分,每一部分的数量分别为N1,N2,…Nk,则比例定义为 显然,各部分的比例之和等于1,即 ++…+ NN N 比例是将总体中各个部分的数值都变成同一个基数,也就是都以1 为基数,这样就可以对不同类别的数值进行比较了。比如,在上面的 例子中,关注金融广告和招生招聘广告的人数比例差不多相同。 (3)百分比( Percentage)。将比例乘以100就是百分比或百分数, 它是将对比的基数抽象化为100而计算出来的,用%表示,它表示每 100个分母中拥有多少个分子。比如在上面的例子中,频率一档就是将 比例乘以100而得到的百分比。百分比是一个更为标准化的数值,很 多相对数都用百分比表示。当分子的数值很小而分母的数值很大时, 也可以用千分数(‰)来表示比例,如人口的出生率、死亡率、自然 增长率等都可用千分数来表示 (4)比率( Ratio)。比率是各不同类别的数量的比值。它可以是一个
招聘广告;f. 其他广告。 这里的变量就是“广告类别”,不同类型的广告就是变量值。调查 数据经分类整理后形成频数分布表。见表 3–1。 表 3-1 某城市居民关注广告类型的频数分布表 广告类型 人数(人) 比例 频率(%) 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 112 51 9 16 10 2 0.560 0.255 0.045 0.080 0.050 0.010 56.0 25.5 4.5 8.0 5.0 1.0 合 计 200 1 100 很显然,如果不做分类整理,观察 200 个人对不同广告的关注情 况,既不便于理解,也不便于分析。经分类整理后,可以大大简化数 据,很容易看出关注“商品广告”的人数最多,而关注“其他广告” 的人数最少。 (2)比例(Proportion)。比例是一个总体中各个部分的数量占总体 数据的比重,通常用于反映总体的构成或结构。假定总体数量 N 被分 成 K 个部分,每一部分的数量分别为 N1,N2,…NK,则比例定义为 N Ni 。 显然,各部分的比例之和等于 1,即 1 1 + 2 + + = N N N N N N K 比例是将总体中各个部分的数值都变成同一个基数,也就是都以 1 为基数,这样就可以对不同类别的数值进行比较了。比如,在上面的 例子中,关注金融广告和招生招聘广告的人数比例差不多相同。 (3)百分比(Percentage)。将比例乘以 100 就是百分比或百分数, 它是将对比的基数抽象化为 100 而计算出来的,用%表示,它表示每 100 个分母中拥有多少个分子。比如在上面的例子中,频率一档就是将 比例乘以 100 而得到的百分比。百分比是一个更为标准化的数值,很 多相对数都用百分比表示。当分子的数值很小而分母的数值很大时, 也可以用千分数(‰)来表示比例,如人口的出生率、死亡率、自然 增长率等都可用千分数来表示。 (4)比率(Ratio)。比率是各不同类别的数量的比值。它可以是一个
总体中各不同部分的数量对比,比如在上面的例子中,关注商品广告 的人数与关注服务广告人数的比率是112:51。为便于理解,通常将分 母化为1。比如,关注商品广告和关注服务广告人数的比率是221。 由于比率不是总体中部分与整体之间的对比关系,因而比值可能 大于1。为方便起见,比率可以不用1作为基数,而用100或其他便于 理解的数作基数。比如,人口的性别比就用每100名女性人口所对应 的男性人口来表示,如性别比为105:100,表示每100个女人对应105 个男人,说明男性人口数量略多于女性人口 在经济和社会问题的研究中,经常使用比率。比如经济学中的积 累与消费之比,国内生产总值中第一、二、三产业产值之比,等等。 比率也可以是同一现象在不同时间或空间上的数量之比,比如将2001 年的国内生产总值与2000年的国内生产总值进行对比,可以得到经济 增长率:将一个地区的国内生产总值同另一个地区的国内生产总值进 行对比,反映两个地区的经济发展水平差异,等等。 2.定类数据的图示 上面我们是用频数分布表示反映分类数据的频数分布。如果用图 形来显示频数分布,就会更加形象和直观。一张好的统计图表,往往 胜过冗长的文字表述。统计图的类型有很多,多数统计图除了可以绘 制二维平面图外,还可以绘制三维立体图。图形的制作均可由计算机 来完成。这里首先介绍反映定类数据的图示方法,其中包括条形图和 圆形图。如果两个总体或两个样本的分类相同且问题可比时,还可以 绘制环形图。 (1)条形图( Bar chart)。条形图是用宽度相同的条形的高度或长短 来表示数据变动的图形。条形图可以横置或纵置,纵置时也称为柱形 图。条形图有单式、复式等形式。例如,根据表3-1数据绘制的条形 图如图3-1所示。 (2)圆形图( Pie chart)。圆形图也称饼图,是用圆形及圆内扇形的 面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分 所占的比例,对于研究结构性问题十分有用。在绘制圆形图时,总体 中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心 角度是按各部分百分比占360°的相应比例确定的。例如,关注服务广 告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为 360°×25.5%=918°,其余类推 根据表3-1数据绘制的圆形图如图3-2所示。 其他广告b2 招生招聘广告□10 房地产广告[16
总体中各不同部分的数量对比,比如在上面的例子中,关注商品广告 的人数与关注服务广告人数的比率是 112:51。为便于理解,通常将分 母化为 1。比如,关注商品广告和关注服务广告人数的比率是 2.2:1。 由于比率不是总体中部分与整体之间的对比关系,因而比值可能 大于 1。为方便起见,比率可以不用 1 作为基数,而用 100 或其他便于 理解的数作基数。比如,人口的性别比就用每 100 名女性人口所对应 的男性人口来表示,如性别比为 105:100,表示每 100 个女人对应 105 个男人,说明男性人口数量略多于女性人口。 在经济和社会问题的研究中,经常使用比率。比如经济学中的积 累与消费之比,国内生产总值中第一、二、三产业产值之比,等等。 比率也可以是同一现象在不同时间或空间上的数量之比,比如将 2001 年的国内生产总值与 2000 年的国内生产总值进行对比,可以得到经济 增长率;将一个地区的国内生产总值同另一个地区的国内生产总值进 行对比,反映两个地区的经济发展水平差异,等等。 2. 定类数据的图示 上面我们是用频数分布表示反映分类数据的频数分布。如果用图 形来显示频数分布,就会更加形象和直观。一张好的统计图表,往往 胜过冗长的文字表述。统计图的类型有很多,多数统计图除了可以绘 制二维平面图外,还可以绘制三维立体图。图形的制作均可由计算机 来完成。这里首先介绍反映定类数据的图示方法,其中包括条形图和 圆形图。如果两个总体或两个样本的分类相同且问题可比时,还可以 绘制环形图。 (1)条形图(Bar chart)。条形图是用宽度相同的条形的高度或长短 来表示数据变动的图形。条形图可以横置或纵置,纵置时也称为柱形 图。条形图有单式、复式等形式。例如,根据表 3–1 数据绘制的条形 图如图 3–1 所示。 (2)圆形图(Pie chart)。圆形图也称饼图,是用圆形及圆内扇形的 面积来表示数值大小的图形。圆形图主要用于表示总体中各组成部分 所占的比例,对于研究结构性问题十分有用。在绘制圆形图时,总体 中各部分所占的百分比用圆内的各个扇形面积表示,这些扇形的中心 角度是按各部分百分比占 360°的相应比例确定的。例如,关注服务广 告的人数占总人数的百分比为 25.5%,那么其扇形的中心角度就应为 360°×25.5%=91.8°,其余类推。 根据表 3–1 数据绘制的圆形图如图 3–2 所示。 人数(人) 0 4 0 8 0 120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 广 告 2 10 16 9
图3-1某城市居民关注不同类型广告的人数分布 招生招聘广告 其他广告 房地产广告 金融广告 商品广告 服务广 图3-2某城市居民关注不同类型广告的人数构成 3.22.定序数据的数理与显示 前面介绍的定类数据的整理与显示方法,如频数、比例、百分比、 比率、条形图和圆形图等,也都适用于对定序数据的整理与显示。但 有些方法适用于对定序数据的整理与显示,却不适用于定类数据。对 于定序数据,除了可使用上面的整理与显示技术外,还可以计算累积 频数和累积频率(百分比)。 累积频数和累积频率 1)累积频数( Cumulative frequencies)。就是将各类别的频数逐级 累加起来。其方法有两种:一是从类别顺序的开始一方向类别顺序的 最后一方累加频数(定距数据和定比数据则是从变量值小的一方向变
图 3–1 某城市居民关注不同类型广告的人数分布 图 3–2 某城市居民关注不同类型广告的人数构成 3.2.2. 定序数据的数理与显示 前面介绍的定类数据的整理与显示方法,如频数、比例、百分比、 比率、条形图和圆形图等,也都适用于对定序数据的整理与显示。但 有些方法适用于对定序数据的整理与显示,却不适用于定类数据。对 于定序数据,除了可使用上面的整理与显示技术外,还可以计算累积 频数和累积频率(百分比)。 1. 累积频数和累积频率 (1)累积频数(Cumulative frequencies)。就是将各类别的频数逐级 累加起来。其方法有两种:一是从类别顺序的开始一方向类别顺序的 最后一方累加频数(定距数据和定比数据则是从变量值小的一方向变 商品广告 服务广告 55% 26% 金融广告 5% 其他广告 1% 招生招聘广告 5% 房地产广告 8%
量值大的一方累加频数),称为向上累积;二是从类别顺序的最后一方 向类别顺序的开始一方累加频数(定距数据和定比数据则是从变量值 大的一方向变量值小的一方累加频数),称为向下累积。通过累积频数, 可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上 的频数之和 (2)累积频率或百分比( Cumulative percentages)。就是将各类别的 百分比逐级累加起来,也有向上累积和向下累积两种方法。 例3-2在一项有关住房问题的研究中,研究人员在甲、乙两个 城市各抽样调查300户家庭,其中的一个问题是:“您对您家庭目前的 住房状况是否满意?” a.非常不满意:b.不满意:c.一般:d.满意:e.非常满意。 调查结果经整理如表3-2和表3-3所示 表3-2甲城市家庭对住房状况的评价 向上累积 向下累积 回答类别户数百分比户数百分比户数百分比 户)(%) (户) 非常不满意24 24 300 不满意 般93 86350 32 276 75.0 满意 270 75 非常满意30 300100.0 10 合计300 表3-3乙城市家庭对住房状况的评价 回答类别户数百分比 (户(「户数百分比户数百分比 非常不满意2 7.0 1000 不满意 99330 120 40.0 一般 26.0 满意 21.3 87. 102 非常满意 12.7 1000 127 合计30100
量值大的一方累加频数),称为向上累积;二是从类别顺序的最后一方 向类别顺序的开始一方累加频数(定距数据和定比数据则是从变量值 大的一方向变量值小的一方累加频数),称为向下累积。通过累积频数, 可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上 的频数之和。 (2)累积频率或百分比(Cumulative percentages)。就是将各类别的 百分比逐级累加起来,也有向上累积和向下累积两种方法。 例 3–2 在一项有关住房问题的研究中,研究人员在甲、乙两个 城市各抽样调查 300 户家庭,其中的一个问题是:“您对您家庭目前的 住房状况是否满意?” a. 非常不满意; b. 不满意;c. 一般;d. 满意;e. 非常满意。 调查结果经整理如表 3–2 和表 3–3 所示。 表 3-2 甲城市家庭对住房状况的评价 回答类别 甲城市 户数 (户) 百分比 (%) 向上累积 向下累积 户数 (户) 百分比 (%) 户数 (户) 百分比 (%) 非常不满意 不满意 一 般 满 意 非常满意 24 108 93 45 30 8 36 31 15 10 24 132 225 270 300 8.0 44.0 75.0 90.0 100.0 300 276 168 75 30 100 92 56 25 10 合 计 300 100 - - - - 表 3-3 乙城市家庭对住房状况的评价 回答类别 乙城市 户数 (户) 百分比 (%) 向上累积 向下累积 户数 (户) 百分比 (%) 户数 (户) 百分比 (%) 非常不满意 不满意 一般 满意 非常满意 21 99 78 64 38 7.0 33.0 26.0 21.3 12.7 21 120 198 262 300 7.0 40.0 66.0 87.3 100.0 300 279 180 102 38 100.0 93.0 60.0 34.0 12.7 合 计 300 100.0 - - - -
2.定序数据的图示 (1)累积频数分布图。根据累积频数或累积频率,可以绘制累积频 数或频率分布图。例如,根据表3-2数据绘制的累积频数分布图如图 所刁 300 累计户数 (a)向上累计 300◆ 去100 30 8令 (b)向下累计 图3-3甲城市对住房状况评价的累积分布图 八(2)环形图。环形图与圆形图类似,但又有区别。环形图中间有 空洞”,总体中的每一部分数据用环中的一段表示。圆形图只能显 示一个总体各部分所占的比例,而环形图则可以同时绘制多个总体的 数据系列,每一个总体的数据系列为一个环。因此环形图可以显示多 个总体各部分所占的相应比例,从而有利于进行比较研究。例如根据 表3-2和表3-3数据绘制两个城市家庭对住房状况评价的环形图 如图3-4所示
2. 定序数据的图示 (1)累积频数分布图。根据累积频数或累积频率,可以绘制累积频 数或频率分布图。例如,根据表 3–2 数据绘制的累积频数分布图如图 3–3 所示。 图 3-3 甲城市对住房状况评价的累积分布图 (2)环形图。环形图与圆形图类似,但又有区别。环形图中间有一 个“空洞”,总体中的每一部分数据用环中的一段表示。圆形图只能显 示一个总体各部分所占的比例,而环形图则可以同时绘制多个总体的 数据系列,每一个总体的数据系列为一个环。因此环形图可以显示多 个总体各部分所占的相应比例,从而有利于进行比较研究。例如根据 表 3-2 和表 3-3 数据绘制两个城市家庭对住房状况评价的环形图, 如图 3-4 所示。 2 4 132 225 270 300 0 100 200 300 非常不满意 不满意 一般 满意 非常满意 (a)向上累计 累 计 户 数 (户) (b)向下累计 300 276 168 75 30 0 100 200 300 非常不满意 不满意 一般 满意 非常满意 累计户数(户)
口非常不满意 日不满意 33% 6% 口满意 口非常满意 26% 图3-4甲、乙两城市家庭对住房状况的评价 在图3-4中,外边的一个环表示的是乙城市家庭对住房状况评价 各等级所占的百分比,里边的一个环则为甲城市家庭对住房状况评价 各等级所占的百分比 3.3数值型数据的整理与显示 上一节介绍的定类数据和定序数据的整理与图示方法,也都适用 于对数值型数据的整理与显示。但数值型数据还有一些特定的整理和 图示方法,并不适用于品质数据。 3.3.1数据的分组 数值型数据包括定距数据和定比数据,在整理时通常要进行数据 分组,就是根据统计研究的需要,将数据按照某种标准化分成不同的 组别。分组后再计算出各组中出现的次数或频数,就形成了一张频数 分布表。分组的方法有单变量值分组和组距分组两种。 1.单变量值分组 单变量值分组是把每一个变量值作为一组,这种分组方法通常只 适合于离散变量且变量值较少的情况。下面结合具体的例子说明分组 的过程和频数分布表的编制过程
图 3-4 甲、乙两城市家庭对住房状况的评价 在图 3-4 中,外边的一个环表示的是乙城市家庭对住房状况评价 各等级所占的百分比,里边的一个环则为甲城市家庭对住房状况评价 各等级所占的百分比。 3.3 数值型数据的整理与显示 上一节介绍的定类数据和定序数据的整理与图示方法,也都适用 于对数值型数据的整理与显示。但数值型数据还有一些特定的整理和 图示方法,并不适用于品质数据。 3.3.1 数据的分组 数值型数据包括定距数据和定比数据,在整理时通常要进行数据 分组,就是根据统计研究的需要,将数据按照某种标准化分成不同的 组别。分组后再计算出各组中出现的次数或频数,就形成了一张频数 分布表。分组的方法有单变量值分组和组距分组两种。 1. 单变量值分组 单变量值分组是把每一个变量值作为一组,这种分组方法通常只 适合于离散变量且变量值较少的情况。下面结合具体的例子说明分组 的过程和频数分布表的编制过程。 8% 36% 31% 15% 10% 7% 33% 26% 21% 13% 非常不满意 不满意 一般 满意 非常满意
例3-3某生产车间50名工人日加工零件数(单位:个)如下。 试采用单变量值对数据进行分组 117122124129139107117130122125 08131125117122133126122118108 110118123126133134127123118112 112134127123119113120123127135 137114120 8124115139128124121 为便于分组,可先对上面的数据进行排序,结果如下 107108108110112112113114115117 117117118118118119120120121122 122122122123123123123124124124 125125126126127127127128128129 130131133133134134135137139139 采用单变量值分组形成的频数分布表如表3-4所示 表3-4某车间50名工人日加工零件数分组表 零件数(个频数(人和零件数(个)频数(人零件数(个频数(人) 110 130 112 113 121211133 123 133 2 114 134 2 l15 125 135 117 3223 l18 127 从表3-4可以看出,在数据较多的情况下,单变量值分组由于组 数较多,不便于观察数据分布的特征和规律,而且对于连续变量无法 采用这种分组方法 2.组距分组 在连续变量或变量值较多的情况下,可采用组距分组,它是将全 部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,一个组的最小值称为下限( Low limit),最大值称为上 限( Upper limit)。采用组距分组需要经过以下几个步骤: 第一步:确定组数。一组数据分多少个组合适呢?这一般与数据
例 3–3 某生产车间 50 名工人日加工零件数(单位:个)如下。 试采用单变量值对数据进行分组。 117 108 110 112 137 122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121 为便于分组,可先对上面的数据进行排序,结果如下: 107 117 122 125 130 108 117 122 125 131 108 118 122 126 133 110 118 123 126 133 112 118 123 127 134 112 119 123 127 134 113 120 123 127 135 114 120 124 128 137 115 121 124 128 139 117 122 124 129 139 采用单变量值分组形成的频数分布表如表 3–4 所示。 表 3-4 某车间 50 名工人日加工零件数分组表 零件数(个)频数(人)零件数(个)频数(人)零件数(个)频数(人) 107 108 110 112 113 114 115 117 118 1 2 1 2 1 1 1 3 3 119 120 121 122 123 124 125 126 127 1 2 1 4 4 3 2 2 3 128 129 130 131 133 134 135 137 139 2 1 1 1 2 2 1 1 2 从表 3–4 可以看出,在数据较多的情况下,单变量值分组由于组 数较多,不便于观察数据分布的特征和规律,而且对于连续变量无法 采用这种分组方法。 2. 组距分组 在连续变量或变量值较多的情况下,可采用组距分组,它是将全 部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 在组距分组中,一个组的最小值称为下限(Low limit),最大值称为上 限(Upper limit)。采用组距分组需要经过以下几个步骤: 第一步:确定组数。一组数据分多少个组合适呢?这一般与数据