第二章统计数据调查 教学目的与要求:了解统计调查的意义:掌握统计数据的类型、统计调查的分类、统计 调查方案的设计等。 教学重点:统计报表、专门调查及调查方案设计 教学难点:重点讽查与典型训查的区别。 第一节数据的计量与类型 统计研究客观事物的数量方面,离不开统计数据,统计数据是对客观现象进 行计量的结果。对统计数据的属性、特征进行分类、标示和计算,称为统计测定 或统计度量,有定性测定和定量测定之别,并且可分不同的层次。根据计量学的 一般分类方法,按照对事物计量的精确程度,可将所采用的计量尺度由低级到高 级、由粗略到精确分为四个层次,即:定类尺度、定序尺度、定距尺度和定比尺 度。采用不同计量尺度可以得到不同类型的统计数据,而不同类型的逃难数据又 适用于不同的统计分析方法。 一、数据的计量尺度 (一)、定类尺度(Nominal scale) 定类尺度也称类别尺度或列名尺度,是最粗略、计量层次最低的计量尺度。 它只能按照事物的某种屈性对其进行平行的分类或分组。使用该尺度对事物所作 的分类,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺 序是可以改变的。由于定类尺度只能区分事物是同类或不同类因此它具有=或子 的数学特性。定类尺度是对事物最基本的测度,是其他计量尺度的基础。 要求:必须符合穷尽性和互斥性的要求。 (二)定序尺度(Ordinal scale) 定序尺度又称顺序尺度,是对事物之间等级差或顺序差别的一种测度。它不 仅可以竞事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。定序尺 度对事物的计量要比定类尺度精确些,但它也只测度了类别之间的顺序,而未测 量出类别之间的准确差值。因此该尺度具有>和<的数学性质,当然也包括了定类 尺度的特性,其计量结果不仅能对事物分门别类,还可以比较大小,但不能进行 加、减、乘、除等数学运算。 (三)定距尺度(Interval scale)
定距尺度也称间隔尺度,它不仅能将事物区分为不同类型并进行排序,而且 可以准确地指出类别之间的差距是多少。它是对事物类别或次序之间间距的测 度,通常使用自然或度量衡单位作为计量尺度,计算结果表现为数值。由于这种 尺度的每一间隔都是相等的,只要给出一个计量单位,就可以准确地指出两个计 数之间的差值。它不仅具有定类尺度和定序尺度的特性,其结果还可以进行加、 减运算。 (四)定比尺度(Ratio scale) 定比尺度也称为比率尺度,它与定距尺度属于一个层次,一般可不作区分, 其计量的结果也表示为数值。它除了句要上述三种计量尺度的全部特性外,还可 以计算两个测度值之间的比值。这就要求定比尺度中必须有一个绝对固定的“零 点”,这也是它与定距尺度的唯一差别。因此采用定比尺度计量的结果通常不会 出现“0”值。现实生活中,大多数情况下使用的都是定比尺度。 定距尺度和定比尺度的区别可以形象的比喻为:定距尺度是从桌面上开始测 量高度,定比尺度则是从地面上开始测量高度。定比尺度中由于“0”表示不存 在,因而其数值不仅可以比较大小、计算差值,还可以计算数值之间的比值。它 可以进行加、减、乘、除运算 定类尺度 定许尺度 定矩尺度 定比尺度 √ X÷ √ 二、数据的类型和分析方法 (一)数据类型与分析方法 统计数据是采用某种计量尺度对事物进行计量的结果,采用不同的计量尺度 会得到不同类型的统计数据,有以下四种类型: 定类数据:表现为类别,但不区分顺序,是有定类尺度计量形成的。 定序数据:表现为类别,但有顺序,是有定序尺度计量形成的
定距数据:表现为数值,可进行加、减运算,是由定距尺度计量形成的。 定比数据:表现为数值,可进行加、减、乘、除运算,是由定比尺度计量形 成的。 前两类数据说明的是事物的品质特征,不能用数值表示,其结果均表现为类 别,也称为定性数据或品质数据(Qualitative data):后两类数据说明的是现 象的数量特征,能够用数值来表现,也称为定量数据或数量数据(Quantitaive date)。由于定距尺度和定比尺度属于同一测度层次,所可以把后两种数据看作 是同一类数据,统称为定量数据或数值型数据。 特别指出:适用于低层次测量数据的统计方法,也适用于较高层次的测量数 据,因为后者具有前者的数学特性:反之,适于较高层次测量数据的统计方法, 则不能用于较低层次的测量数据,因为低层次数据不具有高层次测量数据的数学 特性。 (二)变量及其类型 在统计中,把说明现象某种特征的概念称为变量(Variable),变量的具体 表现称为变量值。统计数据就是统计变量的具体表现,变量可分为以下几种类型: l、定类变量(ominal variable)。如果一个变量由定类数据来计录就称为 定类变量。如… 2、定序变量(Ordinal variable)。如果一个变量由定序数据来计录就称为 定序变量。如… 3、数字变量(Numerical variable)。如果一个变量由数量数据来计录就称 为数字变量。如… 三、统计调查的种类 (一)按调查的组织方式不同,分为统计报表和专门调查。 (二)根据调查对象包括的范围不同,分为全面调查和非全面调查。全面调 查即对调查对象的全部单位无一例外的进行调查,它又包括全面统计报表的普 查:非全面调查即对调查对象中的一部分单位进行调查,包括抽样调查、重点调 查、典型调查和非全血统计报表。 (三)按调查登记时间连续与否,分为经常性调查和一次性调查。经常性调 查也称连续性调查,是指随着被研究现象的变化,连续不断地进行登记,以取得
这些现象在一段时期内发展的总量。一次性调查又称不连续性调查,是指对被研 究现象每间隔异端相当长的时间所进行的登记,以取得这些现象在一定时点状况 上的总量。 (四)按搜集资料的方法不同,分为直接观察法、凭证(报告)法、询问(采 访)法。直接观察法由调查人员亲临现场对被调查单位进行观察、点数、计量: 凭证法是以各种原始记录和核算凭证为基础,依据统一的表格形式和要求,按照 隶书关系逐机向有关部门提供统计资料的方法:询问法只指派调查员对被调查者 询问、采访,提出所要了解的问题,根据被调查者的答复来搜集统计资料的方法。 第二节统计数据搜集的组织形式 统计数据主要来源于两种渠道:一是直接的调查和科学实验:二是别人调查 和科学实验。 一、统计数据的直接来源 统计数据的直接来源是指由直接的调查和科学实验获得第一手资料,主要有 两个渠道:专门组织的调查和科学试验 (一)统计调查方式 统计调查是取得时候经济数据的主要来源,也是获得直接统计数据的重要手 段。常用的统计调查方式有以下几种 1、普查。普查市委某一特定目的而专门组织的一次性全面调查,如…, 它是使用于特定目的、特定对象的一种调查方式,主要用于搜集处于某一时点状 态上的社会经济现象的数量,摸底是掌握特定社会经济现象的基本全貌,为国家 提供有关政策或措施提供依据。 普查的特点:(1)普查通常是一次性的或周期性的:(2)普查一般须要规定 统一的标准时点:(3)普查的数据一般比较准确,规范化程度较高,可以为其它 调查提供依据:(4)普查的使用范围比较窄,只能调查一些最基本及特定的现象。 2、统计报表。统计报表是所统计数据的一种重要形式,在我国几十年的政 府统计工作中,己形成了一整套比较完备的统计报表制度,它已成为国家和地方 玫府部门统计数据的主要来源。统计报表是按国家有关法规的规定,自上而下地
统一布置、自下而上地逐级提供基本统计数据的一种调查方式。它要以一定的圆 熟数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行 填报。 种类:按调查对象所包括的范围不同可分为全面报表和非全面报表:按报送 时间不同可分为日报、月报、季报、半年报和年报等:按报表的内容和实施范围 的不同可分为国家统计报表(国民经济基本统计报表)、部门统计报表和地方统 计报表:按填报单位不同,可分为基层统计报表和综合统计报表等 优点:统计数据的统一性和时效性、全面性、连续性、相对可靠性。 3、抽样调查。它是实际中应用最广泛的一种调查方式和方法,它是从调查 对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查的结果来 推晰总体数量特征的一种非全面调查。 抽样调查的特点:(1)经济性:(2)时效性强:适用面广:(4)准确性高。 4、重点调查。它是专门组织的一种非全面调查,它是在调查对象中只选择 一部分重点单位所进行的调查,借以了解总体的基本情况。 重点单位:是指在总体中具有举足轻重的地位的单位。这些单位虽然数目较 少,但就调查的标志值来说在懊恼共同标志总量中占有绝大的比重,能够反映出 总体的基本情况。如·,它可以四一次性调查也可以是经常性调查。通常情况 下,可以同统计报表制度想结合,采用统计报表取得所需要的资料。 5、典型调查。它也是专门组织的一种非全面调查,它是根据调查研究的目 的和要求,在对总体进行全面分析的基础上,有意识地选择其中有代表性的典型 单位进行深入细致的调查,借以认识事物的本质特征、因果关系和发展变化的趋 势。 典型单位:是指那些最充分、最集中地体现总体某一方面共性的单位。 选典的方法:(1)“解剖麻雀”式的方法。它适用于总体内各单位差别不太 大的情况。通过对个别代表性单位的调查,即可估计总体的一般情况。(2)“划 类选典”的方法。总体内部差异明显,但可以划分出若干个类型组,使各类型组 内部差异较小。从各类性组中抽选一两个具有代表性的单位进行调查,即为划类 选典。(3)“抓两头”的方法。既分别从先进单位和落后单位中选择典型,以便 总结经验和教训,带动中间状态的单位,推动整体的发展
(二)数据的搜集方法 数据的搜集方法即统计调查方法可分为两大类:询问调查和观察实验。 1、询问调查。是调查者与被调查者直接或间接接触以获得数据的一种方法。 具体包括: (1)访问调查。访问调查又称派员调查,是调查者与被调查者通过面对面 地交谈从而得到所需统计资料的调查方法。其调查的方式有标准式访问和非标准 式访问两种。标准式访问又称结构式访问,是按照调查人员事先设计好的、有同 定格式的标准化问卷或表格,有顺序的依次提问,并由受访者作出回答。非标准 式访问又称非结构式访问,是由调查人员给被调查者一个题目或提纲,由调查人 员和受访者自由交谈,以获得所需资料。 (2)邮寄调查。是通过邮寄或宣传媒体等方式将调查表或调查问卷送至被 调查者手中,由被调查者填写,然后将调查表寄回或投放到指定收集点的一种调 查方法。它是一种标准化调查,其特点是,调查人员和被调查者没有直接的语言 交流,信息的传递完全依赖于调查表。邮寄调查的问卷或表格发放方式有邮寄 宣传媒介传送、专门场所分发三种。 (3)电话调查。是调查人员利用电话同受访者进行语言交流,从而获得信 息的一种方式。它具有时效快、费用低的特点。电话调查所提问题要明确,问题 数量不宜过多。 (4)电脑辅助调查。电脑不仅可以完成调查数据的处理,而且整个调查过 程,包括问卷的设计和显示、样本设计、数据处理等也多可以由电脑来控制和完 成。电脑辅助调查也称为电脑辅助电话调查,是在电话调查时,调查的问卷、答 案都有计算机显示,整个调查过程,包括拨号、调查记录、数据处理等也都借助 于计算机来完成。 (5)座谈会。也称为集体访谈法,是将一组被调查者集中在调查现场,让 他们对对调查的主题发表意见,从而获取调查资料的方法。这种方法适用于搜集 与研究课题有密切关系的少数人员的倾向和意见。参加座谈会的人员不宜太多, 通常为6一10人,并且是所调查问题的专家或有经验的人员。 优点:取得的意见较为广泛、深入,且不会遭到拒访。 (6)个别深度访问。深度访问是一种依次只有一名受访者参加的特殊的定
性研究。它要求不断深入的受访者的思想当中,努力发掘其行为的真实动机。是 一种无结构的个人访问,常用于动机研究。 2、观察与实验。观察与实验是调查者通过直接的观察或实验获得数据的 种方法 (1)观察法。是指就调查对象的行动和意识,调查人员边观察边记录以收 集信息的方法。它是一种可代替直接发问的方法。采用此方法,常常能够在被观 察者不易觉察的情况下获得信息资料 (2)实验法。是一种特殊的观察调查方法,它是在所设定的特殊实验场所、 特殊状态下,对调查对象进行实验以取得所需资料的一种调查方法。有室内实验 法和时常实验法两种。 二、统计数据的间接来源 是指通过其他渠道获取别人调查或科学实验的第二手数据。第二手数据主要 是公开出版的或公开报道的数据,当然也有些是尚未公开的数据。还可以在网络 上获取所需要的统计数据。如… 注意:利用第二手数据对使用者米说既经济又方便,但使用时应注意统计数 据的含义、计算口径和计算方法,以避免误用或滥用。同时,在引用第二手数据 时,一定要注明数据的来源,以尊重他人的劳动成果。 第三节统计调查方案 在进行统计调查之前,需要制定一个周密、完整的调查方案,使调查得以顺 利的实施和完成。不同调查的调查方案在内容和形式上回一定的差别,但总体上 看,一个完整的统计调查方案,至少应回答或解决以下儿个方面的问题(五个“W” -个“H")。 为什么进行调查、向谁调查、调查什么、何时调查、调查何时、怎样调查。 确定调查目的 调查目的是调查所要达到的具体目标,它所回答的是为什么调查,要解决什 么样的问题,调查具有什么样的社会经济意义等。调查目的的写作要简明扼要。 如…
二、确定调查对象和调查单位 调查对象是根据调查目的确定的调查研究的总体或调查范围。调查单位是构 成调查对象的每一个单位,它是调查项目和指标的承担者或载体,是搜集数据、 分析数据的基本单位。调查对象和单位所解决的是向谁调查,由谁提供所需数据 的问题。如…。在实际调查中,调查单位可以是调查对象的全部单位,也可以 是部分单位。 三、 设计调查项目和调查表 即回答调查什么的问题,调查项目是调查的具体内容,可以是调查单位的数 量特征,业可以是调查单位的某种属性或品质特征。 调查项目通常以表格的形式来表现,称为调查表。它是用于登记调查数据的 种表格,一般由表头、表体和表外附加三部分组成。表头是调查表的名称,用 来说明调查表的内容、被调查单位的名称、性质、隶属关系等:表体是调查表的 主要部分,包括调查的具体项目:表外附加通常有填表人签名、填表日期、填表 说明等内容组成。举例。 调查表一般有单一表和一览表两种形式。 四、调查时间与调查方法 调查时间包括两个方面的涵义:一是统计资料所属的时间,路回答的是“调 查何时”的问题:另一个是统计调查的工作时间,它回答的是“何时调查”的问 题,它是一个时间段的概念,是指从搜集资料开始起,到将资料报送到调查方案 所规定的部门和机构为止的整个调查工作所需要的时间。举例。 五、调查工作的组织实施计划 调查的组织与实施工作具体包括:调查人员的选择、组织和培训:调查表格、 问卷、调查员手册的印制:必要调查工作的准备:调查经费的来源和开支预算等。 第四节统计数据的质量 一、统计数据的误差 统计数据的误差通常是指统计数据与客观实际之间的差距,误差主要有登记 性误差和代表性误差两类。 登记性误差是调查过程中由于调查者或被调查者的人为因素所造成的误差。 其中前者造成的误差主要有:调查方案中有关的规定或解释不明确导致的错误
抄录错误、汇总错误等:后者造成的登记性误差主要有:因人为因素干扰形成的 有意虚报或瞒报调查数据这种误差在统计调查中应予以特别重视。从理论上讲, 登记性误差是可以消除的。 代表性误差主要是指用样本数据进行推断时所产生的随机误差。 二、统计数据的质量要求:就一般的统计数据而言,可将其质量评价标准概 括为六个方面:1、精度,即最低的抽样误差或随机误差:2、准确性,即最小的 非抽样误差或偏差:3、关联性,即满足用户决策、管理和研究的需要:4、及时 性,即在最短的时间里取得公布数据:5、一致性,即保持时间序列的可比性:6、 最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 思考题: 1、数据的类型有哪些? 2、什么是统计调查?其在整个统计工作中的地位与作用何? 3、试述普查、重点调查、典型调查、抽样调查的区别? 4、何理解多种调查方式的结合运用?