第2章 统计数据的收集、整理与显示 学习目标 了解统计数据收集的概念,掌握统计数据的计量尺度与类型 2 了解统计数据的各种收集方法: 3、了解普查、统计报表、抽样调查、重点调查、典型调查等各种调查组织方式的特点及其应用场合: 4、掌握统计调查方案的设计内容: 5、熟练掌据统计分组的意义和方法: ,熟悉统计表和统计图的结构与绘制方法 基本概念 统计数据统计调查专门调查统计报表统计整理统计分组变量数列统计表(图) 2.1统计数据的收集 统计学是一门收集、分析、表述和解释统计数据的方法和科学,统计数据是统计科学方法应用的基 础。要正确认识客观事物的数量方面,首先必须掌握其数量事实。 2.1.1统计数据收集概述 1.统计数据的概念 我们身边随时都存在各种各样的数据:社会数据、商务与经济统计数据、自然统计数据、医学研究 数据、卫生统计数据和体有统计数据,以及网络统计数据,等等。下面试举几例加以说明。 【例21】根据第五次人口普查,2000年11月1日0点我国大陆31个省、自治区、直辖市和解放 军现役军人合计为116583万人,其中,男性人口65355万人,女性人口61228万人,平均人口密度每 平方公里132人 【例2-2】2004年财富全球五百家最大公司的前10位如表2-1。 表2-12004年财富全球五百家最大公司 总部 营业收入 排名 公司名称 所在地 主要业务 (百万美元) Wal-Mart Stores沃尔玛 关国 般商品零售 265009.0 BP英国石油 英国 炼油 232571.0 Exxon Mobil埃克套关孚 美国 炼油 223发830 Roya Dutch/Shell Group 壳牌石油 英国/荷兰 炼油 201728.0 General Motors通用汽车 美园 汽车与零件 195324.0 Ford Motor福特汽车 美国 汽车与零件 164505.0 DaimlerChrysler戴姆物克莱斯 德国 汽车与零件 15660m3 Toyota Motor 丰田汽 日木 汽车与零件 15311.0
1 第 2 章 统计数据的收集、整理与显示 学习目标 1、了解统计数据收集的概念,掌握统计数据的计量尺度与类型; 2、了解统计数据的各种收集方法; 3、了解普查、统计报表、抽样调查、重点调查、典型调查等各种调查组织方式的特点及其应用场合; 4、掌握统计调查方案的设计内容; 5、熟练掌握统计分组的意义和方法; 6、掌握频数分布,特别是变量数列的编制方法; 7、熟悉统计表和统计图的结构与绘制方法。 基本概念 统计数据 统计调查 专门调查 统计报表 统计整理 统计分组 变量数列 统计表(图) 2.1 统计数据的收集 统计学是一门收集、分析、表述和解释统计数据的方法和科学,统计数据是统计科学方法应用的基 础。要正确认识客观事物的数量方面,首先必须掌握其数量事实。 2.1.1 统计数据收集概述 1. 统计数据的概念 我们身边随时都存在各种各样的数据:社会数据、商务与经济统计数据、自然统计数据、医学研究 数据、卫生统计数据和体育统计数据,以及网络统计数据,等等。下面试举几例加以说明。 【例 21】根据第五次人口普查,2000 年 11 月 1 日 0 点我国大陆 31 个省、自治区、直辖市和解放 军现役军人合计为 116 583 万人,其中,男性人口 65 355 万人,女性人口 61 228 万人,平均人口密度每 平方公里 132 人。 【例 22】2004 年财富全球五百家最大公司的前 10 位如表 2-1。 表 2-1 2004 年财富全球五百家最大公司 排名 公司名称 总 部 所在地 主要业务 营业收入 (百万美元) 1 WalMart Stores 沃尔玛 美国 一般商品零售 263 009.0 2 BP 英国石油 英国 炼油 232 571.0 3 Exxon Mobil 埃克森美孚 美国 炼油 222 883.0 4 Royal Dutch/Shell Group 壳牌石油 英国/荷兰 炼油 201 728.0 5 General Motors 通用汽车 美国 汽车与零件 195 324.0 6 Ford Motor 福特汽车 美国 汽车与零件 164 505.0 7 DaimlerChrysler 戴姆勒克莱斯勒 德国 汽车与零件 156 602.2 8 Toyota Motor 丰田汽车 日本 汽车与零件 153 111.0
9 General Electrie通用电气 芙国 多元化公司 134187.0 10 Total道状尔 法国 炼油 118441.4 资料来源:商务部网站:小心 gov.cn/able/. 【例23】根据中华人民共和国国家统计局《中华人民共和国2003年国民经济和社会发展统计公报》: 2003年“国民经济较快增长。全年国内生产总值116694亿元,按可比价格计算,比上年增长9.1%,加 快11个百分点。其中,第一产业增加值17247亿元,增长2.5%,减慢04个百分点:第二产业增加值 61778亿元. 长1256 ,加快2.7个百分点:第三产业增加值37669亿元,增长6.7%,减慢0.8个百 分点 在第三产 业中 金融保险业增长6.9% 批发和零售贸易餐饮业增长6.6%, 房地产 业增长5.3% 【例2-4】2004年推典奥运会奖牌前6位的国家为美国、中国和俄罗斯等,详见表2-2。 表2-2 雅典奥运会金牌榜 排名 国家 银 美园 35 29 2 中国 32 17 14 3 俄罗斯 27 38 澳大利亚 17 16 16 日本 16 9 12 6 德国 14 6 18 资料米源:tp://sports.china.com/zh cn2004. 以上事例说明 统计数据时时存在,处处存在。只要存在统计数据,统计学就有用武之地。现在 我们可以对统计数据做出如下定义: 所谓统计数据就是人们对现象进行调查研究所收集、整理、分析和解释的事实和数字,是对客观现 象讲行观测、计量的结果 统计数据的搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、 有组织地向客观实际搜集资料的过程 2.统计数据的计量尺度 按照对客观事物测度的程度或精确水平来划分,可将统计数据的计量尺度从低级到高级、由粗略到 精确划分为四种。 (1)定类尺度 定类尺度又称列名尺度、列名水平或定名测定,它是按照某种屈性对客观事物进行平行分类或分组的 一种测度,是对事物的一种最粗略、计量精度最低或最基本的测度,是其他计量尺度的基础,主要用于 非参数的统计推断, 在形式上,定类尺度具有对称性和传递性两种属性,对称性说明各类之间彼此相对称,传递性则表 示运算上各类量值只具有相等与不相等的性质。 定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。例如,在人口统计中按性别分 组、文化程度分组,并用数字作为代号,如男性为01,女性为02等,可用于计算各组数值占总体数值 的比重和众数等, 不能对各类编号进行加减乘除 定类尺度的主要特征体现为:只能区分事物的类别,但无法比较类间的大小,各类别的顺序可以政 变:对事物的区分必须符合穷尽和互斥的要求:对其进行分析的统计量主要是频数或频率。 (2)定序尺度 定序尺度又称顺序尺度、有序水平或序列测定,它是把各类事物按一定特征的大小、高低、强弱等 2
2 9 General Electric 通用电气 美国 多元化公司 134 187.0 10 Total 道达尔 法国 炼油 118 441.4 资料来源:商务部网站:http://www.mofcom.gov.cn/table/500fg200401.shtml. 【例 23】 根据中华人民共和国国家统计局 《中华人民共和国 2003 年国民经济和社会发展统计公报》: 2003 年“国民经济较快增长。全年国内生产总值 116 694 亿元,按可比价格计算,比上年增长 9.1%,加 快 1.1 个百分点。其中,第一产业增加值 17 247 亿元,增长 2.5%,减慢 0.4 个百分点;第二产业增加值 61 778 亿元,增长 12.5%,加快 2.7 个百分点;第三产业增加值 37 669 亿元,增长 6.7%,减慢 0.8 个百 分点。在第三产业中,金融保险业增长 6.9%,批发和零售贸易餐饮业增长 6.6%,房地产业增长 5.3%。 ” 【例 24】2004 年雅典奥运会奖牌前 6 位的国家为美国、中国和俄罗斯等,详见表 22。 表 2-2 雅典奥运会金牌榜 排名 国家 金 银 铜 1 美国 35 39 29 2 中国 32 17 14 3 俄罗斯 27 27 38 4 澳大利亚 17 16 16 5 日本 16 9 12 6 德国 14 16 18 资料来源:http://sports.china.com/zh_cn/2004。 以上事例说明,统计数据时时存在,处处存在。只要存在统计数据,统计学就有用武之地。现在, 我们可以对统计数据做出如下定义: 所谓统计数据就是人们对现象进行调查研究所收集、整理、分析和解释的事实和数字,是对客观现 象进行观测、计量的结果。 统计数据的搜集就是根据统计研究预定的目的和任务, 运用相应的科学的调查方法与手段, 有计划、 有组织地向客观实际搜集资料的过程。 2. 统计数据的计量尺度 按照对客观事物测度的程度或精确水平来划分,可将统计数据的计量尺度从低级到高级、由粗略到 精确划分为四种。 (1)定类尺度 定类尺度又称列名尺度、 列名水平或定名测定,它是按照某种属性对客观事物进行平行分类或分组的 一种测度,是对事物的一种最粗略、计量精度最低或最基本的测度,是其他计量尺度的基础,主要用于 非参数的统计推断。 在形式上,定类尺度具有对称性和传递性两种属性,对称性说明各类之间彼此相对称,传递性则表 示运算上各类量值只具有相等与不相等的性质。 定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。例如,在人口统计中按性别分 组、文化程度分组,并用数字作为代号,如男性为 01,女性为 02 等,可用于计算各组数值占总体数值 的比重和众数等,但不能对各类编号进行加减乘除计算。 定类尺度的主要特征体现为:只能区分事物的类别,但无法比较类间的大小,各类别的顺序可以改 变;对事物的区分必须符合穷尽和互斥的要求;对其进行分析的统计量主要是频数或频率。 (2)定序尺度 定序尺度又称顺序尺度、有序水平或序列测定,它是把各类事物按一定特征的大小、高低、强弱等
顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度,如例2.2全球企业按照财 富的多少排序:再如产品按其质量高低列成一等品、二等品、三等品等。定序尺度的计量精度要优于定 米日在 它不仅可以测度类别差,而且还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘 除计算 定序尺度 中各类别的顺序不能改变 定序尺度除了可用来计量比重(频率)外,还可进行累计频数(率)、中位数等数值的计算。 (3)定距尺度 定距尺度又称间隔尺度、间隔水平或间距测定,它是对事物类别或次序之间间距进行的一种测度。 它是一种较定类尺度和定序尺度更为高级,更为结确的一种计量尺度。定距尺度的计量结果是数值, 般要求建立某种物理的量度单位,如住房面积以“平方米”计量,公路长度以“公里”计量,钢铁生产 量以“吨”计量,等等。定距尺度的每一间隔都是相等的,如公路长度每公里之间的间隔是相等的,10 公里与90公里的差距等同于90公里与80公里的差距。在运算上,除了等于、不等于、大于、小于之外 定距尺度还可进行加减运算,但不能进行乘除运算。例如可以说30℃与25℃相差5℃,且它与10℃与5 ℃之间的差距相等,但不能说10℃比5℃热一倍。 其主要特征体现为:不仅能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差 异,即可以进行加减运算,但不能计算乘除:没有绝对零点,即可以以任意 个零 起点 这里的 “ 表示一个数值,即“0”水平,而不表示“没有”或“不存在”。如温度为0度、成绩为0分,等等。 (4)定比尺度 定比尺度又称比率尺度、比较水平或比率测定,它是对事物之间比值的一种测度,可用于参数与非 参新统计推。品然与定距尺府同属干一个等级的计量尺度但其功能要比定阳尺府强一些。甚主弘 特征体现为:除能区分类别、排序 比较大小 求出大小差异、 可采用加减运算以外, 还可以进行乘 运算:具有绝对零点,即“0”表示“没有”或“不存在”。可见,定比尺度中的“0”是个没有意义的 数值。如企业数为0,表示没有企业:所有统计量均可对其进行分析。定比尺度与定距尺度的唯一区别 就在于定比尺度有绝对周定的零点,而定距尺度没有。 在计量尺度的应用中,需要注意的是,同类事物用不同的尺度量化,会得到不同的尺度数据。如。 农民收入数据按实际填写就是定距尺度:按高、中、低收入水平分就是定序尺度:按有无收入计量则是 定类尺度:而说某人的收入是 人的两倍,使是定比尺度了。再如 学生成绩按及格、不及格评定是 定类尺度:按优、良、中、及格、不及格评定是定序尺度:按具体分数评定是定序尺度。而平均成绩则 是定比尺度。 一般地,因为研究的目的和内容不同,计量尺度也会不同。如果不担心损失信息量,就可以降低度 量层次。我们将数据的计量或测度尺度归纳如下表。 表2-3 统计数据的计量尺度 计量尺度 特 王要数据特证 运算功能 应用举例 定类尺度 分 计数 产业分类 (列名尺度 组 企业等级 分 (有 (间隔水平 量的差距 加减 总量指标 4。定比尺府 分类 + 计数 品销售额 (比率尺度) 排序 排疗 相对指标 (比较水平) 量的差距 加减 有绝对零点 乘除 3.统计数据的类型
3 顺序排列起来,构成定序数据。它是对事物之间等级或顺序差别的一种测度,如例 2.2 全球企业按照财 富的多少排序;再如产品按其质量高低列成一等品、二等品、三等品等。定序尺度的计量精度要优于定 类尺度。它不仅可以测度类别差,而且还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘 除计算。与定类尺度不同,定序尺度中各类别的顺序不能改变。 定序尺度除了可用来计量比重(频率)外,还可进行累计频数(率)、中位数等数值的计算。 (3)定距尺度 定距尺度又称间隔尺度、间隔水平或间距测定,它是对事物类别或次序之间间距进行的一种测度。 它是一种较定类尺度和定序尺度更为高级,更为精确的一种计量尺度。定距尺度的计量结果是数值,一 般要求建立某种物理的量度单位,如住房面积以“平方米”计量,公路长度以“公里”计量,钢铁生产 量以“吨”计量,等等。定距尺度的每一间隔都是相等的,如公路长度每公里之间的间隔是相等的,100 公里与 90 公里的差距等同于 90 公里与 80 公里的差距。在运算上,除了等于、不等于、大于、小于之外, 定距尺度还可进行加减运算,但不能进行乘除运算。例如可以说 30℃与 25℃相差 5℃,且它与 10℃与 5 ℃之间的差距相等,但不能说 10℃比 5℃热一倍。 其主要特征体现为:不仅能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差 异,即可以进行加减运算,但不能计算乘除;没有绝对零点,即可以以任意一个零为起点。这里的“零” 表示一个数值,即“0”水平,而不表示“没有”或“不存在”。如温度为 0 度、成绩为 0 分,等等。 (4)定比尺度 定比尺度又称比率尺度、比较水平或比率测定,它是对事物之间比值的一种测度,可用于参数与非 参数统计推断。虽然它与定距尺度同属于一个等级的计量尺度,但其功能要比定距尺度强一些,其主要 特征体现为:除能区分类别、排序、比较大小、求出大小差异、可采用加减运算以外,还可以进行乘除 运算;具有绝对零点,即“0”表示“没有”或“不存在”。可见,定比尺度中的“0”是个没有意义的 数值。如企业数为 0,表示没有企业;所有统计量均可对其进行分析。定比尺度与定距尺度的唯一区别 就在于定比尺度有绝对固定的零点,而定距尺度没有。 在计量尺度的应用中,需要注意的是,同类事物用不同的尺度量化,会得到不同的尺度数据。如, 农民收入数据按实际填写就是定距尺度;按高、中、低收入水平分就是定序尺度;按有无收入计量则是 定类尺度;而说某人的收入是另一人的两倍,便是定比尺度了。再如,学生成绩按及格、不及格评定是 定类尺度;按优、良、中、及格、不及格评定是定序尺度;按具体分数评定是定序尺度。而平均成绩则 是定比尺度。 一般地,因为研究的目的和内容不同,计量尺度也会不同。如果不担心损失信息量,就可以降低度 量层次。我们将数据的计量或测度尺度归纳如下表。 表 2-3 统计数据的计量尺度 计量尺度 特 征 主要数据特征 运算功能 应用举例 1、定类尺度 (列名尺度) 分类 分组 = ≠ 计数 产业分类 2、定序尺度 (顺序尺度) (有序水平) 分类 排序 > < 计数 排序 企业等级 分位数 众数 3、定距尺度 (间隔尺度) (间隔水平) 分类 排序 量的差距 + - 计数 排序 加减 产品质量 差异 总量指标 4、定比尺度 (比率尺度) (比较水平) 分类 排序 量的差距 有绝对零点 + - × ÷ 计数 排序 加减 乘除 商品销售额 相对指标 3. 统计数据的类型
(1)品质数据和数量数据 根据数据反映的现象的特征不同,可以归结为两类,一类称作品质数据,亦称定性数据,是用于鉴 别每一个个体品质的标记或名称,用来说明现象品质特征的。数据有数值型数据和非数值型数据两种: 性数一船是非勒值利勒报 ,并且用文字表现。但是,为了便于计算机处理,有时也对定性数据赋值 用数值作为标签来表现(数值仅仅作为标签 不能用于计算)。如居民身份证号码是一组数值,但这一麦 据却是品质数据,因其是鉴别特定个人的实质性标志, 品质数据是由定类尺度和定序尺度计量所形成的数据,其中定类尺度和定序尺度相当于通常所说的 品质标志。 另一类数据称作数最数据,亦称定量数据,它是用来说明现象数量特征的,用数值来表现,这种数 值可以进行算术计算。这类数据是由定距尺度和定比尺度计量所形成的数据, 其中,定距尺度和定比 度相当于通常所说的数量标志及数量指标。 (2)静态杰数据和动杰数据 根据数据反映的现象的时间不同,可以将数据分为静态数据和动态数据。静态数据是指在相同或近 似相同的时间点上收集的数据,位描术现象在同一时间点上的麦现。如2004年底各省人口数、2004年 各地区投资额就是静态数据。动态数据是在不同时间上收集的数据, 它描述现象随时间而变化的表现 如历年年底各省人口数、1990 2004年投资额就属于动态数据。 (3)观察数据和试验数据 根据数据的收集方法,可以将数据分为观察数据和实验数据。观察数据指没有对现象进行人为控制 的条件下,通过调查或观测而得到的数据。如有关社会经济的统计数据基本上是观察数据。而在实验中 通过控制实验对象而收集到的数据便称为实验数据,如新药物实验,医学、卫生以及自然科学的大多数 数据都是实验数据, (4)直接数据和间接数据 根据数据的来源渠道,可以将数据分为直接数据和间接数据。研究者直接对研究对象进行调查、观 测和实验所获得的数据称为直接数据,也称为原始数据,实验数据就属于直接数据。研究者根据研究目 的所收集的己经加工整理过的数据为间接数据。如人们对政府统计数据的应用就属于间接数据的利用。 2.1.2统计数据的收集方法 各种数据的收集方法会因为时间、空间、经费、人员数量、研究条件和被研究现象的特性等因素而 不同,要选择适当的方法。直接数据的收集方法,常用的有直接观察法、报告法(通讯法)、采访法、实 验设计调查法等方法 1.直接观察法 直接观察法是指由调查人员到现场对调查对象进行观察点数和计量。通常在科学实验中根据仪表读 出所需数据、各种产品检验、身体检查、人流量、交通流量、货架商品的价格标示都是直接观察。 2.报告法(通讯法) 报告法也称为通讯法 一般是由统计工作机构将调查表格通过邮电、网络发给或传给被调查者,被 调查者根据填报的要求将填好的调查表格寄回或发回。我围现行的统计报表制度采用的正是该种方法 3.采访法 采访法是根据被调查者的答复来搜集数据。这种方法可分为口头询问法和被调查者自填法两种。 (1)口头询问法 口头淘问法是由调查人员对被调查者逐一采访,逐顶填答,它又有人品采访法和申话采访法两种 a人员采访法。 人员采访法的运用方式是派出访问员直接面对面采访被调查人, 当面询问问题以 集所需数据资料,该法适用于需要和受访者深入讨论的问题的数据收集。因为访问员和被调查人直接接 触,被调查人将很认真地回答,所以用这种方法获得的资料的可信度是很高的。 b.电话采访法。电话采访法是访员按照电话号码簿上刊载的电话用户资料,以随机抽取样本的方式 4
4 (1)品质数据和数量数据 根据数据反映的现象的特征不同,可以归结为两类,一类称作品质数据,亦称定性数据,是用于鉴 别每一个个体品质的标记或名称,用来说明现象品质特征的。数据有数值型数据和非数值型数据两种, 定性数据一般是非数值型数据,并且用文字表现。但是,为了便于计算机处理,有时也对定性数据赋值, 用数值作为标签来表现(数值仅仅作为标签,不能用于计算)。如居民身份证号码是一组数值,但这一数 据却是品质数据,因其是鉴别特定个人的实质性标志。 品质数据是由定类尺度和定序尺度计量所形成的数据,其中定类尺度和定序尺度相当于通常所说的 品质标志。 另一类数据称作数量数据,亦称定量数据,它是用来说明现象数量特征的,用数值来表现,这种数 值可以进行算术计算。这类数据是由定距尺度和定比尺度计量所形成的数据,其中,定距尺度和定比尺 度相当于通常所说的数量标志及数量指标。 (2)静态数据和动态数据 根据数据反映的现象的时间不同,可以将数据分为静态数据和动态数据。静态数据是指在相同或近 似相同的时间点上收集的数据,它描述现象在同一时间点上的表现。如 2004 年底各省人口数、2004 年 各地区投资额就是静态数据。动态数据是在不同时间上收集的数据,它描述现象随时间而变化的表现。 如历年年底各省人口数、1990~2004 年投资额就属于动态数据。 (3)观察数据和试验数据 根据数据的收集方法,可以将数据分为观察数据和实验数据。观察数据指没有对现象进行人为控制 的条件下,通过调查或观测而得到的数据。如有关社会经济的统计数据基本上是观察数据。而在实验中 通过控制实验对象而收集到的数据便称为实验数据,如新药物实验,医学、卫生以及自然科学的大多数 数据都是实验数据。 (4)直接数据和间接数据 根据数据的来源渠道,可以将数据分为直接数据和间接数据。研究者直接对研究对象进行调查、观 测和实验所获得的数据称为直接数据,也称为原始数据,实验数据就属于直接数据。研究者根据研究目 的所收集的已经加工整理过的数据为间接数据。如人们对政府统计数据的应用就属于间接数据的利用。 2.1.2 统计数据的收集方法 各种数据的收集方法会因为时间、空间、经费、人员数量、研究条件和被研究现象的特性等因素而 不同,要选择适当的方法。直接数据的收集方法,常用的有直接观察法、报告法(通讯法)、采访法、实 验设计调查法等方法。 1.直接观察法 直接观察法是指由调查人员到现场对调查对象进行观察点数和计量。通常在科学实验中根据仪表读 出所需数据、各种产品检验、身体检查、人流量、交通流量、货架商品的价格标示都是直接观察。 2.报告法(通讯法) 报告法也称为通讯法。一般是由统计工作机构将调查表格通过邮电、网络发给或传给被调查者,被 调查者根据填报的要求将填好的调查表格寄回或发回。我国现行的统计报表制度采用的正是该种方法。 3.采访法 采访法是根据被调查者的答复来搜集数据。这种方法可分为口头询问法和被调查者自填法两种。 (1)口头询问法 口头询问法是由调查人员对被调查者逐一采访,逐项填答,它又有人员采访法和电话采访法两种。 a.人员采访法。人员采访法的运用方式是派出访问员直接面对面采访被调查人,当面询问问题以搜 集所需数据资料,该法适用于需要和受访者深入讨论的问题的数据收集。因为访问员和被调查人直接接 触,被调查人将很认真地回答,所以用这种方法获得的资料的可信度是很高的。 b.电话采访法。电话采访法是访员按照电话号码簿上刊载的电话用户资料,以随机抽取样本的方式
抽出代表样本,然后再打电话进行问卷访问的一种调查方式,此法最适用于题目少且容易回答的问卷调 查。由于不易获得受访者的合作,通常不能询问较为复杂的内容。 (2)被调待者白填法 被调查者自填法 即调查人员把调查表或问卷交给被调查者 ,向被调查者说明填表的要求和方法 并对有关注意事项加以解释,由被调查者按实际情况一 一填写,填好后交调查人员审核收回,该法适用 于需要较长时间思考且样本较大的情况。 4.登记法 登记法是由有关的组织机物发出通告,规定当虫人在某事发生后到该机构进行登记,填写所需登记 的材料。如人口的出生和死亡统计及流动人口统计就是采用规定当事人到公安机构登记的方法。 5.实验设计调查法 实验设计调查法是设计一种统计实验(试验),根据某些可以控制的因素的变化以得到关于这些因素 对研究的变量的影响的信息。而将那些控制因素以外的条件保持不变,或将控制因素以外的其他因素的 影响用随机化的方法加以平衡抵消。例如F,".Taylor的科学管理理论中的工作定额原理,就是用实验设 计调查法获得工人合理的日工作量的溶料的, 实验设计调查法常常用于瘦集某一新 、新工艺或新方法使用效果的测试数据 般地,对于可 以通过科学实验取得数据资料的,采用实验设计调查法,而对于无法通过科学实验取得数据资料的,如 社会现象则应用大量观察法。 在现代信息技术高速发展的今天,计算机、网络、光电技术、卫星遥感、地理信息系统等高新技术 已经或正在被广泛地引入数据收集领域,产生一些新的数据收集方法。如上述各种方法都可以与网络相 结合,形成网络调查。再如,利用卫星遥感技术可以了解矿产资源的分布状况。 各种调查方法各有长短,要根据实际情况选择采用。 2.1.3统计调查的组织形式 直接数据的收集称为统计调查。统计调查的组织形式是指组织搜集数据信息资源的方式方 统计 调查的组织形式多种多样,按调查的 范围划分 可分为全面调查和非全面调查两大类 全面调 查是对调查对象的所有单位 进行调查。非全面调查是对调查对象其中的一部分单位进行调查,以取 得调查对象的一部分资料,用来推断总体或反映总体的基本情况。 按照时间标志,统计调查可分为连续性(经常性)调查和不连续性(一次性)调查。连续性(经常 件)调查是指随若研究现象的恋化,连续不断地讲行调查香记。如重占企业的生产日报表,诚是每日连 续地调查。不连续性(一次性)调查是指间限 一段较长的时间对事物的变化进行一次性调查。如我国目 前的各种普查,许多都是每十年进行一次。 按照组织形式,统计调查可分为定期报表和专门调查。定期报表制度指按国家统一规定的表式和内 容,定期地向各级领导机构报送统计资料的一种形式。专门调查是为某一专题研究而组织的专项调查。 根据相关的标志分类,统计调查的形式如图2一1所示。 以下我们分别介绍具体的统计调查形式: 1.普查 普查是专门组织的一种全面调查。普查一般是调查属于一定时点上的社会经济现象的总量,但也可 以调查某些时期现象的总量,乃至调查一些并非总量的指标。它主要是用以搜集某些不能或不宜用定期 报表搜集的统计济料。对国情国力的调查一般采用警查。普查涉及面广,指标多,工作量大,时间性强 它是非经常性的调查,一般间隔较长的时间才进行一次。第二,它是 一种全面调查,它比任 一种调查形式更能掌握大量、 详细、 全面的统计资料 普查的组织形式有两种,一种是经过组织的普查机构,配备一定数量的普查人员,对调查单位直接 进行登记,如我国人口普查就是采用这种形式。另一种是利用调查单位的原始记录和核算资料,结合 清库盘点,由调查单位自行填报调查表格,如我国物资库存普查就是采用这种形式
5 抽出代表样本,然后再打电话进行问卷访问的一种调查方式,此法最适用于题目少且容易回答的问卷调 查。由于不易获得受访者的合作,通常不能询问较为复杂的内容。 (2)被调查者自填法 被调查者自填法,即调查人员把调查表或问卷交给被调查者,向被调查者说明填表的要求和方法, 并对有关注意事项加以解释,由被调查者按实际情况一一填写,填好后交调查人员审核收回,该法适用 于需要较长时间思考且样本较大的情况。 4.登记法 登记法是由有关的组织机构发出通告,规定当事人在某事发生后到该机构进行登记,填写所需登记 的材料。如人口的出生和死亡统计及流动人口统计就是采用规定当事人到公安机构登记的方法。 5.实验设计调查法 实验设计调查法是设计一种统计实验 (试验), 根据某些可以控制的因素的变化以得到关于这些因素 对研究的变量的影响的信息。而将那些控制因素以外的条件保持不变,或将控制因素以外的其他因素的 影响用随机化的方法加以平衡抵消。 例如 F.W.Taylor 的科学管理理论中的工作定额原理, 就是用实验设 计调查法获得工人合理的日工作量的资料的。 实验设计调查法常常用于搜集某一新产品、新工艺或新方法使用效果的测试数据。一般地,对于可 以通过科学实验取得数据资料的,采用实验设计调查法,而对于无法通过科学实验取得数据资料的,如 社会现象则应用大量观察法。 在现代信息技术高速发展的今天,计算机、网络、光电技术、卫星遥感、地理信息系统等高新技术 已经或正在被广泛地引入数据收集领域,产生一些新的数据收集方法。如上述各种方法都可以与网络相 结合,形成网络调查。再如,利用卫星遥感技术可以了解矿产资源的分布状况。 各种调查方法各有长短,要根据实际情况选择采用。 2.1.3 统计调查的组织形式 直接数据的收集称为统计调查。统计调查的组织形式是指组织搜集数据信息资源的方式方法。 统计调查的组织形式多种多样,按调查的范围划分,可分为全面调查和非全面调查两大类。全面调 查是对调查对象的所有单位一一进行调查。非全面调查是对调查对象其中的一部分单位进行调查,以取 得调查对象的一部分资料,用来推断总体或反映总体的基本情况。 按照时间标志,统计调查可分为连续性(经常性)调查和不连续性(一次性)调查。连续性(经常 性)调查是指随着研究现象的变化,连续不断地进行调查登记。如重点企业的生产日报表,就是每日连 续地调查。不连续性(一次性)调查是指间隔一段较长的时间对事物的变化进行一次性调查。如我国目 前的各种普查,许多都是每十年进行一次。 按照组织形式,统计调查可分为定期报表和专门调查。定期报表制度指按国家统一规定的表式和内 容,定期地向各级领导机构报送统计资料的一种形式。专门调查是为某一专题研究而组织的专项调查。 根据相关的标志分类,统计调查的形式如图 2 - 1 所示。 以下我们分别介绍具体的统计调查形式: 1.普查 普查是专门组织的一种全面调查。普查一般是调查属于一定时点上的社会经济现象的总量,但也可 以调查某些时期现象的总量,乃至调查一些并非总量的指标。它主要是用以搜集某些不能或不宜用定期 报表搜集的统计资料。对国情国力的调查一般采用普查。普查涉及面广,指标多,工作量大,时间性强。 普查有两个主要特点,第一,它是非经常性的调查,一般间隔较长的时间才进行一次。第二,它是 一种全面调查,它比任何一种调查形式更能掌握大量、详细、全面的统计资料。 普查的组织形式有两种,一种是经过组织的普查机构,配备一定数量的普查人员,对调查单位直接 进行登记,如我国人口普查就是采用这种形式。 另一种是利用调查单位的原始记录和核算资料,结合 清库盘点,由调查单位自行填报调查表格,如我国物资库存普查就是采用这种形式
为了摸清、掌握重大国情国力基本情况而专门组织的普查,我国己经实施过的有人口普查、基本单 位普查、工业普查、农业普查、第三产业普查和经济普查等。普查为各级政府制定国民经济和社会发展 规划、出台政簧措施等提供参考依据:普查也是其他统计调杏方法顺利开展的基础,它为其他调查确定 2.统计报表制瘦 统计报表制度是我国统计调查方法体系中的一种重要的组织方式。它是根据国家的统一规定,按统 一的表格形式,统一的指标内容,统一的报送时间,自上而下逐级提供统计资料的统计报告制度。统计 报表制度具备统一性、时效性、全面性、可靠性的特点,可以满足各级管理层次的需要。 统计报表的优占有.第一,报表溶赵的来源是建立在冬个其层已单位的原始记录的基础上,其层单品 可利用其资料对生产 经营活动进行监督管理。第二,由于统计报表是逐级上报和汇总的 各级领导剖 门能获得管辖范用内的报表资料,了解本地区、本部门的经济和社会发展情祝。第三,由于统计报表是 属于经常性(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。 统计报表包括全面报表与非全面报表。全面统计报表的实施范围是调查对象的全部单位。非全面统 计报表的实施范围只要求调查对象中的部分单位填报。 我国的全面统计报表经过儿十年的推广应用,已建立相当稳周、扎实的基础 3.抽样调查 抽样调查是一种非全面调查。它是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然 后根据样本数据推断现象的总体特征。 抽样调杳特点如下:第一,随机抽样。抽样册查按照随机原侧则抽取样本单位,排除了主观因素对选 样的影响,总体中每一个单位都有一定的概率被抽中。第二,部分推断总体。抽样调查根据对总体中剖 分个体的调查数据对调查对象总体的数量特征做出估计。根据数理统计的原理,抽样调查中样本指标和 相对应的总体指标之间存在着内在联系,而且两者的误差分布也是有规律可循的,因而提供了用实际调 查所得的部分信息以推断总体数量特征的科学方法。第三,抽样误差可以事先计算并加以控制。以样本 数据推算总体数量特征,不可避免地会产生误差。但这种误差与其他统计估算所产生的误差不同,它可 以根据有关数据事先加以计算,并且通过一定的方法来控制误差的范围,以保证抽样推断结果达到预期 的可靠程疫】 抽样调查的适用范围主要有:第一,对一些不可能或不必要进行全面调查的社会现象,采用抽样调 查。例如,子弹射程、电灯的使用寿命的检验等,属于破坏性检验,不可能毁坏所有的产品而鉴定其质 量,只能采用抽样调查。第二,对普查资料进行必要的修正。由于普查涉及面广,工作量大,容易产生 香记误差 -出现重复登记或遗漏现象。诵常,可以在普查开始之后,作一次小规模的抽样调杳,将抽 样调查的结果同原来的普查资料进行核对,计算出差错(重复或遗漏)比率,然后以此作为修订系数 对普查资料进行必要的修正。在复查工作完毕之后,还可利用抽样法对普查质量进行检查 抽样调查必须遵循以下原则:第一是随机原则,所谓随机的原则就是要使所有调查单位都有同样的 被抽取的概率。只有按随机原则抽取调查单位,才能保证抽样方法符合概率论和数理统计有关定理的要 求,从而才能运用这些定理去进行推断。第二是最大抽样效果原则。所谓最大的抽样效果,就是在既定 的调查费用下使抽样估计误差最小,或者是在给定的精确度下,使调查费用最少。调查费用是从人力、 物力、财力等方面保证调查工作的顺利进行的物质基础 一般说米 ,提高抽样调查结果的精确度与节省 调查费用的要求往往是矛盾的,抽样误差要求愈小,调查费用要求就愈大。从经济角度看,并非任何 种抽样误差最小的方案就是最优的方案。因此,为遵循上述原则, 一般要求在给定的误差条件下,选择 费用最省的抽样设计方案。 随若社会主义市场经济的建立与完善,抽样调查在我国统计调查中的应用领域越来越广泛。目前 我国三支调查队的专业调查任务基本上都是使用抽样调查方法来完成 4.重点调查 重点调查是指在调查对象中,只选择少数重点单位进行的非全面调查。所谓重点单位,是若眼于现 象的量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有 6
6 为了摸清、掌握重大国情国力基本情况而专门组织的普查,我国已经实施过的有人口普查、基本单 位普查、工业普查、农业普查、第三产业普查和经济普查等。普查为各级政府制定国民经济和社会发展 规划、出台政策措施等提供参考依据;普查也是其他统计调查方法顺利开展的基础,它为其他调查确定 调查范围等提供原始资料。 2.统计报表制度 统计报表制度是我国统计调查方法体系中的一种重要的组织方式。它是根据国家的统一规定,按统 一的表格形式,统一的指标内容,统一的报送时间,自上而下逐级提供统计资料的统计报告制度。 统计 报表制度具备统一性、时效性、全面性、 可靠性的特点,可以满足各级管理层次的需要。 统计报表的优点有:第一,报表资料的来源是建立在各个基层单位的原始记录的基础上,基层单位 可利用其资料对生产、经营活动进行监督管理。第二,由于统计报表是逐级上报和汇总的,各级领导部 门能获得管辖范围内的报表资料,了解本地区、本部门的经济和社会发展情况。第三,由于统计报表是 属于经常性(连续性)调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。 统计报表包括全面报表与非全面报表。全面统计报表的实施范围是调查对象的全部单位。非全面统 计报表的实施范围只要求调查对象中的部分单位填报。 我国的全面统计报表经过几十年的推广应用,已建立相当稳固、扎实的基础。 3.抽样调查 抽样调查是一种非全面调查。它是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然 后根据样本数据推断现象的总体特征。 抽样调查特点如下:第一,随机抽样。抽样调查按照随机原则抽取样本单位,排除了主观因素对选 样的影响,总体中每一个单位都有一定的概率被抽中。第二,部分推断总体。抽样调查根据对总体中部 分个体的调查数据对调查对象总体的数量特征做出估计。根据数理统计的原理,抽样调查中样本指标和 相对应的总体指标之间存在着内在联系,而且两者的误差分布也是有规律可循的,因而提供了用实际调 查所得的部分信息以推断总体数量特征的科学方法。第三,抽样误差可以事先计算并加以控制。以样本 数据推算总体数量特征,不可避免地会产生误差。但这种误差与其他统计估算所产生的误差不同,它可 以根据有关数据事先加以计算,并且通过一定的方法来控制误差的范围,以保证抽样推断结果达到预期 的可靠程度。 抽样调查的适用范围主要有:第一,对一些不可能或不必要进行全面调查的社会现象,采用抽样调 查。例如,子弹射程、电灯的使用寿命的检验等,属于破坏性检验,不可能毁坏所有的产品而鉴定其质 量,只能采用抽样调查。 第二,对普查资料进行必要的修正。由于普查涉及面广,工作量大,容易产生 登记误差——出现重复登记或遗漏现象。通常,可以在普查开始之后,作一次小规模的抽样调查,将抽 样调查的结果同原来的普查资料进行核对,计算出差错(重复或遗漏)比率,然后以此作为修订系数, 对普查资料进行必要的修正。在复查工作完毕之后,还可利用抽样法对普查质量进行检查。 抽样调查必须遵循以下原则:第一是随机原则,所谓随机的原则就是要使所有调查单位都有同样的 被抽取的概率。只有按随机原则抽取调查单位,才能保证抽样方法符合概率论和数理统计有关定理的要 求,从而才能运用这些定理去进行推断。第二是最大抽样效果原则。所谓最大的抽样效果,就是在既定 的调查费用下使抽样估计误差最小,或者是在给定的精确度下,使调查费用最少。调查费用是从人力、 物力、财力等方面保证调查工作的顺利进行的物质基础。一般说来,提高抽样调查结果的精确度与节省 调查费用的要求往往是矛盾的,抽样误差要求愈小,调查费用要求就愈大。从经济角度看,并非任何一 种抽样误差最小的方案就是最优的方案。因此,为遵循上述原则,一般要求在给定的误差条件下,选择 费用最省的抽样设计方案。 随着社会主义市场经济的建立与完善,抽样调查在我国统计调查中的应用领域越来越广泛。目前, 我国三支调查队的专业调查任务基本上都是使用抽样调查方法来完成。 4.重点调查 重点调查是指在调查对象中,只选择少数重点单位进行的非全面调查。所谓重点单位,是着眼于现 象的量的方面而言,尽管这些单位在全部单位中只是一部分,但它们在所研究现象的标志总量中却占有
绝大的比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标 志总量方面的其本情况。 重点单位的确定, 是组织重占调查的一个重要问题。选取重占单位应道活两个百则, 一是要根据调 查任务的要求利和 调查对象的基木情祝而确定选取的重点单位及数国 般米讲 要求重点单位应尽可 少,而其标志值在总体中所占的比重应尽可能大,以保证有足够的代表性:二是要注意选取那些管理比 较健全、业务力量较强、统计工作基础较好的单位作为重点单位。 一般地说,当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,采用重 点调查比较话宜 重点调查的特点是省时、省力,能反映总体的基本情况。能否开展重点调查是由调查任务和调查为 象特点所决定的。当调查任务只在于反映调查总体的主要情况或基本趋势,而且调查对象中又确实存在 重点单位时,方可实施。重点调查通常用于不定期的一次性调查,但有时也用于经常性的连续调查。 5.典型调查 典型调查是从众多的调查研究对象中,有意识地选择若干个具有代表性的典型单位进行深入、周密 系统地调查研究。进行典型调查的主要目的不在于取得社会经济现象的总体数值,而在于了解与有关数 字相关的生动具体情况 典型调查的优点在于调查范围小、调查单位少、灵活机动、具体深入、节省人力、财力和物力等。 其不足是在实际操作中选择真正有代表性的典型单位比较困难,而且还容易受人为因素的干扰,从而可 能会导致调查的结论有一定的倾向性,且典型调查的结果一般情况下不易用以推算全面数字。 典刑调杏有两种类型,一种县解别麻雀刑,即对个别典别单位的谓查研究。在这种典利调查中,具 需在总体中选出少数几个典型单位,通过对这几个典型单位的调查研究,用以说明事物的 般情况或事 物发展的一般规律。第二种是具有统计特征的划类选典调查,即将调查总体划分为若干类,再从每类中 选择若干个典型进行调查,以说明各类的情况。 典型调查的作用主要有两个方面,一是在特定的条件下用于对数据的质量检查:二是了解与数字相 关的生动具体情况。 典型调查可以弥补其它调查方法的不足,为数字资料补充丰富的典型情况,在有些情况下,可用典 型调查估算总体数字或验证全面调查数字的真实性 典型调查和全面统计结合,既可以掌握全面情况,又具有典型材料,为分析问题、解决问题提供了 丰富生动的资料。 全面调查 统计报表 调查 普 荒围 抽样调查 非全面调查 重点调查 典型调查 统计调查形式 调查 连续经常性)调查 时间 周期性调查 不连续调查 一一次性调查 定期报表 普查 抽样调查 专门调查 」重点调查 典型调查 图21 统计调查形式示意图
7 绝大的比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标 志总量方面的基本情况。 重点单位的确定,是组织重点调查的一个重要问题。选取重点单位应遵循两个原则,一是要根据调 查任务的要求和调查对象的基本情况而确定选取的重点单位及数量。一般来讲,要求重点单位应尽可能 少,而其标志值在总体中所占的比重应尽可能大,以保证有足够的代表性;二是要注意选取那些管理比 较健全、业务力量较强、统计工作基础较好的单位作为重点单位。 一般地说,当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,采用重 点调查比较适宜。 重点调查的特点是省时、省力,能反映总体的基本情况。能否开展重点调查是由调查任务和调查对 象特点所决定的。当调查任务只在于反映调查总体的主要情况或基本趋势,而且调查对象中又确实存在 重点单位时,方可实施。重点调查通常用于不定期的一次性调查,但有时也用于经常性的连续调查。 5.典型调查 典型调查是从众多的调查研究对象中, 有意识地选择若干个具有代表性的典型单位进行深入、 周密、 系统地调查研究。进行典型调查的主要目的不在于取得社会经济现象的总体数值,而在于了解与有关数 字相关的生动具体情况。 典型调查的优点在于调查范围小、调查单位少、灵活机动、具体深入、节省人力、财力和物力等。 其不足是在实际操作中选择真正有代表性的典型单位比较困难,而且还容易受人为因素的干扰,从而可 能会导致调查的结论有一定的倾向性,且典型调查的结果一般情况下不易用以推算全面数字。 典型调查有两种类型:一种是解剖麻雀型,即对个别典型单位的调查研究。在这种典型调查中,只 需在总体中选出少数几个典型单位,通过对这几个典型单位的调查研究,用以说明事物的一般情况或事 物发展的一般规律。 第二种是具有统计特征的划类选典调查,即将调查总体划分为若干类,再从每类中 选择若干个典型进行调查,以说明各类的情况。 典型调查的作用主要有两个方面,一是在特定的条件下用于对数据的质量检查;二是了解与数字相 关的生动具体情况。 典型调查可以弥补其它调查方法的不足,为数字资料补充丰富的典型情况,在有些情况下,可用典 型调查估算总体数字或验证全面调查数字的真实性。 典型调查和全面统计结合,既可以掌握全面情况,又具有典型材料,为分析问题、解决问题提供了 丰富生动的资料。 图 2-1 统计调查形式示意图 统计报表 普 杳 抽样调查 重点调查 典型调查 周期性调查 一次性调查 普 查 抽样调查 重点调查 典型调查 全面调查 非全面调查 连续(经常性)调查 不连续调查 定期报表 专门调查 调 查 范围 调 查 时间 组 织 形式 统 计 调 查 形 式
2.1.4统计调查体系 不同的统计调查的方式方法,各有其特点和作用。在实际工作中,并非单用一种方式方法,而是 种方式方法的结合运用。这是因为:①国民经济和社会发展情况复杂,国民经济门类众多,必须应用 多种多样的统计调查方法,才能搜集到丰富的统计资料:②任何一种统计调查方法,都有它的优越性 与局限性,各有不同的实施条件,只用一种统计调查方法 不能满足多种需要 统计调查体系是指若干相互联系的统计调查方法所构成的整体。对于复杂的经济、社会现象,要了 解其数量变化情况,客观上需要区别不同的研究对象和研究目的,采取不同的调查方法。 长期以米,我国政府统计系统所使用的统计调查体系主要是以全面报表制度为基础,适当辅之以抽 样调查、普查和重点调查等方法。该体系是按照高度集中的计划经济体制和分级管理的要求建立起来的。 改革开放以来,随若社会主义市场经济的发展,一方面,社会经济现象空前复杂化,统计调查对象的期 模迅猛扩展,三资企业、私营经济、个体经济等多种经济成分迅速发展,给准确把握统计口径带来困难 一方面,统计调查对象的构成日趋复杂 不仅多种经济成分同时并存,而且国有经济中也出现了承包 经营、租赁经营等多种经营形式,特别是随着现代企业制度的建立和产权的流动与重组,不同所有制的 经济主体投资于同一企业的状况日趋扩大、混合所有制的经济单位越来越多,训练有素的基层统计人员 日显匮乏。由于利益格局的变化很大,被调查者对统计调查的合作与支持程度降低,统计信息在采集过 程中的人为干扰现象增多,信息失真的风险性增大。这些都使得以全面统计报表为主的调查体系越来越 难以满足 府与社会公众的 对统计信息的需求 近年来,为了适应国民经济和社会主义市场经济发展的需要,在总结统计调查实践经验的基础上 按照社会主义市场经济的要求,借鉴国际上成功的作法,对历史上形成的传统的统计调查方法体系进行 了一系列的改革。全面报表制度的基础地位有所削弱,而抽样调查和重点调查等方法日益得广泛应用。 目前,我国建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、 科学推算和部分全面报表综合运用的统计调查方法体系 一统计调查体系中, 普查是基础 这是因为只有通过普查,才能收集到全面和详细的数据,同 时为开展抽样调查和统计推断提供必要的基础资料。但是,由于普查要耗费大量的人力、物力、财力和 时间,无法及时反映社会经济现象日新月异的变化状况,因此,对大量的社会经济现象,必须采用抽样 调查方式才能及时地捕获各类信息。抽样调查调查单位少,可以由经过专门训练的人员去完成,同时也 便于对某一社会经济现象进行更深入的研究,这样既可以节省调查费用又可以满足统计时效和统计数据 质量的要求。 所以 新的统计调查体系要以经常性的抽样调查为主体。重点调查、典型调查和统计报表 是我国过去统计实践中常用的方式,在新形势下也仍可发挥一定的作用。 在目前的统计调查体系中,还要采用科学的推算方法。所谓统计推算,是在不可能或不必直接通过 调查取得资料的情况下,根据已掌握的资料,运用各种统计方法进行科学的估计推算,以间接方式取得 所需的资料。统计推算若是对同一时期内的末知项所作的推算,属于静态推算:若是针对未来的时期 作的推 属于动态 计推算的内容主要包括:从 个现象推算 现象,从局部推算总体 现在推算未来。统计推算的方法主要有:比例推算法,因素估算法,平衡估算法,线性插值法,拉格朗 日插值法及各种动态数列的预测方法等。 总而言之,在统计调查中,应根据调查的目的和调查对象的特点,灵活地选用不同的调查方式,以 及时、准确地获得各种不同的信息。 2.15统计数据收集方案设计 统计数据收集也就是人们常说的统计调查,指根据研究目的和任务,运用利学的调查方法与手段 有计划、有组织地向客观实际 采集数据的过程。 统计数据收集是统计研究的基础阶段。 进行统计研究必 须通过恰当的数据收集来获得合适的统计数据,为此,必须进行统计数据收集方案的设计 1.明确调查目的 -why 8
8 2.1.4 统计调查体系 不同的统计调查的方式方法,各有其特点和作用。在实际工作中,并非单用一种方式方法,而是多 种方式方法的结合运用。这是因为: ① 国民经济和社会发展情况复杂,国民经济门类众多,必须应用 多种多样的统计调查方法,才能搜集到丰富的统计资料; ② 任何一种统计调查方法,都有它的优越性 与局限性,各有不同的实施条件,只用一种统计调查方法,不能满足多种需要。 统计调查体系是指若干相互联系的统计调查方法所构成的整体。对于复杂的经济、社会现象,要了 解其数量变化情况,客观上需要区别不同的研究对象和研究目的,采取不同的调查方法。 长期以来,我国政府统计系统所使用的统计调查体系主要是以全面报表制度为基础,适当辅之以抽 样调查、 普查和重点调查等方法。 该体系是按照高度集中的计划经济体制和分级管理的要求建立起来的。 改革开放以来,随着社会主义市场经济的发展,一方面,社会经济现象空前复杂化,统计调查对象的规 模迅猛扩展,三资企业、私营经济、个体经济等多种经济成分迅速发展,给准确把握统计口径带来困难。 另一方面,统计调查对象的构成日趋复杂,不仅多种经济成分同时并存,而且国有经济中也出现了承包 经营、租赁经营等多种经营形式,特别是随着现代企业制度的建立和产权的流动与重组,不同所有制的 经济主体投资于同一企业的状况日趋扩大、混合所有制的经济单位越来越多,训练有素的基层统计人员 日显匮乏。由于利益格局的变化很大,被调查者对统计调查的合作与支持程度降低,统计信息在采集过 程中的人为干扰现象增多,信息失真的风险性增大。这些都使得以全面统计报表为主的调查体系越来越 难以满足政府与社会公众的对统计信息的需求。 近年来,为了适应国民经济和社会主义市场经济发展的需要,在总结统计调查实践经验的基础上, 按照社会主义市场经济的要求,借鉴国际上成功的作法,对历史上形成的传统的统计调查方法体系进行 了一系列的改革。全面报表制度的基础地位有所削弱,而抽样调查和重点调查等方法日益得广泛应用。 目前,我国建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、 科学推算和部分全面报表综合运用的统计调查方法体系。 在这一统计调查体系中,普查是基础,这是因为只有通过普查,才能收集到全面和详细的数据,同 时为开展抽样调查和统计推断提供必要的基础资料。但是,由于普查要耗费大量的人力、物力、财力和 时间,无法及时反映社会经济现象日新月异的变化状况,因此,对大量的社会经济现象,必须采用抽样 调查方式才能及时地捕获各类信息。抽样调查调查单位少,可以由经过专门训练的人员去完成,同时也 便于对某一社会经济现象进行更深入的研究,这样既可以节省调查费用又可以满足统计时效和统计数据 质量的要求。所以,新的统计调查体系要以经常性的抽样调查为主体。重点调查、典型调查和统计报表 是我国过去统计实践中常用的方式,在新形势下也仍可发挥一定的作用。 在目前的统计调查体系中,还要采用科学的推算方法。所谓统计推算,是在不可能或不必直接通过 调查取得资料的情况下,根据已掌握的资料,运用各种统计方法进行科学的估计推算,以间接方式取得 所需的资料。统计推算若是对同一时期内的未知项所作的推算,属于静态推算;若是针对未来的时期所 作的推算,属于动态推算。统计推算的内容主要包括:从一个现象推算另一现象,从局部推算总体,从 现在推算未来。统计推算的方法主要有:比例推算法,因素估算法,平衡估算法,线性插值法,拉格朗 日插值法及各种动态数列的预测方法等。 总而言之,在统计调查中,应根据调查的目的和调查对象的特点,灵活地选用不同的调查方式,以 及时、准确地获得各种不同的信息。 2.1.5 统计数据收集方案设计 统计数据收集也就是人们常说的统计调查,指根据研究目的和任务,运用科学的调查方法与手段, 有计划、有组织地向客观实际采集数据的过程。统计数据收集是统计研究的基础阶段。进行统计研究必 须通过恰当的数据收集来获得合适的统计数据,为此,必须进行统计数据收集方案的设计。 1.明确调查目的——why
即明确统计调查要解决什么问题,只有明确调查目的,资料的搜集工作才能有序地进行,因为任何 现象和过程都可以根据人们的需要从不同的方面、不同的角度来搜集数据。 2.确定调查对象和调查单位 调查对象指需要调查的现 总体(许多个体的总和),该总体由许多性质相同的调查单位(个体)组 成。调查单位指所要调查的具体单位(个体),它是进行调查登记的标志的直接承担者,是搜集数据、分 析数据的基本单位。 明确调查单位,还必须把它与报告单位区别。报告单位亦称填报单位,它是负责向上报告调查内容 提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位,可能是基层企虫业单 位,也可能是住户、职工、学生等。而调查单位可以是个人、企事业单位,也可以是物。根据不同的调 查目的,调查单位与报告单位,有时是一致的,有时不一致 3.确定调查项目 wha 调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质 标志和数量标志所构成。 4.调查表格和问卷的设计 所谓调查表是指将各个调查项目按照一定的顺序排列而形成的表格。利用调查表,可以有条理地填 写需要搜集的资料,便于调查后资料的汇总整理 调查表一般有一览表和单一表两种形式。一览表是把许多调查单位填写在一张表上。单一表是每个 调查单位填写一份,可容纳较多标志,一般用于调查项目较多的场合。 问卷调查是一种特殊的调查形式,根据调查目的,在调查对象中随机选择或有意识地确定调查单位 以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的间题。调查表格 和问卷的设计应简明扼要,问题应该通俗易懂,以保证所搜集资料的准确, 5.确定调查时间 统计调查时间包括调查时间和调查期限二种涵义。调查时间指调查资料所属的时间,在统计调查中, 如果所调查的是时期现象,必须明确规定调查资料所反映的起止日期.如调查2004年全国国内生产总值, 则调查时间是从2004年1月1日起至12月31日止。如果所要调查的是时点现象,调查时间就是规定的 续一的标准时占。例加.我围第一次全国经济普的标推时占是2004年12月31日,时期料为200 年度。而调查期限则是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间, 应尽可能 短。如2000年人口普查规定2000年11月1日至1月10日登记完毕,则调查期限为11月1日至10 日共10天。 6.确定调查的组织实施计划 调查组织工作包括确定调查机构,组织和培训调查人员,落实调查经费的来源和开支办法,确定调 查济料的报送方法和公布调杏结果的时间】 2.16实哈设计的原叫 试验设计是统计学的一个分支,是进行科学研究的重要工具。由于它与生产实践和科学研究紧密结 合,在理论和方法上不断地丰富和发展,因而 广泛地应用于各个领域 试验设计,广义上指试验研究课题设计,也就是整个试验计划的拟定。 主要包括课题的名称、试 目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分 组,试验的记录项目和要求,试验结果的分析方法,经济效益或社会效益估计,已具备的条件,需要购 置的仪器设备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文或 专著的撰写等内容。狭义上指试验单位的选取、重复数目的确定及试验单位的分组。 试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体 做出可。 正确的推断。实验设计采集数据应遵循如下原则
9 即明确统计调查要解决什么问题,只有明确调查目的,资料的搜集工作才能有序地进行,因为任何 现象和过程都可以根据人们的需要从不同的方面、不同的角度来搜集数据。 2.确定调查对象和调查单位——who 调查对象指需要调查的现象总体(许多个体的总和),该总体由许多性质相同的调查单位(个体)组 成。调查单位指所要调查的具体单位(个体),它是进行调查登记的标志的直接承担者,是搜集数据、分 析数据的基本单位。 明确调查单位,还必须把它与报告单位区别。报告单位亦称填报单位,它是负责向上报告调查内容、 提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位,可能是基层企事业单 位,也可能是住户、职工、学生等。而调查单位可以是个人、企事业单位,也可以是物。根据不同的调 查目的,调查单位与报告单位,有时是一致的,有时不一致。 3.确定调查项目——what 调查项目就是调查中所要登记的调查单位的特征,即调查单位所承担的基本标志,它由一系列品质 标志和数量标志所构成。 4.调查表格和问卷的设计 所谓调查表是指将各个调查项目按照一定的顺序排列而形成的表格。利用调查表,可以有条理地填 写需要搜集的资料,便于调查后资料的汇总整理。 调查表一般有一览表和单一表两种形式。一览表是把许多调查单位填写在一张表上。单一表是每个 调查单位填写一份,可容纳较多标志,一般用于调查项目较多的场合。 问卷调查是一种特殊的调查形式, 根据调查目的, 在调查对象中随机选择或有意识地确定调查单位, 以书面文字或表格形式了解被调查者的意见,调查者自愿、自由地回答问卷中所提出的问题。调查表格 和问卷的设计应简明扼要,问题应该通俗易懂,以保证所搜集资料的准确。 5.确定调查时间 统计调查时间包括调查时间和调查期限二种涵义。 调查时间指调查资料所属的时间, 在统计调查中, 如果所调查的是时期现象, 必须明确规定调查资料所反映的起止日期。 如调查 2004 年全国国内生产总值, 则调查时间是从 2004 年 1 月 1 日起至 12 月 31 日止。 如果所要调查的是时点现象, 调查时间就是规定的 统一的标准时点。例如,我国第一次全国经济普查的标准时点是 2004 年 12 月 31 日,时期资料为 2004 年度。而调查期限则是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间,应尽可能缩 短。如 2000 年人口普查规定 2000 年 11 月 1 日至 11 月 10 日登记完毕,则调查期限为 11 月 1 日至 10 日共 10 天。 6.确定调查的组织实施计划 调查组织工作包括确定调查机构,组织和培训调查人员,落实调查经费的来源和开支办法,确定调 查资料的报送方法和公布调查结果的时间。 2.1.6 实验设计的原则 试验设计是统计学的一个分支,是进行科学研究的重要工具。由于它与生产实践和科学研究紧密结 合,在理论和方法上不断地丰富和发展,因而广泛地应用于各个领域。 试验设计,广义上指试验研究课题设计,也就是整个试验计划的拟定。主要包括课题的名称、试验 目的,研究依据、内容及预期达到的效果,试验方案,试验单位的选取、重复数的确定、试验单位的分 组,试验的记录项目和要求,试验结果的分析方法,经济效益或社会效益估计,已具备的条件,需要购 置的仪器设备,参加研究人员的分工,试验时间、地点、进度安排和经费预算,成果鉴定,学术论文或 专著的撰写等内容。狭义上指试验单位的选取、重复数目的确定及试验单位的分组。 试验设计的目的是避免系统误差,控制、降低试验误差,无偏估计处理效应,从而对样本所在总体 做出可靠、正确的推断。实验设计采集数据应遵循如下原则:
1.重复性原则 重复指试验中同一处理实施在两个或两个以上的试验单位上。重复的主要作用在于估计试验误差和 降低试验误差,提高数据的准确性。重复数的多少可根据试验的对象、要求和条件而定。如供实验的对 象个体间差异较大,重复数应多些,差异较小,重复数可少些。 2.随机性原则 随机性指在进行实验设计时,实验对象的分配、实验次序的安排都必须是随机的 以避免试验人员 主观倾向的影响。这是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量。 实验中遵循随机化原则保证了实验的客观与公正。 3.局部控制的原则 试验条件的局部一致性局部控先制是指在试验时采取一定的技术措错施或方法来控制或降低非试验因麦 对试验结果的影响。在试验中,当试验环境或试验单位差异较大时, 仅根据重复和随机化两原则进行设 计不能将试 或试验单位差异所引起的变异从试验误差中分离出来 因而试验误差大 试验的精矿 性与检验的灵敏度低。为解决这一问题,在试验环境或试脸单位差异大的情况下,根据局部控制的原知 可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非处理因素尽量一致。每 个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差 中分离出来,所以局部控制值能较好地隆低试验误芳 以上所述重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher))三原则. 4双盲原则 实验设计是在双盲情况下进行的,即实验对象本身不知道自己是被分配在处理组或对照组中,测剥定 反应的人也不知道哪些对象在处理组,哪些对象在对照组。进行双盲实验,是为了防止对研究对象的测 定或评估带有偏见。 2.1.7统计数据的主要来源及其误差 1.统计数据的来源 绕计影据来源于登记、调查和验,对于成用然计影据讲行分折的人员而言,计据的主要来调 是直接来源和间接来源两个渠道。 直接来源就是通过各种调查方法进行统计调查或实验 设而言 可供利用的间接数据是最经济的,只有缺乏间接数据或因为情况的改变,间接数据不可采用时,才去获 取直接数据。 统计数据的间接来源。使用者收集到并使用了他人的调查或实验而得到的统计数据就称为统计数据 的间接来源。相应地,与研究内容有关的原数据己经存在,伸用者对这些数据重新加工、整理,使之成 为可以使用的数据,我们称之为间接数据或二手资 从数据收集的范围看,间接数据可以来自于系统的内外部。米源于系统内部的间接数据包括系统内 的业务数据,如各种原始凭证、台账、记录,统计报表、文件档案、分析资料等。 来源于系统外部的间接数据包括统计部门和政府部门公布的有关资料,如各类统计年鉴,如中国统 计出版社出版的《中国统计年鉴》、《国际统计年鉴》等:各类信息中心、信息咨询机构、专业调杏机松 等提供的数据,加中国人口信息研究中心 盖洛普咨询有限公司、北京零点市场调查与分析公司等发布 的数据: 各类专业期刊、 报纸 书籍 所提供的资料,如由中国信 经济预测部编 写的 据分析》,由国家信息中心编写的《经济预测分析》,等等:各种会议如博览会、展销会、交易会及专业 性、学术性研时会上交流的有关资料:以及互联网或图书馆的相关资料,如中国统计信息网( www.stats.gov.cn),中国经济信息网(www google.com),国研网(www.drc.net.com)、中国国家图书馆 等的数据 二手资料的收集比较快捷容易且成本低 是研究者的首选 研究者 应尽量利用间接数拥 ,这不仅为 节省费用和时间,而且因为某些数据(如历史性的,地域广或专业性很强的),个人或个别机构组织直 接收集通常是不可能的。但是,二手资料有其局限性,比如。其可能存在与研究者所研究问题相关性弱、 10
10 1.重复性原则 重复指试验中同一处理实施在两个或两个以上的试验单位上。重复的主要作用在于估计试验误差和 降低试验误差,提高数据的准确性。重复数的多少可根据试验的对象、要求和条件而定。如供实验的对 象个体间差异较大,重复数应多些,差异较小,重复数可少些。 2.随机性原则 随机性指在进行实验设计时,实验对象的分配、实验次序的安排都必须是随机的,以避免试验人员 主观倾向的影响。这是在试验中排除非试验因素干扰的重要手段,目的是为了获得无偏的误差估计量。 实验中遵循随机化原则保证了实验的客观与公正。 3.局部控制的原则 试验条件的局部一致性局部控制是指在试验时采取一定的技术措施或方法来控制或降低非试验因素 对试验结果的影响。在试验中,当试验环境或试验单位差异较大时,仅根据重复和随机化两原则进行设 计不能将试验环境或试验单位差异所引起的变异从试验误差中分离出来,因而试验误差大,试验的精确 性与检验的灵敏度低。为解决这一问题,在试验环境或试验单位差异大的情况下,根据局部控制的原则, 可将整个试验环境或试验单位分成若干个小环境或小组,在小环境或小组内使非处理因素尽量一致。每 个比较一致的小环境或小组,称为单位组(或区组)。因为单位组之间的差异可在方差分析时从试验误差 中分离出来,所以局部控制原则能较好地降低试验误差。 以上所述重复、随机化、局部控制三个基本原则称为费雪(R.A.Fisher)三原则。 4.双盲原则 实验设计是在双盲情况下进行的,即实验对象本身不知道自己是被分配在处理组或对照组中,测定 反应的人也不知道哪些对象在处理组,哪些对象在对照组。进行双盲实验,是为了防止对研究对象的测 定或评估带有偏见。 2.1.7 统计数据的主要来源及其误差 1.统计数据的来源 统计数据来源于登记、调查和实验,对于应用统计数据进行分析的人员而言,统计数据的主要来源 是直接来源和间接来源两个渠道。直接来源就是通过各种调查方法进行统计调查或实验。一般而言,有 可供利用的间接数据是最经济的,只有缺乏间接数据或因为情况的改变,间接数据不可采用时,才去获 取直接数据。 统计数据的间接来源。使用者收集到并使用了他人的调查或实验而得到的统计数据就称为统计数据 的间接来源。相应地,与研究内容有关的原数据已经存在,使用者对这些数据重新加工、整理,使之成 为可以使用的数据,我们称之为间接数据或二手资料。 从数据收集的范围看,间接数据可以来自于系统的内外部。来源于系统内部的间接数据包括系统内 的业务数据,如各种原始凭证、台账、记录,统计报表、文件档案、分析资料等。 来源于系统外部的间接数据包括统计部门和政府部门公布的有关资料,如各类统计年鉴,如中国统 计出版社出版的《中国统计年鉴》、《国际统计年鉴》等;各类信息中心、信息咨询机构、专业调查机构 等提供的数据,如中国人口信息研究中心、盖洛普咨询有限公司、北京零点市场调查与分析公司等发布 的数据;各类专业期刊、报纸、书籍所提供的资料,如由中国信息中心经济预测部编写的《中国经济数 据分析》,由国家信息中心编写的《经济预测分析》,等等;各种会议如博览会、展销会、交易会及专业 性、学术性研讨会上交流的有关资料;以及互联网或图书馆的相关资料,如中国统计信息网( www.stats.gov.cn),中国经济信息网(www.google.com),国研网(www.drc.net.com)、中国国家图书馆 等的数据 。 二手资料的收集比较快捷容易且成本低,是研究者的首选。研究者应尽量利用间接数据,这不仅为 了节省费用和时间,而且因为某些数据(如历史性的,地域广或专业性很强的),个人或个别机构组织直 接收集通常是不可能的。但是,二手资料有其局限性,比如。其可能存在与研究者所研究问题相关性弱