第六章整群抽样 第一节整群抽样概述 第二节等概率整群抽样的情形 第三节不等概率整群抽样的情形
第六章 整群抽样 • 第一节 整群抽样概述 第二节 等概率整群抽样的情形 第三节 不等概率整群抽样的情形
第一节整群抽样概述 整群抽样的概念 整群抽样是先将总体各单元划分成若干群 (组),然后以群为单位,从中随机抽取 部分群,对中选群内的所有单元进行全 面调查。确切地说,这种抽样组织形式应 称为单级整群抽样。 二、分群的原则 尽量扩大群内差异,而缩小群间差异
第一节 整群抽样概述 • 一、整群抽样的概念 • 整群抽样是先将总体各单元划分成若干群 (组),然后以群为单位,从中随机抽取 一部分群,对中选群内的所有单元进行全 面调查。确切地说,这种抽样组织形式应 称为单级整群抽样。 • 二、分群的原则 • 尽量扩大群内差异,而缩小群间差异
三、整群抽样的特点 在大规模抽样调查中,常常没有或很难编制 出包括总体所有次级单元在内的抽样框,而整群 抽样则不需要编制庞大的抽样框。 2.在样本单元数相同的条件下,整群抽样与简 单随机抽样相比,样本单元的分布相对较集中, 虽然样本的代表性较差,但调查组织实施过程更 加便利,同时还可以大大地节省调查费用。因此, 空际工作中,在权衡费用和精度之后有时宁可 适当增加一些样本单元数,也采用整群抽样方法 3.整群抽样的随机性体现在群与群间不重叠, 也无遗漏,群的抽选按概率确定 4:如果把每一个群看作一个单位,则整群抽样 可以被理解为是一种特殊的简单随机抽样
• 三、整群抽样的特点 • 1.在大规模抽样调查中,常常没有或很难编制 出包括总体所有次级单元在内的抽样框,而整群 抽样则不需要编制庞大的抽样框。 • 2.在样本单元数相同的条件下,整群抽样与简 单随机抽样相比,样本单元的分布相对较集中, 虽然样本的代表性较差,但调查组织实施过程更 加便利,同时还可以大大地节省调查费用。因此, 实际工作中,在权衡费用和精度之后,有时宁可 适当增加一些样本单元数,也采用整群抽样方法。 • 3.整群抽样的随机性体现在群与群间不重叠, 也无遗漏,群的抽选按概率确定。 • 4.如果把每一个群看作一个单位,则整群抽样 可以被理解为是一种特殊的简单随机抽样
5.整群抽样也是多阶段抽样的前提和基础。 6.整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体,很难说明 题,必须以一定范围所包括的基本单元为群体, 进行整群抽样,才能满足调查的目的。如人口普 查后的复查、要想估计出普查的差错率,只有通 过对一定地理区域内的人口群体作全面调查才行 类似地诸如人口出生率、流动率等调査查都需要采 用整群抽样 7.整群抽样要求分群后各群所含次级单元数目 应该确知,否则会给抽样推断带来不便
• 5.整群抽样也是多阶段抽样的前提和基础。 • 6.整群抽样有特殊的用途。有些现象的研究, 如果直接调查作为基本单元的个体,很难说明问 题,必须以一定范围所包括的基本单元为群体, 进行整群抽样,才能满足调查的目的。如人口普 查后的复查、要想估计出普查的差错率,只有通 过对一定地理区域内的人口群体作全面调查才行。 类似地诸如人口出生率、流动率等调查都需要采 用整群抽样。 • 7.整群抽样要求分群后各群所含次级单元数目 应该确知,否则会给抽样推断带来不便
四、关于群大小的计量 整群抽样中,如何有效地对群的大小进行计量,直接关系 到抽样估计效率的高低。研究表明,对群的大小的最优计 量尺度是各群在所研究标志上的标志总量大小。但在实际 工作中,它是未知的。因此通常选择与所研究标志高度线 性相关的另一辅助标志作为计量尺度 在整群抽样的实际应用中,经常选择以各群所含次级单元 数的多少作为群大小的计量尺度。当各群所含次级单元数 相等时,就称群的大小相等;当各群所含次级单元数不相 等时,就称群的大小不相等。 五、整群抽样与分层抽样的比较 综合前面的分析,比较整群抽样和分层抽样可以发现二者 在分组(层或群)的条件、调查的方式、分组(层或群) 的目的、分组(层或群)的原则、总体方差的分解等方面 都存在着较为明显的差别
• 四、关于群大小的计量 • 整群抽样中,如何有效地对群的大小进行计量,直接关系 到抽样估计效率的高低。研究表明,对群的大小的最优计 量尺度是各群在所研究标志上的标志总量大小。但在实际 工作中,它是未知的。因此通常选择与所研究标志高度线 性相关的另一辅助标志作为计量尺度。 • 在整群抽样的实际应用中,经常选择以各群所含次级单元 数的多少作为群大小的计量尺度。当各群所含次级单元数 相等时,就称群的大小相等;当各群所含次级单元数不相 等时,就称群的大小不相等。 • 五、整群抽样与分层抽样的比较 • 综合前面的分析,比较整群抽样和分层抽样可以发现二者 在分组(层或群)的条件、调查的方式、分组(层或群) 的目的、分组(层或群)的原则、总体方差的分解等方面 都存在着较为明显的差别
第二节等概率整群抽样的情形 群的大小相等时 (-)估计量 ·整群抽样是以群为单位进行抽样,如果群的抽取 是简单随机的,则当群的大小都相等时,可以将 简单随杋抽样理解为是一种特殊的整群抽样,特 别当总体分群后的每个群都只包括一个次级单元 时,整群抽样和简单随机抽样一致。因此,整群 抽样的估计量可以比照简单随机抽样方式来构造
第二节 等概率整群抽样的情形 • 一、群的大小相等时 • (一)估计量 • 整群抽样是以群为单位进行抽样,如果群的抽取 是简单随机的,则当群的大小都相等时,可以将 简单随机抽样理解为是一种特殊的整群抽样,特 别当总体分群后的每个群都只包括一个次级单元 时,整群抽样和简单随机抽样一致。因此,整群 抽样的估计量可以比照简单随机抽样方式来构造
1、总体均值Y的估计 ==∑Y 2、总体总和Y的估计 同理可得总体总和的无偏估计量为 N Y=NM ∑Y1=-y 3、总体比例P的估计 P nM
1、总体均值Y 的估计= = = n i Yi n Y y 1 ˆ 1 2、总体总和Y 的估计 同理可得总体总和的无偏估计量为 y n N Y n N Y NM y n i i = = • = = 1 ˆ 3、总体比例P的估计 = = = = = n i i n i i nM P n P p 1 1 1 1 ˆ
(二)估计量的方差及其估计 由于群是按简单随机方法抽取的,因此,估计量F,Y与P的方差及方差的无偏估计量可直接 按第三章的方法构造,无需专门推导。 、群的大小不等时 在许多情况下,总体各群的大小M;是不完全相等,或完全不相等的。若各群的大小相 差不大时,总体参数的估计量可按简单估计或比估计来确定 (一)简单估计 如果群的抽取是简单随机的,则可将每个群的总和Y;看作是第i群的指标,于是总体总和 Y=∑Y1的简单估计可依照简单随机抽样的情形(参第三章)来做
(二)估计量的方差及其估计 由于群是按简单随机方法抽取的,因此,估计量Y Y ˆ , ˆ 与 P ˆ 的方差及方差的无偏估计量可直接 按第三章的方法构造,无需专门推导。 三、群的大小不等时 在许多情况下,总体各群的大小 Mi 是不完全相等,或完全不相等的。若各群的大小相 差不大时,总体参数的估计量可按简单估计或比估计来确定: (一)简单估计 如果群的抽取是简单随机的,则可将每个群的总和 Yi 看作是第i 群的指标,于是总体总和 = = N i 1 Y Yi 的简单估计可依照简单随机抽样的情形(参第三章)来做
(二)比估计 当群的大小不等时,在对群进行简单随机抽样的情况下,=∑/∑M,我们注意到 它同第五章所讨论的比率R=∑/∑x形式上完全相同,只不过在这里是将各群的大小 M,作为辅助变量。因此,可采用比估计的方法得出有关参数的比估计量。按前面的论述, 比估计量是有偏的,但当n充分大时,其偏差可以很小,近似无偏
(二)比估计 当群的大小不等时,在对群进行简单随机抽样的情况下, = = = N i i N i Y Yi M 1 1 ,我们注意到 它同第五章所讨论的比率 = = = N i i N i R Yi X 1 1 形式上完全相同,只不过在这里是将各群的大小 Mi 作为辅助变量。因此,可采用比估计的方法得出有关参数的比估计量。按前面的论述, 比估计量是有偏的,但当 n 充分大时,其偏差可以很小,近似无偏
第三节不等概率整群抽样的情形 、放回的不等概率抽样 (一)PPS抽样的入样概率和实施方法 1、入样概率 2、实施方法 1)代码法(累计和法,由汉森一赫维茨提出) 2)拉希里法 (二)PPS抽样的估计量 对于PPS抽样,其估计量可按汉森一赫维茨 1943年提出的方法构造
第三节 不等概率整群抽样的情形 一、放回的不等概率抽样 • (一)PPS抽样的入样概率和实施方法 • 1、入样概率 • 2、实施方法 • 1)代码法(累计和法,由汉森—赫维茨提出) • 2)拉希里法 • (二)PPS抽样的估计量 • 对于PPS抽样,其估计量可按汉森—赫维茨 1943年提出的方法构造