第八章多阶抽样 第一节多阶抽样概述 第二节一阶单元等大小的两阶抽样 第三节一阶单元不等大小的两阶抽样 返回
第八章 多阶抽样 第一节 多阶抽样概述 第二节 一阶单元等大小的两阶抽样 第三节 一阶单元不等大小的两阶抽样 返回
第一节多阶抽样概述 、多阶抽样的基本概念 ·根据实际情况将整个抽样程序分成若干个阶段,一个阶段 个阶段地进行抽样,以完成整个抽样过程,这种抽样就 叫多阶抽样。从总体中随机抽取一部分一阶单元,然后再 从被抽中的一阶单元内,随机抽取部分二阶单元并对它们 进行全面调查,我们把这种抽样技术称为两阶抽样。它是 由印度统计学家马哈拉诺比斯首先提出来的 多阶抽样的特点 )便于组织抽样(二)抽样方式灵活,有利于提高抽样的 估计效率(三)多阶段抽样对基本调查单元的抽选不是一步 到位的(四)多阶段抽样实质上是分层抽样与整群抽样的有 机结合(五)多阶抽样在抽样时并不需要二阶或更低阶单元 的抽样框(六)多阶抽样还可用于“散料”的抽样,即散料 抽样
第一节 多阶抽样概述 • 一、多阶抽样的基本概念 • 根据实际情况将整个抽样程序分成若干个阶段,一个阶段 一个阶段地进行抽样,以完成整个抽样过程,这种抽样就 叫多阶抽样。从总体中随机抽取一部分一阶单元,然后再 从被抽中的一阶单元内,随机抽取部分二阶单元并对它们 进行全面调查,我们把这种抽样技术称为两阶抽样。它是 由印度统计学家马哈拉诺比斯首先提出来的。 • 二、多阶抽样的特点 • (一)便于组织抽样 (二)抽样方式灵活,有利于提高抽样的 估计效率(三)多阶段抽样对基本调查单元的抽选不是一步 到位的(四)多阶段抽样实质上是分层抽样与整群抽样的有 机结合(五)多阶抽样在抽样时并不需要二阶或更低阶单元 的抽样框 (六)多阶抽样还可用于“散料”的抽样,即散料 抽样
第二节一阶单元等大小的两阶抽样 估计量及其方差 由于二阶抽样中,抽样过程分成两步,因此,对于总体参数O的估计量6求均值和方差 时,必须把这两阶抽样过程所能产生的所有样本加以平均,即 E()=EE2(l小 V()=HE2(O)+E1 其中,E表示所有样本的期望值或均值,E1、V分别表示对第一阶抽样求的均值与方差,E2、 V2分别表示对固定的第一阶抽样中抽得的一组一阶单元对第二阶抽样求的均值与方差。 返回
第二节 一阶单元等大小的两阶抽样 返回 一、估计量及其方差 由于二阶抽样中,抽样过程分成两步,因此,对于总体参数 的估计量 ˆ求均值和方差 时,必须把这两阶抽样过程所能产生的所有样本加以平均,即 ) ˆ ) ( ˆ ( E = E1 E2 ) ˆ ) ( ˆ ) ( ˆ ( V = V1 E2 + E1 V2 其中,E 表示所有样本的期望值或均值,E1、V1 分别表示对第一阶抽样求的均值与方差,E2 、 V2 分别表示对固定的第一阶抽样中抽得的一组一阶单元对第二阶抽样求的均值与方差
1、总体均值的估计 对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值y的无偏估计量为 y==∑∑/m=∑ 由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段都用不放回方 法抽样时,其总体均值估计量的方差可构造为 f2,1-/2 S M 可以证明其方差的无偏估计量为 f12,f1(1-f2)
1、总体均值的估计 对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值Y 的无偏估计量为 = = = = = = n i i n i m j ij y n Y y y m 1 1 1 0 1 . 由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段都用不放回方 法抽样时,其总体均值估计量的方差可构造为 2 2 2 2 1 1 1 1 ( ) S mn f S n f V y − + − = = N S mn S M S S n 2 1 2 2 2 2 2 1 ( ) 1 − + − 可以证明其方差的无偏估计量为 2 2 2 1 2 1 1 1 (1 ) ( ) ˆ s mn f f s n f V y − + − =
2、总体比例的估计 若两阶段的抽样都是不放回简单随机的,则总体比例P的无偏估计量为 其方差为 V(P)=V(p)= 1-f1 M 方差估计量为 V(p)= 2 S,+ S
若两阶段的抽样都是不放回简单随机的,则总体比例 P 的无偏估计量为 = = = n i pi n P p 1 1 ˆ 其方差为 2 1 2 2 1 1 1 1 ) ( ˆ) ˆ ( S Mn f S n f V P V p − + − = = 方差估计量为 2 2 2 2 1 1 1 1 ( ) ˆ s mn f s n f V p − + − = 2、总体比例的估计
3.最佳抽样比的确定 按费用固定条件下,使方差极小,或在方差固定条件下使费用极小的条件 可求得m的最优值为 2S2V(其中s2>S2/M) 求出m后,将其代入估计量方差的计算公式或上述线性费用函数式中,即可求出n的值 这样就可确定出最佳的抽样比f和f2 特别地,当f2=1时,即m=M时,二阶抽样就化为对一阶单元进行的单级整群抽样, 故其估计量的方差及其估计量就转变为整群抽样估计量的方差及其估计。当f1=1,即 η=N时,二阶抽样就化为按比例分配的分层随机抽样,且其层权相等,此时二阶抽样估计 量的方差及其估计也就转变为分层随机抽样估计量的方差及其估计。所以,一般地二阶抽样 也可看作是把一阶单元作为层的不完全的分层抽样
可求得 m 的最优值为 2 1 2 2 2 1 2 C C M S S S mopt − = (其中 S S M 2 2 2 1 ) 求出m 后,将其代入估计量方差的计算公式或上述线性费用函数式中,即可求出 n 的值。 这样就可确定出最佳的抽样比 1 f 和 2 f 。 特别地,当 f 2 =1时,即m = M 时,二阶抽样就化为对一阶单元进行的单级整群抽样, 故其估计量的方差及其估计量就转变为整群抽样估计量的方差及其估计。当 f 1 =1 ,即 n = N 时,二阶抽样就化为按比例分配的分层随机抽样,且其层权相等,此时二阶抽样估计 量的方差及其估计也就转变为分层随机抽样估计量的方差及其估计。所以,一般地二阶抽样 也可看作是把一阶单元作为层的不完全的分层抽样。 3.最佳抽样比的确定 按费用固定条件下,使方差极小,或在方差固定条件下使费用极小的条件
二、分层二阶抽样 设总体分成L层,第h层有N个一阶单元, 每个一阶单元均含M个二阶单元。在第h 层随机抽了n个一阶单元,又从每个被抽 中的一阶单元中随机抽了m个二阶单元。 则的估计量为 >, 其中Wn= MmH N 111h h
二、分层二阶抽样 • 设总体分成L层,第h层有Nh个一阶单元, 每个一阶单元均含Mh个二阶单元。在第h 层随机抽了nh个一阶单元,又从每个被抽 中的一阶单元中随机抽了mh个二阶单元。 则的估计量为 h L h yst =Wh y 其中 = L h h h h h h N m N M W
是按二阶单元的层权; h m h 5=∑∑ym/n1mb i=1j=1 为第h层的样本均值。其方差为 L m)=∑W7S+二1s2)
是按二阶单元的层权; h h n i m j yh yhij n m h h / 1 1 = = = 为第h层的样本均值。其方差为 ) 1 1 ( ) ( 2 2 2 2 1 2 1 h h h h h h h L h s h h S n m f S n f V y W − + − =
方差估计量为 )=∑ 1-fb2,f(1-2)2 Su t 2h
方差估计量为 ) 1 (1 ) ( ) ( ˆ 2 2 2 1 2 1 2 1 h h h h h h h h L h s h h s n m f f s n f V y W − + − =
其中 f1 h h Nn”2bMn 上式乘以 则得的方差及其方差估计量。 在分层二阶抽样中,若
其中 •上式乘以 h h h h h h M m f N n f 1 = , 2 = 2 ( ) L h Nh Mh 则得Ys t ˆ