第九章二重抽样 第一节二重抽样概述 第二节二重分层抽样 第三节二重比估计 第四节二重回归估计 返回
第九章 二重抽样 第一节 二重抽样概述 第二节 二重分层抽样 第三节 二重比估计 第四节 二重回归估计 返回
第一节二重抽样概述 二重抽样的概念 在设计和实施某些抽样调査时,需要事先掌握有关总体的 些信息。但在许多场合下,总体的这些有关信息是事先未知 的,或者不完全知道。为此,人们提出了二重或多重抽样的 方法,以掌握有关总体信息,然后实施抽样调査 二重抽样也称二相抽样。其基本做法是:对于一个大总体, 先从总体中随机抽取一个较大的样本(第一重样本),由此估计 有关总体的结构或辅助指标以及其他有关信息,为第二重抽 样估计提供条件;然后再从第一重样本中随机抽取一个较小 的样本(第二重样本),利用这第二重样本,对总体所研究变量 进行抽样推断。 在某些情况下,也可在第二重样本中再抽第三重、第四重样 本,由此形成多重抽样。其中二重抽样是最为常用的
一、二重抽样的概念 在设计和实施某些抽样调查时,需要事先掌握有关总体的一 些信息。但在许多场合下,总体的这些有关信息是事先未知 的,或者不完全知道。为此,人们提出了二重或多重抽样的 方法,以掌握有关总体信息,然后实施抽样调查。 二重抽样也称二相抽样。其基本做法是:对于一个大总体, 先从总体中随机抽取一个较大的样本(第一重样本),由此估计 有关总体的结构或辅助指标以及其他有关信息,为第二重抽 样估计提供条件;然后再从第一重样本中随机抽取一个较小 的样本(第二重样本),利用这第二重样本,对总体所研究变量 进行抽样推断。 在某些情况下,也可在第二重样本中再抽第三重、第四重样 本,由此形成多重抽样。其中二重抽样是最为常用的。 第一节 二重抽样概述
、二重抽样的作用 在社会经济抽样调查中,二重抽样的主要作用有下列 几方面: 第一,用于从总体所有基本单元中筛选确定出主调查对象 第二,用于经常性调查。对于诸如居民的某些收入、居民基 本生活支出、某些商品价格等指标,统计部门需经常了解。 第三,用于了解陌生总体内在结构或分布的大致情况,为抽 样方法和抽样组织形式的选择提供依据 第四,为分层抽样推断提供层权资料。分层抽样推断的前提 是总体各单元能按分层标志进行归类并事先已知各层的层权 第五,为比率估计和回归估计提供辅助资料, 第六,在经常性的多项目抽样调查中,用于解决不同调查项 目需要不同样本容量的问题。 第七,用于研究样本轮换中的某些问题
二、二重抽样的作用 在社会经济抽样调查中,二重抽样的主要作用有下列 几方面: • 第一,用于从总体所有基本单元中筛选确定出主调查对象。 • 第二,用于经常性调查。对于诸如居民的某些收入、居民基 本生活支出、某些商品价格等指标,统计部门需经常了解。 • 第三,用于了解陌生总体内在结构或分布的大致情况,为抽 样方法和抽样组织形式的选择提供依据。 • 第四,为分层抽样推断提供层权资料。分层抽样推断的前提 是总体各单元能按分层标志进行归类并事先已知各层的层权。 • 第五,为比率估计和回归估计提供辅助资料。 • 第六,在经常性的多项目抽样调查中,用于解决不同调查项 目需要不同样本容量的问题。 • 第七,用于研究样本轮换中的某些问题
第二节二重分层抽样 二重分层抽样概述 在分层抽样中,我们要求总体各层的层权应事先已知, 如果层权未知或不能事先确定,则分层抽样在精度上 的得益可能会在很大程度上被抵消掉,此时,选择二 重分层抽样可以较好地解决层权问题 二重分层抽样是先在总体中随机抽取第一重样本n 对这个样本各单元进行分层后求各层的层权,然后从 第一重样本中用分层随机抽样法抽取第二重样本n,用 于估计总体指标。由于第一重简单随机抽样,第二重 分层抽样,故其误差同二重的抽样都有关
第二节 二重分层抽样 一、二重分层抽样概述 在分层抽样中,我们要求总体各层的层权应事先已知, 如果层权未知或不能事先确定,则分层抽样在精度上 的得益可能会在很大程度上被抵消掉,此时,选择二 重分层抽样可以较好地解决层权问题。 二重分层抽样是先在总体中随机抽取第一重样本n′, 对这个样本各单元进行分层后求各层的层权,然后从 第一重样本中用分层随机抽样法抽取第二重样本n,用 于估计总体指标。由于第一重简单随机抽样,第二重 分层抽样,故其误差同二重的抽样都有关
在二重分层抽样中, W=mh为第h层估计层权, n第一重样本量, n'第一重样本中第h层单元数, n第二重样本量, N总体单元数, n第二重样本中第h层单元数(第h层第二重样本量), n=nn为第二重抽样第h层的抽样比, υ第二重样本中第h层第j单元观测值, L总体层数
在二重分层抽样中, ' ' n n w h h = 为第 h 层估计层权, n第一重样本量, h n' 第一重样本中第 h 层单元数, n第二重样本量, N 总体单元数, h n 第二重样本中第 h 层单元数(第 h 层第二重样本量), h nk n h v = / ' 为第二重抽样第 h 层的抽样比, hj y 第二重样本中第 h 层第 j 单元观测值, L 总体层数
二、估计量及其方差 在讨论二重分层抽样估计量的性质之前,我们先给出二重抽 样中对估计量θ求均值与方差的一般公式如下 E(6)=E1[E2() (6)=V[E2(6)+E1[2() 其中,E2、V为第一重抽样结果条件下对第二重抽样的均值 及方差,E1、V则是对第一重抽样的均值与方差。 据此,可以构造出二重分层抽样的总体均值估计量为 51D ∑ 其中 ∑y 为第一重样本第h层均值的无偏估计
二、估计量及其方差 在讨论二重分层抽样估计量的性质之前,我们先给出二重抽 样中对估计量 ˆ求均值与方差的一般公式如下 )] ˆ )] [ ( ˆ ) [ ( ˆ ( )], ˆ ) [ ( ˆ ( 1 2 1 2 1 2 V V E E V E E E = + = 其中,E2、V2为第一重抽样结果条件下对第二重抽样的均值 及方差,E1、V1则是对第一重抽样的均值与方差。 据此,可以构造出二重分层抽样的总体均值估计量为 = = = L h stD stD h h Y y w y 1 ˆ 其中 = = h n j hj h h y n y 1 1 为第一重样本第 h 层均值的无偏估计
可以证明元是总体均值的无偏估计量 如果第一重样本是随机样本,第二重样本为第一重样本的随 机子样本,则估计量的方差为 V(YD)=V1()+E1[V2() (1-x)+∑W("-1) S2( n' N 其中κ()为第一重抽样之方差,V2(为第二重抽样之方差
可以证明 stD y 是总体均值YstD的无偏估计量。 如果第一重样本是随机样本,第二重样本为第一重样本的随 机子样本,则估计量的方差为 = = = − + − = − + − = + L h h h h L h h h h h stD n v W S n N S n n n S W N n n S V Y V y E V y 1 2 2 1 2 2 2 1 1 2 1) 1 ( ' ) 1 ' 1 ( 1) ' ( ' ) ' (1 ' ) ( ') [ ( )] ˆ ( 其中 ( ') 1 V y 为第一重抽样之方差, ( ) 2 V y 为第二重抽样之方差
以各层的样本方差代替各层的总体方差,以 样本各层间方差代替总体方差,则可得方差 的近似无偏估计量为 stD N 公(-)2+ ∑2s5( h=1 h
以各层的样本方差代替各层的总体方差,以 样本各层间方差代替总体方差,则可得方差 的近似无偏估计量为 ) ' 1 1 ) ( ) ( 1 ' 1 ) ( ˆ ( ˆ 1 2 2 1 2 h L h h h h L h stD h h stD n n w y y w s n N V Y = = = − − + −
三、样本容量的最优分配 在二重分层抽样中,样本量最优分配的目的是按在费用一定 时使方差达到极小,或在方差一定时使费用最省的原则确定 第一重样本量n′和第二重每层样本量nh 为此,可以考虑费用函数 C=Cn+∑Cn 其中,C′为第一重抽样平均每一单元的调查费用;C是第 二重样本中h层平均每个单元的调查费用
三、样本容量的最优分配 在二重分层抽样中,样本量最优分配的目的是按在费用一定 时使方差达到极小,或在方差一定时使费用最省的原则确定 第一重样本量 n′和第二重每层样本量 h n 。 为此,可以考虑费用函数 C = C n +Ch nh ' ' 其中,C′为第一重抽样平均每一单元的调查费用;Ch是 第 二重样本中 h 层平均每个单元的调查费用
由于n是随机的,因此,我们考虑选择的n′与v,的期望费用 C=B()=Cn+n∑C"nW 另一方面,由于方差函数 W,S2,1 SID )=S ∑"-∑ hh h=1H1 h=1
由于 h n 是随机的,因此,我们考虑选择的 n′与 h v 的期望费用 = = + h h Wh C E(C) C'n' n' C v * 另一方面,由于方差函数 = = = = + − − = − + − L h h h L h h h h L h h h h stD N S n W S n v W S n S n v W S n N V Y S 1 2 2 1 2 2 1 2 2 ' ' ' 1) 1 ( ' ) 1 ' 1 ) ( ˆ (