第四章分层抽样 第一节分层抽样概述 第二节总体参数的估计 第三节总样本量的分配 第四节分层与提高精度
第一节 分层抽样概述 第四章 分层抽样 第二节 总体参数的估计 第三节 总样本量的分配 第四节 分层与提高精度
第一节分层抽样概述 分层抽样是在抽样之前,先将总体按一定标志划分为若干 个层(组),后在各层内分别独立地进行抽样。由此所抽 得的样本称之为分层样本。各层所抽的样本也是互相独立 的 如果每层中的抽样都是简单随机的,则这种抽样就叫做分 层随机抽样。由此所得到的样本称做分层随机样本。 分层时应遵循“尽可能使层内差异小,而使层间差异大” 的原则,同时要使分层的结果既无重复又无遗漏 进行分层抽样时应注意:①层内抽样设计的选择;②分层 变量的选择;③各层样本量的分配;④层数;⑤层的分界。 以前只重视③,近年来,④和⑤引起了越来越多的关注
第一节 分层抽样概述 • 分层抽样是在抽样之前,先将总体按一定标志划分为若干 个层(组),后在各层内分别独立地进行抽样。由此所抽 得的样本称之为分层样本。各层所抽的样本也是互相独立 的。 • 如果每层中的抽样都是简单随机的,则这种抽样就叫做分 层随机抽样。由此所得到的样本称做分层随机样本。 • 分层时应遵循“尽可能使层内差异小,而使层间差异大” 的原则,同时要使分层的结果既无重复又无遗漏。 • 进行分层抽样时应注意:①层内抽样设计的选择;②分层 变量的选择;③各层样本量的分配;④层数;⑤层的分界。 以前只重视③,近年来,④和⑤引起了越来越多的关注
分层抽样具有以下特点 ①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此 抽样的效果一般比简单随机抽样要好。但当对总体缺乏较多的了解时, 则无法分层或不能保证 的效果。 ②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两 部分。由于分层抽样的误差只与层内差异有关,而与层间差异无关, 因此,分层抽样可以提高估计量的精度 ③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能 够比简单随机样本更加均匀地分布于总体之内,所以箕代表性也更好 ④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在 各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是 相互独立的。 ⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。因 为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异, 从而使层内差异天大减弱 ⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量 灌 步作对比分析,从而满足不同方面的需要,也能帮助人 更全面、更深入的了解。但对各层的估计缺乏精度保证
• 分层抽样具有以下特点: • ①分层抽样能够充分地利用关于总体的各种已知信息进行分层,因此 抽样的效果一般比简单随机抽样要好。但当对总体缺乏较多的了解时, 则无法分层或不能保证分层的效果。 • ②在分层抽样中,总体的方差一般可以分解为层间方差和层内方差两 部分。由于分层抽样的误差只与层内差异有关,而与层间差异无关, 因此,分层抽样可以提高估计量的精度。 • ③由于分层抽样是在每层内独立地进行抽样,因此,使得分层样本能 够比简单随机样本更加均匀地分布于总体之内,所以其代表性也更好 些。 • ④分层抽样的随机性具体体现在层内各单元的抽取过程之中,也即在 各层内部的每一个单元都有相同的机会被抽中,而在层与层之间则是 相互独立的。 • ⑤分层抽样适合于调查标志在各单元的数量分布差异较大的总体。因 为对这样的总体进行合理的分层后可将其差异较多地转化为层间差异, 从而使层内差异大大减弱。 • ⑥分层抽样中除了可以推断总体参数外,还可以推断各不同层的数量 特征,并进一步作对比分析,从而满足不同方面的需要,也能帮助人 们对总体作更全面、更深入的了解。但对各层的估计缺乏精度保证
⑦分层抽样调查实施中的组织管理及数据收集和 汇总处理可以分别在各层内独立地进行,因此较 之简单随机抽样更方便。 ⑧分层抽样中,由于各层的抽样相互独立,互不 影响,且各层间可能有显著的不同,因此,对不 同层可以按照具体情况和条件分别采用不同的抽 样和估计方法进行处理,从而提高估计的精确度 ⑨当总体有周期现象时,用分层比例抽样法可以 减少抽样方差。 ⑩分层抽样中在进行分层时,需收集可用于分层 的必要的各种资料,因此可能会增加一定的额外 费用。同时,分层抽样中,总体参数的估计以及 各层间样本量的分配、总样本量的确定等都更为 复杂化
• ⑦分层抽样调查实施中的组织管理及数据收集和 汇总处理可以分别在各层内独立地进行,因此较 之简单随机抽样更方便。 • ⑧分层抽样中,由于各层的抽样相互独立,互不 影响,且各层间可能有显著的不同,因此,对不 同层可以按照具体情况和条件分别采用不同的抽 样和估计方法进行处理,从而提高估计的精确度。 • ⑨当总体有周期现象时,用分层比例抽样法可以 减少抽样方差。 • ⑩分层抽样中在进行分层时,需收集可用于分层 的必要的各种资料,因此可能会增加一定的额外 费用。同时,分层抽样中,总体参数的估计以及 各层间样本量的分配、总样本量的确定等都更为 复杂化
满足下述条件时,分层在精度上会有很大的得益: ①总体是由一些大小差异很大的单元组成的,即 总体差异大; ②分层后,每层所包含的总体单元数应是可知的 也即分层后各层的权重是确知的或可以精确估计 的 ③要调查的主要变量(标志)与单元的大小是密 切相关的 ·④对单元的大小有很好的测量资料可用于分层, 也即分层变量容易确定
• 满足下述条件时,分层在精度上会有很大的得益: • ①总体是由一些大小差异很大的单元组成的,即 总体差异大; • ②分层后,每层所包含的总体单元数应是可知的, 也即分层后各层的权重是确知的或可以精确估计 的; • ③要调查的主要变量(标志)与单元的大小是密 切相关的; • ④对单元的大小有很好的测量资料可用于分层, 也即分层变量容易确定
第二节总体参数的估计 估计量 总体均值的估计量 在分层抽样中,总体均值¥的估计量一般用νr表示,它是各层总体均值yh的估计量按 层权W的加权平均,即 Y=yn=∑WY=∑N 一般情况下: yx≠y y 在分层随机抽样中,yh2是Yh的无偏估计量,即Y=n,因此, yn=∑ 也是Y的无偏估计量
第二节 总体参数的估计 • 二、估计量 1、总体均值的估计量 在分层抽样中,总体均值Y 的估计量一般用 st y 表示,它是各层总体均值Y h 的估计量按 层权Wh 的加权平均,即 Y N Y y W Y L st ˆ N ˆ ˆ 1 L h 1 h h 1 h = = = = = 一般情况下: st y ≠ y = L h 1 st y n 在分层随机抽样中, h y 是Y h 的无偏估计量,即Y ˆ = h y ,因此, = L h Wh y y st 也是Y 的无偏估计量
2、总体总和Y的估计量 有了总体均值的估计量,就可推出总体总和的估计量 ∑ 3、总体比例P的估计量 按照总体均值估计量的公式,可推出总体比例(成数)P的估计量为: ∑WP=∑W 可以证明,在分层随机抽样中,j,是Y的无偏估计量,是Y的无偏估计量,P是 P的无偏估计量
2、总体总和Y的估计量 有了总体均值的估计量,就可推出总体总和的估计量 = = L h Nh h ˆY Ny y st st 3、总体比例 P 的估计量 按照总体均值估计量的公式,可推出总体比例(成数)P的估计量为: h h h h h h ˆ ˆ P W P W p L L st = = 可以证明,在分层随机抽样中, st y Y 的无偏估计量,Yst ˆ 是Y的无偏估计量,Pst ˆ 是 P的无偏估计量
三、估计量的方差 总体均值估计量的方差 对于一般的分层抽样,由于各层的抽样是相互独立的,诸Y也相互独立,因此总体均值 Y估计量的方差是总体各层均值估计量方差的加权平均,即 )=v()=∑Wn2(x) 式中κ()是第h层总体均值估计量的方差 2、总体总和估计量的方差 有了总体均值估计量的方差,就可推导出总体总和估计量的方差 r(G)=N(n)=∑N(
三、估计量的方差 1、总体均值估计量的方差 对于一般的分层抽样,由于各层的抽样是相互独立的,诸 h ˆ Y 也相互独立,因此总体均值 Y 估计量的方差是总体各层均值估计量方差的加权平均,即 = = L h h 2 h ) ˆ ) ( ) W ( ˆ V (Yst v yst V Y 式中 ) ˆ ( V Yh 是第 h 层总体均值估计量的方差。 2、总体总和估计量的方差 有了总体均值估计量的方差,就可推导出总体总和估计量的方差: = = L V Ys t N V Ys t N V Y h h 2 h 2 ) ˆ ) ( ˆ ) ( ˆ (
3、总体比例估计量的方差 估计总体比例,当N1充分大时,有 V(P)=∑WV(P) 对于分层随机抽样则可以写出其方差的具体形式来
3、总体比例估计量的方差 估计总体比例,当 Nh 充分大时,有: = L h h 2 h ) ˆ ) ( ˆ V (Pst W V P 对于分层随机抽样则可以写出其方差的具体形式来
四、方差的估计量 按上述方法确定估计量的方差时,要求各 层的总体方差应事先已知,但实际工作中, 各层的总体方差又常常是未知的,此时, 般可用对应的各层样本方差替代,以对 估计量的方差作出估计
• 四、方差的估计量 • 按上述方法确定估计量的方差时,要求各 层的总体方差应事先已知,但实际工作中, 各层的总体方差又常常是未知的,此时, 一般可用对应的各层样本方差替代,以对 估计量的方差作出估计