第五章比估计与回归估计 第一节比估计的一般形式 第二节分层比估计 第三节回归估计的一般形式 第四节分层回归估计
第五章 比估计与回归估计 • 第一节 比估计的一般形式 • 第二节 分层比估计 • 第三节 回归估计的一般形式 • 第四节 分层回归估计
第一节比估计的一般形式 、比估计综述 比估计是依据调查变量与辅助变量间的比率来对总体有关参数进行估 计和推断。通常简称比估计。 同简单估计相比,比估计具有以下特点 点些要录轴阶变的是体:均在成(体总调2已关图的为 利用辅助变量带来的信息估计总体参数,比单纯用调査变量资料会有 更好的效果。 2)比估计方法,对抽样调查单元是有条件的,通常是用组成总体的 最基层单位为调查单元。 3)比估计只适用于有限总体,因为只有有限总体才可能计算出为比 估计所需要的辅助变量的总体总和与总体均值。 4)当每个单元的调查变量与辅助变量的比例(一般要求为正比例) 分稳定:具变异很小时,比估计就具有分精确的估计效果,只要抽 取少量的样本单元,就可得到满意的结论 5)在比估计时,出于估计精度方面的要求,选择辅助变量时,须与 调查变量的关系愈密切愈好,至少要求相关系数在1/2以上
第一节 比估计的一般形式 • 一、比估计综述 • 比估计是依据调查变量与辅助变量间的比率来对总体有关参数进行估 计和推断。通常简称比估计。 • 同简单估计相比,比估计具有以下特点: • (1)在比估计中,除调查变量外,还需要了解与调查变量有关的辅助 变量,并且要求辅助变量的总体均值或总体总和必须事先已知。充分 利用辅助变量带来的信息估计总体参数,比单纯用调查变量资料会有 更好的效果。 • (2)比估计方法,对抽样调查单元是有条件的,通常是用组成总体的 最基层单位为调查单元。 • (3)比估计只适用于有限总体,因为只有有限总体才可能计算出为比 估计所需要的辅助变量的总体总和与总体均值。 • (4)当每个单元的调查变量与辅助变量的比例(一般要求为正比例)十 分稳定,且变异很小时,比估计就具有十分精确的估计效果,只要抽 取少量的样本单元,就可得到满意的结论。 • (5)在比估计时,出于估计精度方面的要求,选择辅助变量时,须与 调查变量的关系愈密切愈好,至少要求相关系数在1/2以上
比估计中,辅助变量可以是上次普查或调查时与 调査变量相应的数据(即调查变量的前期或历史资 料):也可以是对调查变量的粗略估计;或者是表 示单元规模的某个量 为了充分发挥比估计的优越性,在应用比估计时 应考虑两条: 是选与调查变量有较密切的正相关关系的变量 作为辅助变量。因为如果辅助变量与调査变量的 关系不密切,各自独立变化,则对比估计起不了 应有的辅助作用 是样本容量要比较大。因为比估计是有偏倚的, 只有当样本容量n比较大时,其偏倚才能比较小, 比估计才更加有效
• 比估计中,辅助变量可以是上次普查或调查时与 调查变量相应的数据(即调查变量的前期或历史资 料);也可以是对调查变量的粗略估计;或者是表 示单元规模的某个量。 • 为了充分发挥比估计的优越性,在应用比估计时 应考虑两条: • 一是选与调查变量有较密切的正相关关系的变量 作为辅助变量。因为如果辅助变量与调查变量的 关系不密切,各自独立变化,则对比估计起不了 应有的辅助作用。 • 二是样本容量要比较大。因为比估计是有偏倚的, 只有当样本容量n比较大时,其偏倚才能比较小, 比估计才更加有效
二、总体比率的估计 设总体有N个单元,对每个单元考虑两个指标y和x。抽取容量为n的简单随机样本, 则总体比率R的估计量为 X X 比率估计是有偏的,但当样本量n增大时,偏倚逐渐趋于零。 其方差为 6、-∑0- N-1 nF(s,+rs_RS Ks 々F2(S2+R2S2-2R
二、总体比率的估计 设总体有 N 个单元,对每个单元考虑两个指标 y 和 x。抽取容量为 n 的简单随机样本, 则总体比率 R 的估计量为: , ˆ x y x y R = = 比率估计是有偏的,但当样本量n增大时,偏倚逐渐趋于零。 其方差为 ( 2 ) 1 1 ( ) 1 ) ˆ ( 2 2 2 2 1 2 2 y x yx N i i i S R S RS nX f N y Rx nX f V R + − − = − − − = ( 2 ) 1 2 2 2 2 y x y x S R S R S S nX f + − − =
当总体方差未知时,可用样本方差替代,以估计方差 此时 ∑(y-Rx) V1(R) nX2 YnR(s+RSr yx 总体均值和总和的比估计 当调査变量和辅助变量具有正相关关系时,为了利用辅助变量的信息,可以 构造总体均值或总和的比估计量。在简单随机抽样中,总体均值和总体总和 的比估计量分别为 ==x=R7 X=LX=RX=YN
当总体方差未知时,可用样本方差替代,以估计方差。 此时 ) ˆ 2 ˆ ( 1 1 ) ˆ ( 1 ) ˆ ( ˆ 2 2 2 2 1 2 1 2 y x yx N i i i s R s Rs nX f n y Rx nX f V R + − − = − − − = = 三、总体均值和总和的比估计 当调查变量和辅助变量具有正相关关系时,为了利用辅助变量的信息,可以 构造总体均值或总和的比估计量。在简单随机抽样中,总体均值和总体总和 的比估计量分别为 X RX x y X x y YR ˆ ˆ = = = X RX Y N x y X x y YR R ˆ ˆ ˆ = = = =
其方差为 (Y)=XV(R), T(Ya)≈N2()=N2Y2(R) 其方差估计量为: V(YR) 之(-hn) s.2+R2s.2-2Rs V(YR=NV(YR
其方差为 ) ˆ ) ( ˆ ( 2 V YR = X V R , ) ˆ ) ( ˆ ) ( ˆ ( 2 2 2 V YR N V YR = N X V R 其方差估计量为: ) ˆ 2 ˆ ( 1 1 ) ˆ ( 1 ) ˆ ( ˆ 1 2 2 2 2 y x yx n i i i R s R s Rs n f n y Rx n f V Y + − − = − − − = = ) ˆ ( ˆ ) ˆ ( ˆ 2 V YR = N V YR
四、比估计量与简单估计量的比较 对简单随机抽样,若n足够大,则当 1S,/X +、O 时,有 V(YRV( 其中 分别为总体中x与y的变异系数 结论为:利用比估计提高抽样效果的条件是p>1/2。 五、样本容量的确定
四、比估计量与简单估计量的比较 对简单随机抽样,若 n 足够大,则当 y x y x C C S Y S X = 2 1 2 1 时,有 ) ˆ ( V YR 1/2。 五、样本容量的确定
第二节分层比估计 分层随机抽样中的比估计量有两种形式: 先构造各层比估计,再加权平均——各层 分别比估计;先加权平均,再构造比估 计—联合比估计。 各层分别比估计 各层分别比估计是先对各层分别进行比估 计,然后按层权加权平均,以得出总体参 数的估计,即:
第二节 分层比估计 • 分层随机抽样中的比估计量有两种形式: 先构造各层比估计,再加权平均——各层 分别比估计;先加权平均,再构造比估 计——联合比估计。 • 一、各层分别比估计 • 各层分别比估计是先对各层分别进行比估 计,然后按层权加权平均,以得出总体参 数的估计,即:
∑WF ∑Wx X,(X,及X,已知) Nx ∑ Ym.(X,已知
= L h YRS Wh YRh ˆ ˆ = L h h h h h X x y W = L h h h h X x y N 1 ,( Xh及Xh 已知) = = L h Rh L h h h RS X Y x y Yˆ ˆ h .( X h 已知)
其方差为: V0)=2(A62+R32-2 方差的估计量:C)=∑N20(62+22-2 Y的估计量的方差(或方差估计量)乘以一即可得出Y的估计量的方差(或方差估计 N
其方差为: ( 2 ) (1 ) ) ˆ ( 2 2 2 2 yh h xh h h yh xh h h L h RS h S R S R S S n f V Y N + − − 方差的估计量: ) ˆ 2 ˆ ( (1 ) ) ˆ ( ˆ 2 2 2 2 yh h xh h h yh xh h h L h RS h s R s R r s s n f V Y N + − − Y 的估计量的方差(或方差估计量)乘 以 2 1 N 即可得出Y 的估计量的方差(或方差估计 量)