§3二重抽样的比估升与回归估 重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量X的平 均数或总和。如東事先并不掌握辅助变量的平荺数或者总和 的信息,但辅助变量的观察要比调查的指标Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元(x,y)。先从总体中抽 取一个大样本,记作: {(x1,y1),(x2y2),…(xn,yn)
二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量 X的平 均数或总和。如果事先并不掌握辅助变量的平均数或者总和 的信息,但辅助变量的观察要比调查的指标 Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 §3 二重抽样的比估计与回归估计 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元 。先从总体中抽 取一个大样本,记作: ( , ) x y 1 1 2 2 {( , ),( , ), ,( , )} x y x y x y n n
n是样本容量,仅对辅助变量x进行观察,计算样本均值 x=2 它是总体辅助变量平均数X的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n<n,得样本: {(x21,y21),(x2y2),…,(x2n2y2n) 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 x=∑ 卩=∑ 6.7) n j=1 构造总体主调查指标平均数Y的比估计量:
n 是样本容量,仅对辅助变量X进行观察,计算样本均值 1 1 n i i x x n = = 它是总体辅助变量平均数 X 的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n n ,得样本: 21 21 22 22 2 2 {( , ),( , ), ,( , )} x y x y x y n n 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 构造总体主调查指标平均数 Y 的比估计量: 2 1 1 n j j x x n = = 2 1 1 n j j y y n = = (6.7)
RD 兰· = (68) 这里用记号R表示y/x,根据第五章第一节的讨论,我们 知道当n足够大时,R近似地等R=y/x,即R是R的 渐近无偏估计。因此 yRD≈x=y (6.9) 而由第三章可知,是总体平均数y的无偏估计。故yRD 是总体平均数Y的渐近无偏估计 二重比估计yRD的方差vr(y)的估计为: 2 ()=2(11 n(n/(R22-2Rsgx)(610)
这里用记号 表示 ,根据第五章第一节的讨论,我们 知道当 n 足够大时, 近似地等于 ,即 是 的 渐近无偏估计。因此 R ˆ R ˆ R ˆ R y x R y x = 而由第三章可知, 是总体平均数 的无偏估计。故, 是总体平均数 的渐近无偏估计。 y Y Y RD y 二重比估计 yRD 的方差 Var y( ) RD 的估计为: ˆ RD y y x R x x = (6.8) RD y y x y x = (6.9) 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n = + − − (6.10)
这里,S2,s32和Sx分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 n ∑0y)=n12(x-x) 1)=1 S= ∑(2-)(x2-x)( n 例62某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表
这里, 和 分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 2 2 , y x s s yx s 2 2 2 1 1 ( ) 1 n y j j s y y n = = − − 2 2 2 1 1 ( ) 1 n x j j s x x n = = − − 2 2 1 1 ( )( ) 1 n yx j j j s y y x x n = = − − − (6.11) 例6.2 某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表
试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差。 村年终生猪存栏头数(x)全年交售肉猪头数(2) 550 610 720 780 234567 1500 1600 1020 1030 620 600 980 1050 928 977 8 1200 1440 1350 1570 10 1750 2210 670 980 12 729 865 13 1530 1710
1 2 3 4 5 6 7 8 9 10 11 12 13 550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710 村i 2 ( )j 年终生猪存栏头数 x 2 ( )j 全年交售肉猪头数 y 试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差
解:根据表中数据计算可得 =1186.31x=1042.08R=y/x=11384 ∑(2-y)2=231543 13-1f S 13 13-1 ∑ (x/~x)2=153876 j=1 S=13-12(y-D(x1-x)=1838 而n=80,x=1080,n=13 于是计算可得每村平均交售肉猪头数的估计为 a=Rx=1.1384×1080≈1230(头)
解: 根据表中数据计算可得 y = 1186.31 x = 1042.08 ˆ R y x = = 1.1384 13 2 2 2 1 1 ( ) 231543 13 1 y j j s y y = = − = − 13 2 2 2 1 1 ( ) 153876 13 1 x j j s x x = = − = − 13 2 2 1 1 ( )( ) 183578 13 1 yx j j j s y y x x = = − − = − 而 n x n = = = 80 , 1080 , 13 于是计算可得每村平均交售肉猪头数的估计为 ˆ 1.1384 1080 1230 RD y R x = = (头)
二重比估计yAD的方差vr(y)的估计为: RD =→+ (R SK-2RS =—×231543+ (1.13842×153876-2×11384×183578) 13 1380 =373109 于是交售头数平均数估计的标准差为、v(m2)=61.08(头) 2、二重回归估计方法 沿用前一小节的符号,仅讨论B为样本回归系数的情形。 利用第二重样本估计回归系数B,即
二重比估计 yRD 的方差 Var y( ) RD 的估计为: 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n = + − − 1 1 1 2 231543 (1.1384 153876 2 1.1384 183578) 13 13 80 = + − − = 3731.09 于是交售头数平均数估计的标准差为 ( ) 61.08 (头) RD v y = 2、二重回归估计方法 沿用前一小节的符号,仅讨论 为样本回归系数的情形。 利用第二重样本估计回归系数 ,即
∑(2)-)(x2/-x) 1 ∑xx j=1 对总体平均数Y的二重抽样的回归估计量为: JirD=y+B(x'x) (6.12) x为第一重样本辅助变量的平均值,x与卫分别是第二重样 本辅助变量与主调査指标的平均值。 yhD是总体平均数Y的渐近无偏估计,其方差的估计为: irD)S Sy. T S (6.13) n nn
对总体平均数 Y 的二重抽样的回归估计量为: 2 2 1 2 2 1 ( )( ) ( ) n j j j n j j y y x x x x = = − − = − ( ) lrD y y x x = + − (6.12) 为第一重样本辅助变量的平均值, 与 分别是第二重样 本辅助变量与主调查指标的平均值。 x x y ylrD 是总体平均数 Y 的渐近无偏估计,其方差的估计为: 2 1 1 2 2 ( ) y lrD y s v y r s n n n = + − (6.13)
r是辅助变量X与主调查指标Y之间的相关系数的估计,即 ∑(y2/-)(x2y-x) 6.14 ∑(x2-x)2·∑(y2y-)2 j=1 例63在前例中,改用二重回归估计来估计该县去年全年每 村肉猪平均交售头数,并计算估计的标准差。 解:根据前例数据计算可得 ∑( y2i )(x. -x) Syx 183578 B =1.193 ∑(x2-x)2 153876 j=1
r 是辅助变量X与主调查指标Y之间的相关系数的估计,即 2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = − − (6.14) 例6.3 在前例中,改用二重回归估计来估计该县去年全年每 村肉猪平均交售头数,并计算估计的标准差。 解: 根据前例数据计算可得 2 2 1 2 2 2 1 ( )( ) 183578 1.193 153876 ( ) n j j j yx n x j j y y x x s s x x = = − − = = = = −
∑(y2-j)x2-x) ∑(xy-x j=1 (对一对2=2(, 153876 =B=1193 =0.97256 231543 J 于是该县去年全年每村肉猪平均交售头数Y的二重回归估计 Vird=y+B(x'x) =1186.31+1.193×(1080-104208)≈1232(头)
2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = − − 2 2 1 2 2 1 ( ) ( ) n j j n j j x x y y = = − = − x y s s = 153876 1.193 0.97256 231543 = = ( ) lrD y y x x = + − = + − 1186.31 1.193 (1080 1042.08) 1232 (头) 于是该县去年全年每村肉猪平均交售头数 Y 的二重回归估计