§3二重抛样的眈估针与回归估针 二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量X的平 均数或总和。如果事先并不掌握辅助变量菂平均数或者总和 的信息,但辅助变量的观察要比调查的指标Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元(x,y)。先从总体中抽 取一个大样本,记作: (x1,y1),(x2,y2),,(xn,yn)
二重比估计与二重回归估计的思想与二重分层估计的思 想相类似。比估计与回归估计需要事先知道辅助变量 X的平 均数或总和。如果事先并不掌握辅助变量的平均数或者总和 的信息,但辅助变量的观察要比调查的指标 Y容易得多,那 么就可以使用二重比估计或者二重回归估计。第一重抽样只 观察辅助变量的值,获得均值或者总和的估计,然后在第二 重抽样时应用比估计或者回归估计。为简单起见,本节仅讨 论对总体平均数的估计。 §3 二重抽样的比估计与回归估计 1、二重比估计方法 由于涉及到两个指标,一个是主调查指标Y,另一个是 辅助变量X,用数据对表示一个单元 。先从总体中抽 取一个大样本,记作: ( , ) x y 1 1 2 2 {( , ),( , ), ,( , )} x y x y x y n n
n是样本容量,仅对辅助变量X进行观察,计算样本均值 x=∑ 它是总体辅助变量平均数X的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n<n,得样本: (x21y21),( 229J22 2n9v2n )} 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 x=∑ 2j =∑ (6.7) 构造总体主调查指标平均数Y的比估计量:
n 是样本容量,仅对辅助变量X进行观察,计算样本均值 1 1 n i i x x n = = 它是总体辅助变量平均数 X 的无偏估计。 把该样本作为总体进行第二重简单随机抽样,样本容量 n n ,得样本: 21 21 22 22 2 2 {( , ),( , ), ,( , )} x y x y x y n n 第一个下标表示第二重抽样。分别计算辅助变量与主调查指 标的样本均值 构造总体主调查指标平均数 Y 的比估计量: 2 1 1 n j j x x n = = 2 1 1 n j j y y n = = (6.7)
m=yx△Rx 68) --1--1--1-÷*--+-1--1--1 这里用记号R表示y/x,根据第五章第一节的讨论,我们 知道当n足够大时,R近似地等fR=y/x,即R是R的 渐近无偏估计。因此 RD x =y (6.9) 而由第三章可知,y是总体平均数F的无偏估计。故JRD 是总体平均数Y的渐近无偏估计。 二重比估计yRD的方差r(V)的估计为: vm)=2+1-1(0232-2R) (6.10) nnn
这里用记号 表示 ,根据第五章第一节的讨论,我们 知道当 n 足够大时, 近似地等于 ,即 是 的 渐近无偏估计。因此 R ˆ R ˆ R ˆ R y x R y x = 而由第三章可知, 是总体平均数 的无偏估计。故, 是总体平均数 的渐近无偏估计。 y Y Y RD y 二重比估计 yRD 的方差 Var y( ) RD 的估计为: ˆ RD y y x R x x = (6.8) RD y y x y x = (6.9) 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n = + − − (6.10)
这里,2,2和Sm分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 ∑(2-y)22=∑ n n一 1(2-D)(x2 n-1 2-x)(6) 例62某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表
这里, 和 分别为第二重样本关于主调查指标、辅助变 量的方差以及它们的协方差,即 2 2 , y x s s yx s 2 2 2 1 1 ( ) 1 n y j j s y y n = = − − 2 2 2 1 1 ( ) 1 n x j j s x x n = = − − 2 2 1 1 ( )( ) 1 n yx j j j s y y x x n = = − − − (6.11) 例6.2 某县共有200个村,现要估计去年全县平均每村交售肉 猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高 的相关性,而存栏头数的资料容易取得。采用二重比估计的方 法,先抽取80个村作为第一重样本,得年终平均每村的生猪存 栏数为1080头。然后在这80个村中又选了13个村作为第二重样 本,分别统计了年终的存栏数和交售头数,资料见下表
试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差。 村年终生猪存栏头数(x2)全年交售肉猪头数门2,) 550 610 720 780 3 1500 1600 4 1020 1030 620 600 980 1050 928 977 8 1200 1440 1350 5 10 1750 2210 670 980 12 729 865 13 1530 1710
1 2 3 4 5 6 7 8 9 10 11 12 13 550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710 村i 2 ( )j 年终生猪存栏头数 x 2 ( )j 全年交售肉猪头数 y 试估计该县去年全年平均每村交售肉猪的头数,并计算其标 准差
解:根据表中数据计算可得 j=1186.31x=1042.08R=y/x=11384 ∑(2-y)2 231543 13-1 13-1 ∑(x1-x)2=153876 13-1 ∑(21-)(x2-x)=183578 而n’=80,x=1080,n=13 于是计算可得每村平均交售肉猪头数的估计为 AD=R·x=11384×1080≈1230(头)
解: 根据表中数据计算可得 y = 1186.31 x = 1042.08 ˆ R y x = = 1.1384 13 2 2 2 1 1 ( ) 231543 13 1 y j j s y y = = − = − 13 2 2 2 1 1 ( ) 153876 13 1 x j j s x x = = − = − 13 2 2 1 1 ( )( ) 183578 13 1 yx j j j s y y x x = = − − = − 而 n x n = = = 80 , 1080 , 13 于是计算可得每村平均交售肉猪头数的估计为 ˆ 1.1384 1080 1230 RD y R x = = (头)
二重比估计yR的方差vur(A)的估计为: v()=n+-小(R-2B 11 231543+ (1.13842×153876-2×11384×183578) 13 1380 =373109 于是交售头数平均数估计的标准差为(m)=61.08(头) 2、二重回归估计方法 沿用前一小节的符号,仅讨论B为样本回归系数的情形。 利用第二重样本估计回归系数B,即
二重比估计 yRD 的方差 Var y( ) RD 的估计为: 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n = + − − 1 1 1 2 231543 (1.1384 153876 2 1.1384 183578) 13 13 80 = + − − = 3731.09 于是交售头数平均数估计的标准差为 ( ) 61.08 (头) RD v y = 2、二重回归估计方法 沿用前一小节的符号,仅讨论 为样本回归系数的情形。 利用第二重样本估计回归系数 ,即
∑(2-y)(x2-x) B= j=1 ∑(x2=x)-1 =1 对总体平均数Y的二重抽样的回归估计量为: VirD=y+B(x-x) (6.12) x为第一重样本辅助变量的平均值,x与卫分别是第二重样 本辅助变量与主调查指标的平均值。 yh是总体平均数Y的渐近无偏估计,其方差的估计为 11 v(D)=+--|r22 (6.13) n
对总体平均数 Y 的二重抽样的回归估计量为: 2 2 1 2 2 1 ( )( ) ( ) n j j j n j j y y x x x x = = − − = − ( ) lrD y y x x = + − (6.12) 为第一重样本辅助变量的平均值, 与 分别是第二重样 本辅助变量与主调查指标的平均值。 x x y ylrD 是总体平均数 Y 的渐近无偏估计,其方差的估计为: 2 1 1 2 2 ( ) y lrD y s v y r s n n n = + − (6.13)
r是辅助变量X与主调查指标Y之间的相关系数的估计,即 ∑(P2-)(x2y-x) ∑(x1-x∑(y1- 例63在前例中,改用二重回归估计来估计该县去年全年每 村肉猪平均交售头数,并计算估计的标准差。 解:根据前例数据计算可得 ∑(2y-)(x2y-x) Sx183578 B -=1.193 ∑(x2y-x) 153876
r 是辅助变量X与主调查指标Y之间的相关系数的估计,即 2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = − − (6.14) 例6.3 在前例中,改用二重回归估计来估计该县去年全年每 村肉猪平均交售头数,并计算估计的标准差。 解: 根据前例数据计算可得 2 2 1 2 2 2 1 ( )( ) 183578 1.193 153876 ( ) n j j j yx n x j j y y x x s s x x = = − − = = = = −
∑(2-)(x2y-x) x2;-x B=1.193 153876 =097256 231543 于是该县去年全年每村肉猪平均交售头数Y的二重回归估计 D y+B(x-x =118631+1.193×(1080-1042.08)≈1232(头)
2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = − − 2 2 1 2 2 1 ( ) ( ) n j j n j j x x y y = = − = − x y s s = 153876 1.193 0.97256 231543 = = ( ) lrD y y x x = + − = + − 1186.31 1.193 (1080 1042.08) 1232 (头) 于是该县去年全年每村肉猪平均交售头数 Y 的二重回归估计