《抽样调查》课程PPT教学课件：第六章二重抽样（6.3-6.4）

6.3二重抽样的比估计与回归估计 6.4二重抽样样本量的最优分配

团购合买资源类别：文库，文档格式：PPT，文档页数：20，文件大小：660.5KB

§3二重抛样的眈估针与回归估针二重比估计与二重回归估计的思想与二重分层估计的思想相类似。比估计与回归估计需要事先知道辅助变量X的平均数或总和。如果事先并不掌握辅助变量菂平均数或者总和的信息,但辅助变量的观察要比调查的指标Y容易得多,那么就可以使用二重比估计或者二重回归估计。第一重抽样只观察辅助变量的值,获得均值或者总和的估计,然后在第二重抽样时应用比估计或者回归估计。为简单起见,本节仅讨论对总体平均数的估计。 1、二重比估计方法由于涉及到两个指标,一个是主调查指标Y,另一个是辅助变量X,用数据对表示一个单元(x,y)。先从总体中抽取一个大样本,记作: (x1,y1),(x2,y2),,(xn,yn)

二重比估计与二重回归估计的思想与二重分层估计的思想相类似。比估计与回归估计需要事先知道辅助变量 X的平均数或总和。如果事先并不掌握辅助变量的平均数或者总和的信息，但辅助变量的观察要比调查的指标 Y容易得多，那么就可以使用二重比估计或者二重回归估计。第一重抽样只观察辅助变量的值，获得均值或者总和的估计，然后在第二重抽样时应用比估计或者回归估计。为简单起见，本节仅讨论对总体平均数的估计。 §3 二重抽样的比估计与回归估计 1、二重比估计方法由于涉及到两个指标，一个是主调查指标Y，另一个是辅助变量X，用数据对表示一个单元。先从总体中抽取一个大样本，记作： ( , ) x y 1 1 2 2 {( , ),( , ), ,( , )} x y x y x y n n  

n是样本容量,仅对辅助变量X进行观察,计算样本均值 x=∑ 它是总体辅助变量平均数X的无偏估计。把该样本作为总体进行第二重简单随机抽样,样本容量 n<n,得样本: (x21y21),( 229J22 2n9v2n )} 第一个下标表示第二重抽样。分别计算辅助变量与主调查指标的样本均值 x=∑ 2j =∑ (6.7) 构造总体主调查指标平均数Y的比估计量:

n 是样本容量，仅对辅助变量X进行观察，计算样本均值 1 1 n i i x x n  =  =   它是总体辅助变量平均数 X 的无偏估计。把该样本作为总体进行第二重简单随机抽样，样本容量 n n   ，得样本： 21 21 22 22 2 2 {( , ),( , ), ,( , )} x y x y x y n n 第一个下标表示第二重抽样。分别计算辅助变量与主调查指标的样本均值构造总体主调查指标平均数 Y 的比估计量： 2 1 1 n j j x x n = =  2 1 1 n j j y y n = =  (6.7)

m=yx△Rx 68) --1--1--1-÷*--+-1--1--1 这里用记号R表示y/x,根据第五章第一节的讨论,我们知道当n足够大时,R近似地等fR=y/x,即R是R的渐近无偏估计。因此 RD x =y (6.9) 而由第三章可知,y是总体平均数F的无偏估计。故JRD 是总体平均数Y的渐近无偏估计。二重比估计yRD的方差r(V)的估计为: vm)=2+1-1(0232-2R) (6.10) nnn

这里用记号表示，根据第五章第一节的讨论，我们知道当 n 足够大时，近似地等于，即是的渐近无偏估计。因此 R ˆ R ˆ R ˆ R y x R y x =   而由第三章可知，是总体平均数的无偏估计。故，是总体平均数的渐近无偏估计。 y Y Y RD y 二重比估计 yRD 的方差 Var y( ) RD 的估计为： ˆ RD y y x R x x =     (6.8) RD y y x y x    =    (6.9) 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n   = + − −     (6.10)

这里,2,2和Sm分别为第二重样本关于主调查指标、辅助变量的方差以及它们的协方差,即 ∑(2-y)22=∑ n n一 1(2-D)(x2 n-1 2-x)(6) 例62某县共有200个村,现要估计去年全县平均每村交售肉猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高的相关性,而存栏头数的资料容易取得。采用二重比估计的方法,先抽取80个村作为第一重样本,得年终平均每村的生猪存栏数为1080头。然后在这80个村中又选了13个村作为第二重样本,分别统计了年终的存栏数和交售头数,资料见下表

这里，和分别为第二重样本关于主调查指标、辅助变量的方差以及它们的协方差，即 2 2 , y x s s yx s 2 2 2 1 1 ( ) 1 n y j j s y y n = = − −  2 2 2 1 1 ( ) 1 n x j j s x x n = = − −  2 2 1 1 ( )( ) 1 n yx j j j s y y x x n = = − − −  (6.11) 例6.2 某县共有200个村，现要估计去年全县平均每村交售肉猪的头数。已知肉猪的交售头数与生猪年终存栏数之间有较高的相关性，而存栏头数的资料容易取得。采用二重比估计的方法，先抽取80个村作为第一重样本，得年终平均每村的生猪存栏数为1080头。然后在这80个村中又选了13个村作为第二重样本，分别统计了年终的存栏数和交售头数，资料见下表

试估计该县去年全年平均每村交售肉猪的头数,并计算其标准差。村年终生猪存栏头数(x2)全年交售肉猪头数门2,) 550 610 720 780 3 1500 1600 4 1020 1030 620 600 980 1050 928 977 8 1200 1440 1350 5 10 1750 2210 670 980 12 729 865 13 1530 1710

1 2 3 4 5 6 7 8 9 10 11 12 13 550 720 1500 1020 620 980 928 1200 1350 1750 670 729 1530 610 780 1600 1030 600 1050 977 1440 1570 2210 980 865 1710 村i 2 ( )j 年终生猪存栏头数 x 2 ( )j 全年交售肉猪头数 y 试估计该县去年全年平均每村交售肉猪的头数，并计算其标准差

解:根据表中数据计算可得 j=1186.31x=1042.08R=y/x=11384 ∑(2-y)2 231543 13-1 13-1 ∑(x1-x)2=153876 13-1 ∑(21-)(x2-x)=183578 而n’=80,x=1080,n=13 于是计算可得每村平均交售肉猪头数的估计为 AD=R·x=11384×1080≈1230(头)

解：根据表中数据计算可得 y = 1186.31 x = 1042.08 ˆ R y x = = 1.1384 13 2 2 2 1 1 ( ) 231543 13 1 y j j s y y = = − = −  13 2 2 2 1 1 ( ) 153876 13 1 x j j s x x = = − = −  13 2 2 1 1 ( )( ) 183578 13 1 yx j j j s y y x x = = − − = −  而 n x n   = = = 80 , 1080 , 13 于是计算可得每村平均交售肉猪头数的估计为 ˆ 1.1384 1080 1230 RD y R x =  =    (头)

二重比估计yR的方差vur(A)的估计为: v()=n+-小(R-2B 11 231543+ (1.13842×153876-2×11384×183578) 13 1380 =373109 于是交售头数平均数估计的标准差为(m)=61.08(头) 2、二重回归估计方法沿用前一小节的符号,仅讨论B为样本回归系数的情形。利用第二重样本估计回归系数B,即

二重比估计 yRD 的方差 Var y( ) RD 的估计为： 2 1 1 ˆ 2 2 ˆ ( ) ( 2 ) y RD x yx s v y R s Rs n n n   = + − −     1 1 1 2 231543 (1.1384 153876 2 1.1384 183578) 13 13 80   =  + −   −       = 3731.09 于是交售头数平均数估计的标准差为 ( ) 61.08 (头) RD v y = 2、二重回归估计方法沿用前一小节的符号，仅讨论为样本回归系数的情形。利用第二重样本估计回归系数，即  

∑(2-y)(x2-x) B= j=1 ∑(x2=x)-1 =1 对总体平均数Y的二重抽样的回归估计量为: VirD=y+B(x-x) (6.12) x为第一重样本辅助变量的平均值,x与卫分别是第二重样本辅助变量与主调查指标的平均值。 yh是总体平均数Y的渐近无偏估计,其方差的估计为 11 v(D)=+--|r22 (6.13) n

对总体平均数 Y 的二重抽样的回归估计量为： 2 2 1 2 2 1 ( )( ) ( ) n j j j n j j y y x x x x  = = − − = −   ( ) lrD y y x x = + −   (6.12) 为第一重样本辅助变量的平均值，与分别是第二重样本辅助变量与主调查指标的平均值。 x x y ylrD 是总体平均数 Y 的渐近无偏估计，其方差的估计为： 2 1 1 2 2 ( ) y lrD y s v y r s n n n   = + −     (6.13)

r是辅助变量X与主调查指标Y之间的相关系数的估计,即 ∑(P2-)(x2y-x) ∑(x1-x∑(y1- 例63在前例中,改用二重回归估计来估计该县去年全年每村肉猪平均交售头数,并计算估计的标准差。解:根据前例数据计算可得 ∑(2y-)(x2y-x) Sx183578 B -=1.193 ∑(x2y-x) 153876

r 是辅助变量X与主调查指标Y之间的相关系数的估计，即 2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = −  −    (6.14) 例6.3 在前例中，改用二重回归估计来估计该县去年全年每村肉猪平均交售头数，并计算估计的标准差。解：根据前例数据计算可得 2 2 1 2 2 2 1 ( )( ) 183578 1.193 153876 ( ) n j j j yx n x j j y y x x s s x x  = = − − = = = = −  

∑(2-)(x2y-x) x2;-x B=1.193 153876 =097256 231543 于是该县去年全年每村肉猪平均交售头数Y的二重回归估计 D y+B(x-x =118631+1.193×(1080-1042.08)≈1232(头)

2 2 1 2 2 2 2 1 1 ( )( ) ( ) ( ) n j j j n n j j j j y y x x r x x y y = = = − − = −  −    2 2 1 2 2 1 ( ) ( ) n j j n j j x x y y  = = − = −   x y s s =  153876 1.193 0.97256 231543 = = ( ) lrD y y x x = + −   = +  −  1186.31 1.193 (1080 1042.08) 1232 (头) 于是该县去年全年每村肉猪平均交售头数 Y 的二重回归估计

点击下载完整版文档（PPT格式）

共20页，试读已结束，阅读完整版请下载

点击下载（PPT格式）

浏览记录