§3样本总容量∩的确定 上一节讨论的分配原则主要是在n给定的条件下对各 层中的抽样容量的合理分配。本节面临的问题是在分层抽样 下如何确定n。显然它与调查所要求的精度、调查的统计 量、如何分层、各层的样本容量如何分配以及各层单位抽样 花费等等因素有关。 1、待估的总体参数为Y(总体平均数) 设此时各层的分配额为,m2,…,n,∑=n,那么 =1 W2·S 2 ar(n)=∑ S-∑ N
§3 样本总容量n 的确定 上一节讨论的分配原则主要是在 n 给定的条件下对各 层中的抽样容量的合理分配。本节面临的问题是在分层抽样 下如何确定 n 。显然它与调查所要求的精度、调查的统计 量、如何分层、各层的样本容量如何分配以及各层单位抽样 花费等等因素有关。 1、 待估的总体参数为 Y (总体平均数) 设此时各层的分配额为 1 2 ,那么 1 , , , , k k h h n n n n n = = 2 2 2 1 1 ( ) k k h h h h st h h h W S W S Var y = = n N = −
若按调查的精度要求,t的最大方差为V,则有 ∑WSh/" - h=1 1--1-(428) +0∑W 2 h h h=1 若记On=n/n(相当于样本中的层权),并取n的一次近似 k W2s2 =1 12S hh 0 ∑ (4.29) h=1 那么 n= k (4.30) 2 NV h ∑W h h
若按调查的精度要求, yst 的最大方差为V,则有 若记 h h = n n (相当于样本中的层权),并取 n 的一次近似: 2 2 1 2 1 1 h k n h h n h k h h h W S n V W S N = = = + (4.28) 2 2 2 2 1 0 1 1 k h h k h h h h h h W S W S n V V = = = = (4.29) 那么 0 2 1 1 1 k h h h n n W S NV = = + (4.30)
现考虑按比例分配的情况,此时On=m1/n=N/N=Wn 于是 hh k 2c2 0 ∑WSh(431) h=1 h=1 而 n= 1玉 (4.32) 1+ ∑WS21+ 0 NT台 N 由(432)式,一般地,当n0远远小于N时,自然取n=n 当然实际由(432)式计算n时,公式中的S2应换为6。 假如换为Nman最优分配,则=HS/∑WS k 2 ∑W h h h=1 n (4.3 k + N ∑W
现考虑按比例分配的情况,此时 h h h h = = = n n N N W 2 2 2 0 1 1 1 1 k k h h h h h h h W S n W S V V = = 于是 = = (4.31) 0 0 2 0 1 1 1 1 k h h h n n n n W S NV = N = = + + 而 (4.32) 由(4.32)式,一般地,当 远远小于N时,自然取 。 当然实际由(4.32)式计算 n 时,公式中的 应换为 。 n0 n n = 0 2 Sh 2 h s 假如换为Neyman最优分配,则 1 k h h h h h h W S W S = = 2 1 2 1 1 k h h h k h h h W s n V W s N = = = + (4.33)
假如考虑费用问题,仍按线性费用函数=C+∑cn,当 V给定时,可以计算得: =1 ∑HsV‖∑W么s,/n h=1 h=1 n k (4.34) 丿+ N ∑ hsh h=1 如果总费用c给定,此时将(4.20)式 WS=n写成: h W√cn=Vcn(h=1,2,…,k)(435 将(4.35式对所有的h求和得: ∑WSn =∑WS/∑n2=互 (4.36) =1 =1 C-Co
假如考虑费用问题,仍按线性费用函数 ,当 V给定时,可以计算得: 0 1 k h h h c c c n = = + 1 1 2 1 1 k k h h h h h h h h k h h h W s c W s c n V W s N = = = = + (4.34) 如果总费用c 给定,此时将(4.20)式 h h h 写成: h W S n c = ( 1,2, , ) W S c c n h k h h h h h = = (4.35) 将(4.35)式对所有的h 求和得: 1 1 1 0 k k k h h h h h h h h h h h W S c W S c c n c c = = = = = − (4.36)
于是n=C=c WISIn (h=1,2,,k)(4.37) ∑WS 利用∑n=n,将(37式对所有的h求和,并将S代S =1 k ∑Ws√cn n=( (4.38) ∑ Cinven /=1 例43对一个N相当大的总体进行某指标调查,关心的参数 是总体平均数,假设合理地可以分为两层,一些具体数据如 下表:
利用 ,将(4.37)式对所有的h 求和,并将 代 1 k h h n n = = h s Sh 于是 0 1 ( 1,2, , ) h h h k h j j j j c c W S n h k c W S c = − = = (4.37) 1 0 1 ( ) k h h h h k h h h h W s c n c c W s c = = = − (4.38) 例4.3 对一个N 相当大的总体进行某指标调查,关心的参数 是总体平均数,假设合理地可以分为两层,一些具体数据如 下表:
h Sh 0.3 10 9 0.7 625 为方便起见,设费用函数为C=C11+c22。试求使得 Jmr(V)=1所需的最优分配n、n2 解:W1S1,W2S2 0.3×100.7 一1+ +当产=5.4 9 16 2 由(4.21)可得最优分配为 WS 0.3×10 n1=nx、Sy =n. 0.3×100.7X255 n 27 ×、1 6
Wh 2 Sh h h c 1 2 0.3 0.7 100 625 9 16 为方便起见,设费用函数为 c c n c n = + 1 1 2 2 。试求使得 ( ) 1 Var yst = 所需的最优分配 n n 1 2 、 解: 1 1 2 2 1 2 0.3 10 0.7 25 5.4 9 16 W S W S c c + = + = 由(4.21)可得最优分配为 1 1 1 1 1 1 2 2 1 2 0.3 10 9 5 0.3 10 0.7 25 27 9 16 W S c n n n n W S W S c c = = = + +
WAS 0.7×25 16 22 =n WS WAS =n 0.3×100.7×2527 √2--N 16 由(434)式,此时样本容量n为: ∑ 1n, Vcn‖∑Ws√V h=1 h=1 1 + 2 N ∑W h h=1 由于N相当大,此时∑WN可忽略不计,于是 比)w)
2 2 2 2 1 1 2 2 1 2 0.7 25 16 22 0.3 10 0.7 25 27 9 16 W S c n n n n W S W S c c = = = + + 1 1 2 1 1 k k h h h h h h h h k h h h W s c W s c n V W s N = = = = + 由(4.34)式,此时样本容量n 为: 由于N相当大,此时 可忽略不计,于是 2 1 k h h h W s N = 2 2 1 1 1 h h h h h h h h n W s c W s c V = =
(0.3×10×V9+07×25×√16)×5426.6≈47 得n 5 427=79n 427=348 27 27 此时总费用约为:c=79×9+348×16=6279 2、待估的参数为总体总和Y 由于总体总和的分层估计可以写成x=NJx,样本容量 n的确定是十分容易的。 假设为y的允许的最大方差,由于aur(yn)=N2r(x) 只需将v=例/N代入有关j的一切公式,就可以得到相应的 结论,下面列出有关的结果。 对给定的各层分配额,nn=HO有:
1 (0.3 10 9 0.7 25 16) 5.4 426.6 427 1 = + = 得 1 5 427 79 27 n = = 2 22 427 348 27 n = = 此时总费用约为: c = + = 79 9 348 16 6279 2、 待估的参数为总体总和 Y 由于总体总和的分层估计可以写成 ,样本容量 n 的确定是十分容易的。 st st y N y = 假设 为 的允许的最大方差,由于 只需将 代入有关 的一切公式,就可以得到相应的 结论,下面列出有关的结果。 v 2 ( ) ( ) Var y N Var y st st = st y 2 v v N = st y 对给定的各层分配额, n n h h = 有:
∑NSh/n h==1 (4.39) +∑N 2 hh 二二二二二二二二 1玉NS 若记=3∑ n=(40)5S2(40 则n= 相应的 Neyman最优分配: (4.41) +∑Nn 2 h 若记n=1/ 2 0 hh 则n= k (4.42) h=1 1+∑ hh =1
2 2 1 2 1 k h h h h k h h h N S n v N S = = = + (4.39) 若记 ,则 2 2 0 1 1 k h h h h N S n v = = 0 2 1 1 1 k h h h n n N S v = = + (4.40) 若记 ,则 2 0 1 1 k h h h n N S v = = (4.42) 0 2 1 1 1 k h h h n n N S v = = + 相应的Neyman最优分配: 2 1 2 1 k h h h k h h h N S n v N S = = = + (4.41)
若按比例分配: N∑N 2 h h=1 k (4.43) -+-+-→i+ENSh h=1 N 若记n ∑N52,则n= (4.44) V h=1 1+-0 N
若记 ,则 2 0 1 k h h h N n N S v = = (4.44) 0 0 1 n n n N = + 若按比例分配: 2 1 2 1 k h h h k h h h N N S n v N S = = = + (4.43)