二、区间估计:确定一个区间,并给出该区间包含总体参数的概率 点估计的最大缺点就是由于估计量也是统计量,它必然带有一定误差。换句话说估计值 不可能正好等于真值。但估计值与真值到底差多少,点估计中没有给我们任何信息。而区间 估计正好弥补了这个缺点,它不仅给出了真值的范围,而且给出了真值落入这一范围的概率。 因此区间估计给出的信息显然多于点估计。 1.正态总体μ与σ2的置信区间 我们主要针对正态分布讨论μ与2的置信区间。这一方面是因为正态分布确实是最常 见的分布,另一方面是因为中心极限定理保证了当样本足够大时,不管总体服从什么分布, 我们都可以把x看作近似服从正态分布。因此只有当样本含量较小时,我们才需要对总体是 否服从正态分布加以考虑 求μ与σ2的置信区间时,选择统计量和理论分布的方法与§3.3假设检验中完全相同, 然后根据所得到的接受域对未知参量解不等式,即得到所求的置信区间。若所选择的显著性 水平为a,则该区间包含总体参数的概率即为1-a,称为置信水平 例3.13求σ已知时μ的95%置信区间。 解:σ已知时 x-l ~N(o,1 取a=0.05,则:P(-196≤x-≤1.96)=095 o/√n 解不等式,得:P(x-1.96≤≤x+1.96-)=095 即:u的95%置信区间为:(x-1.96 nx+1.96 例3.13求两样本,标准差σ;未知但相等时μ-μ2的1-a置信区间。 解:两样本,标准差未知但相等时的统计量为: A-2) t(m+n-2) m-1)S1+(n-1)S m+n-2 显著性水平为a的接受域为 tan2(m+n-2)≤t≤t1an2(m+n-2) 把t表达式代入,解得μ1u2的1-a置信区间为: (x1-x2)±1(m+n-2)./(m-1)S2+(n-1)S2 例3.15求正态总体σ2的1-a置信区间 解:设样本方差为S2。根据(36)式,有: (n-1)S2
二、区间估计:确定一个区间,并给出该区间包含总体参数的概率。 点估计的最大缺点就是由于估计量也是统计量,它必然带有一定误差。换句话说估计值 不可能正好等于真值。但估计值与真值到底差多少,点估计中没有给我们任何信息。而区间 估计正好弥补了这个缺点,它不仅给出了真值的范围,而且给出了真值落入这一范围的概率。 因此区间估计给出的信息显然多于点估计。 1. 正态总体μ与σ2 的置信区间 我们主要针对正态分布讨论μ与σ2 的置信区间。这一方面是因为正态分布确实是最常 见的分布,另一方面是因为中心极限定理保证了当样本足够大时,不管总体服从什么分布, 我们都可以把 x 看作近似服从正态分布。因此只有当样本含量较小时,我们才需要对总体是 否服从正态分布加以考虑。 求μ与σ2 的置信区间时,选择统计量和理论分布的方法与§3.3 假设检验中完全相同, 然后根据所得到的接受域对未知参量解不等式,即得到所求的置信区间。若所选择的显著性 水平为α,则该区间包含总体参数的概率即为 1-α,称为置信水平。 例 3.13 求σ已知时μ的 95%置信区间。 解:σ已知时 ~ (0,1) / N n x − 取α= 0.05,则: 1.96) 0.95 / ( 1.96 = − − n x P 解不等式,得: ( −1.96 +1.96 ) = 0.95 n x n P x 即:μ的 95%置信区间为: ( 1.96 , 1.96 ) n x n x − + 例 3.13 求两样本,标准差σi 未知但相等时μ1-μ2 的 1-α置信区间。 解:两样本,标准差未知但相等时的统计量为: ~ ( 2) ) 1 1 ( 2 ( 1) ( 1) ( ) 2 2 2 1 1 2 1 2 + − + + − − + − − − − = t m n m n m n m S n S x x t 显著性水平为α的接受域为: ( 2) ( 2) t / 2 m + n − t t 1− /2 m + n − 把 t 表达式代入,解得μ1-μ2 的 1-α置信区间为: ) 1 1 ( 2 ( 1) ( 1) ( ) ( 2) 2 2 2 1 2 1 2 m n m n m S n S x x t a m n + + − − + − − + − 例 3.15 求正态总体σ2 的 1-α置信区间 解:设样本方差为 S 2。根据(3.6)式,有: ~ ( 1) ( 1) 2 2 2 − − n n S
xa(n-1<(n-1)s2 对未知参数σ2解不等式,得 P < (n x2(n-1) σ2的1-a置信区间为 (n-1)S 2∠(n-1)S ≤σ“ x2(n-1) n 上述几道题我们都只进行了公式的推导,而没有代入具体的数字。当需要解决具体问题 ,只须将数字代入即可。同时,我们并不希望同学们死记上述公式,而是要搞清楚在各种 情况下什么是接受域,应当对哪个变量求解不等式,这样才能针对不同情况灵活使用公式 也有几种情况例题中未涉及,如σ2已知时的双样本u检验,σ2未知且不等的近似t检验, 两方差是否相等的F检验等。相信同学们只要真正理解、掌握了上述几道例题的思想与方 法,这些问题是不难解决的。另外,在某些情况下也会要求单侧置信区间,此时只要用单侧 分位数代替双侧分位数即可 2.二项分布中P的置信区间。(参见国标GB4087.2-83) 项分布的概率函数为: P(x=x,p)=Cnp(1-py-,x-0.1,2.-n 参数p的点估计为:-。(n:样本含量。x:样本中具有某种属性的个体数) 置信区间的求法如下(Pu,P1分别为区间的上下限) 1°n<10时,置信区间一般太宽,无实用价值。 2°n≥10时,采用下述公式: Y? (3.24) y2+y1·F1a(1,y2) 其中yY1=2(n-x+1),y2=2x 2+y1/F1.(2y1) 其中Y:=2(n-x),Y2=2(x+1)。 例3.16取n=20,x=8,1-a=0.95,求上单侧,下单侧,双侧置信区间。 解:上单侧:n=20,x=8,Y=2(20-8)=24,y=2(8+1)=18 2.11+2.03 查F分布表,取F.5(15,24)与Fa95(20,24)的平均数 =207代入公式,得 P 18+24/2.070.608 所求区间为:[0,0.608) 下单侧:n=20,x=8,y1=2(20-8+1)=26,y2=2x=16
∴ = − − − − − ( 1) 1 ( 1) ( 1) 2 1 2 2 2 n n S P n 对未知参数σ2 解不等式,得: = − − − − − − 1 ( 1) ( 1) ( 1) ( 1) 2 2 2 2 2 2 1 2 n n S n n S P ∴σ2 的 1-α置信区间为: ( 1) ( 1) ( 1) ( 1) 2 2 2 2 2 2 1 2 − − − − − n n S n n S 上述几道题我们都只进行了公式的推导,而没有代入具体的数字。当需要解决具体问题 时,只须将数字代入即可。同时,我们并不希望同学们死记上述公式,而是要搞清楚在各种 情况下什么是接受域,应当对哪个变量求解不等式,这样才能针对不同情况灵活使用公式。 也有几种情况例题中未涉及,如σ2 已知时的双样本 u 检验,σ2 未知且不等的近似 t 检验, 两方差是否相等的 F 检验等。相信同学们只要真正理解、掌握了上述几道例题的思想与方 法,这些问题是不难解决的。另外,在某些情况下也会要求单侧置信区间,此时只要用单侧 分位数代替双侧分位数即可。 2. 二项分布中 P 的置信区间。(参见国标 GB4087.2–83) 二项分布的概率函数为: ( , ) (1 ) , x x n x P X x n p Cn p p − = = − x = 0, 1, 2, ……n 参数 p 的点估计为: n x 。(n:样本含量。x:样本中具有某种属性的个体数) 置信区间的求法如下(Pu,PL 分别为区间的上下限): 1°n<10 时,置信区间一般太宽,无实用价值。 2°n≥10 时,采用下述公式: ( , ) 1 2 2 2 1 1 2 − + = F PL (3.24) 其中γ1= 2(n-x+1),γ2 = 2x; ( , ) 2 1 2 2 1 1 2 − + = F Pu (3.25) 其中γ1= 2(n-x),γ2 = 2(x+1)。 例 3.16 取 n = 20, x = 8, 1-α= 0.95, 求上单侧,下单侧,双侧置信区间。 解:上单侧:n = 20, x = 8, γ1= 2(20-8)= 24,γ2= 2(8+1)= 18 查 F 分布表,取 F0.95(15,24)与 F0.95(20,24)的平均数: 2.07 2 2.11 2.03 = + 代入公式,得: 0.608 18 24 / 2.07 18 = + Pu = ∴ 所求区间为:[0,0.608)。 下单侧:n = 20, x = 8, γ1= 2(20-8+1)= 26,γ2 = 2x = 16
查F分布表,取Fas(24,16)与Fa9(30,16)的平均数 2.24+2.19 =2215代入公式 =0.217 16+26×2.215 所求区间为:(0.217,1]。 双侧:n=20,x=8 P:Y=2(20-8+1)=26,y2=2·8=16 查F分布表,取Fmn(24,16)与F(30,16)的平均数:263+251=260,代入公式, 得 0.191 16+26×2.6 Pa:Y1=2(20-8)=24,y2=2(8+1)=18, 查表,取F0(15,24)与F05(20,24)的平均244+1.3=2385,代入公式,得: P +24/2.385 ∴所求区间为:(0.191,0.641) 3°n>30,且0.1<-<0.9时,可使用下述近似公式 n P=P-uyR(l-P)/(n+2d) (3.26) P=P2+yP(1-P2)/n+2d) 式中P=x+d-05,B2=x+d+05,m为正态分布的分位数,d为常数,取值见表 n+2d n+2d 表3.1d与ua的取值 置信水平1-a 单侧 双侧 0.90 1.2820.7 1.6451.0 0.95 1.6451 1.9601.5 0.99 2.32 2.5762.5 例3.17取n=40,x=12,1-a=0.95,求双侧置信区间(P,P)。 解:查表,得d=1.5,ua=1.960代入公式,得: ≈x+d-0.512+1.5-0.5 0.3023 n+2d40+2×1.5 x+d+0.512+1.5+0.5 P2 0.3256 n+2d 40+2×1.5
查 F 分布表,取 F0.95(24,16)与 F0.95(30,16)的平均数: 2.215 2 2.24 2.19 = + 代入公式,得: 0.217, 16 26 2.215 16 = + PL = ∴ 所求区间为:(0.217,1]。 双侧:n=20, x=8 PL: γ1= 2(20-8+1)= 26, γ2 = 2·8 = 16 查 F 分布表,取 F0.975(24,16)与 F0.975(30,16)的平均数: 2.60 2 2.63 2.57 = + ,代入公式, 得: 0.191 16 26 2.6 16 = + PL = ; Pu: γ1= 2(20-8)= 24, γ2 = 2(8+1)= 18, 查表,取 F0.975(15,24)与 F0.975(20,24)的平均数: 2.385 2 2.44 2.33 = + ,代入公式,得: 0.641 18 24 / 2.385 18 = + Pu = ∴ 所求区间为:(0.191, 0.641)。 3° n>30, 且 0.1< n x <0.9 时,可使用下述近似公式: (1 )/( 2 ) PL = P1 − u P1 − P1 n + d (3.26) (1 )/( 2 ) Pu = P2 + u P2 − P2 n + d (3.27) 式中 n d x d P n d x d P 2 0.5 , 2 0.5 1 2 + + + = + + − = ,u 为正态分布的分位数,d 为常数,取值见表 3.1。 表 3.1 d 与 uα的取值 置信水平 1-α 单侧 uα d 双侧 uα d 0.90 1.282 0.7 1.645 1.0 0.95 1.645 1 1.960 1.5 0.99 2.326 2 2.576 2.5 例 3.17 取 n=40,x=12, 1-α=0.95, 求双侧置信区间(PL,Pu)。 解:查表,得 d=1.5, uα=1.960 代入公式,得: 0.3023 40 2 1.5 12 1.5 0.5 2 0.5 1 = + + − = + + − = n d x d P 0.3256 40 2 1.5 12 1.5 0.5 2 0.5 2 = + + + = + + + = n d x d P
P=P-UaVP(-P)/(n+2a =03023-196×√03023×0697743 P2+Ua√P2(1-P2)n+2d) 0.3256+196×√03256×0.6744/43 =04657 所求置信区间为:(0.1650,0.4657)。 4°当n>30,且一≤0.1或一≥09时,可采用泊松近似。近似公式为 2n-x+1+ 当-接近0 P (3.28) n+x-2 n+x+2 式中A=x2(2x),2=x20[2(n-x)+2],x2和x2。为x2分布的分位数,依单侧 或双侧区间a可取值a或。括号中为自由度。 22 当-接近0 P n+x+1-1 当-接近1 n+x+1+2 式中2=2x2(2x+2),2222(m-x,x2和x2同上。 例3.18取n=50,x=5,1-a=0.95,求双侧置信区间 解: 0.1,用接近于0的公式 P.:=a25(10)=÷×3.247=1.6235 2 2×16235 h=2n-x+1+1=2×50-5+1+16235 =0.03396 P:几=÷20975(12)=÷×23.337=116685 23.337 0.2188 n-x+A2×50-5+116685 所求置信区间为(0.03396,0.2188) 三、正态总体区间估计与显著性检验的关系: 1°来自于同一不等式,结果是一致的。因此必要时也可使用置信区间进行假设检验:只要 看看H中的理论值是否落在置信区间中就可以了
0.1650 0.3023 1.96 0.3023 0.6977 / 43 (1 )/( 2 ) 1 1 1 = = − PL = P −U P − P n + d 0.4657 0.3256 1.96 0.3256 0.6744 / 43 (1 ) /( 2 ) 2 2 2 = = + Pu = P +U P − P n + d ∴ 所求置信区间为:(0.1650,0.4657)。 4°当 n>30, 且 0.1 n x 或 0.9 n x 时,可采用泊松近似。近似公式为: + + + − − + + = , 1 , 0 2 1 2 当 接近 当 接近 n x n x n x n x n x PL (3.28) 式中 [2( ) 2] 2 1 (2 ), 2 1 2 1 2 = a x = −a n − x + , 2 1 2 a和 −a 为 2 分布的分位数,依单侧 或双侧区间 a 可取值α或 2 。括号中为自由度。 + + + + + − − + = , 1 1 1 , 0 2 2 当 接近 当 接近 n x n x n x n x n x Pu 式中 [2( )] 2 1 (2 2), 2 1 2 2 1 x n x = −a + = a − , 2 1 2 a和 −a 同上。 例 3.18 取 n=50, x=5, 1-α=0.95, 求双侧置信区间。 解: = 0.1 n x ,用接近于 0 的公式。 3.247 1.6235 2 1 (10) 2 1 : 2 PL = 0.025 = = 0.03396 2 50 5 1 1.6235 2 1.6235 2 1 2 = − + + = − + + = n x PL 23.337 11.6685 2 1 (12) 2 1 : 2 Pu = 0.975 = = 0.2188 2 50 5 11.6685 23.337 2 2 = − + = − + = n x Pu ∴ 所求置信区间为(0.03396,0.2188)。 三、正态总体区间估计与显著性检验的关系: 1°来自于同一不等式,结果是一致的。因此必要时也可使用置信区间进行假设检验:只要 看看 H0 中的理论值是否落在置信区间中就可以了
2°直观上有一定差异。显著性检验是把H:μ=μ。视为固定常数,依据它建立理论分布,再 来判断实际观察值X是否小概率事件;区间估计则是把观察值X视为最可能的μ的取值 点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 3.5非参数检验I:x2检验 前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于 某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检 验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分 布,两个事件是否独立等等 x2检验在非参数检验中应用相当广泛。在以前的检验中我们也用过x2分布,当时用于 检验总体的方差σ2是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下 的 Pearson定理 Pearson定理:当(P1,P2,…P)是总体的真实概率分布时,统计量 np (3.30) 随n的增加渐近于自由度为r-1的x2分布 (3.30)式的统计量也被称为 Pearson计量。其中P,P2,…P为r种不同属性出现的概 率,n为样本含量,n为样本中第i种属性出现的次数。 由于n是样本中第ⅰ种属性出现的次数,是观察值;而p是第i种属性出现的概率,因 此np可被看作是理论上该样本中第i种属性应出现的次数。这样我们就可以换一种写法 把n视为观察值O,np视为理论值T;,则(3.30)式可写成 (O1-11 (3.31) 这样一来, Pearson定理实际是说如果样本确实抽自由(P:,P2,…P)代表的总体,O和 T之间的差异就只是随机误差,则 Pearson统计量可视为服从x2分布:反之若样本不是抽自 由(P1,P2,…P)代表的总体,O和T1之间的差异就不只是随机误差,从而使计算出的统 计量有偏大的趋势。因此对上述 Pearson统计量进行上单尾检验可用于判断离散型数据的观 察值与理论值是否吻合。此时统计假设为:Ho:O1=T:;HA:O≠Tl,但检验是上单尾检验。 显然,上述数据应满足 n2∑P 另外,为了使 Pearson统计量近似服从x(r-1)分布,还要求: 1°各理论值均大于5。即:T≥5,i=1,2,…,r。如果有一个或多个T<5,会使 Pearson 统计量明显偏离ⅹ2分布,可能导致错误检验结果 2°若自由度为1,则应作连续性矫正,即把统计量改为 z=∑-列-0 T 还应注意由于 Pearson统计量的H为O=T,所以统计量值为0意味着H0严格成立
2°直观上有一定差异。显著性检验是把 H0:μ=μ0 视为固定常数,依据它建立理论分布,再 来判断实际观察值 X 是否小概率事件;区间估计则是把观察值 X 视为最可能的μ的取值 (点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 平)。 §3.5 非参数检验 I:χ2检验 前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于 某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检 验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分 布,两个事件是否独立等等。 χ2 检验在非参数检验中应用相当广泛。在以前的检验中我们也用过χ2 分布,当时用于 检验总体的方差σ2 是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下 的 Pearson 定理。 Pearson 定理:当(P1,P2,…Pr)是总体的真实概率分布时,统计量 = − = r i i i i np n np 1 2 2 ( ) (3.30) 随 n 的增加渐近于自由度为 r-1 的χ2 分布。 (3.30)式的统计量也被称为 Pearson 计量。其中 P1,P2,… Pr 为 r 种不同属性出现的概 率,n 为样本含量,ni 为样本中第 i 种属性出现的次数。 由于 ni 是样本中第 i 种属性出现的次数,是观察值;而 pi 是第 i 种属性出现的概率,因 此 npi 可被看作是理论上该样本中第 i 种属性应出现的次数。这样我们就可以换一种写法, 把 ni 视为观察值 Oi,npi 视为理论值 Ti,则(3.30)式可写成: = − = r i i i i T O T 1 2 2 ( ) (3.31) 这样一来,Pearson 定理实际是说如果样本确实抽自由(P1,P2,…Pr)代表的总体,Oi 和 Ti 之间的差异就只是随机误差,则 Pearson 统计量可视为服从χ2 分布;反之若样本不是抽自 由(P1,P2,…Pr)代表的总体,Oi和 Ti 之间的差异就不只是随机误差,从而使计算出的统 计量有偏大的趋势。因此对上述 Pearson 统计量进行上单尾检验可用于判断离散型数据的观 察值与理论值是否吻合。此时统计假设为:H0:Oi = Ti;HA:Oi ≠ TI,但检验是上单尾检验。 显然,上述数据应满足: = = = = r i i r i Oi n p 1 1 , 1。 另外,为了使 Pearson 统计量近似服从χ2 (r–1)分布,还要求: 1°各理论值均大于 5。即:Ti ≥ 5, i = 1, 2,…,r。如果有一个或多个 Ti < 5,会使 Pearson 统计量明显偏离χ2 分布,可能导致错误检验结果。 2°若自由度为 1,则应作连续性矫正,即把统计量改为: = − − = r i i i i T O T 1 2 2 ( 0.5) (3.32) 还应注意由于 Pearson 统计量的 H0 为 Oi = Ti,所以统计量值为 0 意味着 H0 严格成立
即它不会有下侧拒绝域,永远只用上单侧检验。 Pearson统计量的应用主要有以下两个方面 、吻合度检验。用于检验总体是否服从某个指定分布。 方法为:设给定分布函数为F(x)。首先把x的值域分为r个不相重合的区间,并统计样 本含量为n的一次抽样中,观察值落入各区间的次数,把落入区间i的次数记为O,i=1,2, r;再算出在指定的分布下,x落入每一区间的概率p,i=1,2,…r。由于样本含量为n, 因此理论上落入每一区间的次数应为T=n·p;从而可用 Pearson统计量进行检验。 需要特别注意的是,在做吻合度检验时, Pearson统计量的自由度可能发生变化。一般 来说,如果给定的分布函数F(x)中不含有未知参数,则 Pearson统计量的自由度就是r-1 但如果F(x)中含有一个或几个未知参数,需要用从样本中计算出的估计量代替,则使用了几 个估计量自由度一般就应在r-1的基础上再减去几。如例3.19,观测值共分了9组,自由 度本应为9-1=8,但由于理论分布的μ和σ2未知,使用估计量代替,因此自由度应为8 例3.19调查了某地200名男孩身高,得x=139.5,S=7.42,分组数据见下表。男孩身 高是否符合正态分布? 表3.2男孩身高分布表 0.0344 6.88 0.1806 [126,130) 0.0658 13.16 0.0019 0.1291 3.0081 3812 138,142) 0.2120 42.40 3.7420 0.1776 0.1781 46.15 18 0.1120 0.8637 150,154) 0.0532 10.64 0.0380 154+∞) 0.0253 3.0506 表中前三列是观察数据,后三列是计算所得。计算公式为:设区间为x1,x1),则 P2=P(x1≤x<x)=Φ(-)-d( 其中Φ为N(0,1)的分布函数,可查表得到。 T;=200·P (O-7)2 11.0963 自由度df=9-1-2=6(:用x,S2作为μ,2的估计量,∴应再减去二个自由度)。查 x2分布表,得:x95(6)=12.592。由于x2<x095(6),故可认为男孩身高分布与正态分 布无明显差异 例3.20以红米非糯稻和白米襦稻杂交,子二代检测179株,数据如下: 属性(x)红米非糯(0)红米糯(1)白米非糯(2)白米糯(3) 31 179 问子二代分离是否符合9:3:3:1的规律? 解:若符合9:3:3:1的规律,则应有
即它不会有下侧拒绝域,永远只用上单侧检验。 Pearson 统计量的应用主要有以下两个方面: 一、吻合度检验。用于检验总体是否服从某个指定分布。 方法为:设给定分布函数为 F(x)。首先把 x 的值域分为 r 个不相重合的区间,并统计样 本含量为 n 的一次抽样中,观察值落入各区间的次数,把落入区间i 的次数记为 Oi,i=1, 2,… r;再算出在指定的分布下,x 落入每一区间的概率 pi ,i=1, 2,… r。由于样本含量为 n, 因此理论上落入每一区间的次数应为 Ti = n·pi;从而可用 Pearson 统计量进行检验。 需要特别注意的是,在做吻合度检验时,Pearson 统计量的自由度可能发生变化。一般 来说,如果给定的分布函数 F(x)中不含有未知参数,则 Pearson 统计量的自由度就是 r – 1; 但如果 F(x)中含有一个或几个未知参数,需要用从样本中计算出的估计量代替,则使用了几 个估计量自由度一般就应在 r – 1 的基础上再减去几。如例 3.19,观测值共分了 9 组,自由 度本应为 9 – 1 = 8,但由于理论分布的μ和σ2 未知,使用估计量代替,因此自由度应为 8 – 2 = 6。 例 3.19 调查了某地 200 名男孩身高,得 x =139.5, S = 7.42 ,分组数据见下表。男孩身 高是否符合正态分布? 表 3.2 男孩身高分布表 组号 区间 Oi Pi Ti (Oi - Ti) 2 /Ti 1 (-∞, 126) 8 0.0344 6.88 0.1806 2 [126, 130) 13 0.0658 13.16 0.0019 3 [130, 134) 17 0.1291 25.81 3.0081 4 [134, 138) 37 0.1906 38.12 0.0332 5 [138, 142) 55 0.2120 42.40 3.7420 6 [142, 146) 33 0.1776 35.51 0.1781 7 [146, 150) 18 0.1120 22.40 0.8637 8 [150, 154) 10 0.0532 10.64 0.0380 9 [154, +∞) 9 0.0253 5.07 3.0506 表中前三列是观察数据,后三列是计算所得。计算公式为:设区间为[xi-1, xi),则 ( ) ( ) ( ) 1 1 S x x S x x p P x x x i i i i i − − − = = − − , 其中Ф为 N(0,1)的分布函数,可查表得到。 T i = 200·Pi = = − = r i i i i T O T 1 2 2 11.0963 ( ) 自由度 df = 9-1-2 = 6 (∵用 x ,S 2 作为μ,σ2 的估计量,∴应再减去二个自由度)。查 χ 2 分布表,得: (6) 12.592 2 0.95 = 。由于χ2 < 2 0.95 (6),故可认为男孩身高分布与正态分 布无明显差异。 例 3.20 以红米非糯稻和白米糯稻杂交,子二代检测 179 株,数据如下: 属性(x) 红米非糯(0) 红米糯(1) 白米非糯(2) 白米糯(3) 合计 株数 96 37 31 15 179 问子二代分离是否符合 9 : 3 : 3 : 1 的规律? 解:若符合 9 : 3 : 3 : 1 的规律,则应有:
9 p(0) p(1)=p(2) p(3) 9+3+3+116 70=16×179=100095 T=2s、319=35625 16 T (96-1006875)2(37-335625)2(31-335625)2,(15-11.1875) 100.6875 33.5625 33.5625 11.1875 =0.2182+0.3521+0.1956+1.2992 =2.0651 查表,x295(3)=7.8147>x2,…∴差异不显著,接受H,子二代分离规律符合93:3l 本题理论分布中没有未知参数,因此ⅹ2统计量自由度仍为3。 例3.21用血球计数板计数每微升培养液中的酵母细胞,得数据如下表中的前两列: 细胞数i 出现次数O 概率p (O -T/T 213 0.5054 202.16 0.581 28 0.3449 137.96 0.719 0.1177 47.08 2.158 3 18 0.0268 10.7 0.0046 6.613 0.0006 0.24 合计 问此细胞计数数据是否符合 Poisson分布? 解: Poisson分布的概率函数:p(x=1)=-e-,i=0,2,…。其中只有唯一参数λ,既 是期望又是方差。∴可用x估计。 x=1S10D28+2×37+3×18+4×3+5)=06825 令λ=x=06825,代入概率函数可求出i=0,1,…5的概率p;,填入表中第三列。 令T=n·p=400·p,填入表中第四列。由于i=4,5时T值太小,所它们与i=3合并。 即令O3=18 3+1=22,T=10.72+1.84+0.24=12 计算O-7)2,填入第五列。将第五列各数字相加,得:x2=1071 由于计算理论分布时使用了一个估计量,因此自由度df=4-2=2 查表:x95(2)=5.9915,κ.9(2)=9.2103,x2>x09,∴差异极显著,拒绝H,观 测数据不符合 Poisson分布
16 1 , (3) 16 3 , (1) (2) 16 9 9 3 3 1 9 (0) = = = = + + + p = p p p 179 33.5625 16 3 179 100.6875, 16 9 1 2 0 = = = = = T T T 179 11.1875 16 1 T3 = = 2.0651 0.2182 0.3521 0.1956 1.2992 11.1875 (15 11.1875) 33.5625 (31 33.5625) 33.5625 (37 33.5625) 100.6875 (96 100.6875) ( ) 2 2 2 2 3 0 2 2 = = + + + − + − + − + − = − = i= i i i T O T 查表, 2 2 0.95 (3) = 7.8147 ,∴ 差异不显著,接受 H0,子二代分离规律符合 9:3:3:1。 本题理论分布中没有未知参数,因此χ2 统计量自由度仍为 3。 例 3.21 用血球计数板计数每微升培养液中的酵母细胞,得数据如下表中的前两列: 细胞数 i 出现次数 Oi 概率 pi Ti (Oi–Ti) 2 / Ti 0 213 0.5054 202.16 0.581 1 128 0.3449 137.96 0.719 2 37 0.1177 47.08 2.158 3 18 0.0268 10.72 4 3 0.0046 1.84 6.613 5 1 0.0006 0.24 合计 400 1 400 10.17 问此细胞计数数据是否符合 Poisson 分布? 解:Poisson 分布的概率函数: , 0,1,2, ! ( = ) = = − e i i p x i i 。其中只有唯一参数λ,既 是期望又是方差。∴可用 x 估计。 = = = + + + + = 5 1 (128 2 37 3 18 4 3 5) 0.6825 400 1 1 i Oi i n x 令 = x = 0.6825 ,代入概率函数可求出 i=0,1,…5 的概率 pi,填入表中第三列。 令 Ti= n·pi= 400·pi,填入表中第四列。由于 i=4,5 时 Ti 值太小,所它们与 i=3 合并。 即令 O3 = 18 + 3 + 1 = 22, T3 = 10.72 + 1.84 + 0.24 = 12.80 计算 i i i T O T 2 ( − ) ,填入第五列。将第五列各数字相加,得:χ2 = 10.71 由于计算理论分布时使用了一个估计量,因此自由度 df = 4 - 2 = 2。 查表: (2) 5.9915, (2) 9.2103, 2 0.99 2 0.95 = = 2 0.99 2 ,∴差异极显著,拒绝 H0,观 测数据不符合 Poisson 分布
般来说细胞计数应服从 Poisson分布,其前提条件就是各细胞之间既不能互相吸引, 也不能互相排斥,必须是互不影响。本例中差异主要表现在出现3个以上细胞的次数明显偏 多,也许说明细胞间有某种吸引力,有聚在一起的趋势 、列联表的独立性检验 列联表独立性检验是 Pearsson统计量的又一重要应用。它主要用于检验两个事件是否独 立,例如处理方法和效果是否独立。问题可以这样提出 设实验中可采用r种处理方法,可能得到C种不同的实验结果。一个常见的问题就是 这r种方法的效果是否相同?或改一种问法:方法与效果是否独立? 例3.22下表是对某种药的试验结果: 表3.3给药方式与药效试验结果 给药方式 有效(A) 无效(A) 总数 有效率 口服(B) 注射(B) 31 95 67.4% 问给药方式对药效果是否有影响? 分析:表中各行、各列总数分别为口服与注射、有效与无效的总数。若A代表有效,B代 表口服,则应有:P(A)=第一列总数总数;PB)=第一行总数总数。这样,若我们保持 表中各行各列总数不变,即保持口服与注射、有效与无效的总数不变,也就是保持了P(A)、 P(B)等概率不变。在这样的条件下,若再有H0成立,即药效与给药方式无关,A与B互 相独立,则有:P(AB)=P(A)·P(B)。此时总数XP(AB)就应是口服且有效的理论值。与此 类似,可用以下方法计算出各格的理论值T:T=(行总数×列总数)总数,从而可使用 Pearson统计量对Ho:O-T=0(或A与B独立)进行检验。这种方法就称为列联表独立性 检验。设表有r行c列,由于在这种方法中使用了各行、各列总数作为常数,自由度也应 相应减少。若各行总数都确定了,总数当然也就确定了:此时列总数只要确定c-1个即 可,最后一个可用解方程的方法算出来。因此实际使用的常数不是r+c个,而是r+c-1 个。这样一来,自由度应为: df=r·c-r-c+1=(r-1)·(c-1)=(行总数-1)×(列总数-1) 解:在保持各行、列总数不变,且A与B独立的条件下,计算各格理论值T: 有效(A) 无效(A) 行总数 口服(B) O1=58 7、98×122 98×71 =61.95 T =36.05 注射(B) 95×122 =6057 1933495 列总数 总数:193 Df=(2-1)×(2-1)=1 x258=61951-052+(40=3605-052+064-60-055 6195 36.05 60.05
一般来说细胞计数应服从 Poisson 分布,其前提条件就是各细胞之间既不能互相吸引, 也不能互相排斥,必须是互不影响。本例中差异主要表现在出现 3 个以上细胞的次数明显偏 多,也许说明细胞间有某种吸引力,有聚在一起的趋势。 二、列联表的独立性检验 列联表独立性检验是 Pearsson 统计量的又一重要应用。它主要用于检验两个事件是否独 立,例如处理方法和效果是否独立。问题可以这样提出: 设实验中可采用 r 种处理方法,可能得到 C 种不同的实验结果。一个常见的问题就是: 这 r 种方法的效果是否相同?或改一种问法:方法与效果是否独立? 例 3.22 下表是对某种药的试验结果: 表 3.3 给药方式与药效试验结果 给药方式 有效(A) 无效( A ) 总数 有效率 口服(B) 58 40 98 59.2% 注射( B ) 64 31 95 67.4% 总数 122 71 193 问给药方式对药效果是否有影响? 分析:表中各行、各列总数分别为口服与注射、有效与无效的总数。若 A 代表有效,B 代 表口服,则应有:P(A) = 第一列总数/总数;P(B) = 第一行总数/总数。这样,若我们保持 表中各行各列总数不变,即保持口服与注射、有效与无效的总数不变,也就是保持了 P(A)、 P(B)等概率不变。在这样的条件下,若再有 H0 成立,即药效与给药方式无关,A 与 B 互 相独立,则有:P(AB)= P(A)·P(B)。此时总数×P(AB)就应是口服且有效的理论值。与此 类似,可用以下方法计算出各格的理论值 Ti:Ti = (行总数×列总数)/总数,从而可使用 Pearson 统计量对 H0: O-T = 0 (或 A 与 B 独立)进行检验。这种方法就称为列联表独立性 检验。设表有 r 行 c 列,由于在这种方法中使用了各行、各列总数作为常数,自由度也应 相应减少。若各行总数都确定了,总数当然也就确定了;此时列总数只要确定 c-1 个即 可,最后一个可用解方程的方法算出来。因此实际使用的常数不是 r+c 个,而是 r+c-1 个。这样一来,自由度应为: df = r c − r − c +1 = (r −1)(c −1) = (行总数-1)×(列总数-1) 解:在保持各行、列总数不变,且 A 与 B 独立的条件下,计算各格理论值 Ti: 有效(A) 无效( A ) 行总数 口服(B) O1 = 58 61.95 193 98 122 1 = T = O2 = 40 36.05 193 98 71 2 = T = 98 注射( B ) O3 = 64 60.05 193 95 122 3 = T = O4 = 31 34.95 193 95 71 4 = T = 95 列总数 122 71 总数:193 Df=(2-1)×(2-1)=1 60.05 ( 64 60.05 0.5) 36.05 ( 40 36.05 0.5) 61.95 ( 58 61.95 0.5) 2 2 2 2 − − + − − + − − =
(31-3495-0.5) =0.19213+0.33017+0.19821+0.34056=1.061 34.95 查x2分布表,得:x2(1)=3.841。:x2<x2(1),∴接受H,给药方式与药效无关。 几点说明 1°由于保持各列、行总数不变,相当每行、每列均加了一个约束,因此对r行c列列联表 自由度为df=(r-1)·(c-1) 2°由于A与B独立,有:P(AB)=P(A)·P(B);这样在保持各行各列总数不变的条 件下,可得T的计算公式为 T:=n·p=n·P(AB)=n·P(A)·P(B) 总数x行总数列总数行总数×列总数 (3.33) 总数总数 总数 3°由于常用的2×2列联表自由度为1,因此一般应加连续性矫正,即使用公式(3.32)代 替(3.31) 4°对于2×2列联表还可能有一种特殊的单侧检验。例如在例3.22中,若已知该药注射效 果只会比口服好,不会比口服差:或问题改为:“问注射效果是否优于口服?”此时相当 于专业知识或实际问题要求只检验注射效果偏好的一个单侧。前已述及,由于 Pearson统 计量自身的构造,它只能有上单尾检验,现在却又出来一个单侧。关于这个问题可进行如 下分析 2×2列联表自由度只有1,在它的4个格中只要有一个格的值确定了,其他3个格的 值也就都定下来。因此O偏离T的情况只有某格O偏大和偏小两种。这里所说的特殊的 单侧检验,实际就是在这两种中检验一种。若行或列不只2,则自由度多于1,O1偏离T 的情况就会复杂得多,不能只归结为两种了。 由于 Pearsson统计量的分子为(O-Tr)2,对某一个格来说,O偏大偏小都会使统计量 的值偏大。这说明在ⅹ2上单尾的拒绝域中,本来就包含了某一格偏大或偏小两种情况, 而且这两种情况是对称的,即它们出现的可能相等。在2×2列联表中,又只有这两种情 况。这样一来,我们可以认为原来上单尾包含的值为a的概率中,有α/2是属于某格O1 偏大,a/2属于这一O偏小。具体到例3.21,就是有α/2属于注射优于口服,a/2属 于注射劣于口服。因此此时 Pearsson统计量的上单尾检验对注射效果来说,相当一种双尾 检验:而如果要对注射效果进行单尾检验,同时又要保持α不变的话,则査表时不应查 x1a,而要查x12a,即对a=0.05来说,应查xa90。此时拒绝域对应的概率为2a,但 只有一半即α是属于要检验的单尾。要注意由于统计量不能区分O偏大还是偏小,因此 计算统计量之前应先检查一下注射有效的数据是否大于相应的T,如果不大于,则不必进 行任何检验,直接得出结论“注射不明显优于口服”;若大于T,再按上述方法与x12a比 较进行检验 例3.23为检验某种血清预防感冒的作用;将用了血清的500人与未用血清的另500人在一 年中的医疗记录进行比较,统计他们是否曾患感冒,得如下数据: 未感冒 曾感冒
0.19213 0.33017 0.19821 0.34056 1.061 34.95 ( 31 34.95 0.5) 2 = + + + = − − + 查χ2 分布表,得: (1) 3.841 2 0.95 = 。 (1) 2 0.95 2 ,∴接受 H0,给药方式与药效无关。 几点说明: 1°由于保持各列、行总数不变,相当每行、每列均加了一个约束,因此对 r 行 c 列列联表, 自由度为 df = (r – 1)·(c – 1)。 2°由于 A 与 B 独立,有:P(AB)= P(A)·P(B);这样在保持各行各列总数不变的条 件下,可得 Ti 的计算公式为: Ti = n·pI = n·P(AB) = n·P(A)·P(B) =总数× 总数 行总数 列总数 总数 列总数 总数 行总数 = (3.33) 3°由于常用的 2×2 列联表自由度为 1,因此一般应加连续性矫正,即使用公式(3.32)代 替(3.31)。 4°对于 2×2 列联表还可能有一种特殊的单侧检验。例如在例 3.22 中,若已知该药注射效 果只会比口服好,不会比口服差;或问题改为:“问注射效果是否优于口服?”此时相当 于专业知识或实际问题要求只检验注射效果偏好的一个单侧。前已述及,由于 Pearson 统 计量自身的构造,它只能有上单尾检验,现在却又出来一个单侧。关于这个问题可进行如 下分析: 2×2 列联表自由度只有 1,在它的 4 个格中只要有一个格的值确定了,其他 3 个格的 值也就都定下来。因此 Oi 偏离 Ti 的情况只有某格 Oi 偏大和偏小两种。这里所说的特殊的 单侧检验,实际就是在这两种中检验一种。若行或列不只 2,则自由度多于 1,Oi 偏离 Ti 的情况就会复杂得多,不能只归结为两种了。 由于 Pearsson 统计量的分子为(Oi – Ti) 2,对某一个格来说,Oi 偏大偏小都会使统计量 的值偏大。这说明在χ2 上单尾的拒绝域中,本来就包含了某一格偏大或偏小两种情况, 而且这两种情况是对称的,即它们出现的可能相等。在 2×2 列联表中,又只有这两种情 况。这样一来,我们可以认为原来上单尾包含的值为α的概率中,有α/2 是属于某格 Oi 偏大,α/2 属于这一 Oi 偏小。具体到例 3.21,就是有α/2 属于注射优于口服,α/2 属 于注射劣于口服。因此此时 Pearsson 统计量的上单尾检验对注射效果来说,相当一种双尾 检验;而如果要对注射效果进行单尾检验,同时又要保持α不变的话,则查表时不应查 2 1− ,而要查 2 1−2 ,即对α=0.05 来说,应查 2 0.90 。此时拒绝域对应的概率为 2α,但 只有一半即α是属于要检验的单尾。要注意由于统计量不能区分 Oi 偏大还是偏小,因此 计算统计量之前应先检查一下注射有效的数据是否大于相应的 Ti,如果不大于,则不必进 行任何检验,直接得出结论“注射不明显优于口服”;若大于 Ti,再按上述方法与 2 1−2 比 较进行检验。 例 3.23 为检验某种血清预防感冒的作用;将用了血清的 500 人与未用血清的另 500 人在一 年中的医疗记录进行比较,统计他们是否曾患感冒,得如下数据: 未感冒 曾感冒 合计
用血清 254(2365) 246(263.5) 未用血清 2192365) 281(263.5) 问这种血清对预防感冒是否有效? 解:由于血清不会使人更易患感冒,因此本题应为单侧检验。同时由于用血清的人未感冒的 多,感冒的少,因此血清可能有效,应检验 行总数×列总数500×列总数列总数 按公式T 总数 1000 2计算各格理论值,填于各格括 号中。再计算 Pearsson统计量: 2(254-23651-0:52,(219-2365-05) 236.5 236.5 (246-263.5-05)(1281-263.5-05) 263.5 263.5 =(1.2220+10968)×2 4.6376 由于是对血清有效这一单侧进行检验,对于a=05,应查分位数29(1)=27055,对 0.01,应查x98(1)≈xa975(1)=50239 ,∴差异显著,但未达极显著,即应拒绝Ho,血清对预防感冒有效 例3.24为检测不同灌溉方式对水稻叶片衰老的影响,收集如下资料 表34水稻叶片衰老情况 灌溉方式 绿叶数 黄叶数 枯叶数 总计 146(140.69) 7(8.78) 7(10.53) 浅水 183(180.26) 9(11.24) 13(1349) 湿润 152(16004) 14(9.98) 16(11.98) 计 547 问叶片衰老是否与灌溉方式有关? 解:根据公式7≈行总数x列总数 总数 计算各格理论值,放在相应格的括号中。 例如第一行第一列为 160×481 =140.69, 第一行第二列为:30×160 =8.78,等等。 547
用血清 254(236.5) 246(263.5) 500 未用血清 219(236.5) 281(263.5) 500 合计 473 527 1000 问这种血清对预防感冒是否有效? 解:由于血清不会使人更易患感冒,因此本题应为单侧检验。同时由于用血清的人未感冒的 多,感冒的少,因此血清可能有效,应检验。 按公式 1000 2 500 列总数 列总数 总数 行总数 列总数 = = Ti = 计算各格理论值,填于各格括 号中。再计算 Pearsson 统计量: 4.6376 (1.2220 1.0968) 2 263.5 ( 281 263.5 0.5) 263.5 ( 246 263.5 0.5) 236.5 ( 219 236.5 0.5) 236.5 ( 254 236.5 0.5) 2 2 2 2 2 = = + − − + − − + − − + − − = 由于是对血清有效这一单侧进行检验,对于α=0.05,应查分位数 (1) 2.7055 2 0.90 = ,对 α=0.01,应查 (1) (1) 5.0239 2 0.975 2 0.98 = 2 0.98 2 2 0.9 ,∴差异显著,但未达极显著,即应拒绝 H0,血清对预防感冒有效。 例 3.24 为检测不同灌溉方式对水稻叶片衰老的影响,收集如下资料: 表 3.4 水稻叶片衰老情况 灌溉方式 绿叶数 黄叶数 枯叶数 总计 深水 浅水 湿润 146(140.69) 183(180.26) 152(160.04) 7(8.78) 9(11.24) 14(9.98) 7(10.53) 13(13.49) 16(11.98) 160 205 182 总计 481 30 36 547 问叶片衰老是否与灌溉方式有关? 解:根据公式 总数 行总数列总数 Ti = 计算各格理论值,放在相应格的括号中。 例如 第一行第一列为: 140.69 547 160 481 = , 第一行第二列为: 8.78 547 30 160 = ,等等