《生物统计》第三章（3-5）非参数检验I:x2检验.doc_大学文库

二、区间估计：确定一个区间，并给出该区间包含总体参数的概率。点估计的最大缺点就是由于估计量也是统计量，它必然带有一定误差。换句话说估计值不可能正好等于真值。但估计值与真值到底差多少，点估计中没有给我们任何信息。而区间估计正好弥补了这个缺点，它不仅给出了真值的范围，而且给出了真值落入这一范围的概率。因此区间估计给出的信息显然多于点估计。 1. 正态总体μ与σ2 的置信区间我们主要针对正态分布讨论μ与σ2 的置信区间。这一方面是因为正态分布确实是最常见的分布，另一方面是因为中心极限定理保证了当样本足够大时，不管总体服从什么分布，我们都可以把 x 看作近似服从正态分布。因此只有当样本含量较小时，我们才需要对总体是否服从正态分布加以考虑。求μ与σ2 的置信区间时，选择统计量和理论分布的方法与§3.3 假设检验中完全相同，然后根据所得到的接受域对未知参量解不等式，即得到所求的置信区间。若所选择的显著性水平为α，则该区间包含总体参数的概率即为 1-α，称为置信水平。例 3.13 求σ已知时μ的 95%置信区间。解：σ已知时 ~ (0,1) / N n x  −  取α= 0.05，则： 1.96) 0.95 / ( 1.96  = − −  n x P   解不等式，得： ( −1.96   +1.96 ) = 0.95 n x n P x    即：μ的 95%置信区间为： ( 1.96 , 1.96 ) n x n x   − + 例 3.13 求两样本，标准差σi 未知但相等时μ1-μ2 的 1-α置信区间。解：两样本，标准差未知但相等时的统计量为： ~ ( 2) ) 1 1 ( 2 ( 1) ( 1) ( ) 2 2 2 1 1 2 1 2 + −  + + − − + − − − − = t m n m n m n m S n S x x t   显著性水平为α的接受域为： ( 2) ( 2) t / 2 m + n −  t  t 1− /2 m + n − 把 t 表达式代入，解得μ1-μ2 的 1-α置信区间为： ) 1 1 ( 2 ( 1) ( 1) ( ) ( 2) 2 2 2 1 2 1 2 m n m n m S n S x x t a m n  + + − − + − −  + −  例 3.15 求正态总体σ2 的 1-α置信区间解：设样本方差为 S 2。根据（3.6）式，有： ~ ( 1) ( 1) 2 2 2 − − n n S  

∴       = −          − − −  − ( 1) 1 ( 1) ( 1) 2 1 2 2 2 n n S P n 对未知参数σ2 解不等式，得：       = −           − −   − − − 1 ( 1) ( 1) ( 1) ( 1) 2 2 2 2 2 2 1 2 n n S n n S P ∴σ2 的 1-α置信区间为： ( 1) ( 1) ( 1) ( 1) 2 2 2 2 2 2 1 2 − −   − − − n n S n n S      上述几道题我们都只进行了公式的推导，而没有代入具体的数字。当需要解决具体问题时，只须将数字代入即可。同时，我们并不希望同学们死记上述公式，而是要搞清楚在各种情况下什么是接受域，应当对哪个变量求解不等式，这样才能针对不同情况灵活使用公式。也有几种情况例题中未涉及，如σ2 已知时的双样本 u 检验，σ2 未知且不等的近似 t 检验，两方差是否相等的 F 检验等。相信同学们只要真正理解、掌握了上述几道例题的思想与方法，这些问题是不难解决的。另外，在某些情况下也会要求单侧置信区间，此时只要用单侧分位数代替双侧分位数即可。 2. 二项分布中 P 的置信区间。（参见国标 GB4087.2–83）二项分布的概率函数为： ( , ) (1 ) , x x n x P X x n p Cn p p − = = − x = 0, 1, 2, ……n 参数 p 的点估计为： n x 。（n：样本含量。x：样本中具有某种属性的个体数）置信区间的求法如下（Pu，PL 分别为区间的上下限）： 1°n<10 时，置信区间一般太宽，无实用价值。 2°n≥10 时，采用下述公式： ( , ) 1 2 2 2 1 1 2       − +  = F PL （3.24）其中γ1= 2(n-x+1),γ2 = 2x； ( , ) 2 1 2 2 1 1 2       − + = F Pu （3.25）其中γ1= 2(n-x),γ2 = 2(x+1)。例 3.16 取 n = 20, x = 8, 1-α= 0.95, 求上单侧，下单侧，双侧置信区间。解：上单侧：n = 20, x = 8, γ1= 2(20-8)= 24,γ2= 2(8+1)= 18 查 F 分布表，取 F0.95(15,24)与 F0.95(20,24)的平均数： 2.07 2 2.11 2.03 = + 代入公式，得： 0.608 18 24 / 2.07 18 = + Pu = ∴ 所求区间为：[0，0.608）。下单侧：n = 20, x = 8, γ1= 2(20-8+1)= 26,γ2 = 2x = 16

2°直观上有一定差异。显著性检验是把H:μ=μ。视为固定常数,依据它建立理论分布,再来判断实际观察值X是否小概率事件;区间估计则是把观察值X视为最可能的μ的取值点估计),再以它为中心建立一个区间,并给出母体参数μ落入这一区间的概率(置信水 3.5非参数检验I:x2检验前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分布,两个事件是否独立等等 x2检验在非参数检验中应用相当广泛。在以前的检验中我们也用过x2分布,当时用于检验总体的方差σ2是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下的 Pearson定理 Pearson定理:当(P1,P2,…P)是总体的真实概率分布时,统计量 np (3.30) 随n的增加渐近于自由度为r-1的x2分布 (3.30)式的统计量也被称为 Pearson计量。其中P,P2,…P为r种不同属性出现的概率,n为样本含量,n为样本中第i种属性出现的次数。由于n是样本中第ⅰ种属性出现的次数,是观察值;而p是第i种属性出现的概率,因此np可被看作是理论上该样本中第i种属性应出现的次数。这样我们就可以换一种写法把n视为观察值O,np视为理论值T;,则(3.30)式可写成 (O1-11 (3.31) 这样一来, Pearson定理实际是说如果样本确实抽自由(P:,P2,…P)代表的总体,O和 T之间的差异就只是随机误差,则 Pearson统计量可视为服从x2分布:反之若样本不是抽自由(P1,P2,…P)代表的总体,O和T1之间的差异就不只是随机误差,从而使计算出的统计量有偏大的趋势。因此对上述 Pearson统计量进行上单尾检验可用于判断离散型数据的观察值与理论值是否吻合。此时统计假设为:Ho:O1=T:;HA:O≠Tl,但检验是上单尾检验。显然,上述数据应满足 n2∑P 另外,为了使 Pearson统计量近似服从x(r-1)分布,还要求: 1°各理论值均大于5。即:T≥5,i=1,2,…,r。如果有一个或多个T<5,会使 Pearson 统计量明显偏离ⅹ2分布,可能导致错误检验结果 2°若自由度为1,则应作连续性矫正,即把统计量改为 z=∑-列-0 T 还应注意由于 Pearson统计量的H为O=T,所以统计量值为0意味着H0严格成立

2°直观上有一定差异。显著性检验是把 H0:μ=μ0 视为固定常数，依据它建立理论分布，再来判断实际观察值 X 是否小概率事件；区间估计则是把观察值 X 视为最可能的μ的取值 (点估计)，再以它为中心建立一个区间，并给出母体参数μ落入这一区间的概率(置信水平)。 §3.5 非参数检验 I：χ2检验前边我们介绍的假设检验都属于参数检验，也就是说检验目标是判断总体参数是否等于某一指定值，或两个总体的某一参数是否相等。本节主要介绍另一类检验，这就是非参数检验。它检验的目标一般与参数无关，而是总体分布的某种性质，例如是否服从某种指定的分布，两个事件是否独立等等。 χ2 检验在非参数检验中应用相当广泛。在以前的检验中我们也用过χ2 分布，当时用于检验总体的方差σ2 是否等于某一指定值。而本节的用法与上述用法不同，它主要基于以下的 Pearson 定理。 Pearson 定理：当（P1，P2，…Pr）是总体的真实概率分布时，统计量 = − = r i i i i np n np 1 2 2 ( )  （3.30）随 n 的增加渐近于自由度为 r-1 的χ2 分布。 (3.30)式的统计量也被称为 Pearson 计量。其中 P1，P2，… Pr 为 r 种不同属性出现的概率，n 为样本含量，ni 为样本中第 i 种属性出现的次数。由于 ni 是样本中第 i 种属性出现的次数，是观察值；而 pi 是第 i 种属性出现的概率，因此 npi 可被看作是理论上该样本中第 i 种属性应出现的次数。这样我们就可以换一种写法，把 ni 视为观察值 Oi，npi 视为理论值 Ti，则（3.30）式可写成： = − = r i i i i T O T 1 2 2 ( )  （3.31）这样一来，Pearson 定理实际是说如果样本确实抽自由（P1，P2，…Pr）代表的总体，Oi 和 Ti 之间的差异就只是随机误差，则 Pearson 统计量可视为服从χ2 分布；反之若样本不是抽自由（P1，P2，…Pr）代表的总体，Oi和 Ti 之间的差异就不只是随机误差，从而使计算出的统计量有偏大的趋势。因此对上述 Pearson 统计量进行上单尾检验可用于判断离散型数据的观察值与理论值是否吻合。此时统计假设为：H0：Oi = Ti；HA：Oi ≠ TI，但检验是上单尾检验。显然，上述数据应满足：   = = = = r i i r i Oi n p 1 1 , 1。另外，为了使 Pearson 统计量近似服从χ2 (r–1)分布，还要求： 1°各理论值均大于 5。即：Ti ≥ 5, i = 1, 2,…,r。如果有一个或多个 Ti < 5，会使 Pearson 统计量明显偏离χ2 分布，可能导致错误检验结果。 2°若自由度为 1，则应作连续性矫正，即把统计量改为： = − − = r i i i i T O T 1 2 2 ( 0.5)  （3.32）还应注意由于 Pearson 统计量的 H0 为 Oi = Ti，所以统计量值为 0 意味着 H0 严格成立

即它不会有下侧拒绝域,永远只用上单侧检验。 Pearson统计量的应用主要有以下两个方面、吻合度检验。用于检验总体是否服从某个指定分布。方法为:设给定分布函数为F(x)。首先把x的值域分为r个不相重合的区间,并统计样本含量为n的一次抽样中,观察值落入各区间的次数,把落入区间i的次数记为O,i=1,2, r;再算出在指定的分布下,x落入每一区间的概率p,i=1,2,…r。由于样本含量为n, 因此理论上落入每一区间的次数应为T=n·p;从而可用 Pearson统计量进行检验。需要特别注意的是,在做吻合度检验时, Pearson统计量的自由度可能发生变化。一般来说,如果给定的分布函数F(x)中不含有未知参数,则 Pearson统计量的自由度就是r-1 但如果F(x)中含有一个或几个未知参数,需要用从样本中计算出的估计量代替,则使用了几个估计量自由度一般就应在r-1的基础上再减去几。如例3.19,观测值共分了9组,自由度本应为9-1=8,但由于理论分布的μ和σ2未知,使用估计量代替,因此自由度应为8 例3.19调查了某地200名男孩身高,得x=139.5,S=7.42,分组数据见下表。男孩身高是否符合正态分布? 表3.2男孩身高分布表 0.0344 6.88 0.1806 [126,130) 0.0658 13.16 0.0019 0.1291 3.0081 3812 138,142) 0.2120 42.40 3.7420 0.1776 0.1781 46.15 18 0.1120 0.8637 150,154) 0.0532 10.64 0.0380 154+∞) 0.0253 3.0506 表中前三列是观察数据,后三列是计算所得。计算公式为:设区间为x1,x1),则 P2=P(x1≤x<x)=Φ(-)-d( 其中Φ为N(0,1)的分布函数,可查表得到。 T;=200·P (O-7)2 11.0963 自由度df=9-1-2=6(:用x,S2作为μ,2的估计量,∴应再减去二个自由度)。查 x2分布表,得:x95(6)=12.592。由于x2<x095(6),故可认为男孩身高分布与正态分布无明显差异例3.20以红米非糯稻和白米襦稻杂交,子二代检测179株,数据如下: 属性(x)红米非糯(0)红米糯(1)白米非糯(2)白米糯(3) 31 179 问子二代分离是否符合9:3:3:1的规律? 解:若符合9:3:3:1的规律,则应有

即它不会有下侧拒绝域，永远只用上单侧检验。 Pearson 统计量的应用主要有以下两个方面：一、吻合度检验。用于检验总体是否服从某个指定分布。方法为：设给定分布函数为 F(x)。首先把 x 的值域分为 r 个不相重合的区间，并统计样本含量为 n 的一次抽样中，观察值落入各区间的次数，把落入区间i 的次数记为 Oi，i=1, 2,… r；再算出在指定的分布下，x 落入每一区间的概率 pi ，i=1, 2，… r。由于样本含量为 n，因此理论上落入每一区间的次数应为 Ti = n·pi；从而可用 Pearson 统计量进行检验。需要特别注意的是，在做吻合度检验时，Pearson 统计量的自由度可能发生变化。一般来说，如果给定的分布函数 F(x)中不含有未知参数，则 Pearson 统计量的自由度就是 r – 1；但如果 F(x)中含有一个或几个未知参数，需要用从样本中计算出的估计量代替，则使用了几个估计量自由度一般就应在 r – 1 的基础上再减去几。如例 3.19，观测值共分了 9 组，自由度本应为 9 – 1 = 8，但由于理论分布的μ和σ2 未知，使用估计量代替，因此自由度应为 8 – 2 = 6。例 3.19 调查了某地 200 名男孩身高，得 x =139.5, S = 7.42 ，分组数据见下表。男孩身高是否符合正态分布？表 3.2 男孩身高分布表组号区间 Oi Pi Ti (Oi - Ti) 2 /Ti 1 (-∞, 126) 8 0.0344 6.88 0.1806 2 [126, 130) 13 0.0658 13.16 0.0019 3 [130, 134) 17 0.1291 25.81 3.0081 4 [134, 138) 37 0.1906 38.12 0.0332 5 [138, 142) 55 0.2120 42.40 3.7420 6 [142, 146) 33 0.1776 35.51 0.1781 7 [146, 150) 18 0.1120 22.40 0.8637 8 [150, 154) 10 0.0532 10.64 0.0380 9 [154, +∞) 9 0.0253 5.07 3.0506 表中前三列是观察数据，后三列是计算所得。计算公式为：设区间为[xi-1, xi），则 ( ) ( ) ( ) 1 1 S x x S x x p P x x x i i i i i − −  − =   =  − − ，其中Ф为 N（0，1）的分布函数，可查表得到。 T i = 200·Pi = = − = r i i i i T O T 1 2 2 11.0963 ( )  自由度 df = 9－1－2 = 6 (∵用 x ,S 2 作为μ，σ2 的估计量，∴应再减去二个自由度)。查 χ 2 分布表，得： (6) 12.592 2  0.95 = 。由于χ2 < 2  0.95 (6)，故可认为男孩身高分布与正态分布无明显差异。例 3.20 以红米非糯稻和白米糯稻杂交，子二代检测 179 株，数据如下：属性(x) 红米非糯（0）红米糯（1）白米非糯（2）白米糯（3）合计株数 96 37 31 15 179 问子二代分离是否符合 9 : 3 : 3 : 1 的规律？解：若符合 9 : 3 : 3 : 1 的规律，则应有：

般来说细胞计数应服从 Poisson分布,其前提条件就是各细胞之间既不能互相吸引, 也不能互相排斥,必须是互不影响。本例中差异主要表现在出现3个以上细胞的次数明显偏多,也许说明细胞间有某种吸引力,有聚在一起的趋势、列联表的独立性检验列联表独立性检验是 Pearsson统计量的又一重要应用。它主要用于检验两个事件是否独立,例如处理方法和效果是否独立。问题可以这样提出设实验中可采用r种处理方法,可能得到C种不同的实验结果。一个常见的问题就是这r种方法的效果是否相同?或改一种问法:方法与效果是否独立? 例3.22下表是对某种药的试验结果: 表3.3给药方式与药效试验结果给药方式有效(A) 无效(A) 总数有效率口服(B) 注射(B) 31 95 67.4% 问给药方式对药效果是否有影响? 分析:表中各行、各列总数分别为口服与注射、有效与无效的总数。若A代表有效,B代表口服,则应有:P(A)=第一列总数总数;PB)=第一行总数总数。这样,若我们保持表中各行各列总数不变,即保持口服与注射、有效与无效的总数不变,也就是保持了P(A)、 P(B)等概率不变。在这样的条件下,若再有H0成立,即药效与给药方式无关,A与B互相独立,则有:P(AB)=P(A)·P(B)。此时总数XP(AB)就应是口服且有效的理论值。与此类似,可用以下方法计算出各格的理论值T:T=(行总数×列总数)总数,从而可使用 Pearson统计量对Ho:O-T=0(或A与B独立)进行检验。这种方法就称为列联表独立性检验。设表有r行c列,由于在这种方法中使用了各行、各列总数作为常数,自由度也应相应减少。若各行总数都确定了,总数当然也就确定了:此时列总数只要确定c-1个即可,最后一个可用解方程的方法算出来。因此实际使用的常数不是r+c个,而是r+c-1 个。这样一来,自由度应为: df=r·c-r-c+1=(r-1)·(c-1)=(行总数-1)×(列总数-1) 解:在保持各行、列总数不变,且A与B独立的条件下,计算各格理论值T: 有效(A) 无效(A) 行总数口服(B) O1=58 7、98×122 98×71 =61.95 T =36.05 注射(B) 95×122 =6057 1933495 列总数总数:193 Df=(2-1)×(2-1)=1 x258=61951-052+(40=3605-052+064-60-055 6195 36.05 60.05

一般来说细胞计数应服从 Poisson 分布，其前提条件就是各细胞之间既不能互相吸引，也不能互相排斥，必须是互不影响。本例中差异主要表现在出现 3 个以上细胞的次数明显偏多，也许说明细胞间有某种吸引力，有聚在一起的趋势。二、列联表的独立性检验列联表独立性检验是 Pearsson 统计量的又一重要应用。它主要用于检验两个事件是否独立，例如处理方法和效果是否独立。问题可以这样提出：设实验中可采用 r 种处理方法，可能得到 C 种不同的实验结果。一个常见的问题就是：这 r 种方法的效果是否相同？或改一种问法：方法与效果是否独立？例 3.22 下表是对某种药的试验结果：表 3.3 给药方式与药效试验结果给药方式有效（A）无效（ A ）总数有效率口服（B） 58 40 98 59.2% 注射（ B ） 64 31 95 67.4% 总数 122 71 193 问给药方式对药效果是否有影响？分析：表中各行、各列总数分别为口服与注射、有效与无效的总数。若 A 代表有效，B 代表口服，则应有：P(A) = 第一列总数/总数；P(B) = 第一行总数/总数。这样，若我们保持表中各行各列总数不变，即保持口服与注射、有效与无效的总数不变，也就是保持了 P(A)、 P(B)等概率不变。在这样的条件下，若再有 H0 成立，即药效与给药方式无关，A 与 B 互相独立，则有：P(AB)= P(A)·P(B)。此时总数×P(AB)就应是口服且有效的理论值。与此类似，可用以下方法计算出各格的理论值 Ti：Ti = (行总数×列总数)/总数，从而可使用 Pearson 统计量对 H0: O－T = 0 (或 A 与 B 独立)进行检验。这种方法就称为列联表独立性检验。设表有 r 行 c 列，由于在这种方法中使用了各行、各列总数作为常数，自由度也应相应减少。若各行总数都确定了，总数当然也就确定了；此时列总数只要确定 c－1 个即可，最后一个可用解方程的方法算出来。因此实际使用的常数不是 r+c 个，而是 r+c－1 个。这样一来，自由度应为： df = r c − r − c +1 = (r −1)(c −1) = (行总数－1)×(列总数－1) 解：在保持各行、列总数不变，且 A 与 B 独立的条件下，计算各格理论值 Ti: 有效（A）无效（ A ）行总数口服（B） O1 = 58 61.95 193 98 122 1 =  T = O2 = 40 36.05 193 98 71 2 =  T = 98 注射（ B ） O3 = 64 60.05 193 95 122 3 =  T = O4 = 31 34.95 193 95 71 4 =  T = 95 列总数 122 71 总数：193 Df=(2－1)×(2－1)=1 60.05 ( 64 60.05 0.5) 36.05 ( 40 36.05 0.5) 61.95 ( 58 61.95 0.5) 2 2 2 2 − − + − − + − −  =

(31-3495-0.5) =0.19213+0.33017+0.19821+0.34056=1.061 34.95 查x2分布表,得:x2(1)=3.841。:x2<x2(1),∴接受H,给药方式与药效无关。几点说明 1°由于保持各列、行总数不变,相当每行、每列均加了一个约束,因此对r行c列列联表自由度为df=(r-1)·(c-1) 2°由于A与B独立,有:P(AB)=P(A)·P(B);这样在保持各行各列总数不变的条件下,可得T的计算公式为 T:=n·p=n·P(AB)=n·P(A)·P(B) 总数x行总数列总数行总数×列总数 (3.33) 总数总数总数 3°由于常用的2×2列联表自由度为1,因此一般应加连续性矫正,即使用公式(3.32)代替(3.31) 4°对于2×2列联表还可能有一种特殊的单侧检验。例如在例3.22中,若已知该药注射效果只会比口服好,不会比口服差:或问题改为:“问注射效果是否优于口服?”此时相当于专业知识或实际问题要求只检验注射效果偏好的一个单侧。前已述及,由于 Pearson统计量自身的构造,它只能有上单尾检验,现在却又出来一个单侧。关于这个问题可进行如下分析 2×2列联表自由度只有1,在它的4个格中只要有一个格的值确定了,其他3个格的值也就都定下来。因此O偏离T的情况只有某格O偏大和偏小两种。这里所说的特殊的单侧检验,实际就是在这两种中检验一种。若行或列不只2,则自由度多于1,O1偏离T 的情况就会复杂得多,不能只归结为两种了。由于 Pearsson统计量的分子为(O-Tr)2,对某一个格来说,O偏大偏小都会使统计量的值偏大。这说明在ⅹ2上单尾的拒绝域中,本来就包含了某一格偏大或偏小两种情况, 而且这两种情况是对称的,即它们出现的可能相等。在2×2列联表中,又只有这两种情况。这样一来,我们可以认为原来上单尾包含的值为a的概率中,有α/2是属于某格O1 偏大,a/2属于这一O偏小。具体到例3.21,就是有α/2属于注射优于口服,a/2属于注射劣于口服。因此此时 Pearsson统计量的上单尾检验对注射效果来说,相当一种双尾检验:而如果要对注射效果进行单尾检验,同时又要保持α不变的话,则査表时不应查 x1a,而要查x12a,即对a=0.05来说,应查xa90。此时拒绝域对应的概率为2a,但只有一半即α是属于要检验的单尾。要注意由于统计量不能区分O偏大还是偏小,因此计算统计量之前应先检查一下注射有效的数据是否大于相应的T,如果不大于,则不必进行任何检验,直接得出结论“注射不明显优于口服”;若大于T,再按上述方法与x12a比较进行检验例3.23为检验某种血清预防感冒的作用;将用了血清的500人与未用血清的另500人在一年中的医疗记录进行比较,统计他们是否曾患感冒,得如下数据: 未感冒曾感冒

0.19213 0.33017 0.19821 0.34056 1.061 34.95 ( 31 34.95 0.5) 2 = + + + = − − + 查χ2 分布表，得： (1) 3.841 2  0.95 = 。 (1) 2 0.95 2     ，∴接受 H0，给药方式与药效无关。几点说明： 1°由于保持各列、行总数不变，相当每行、每列均加了一个约束，因此对 r 行 c 列列联表，自由度为 df = (r – 1)·(c – 1)。 2°由于 A 与 B 独立，有：P（AB）= P（A）·P（B）；这样在保持各行各列总数不变的条件下，可得 Ti 的计算公式为： Ti = n·pI = n·P(AB) = n·P(A)·P(B) =总数× 总数行总数列总数总数列总数总数行总数   = （3.33） 3°由于常用的 2×2 列联表自由度为 1，因此一般应加连续性矫正，即使用公式（3.32）代替(3.31)。 4°对于 2×2 列联表还可能有一种特殊的单侧检验。例如在例 3.22 中，若已知该药注射效果只会比口服好，不会比口服差；或问题改为：“问注射效果是否优于口服？”此时相当于专业知识或实际问题要求只检验注射效果偏好的一个单侧。前已述及，由于 Pearson 统计量自身的构造，它只能有上单尾检验，现在却又出来一个单侧。关于这个问题可进行如下分析： 2×2 列联表自由度只有 1，在它的 4 个格中只要有一个格的值确定了，其他 3 个格的值也就都定下来。因此 Oi 偏离 Ti 的情况只有某格 Oi 偏大和偏小两种。这里所说的特殊的单侧检验，实际就是在这两种中检验一种。若行或列不只 2，则自由度多于 1，Oi 偏离 Ti 的情况就会复杂得多，不能只归结为两种了。由于 Pearsson 统计量的分子为(Oi – Ti) 2，对某一个格来说，Oi 偏大偏小都会使统计量的值偏大。这说明在χ2 上单尾的拒绝域中，本来就包含了某一格偏大或偏小两种情况，而且这两种情况是对称的，即它们出现的可能相等。在 2×2 列联表中，又只有这两种情况。这样一来，我们可以认为原来上单尾包含的值为α的概率中，有α/2 是属于某格 Oi 偏大，α/2 属于这一 Oi 偏小。具体到例 3.21，就是有α/2 属于注射优于口服，α/2 属于注射劣于口服。因此此时 Pearsson 统计量的上单尾检验对注射效果来说，相当一种双尾检验；而如果要对注射效果进行单尾检验，同时又要保持α不变的话，则查表时不应查 2  1− ，而要查 2 1−2 ，即对α=0.05 来说，应查 2  0.90 。此时拒绝域对应的概率为 2α，但只有一半即α是属于要检验的单尾。要注意由于统计量不能区分 Oi 偏大还是偏小，因此计算统计量之前应先检查一下注射有效的数据是否大于相应的 Ti，如果不大于，则不必进行任何检验，直接得出结论“注射不明显优于口服”；若大于 Ti，再按上述方法与 2 1−2 比较进行检验。例 3.23 为检验某种血清预防感冒的作用；将用了血清的 500 人与未用血清的另 500 人在一年中的医疗记录进行比较，统计他们是否曾患感冒，得如下数据：未感冒曾感冒合计

《生物统计》第三章（3-5） 非参数检验I:x2检验

《生物统计》第三章（3-5）非参数检验I:x2检验