第十一章非参数检验 在社会研究中我们经常要采用定序尺度,但直到现在,我们都还没有机会讨 论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验 与以前所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例 如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均 值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非 参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验 时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正 态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在 满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采 用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分 布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用 定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对 正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验 非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要 的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独 立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布” 不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。 不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。 很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯 定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”。 参数检验中的n n非参数检验中的 式中的n0和n分别是两种检验保证实现给定的检验力所需的样本容量。如 果说某种非参数检验的检验效率为95%,就意味着这种非参数检验在使用100 个数据时的效力等于t检验(在正确模型条件下)使用95个数据的效力。 检验力又称检验势,它是用1一β或[-(犯第二类错误的概率)]来定义的
第十一章 非参数检验 在社会研究中我们经常要采用定序尺度,但直到现在,我们都还没有机会讨 论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验。 与以前所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例 如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均 值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非 参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行 t 检验 时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正 态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在 满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采 用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分 布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用 定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对 正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验。 非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要 的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独 立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布” 不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。 不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。 很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯 定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”。 式中的 n 0 和 n 分别是两种检验保证实现给定的检验力所需的样本容量。如 果说某种非参数检验的检验效率为 95%,就意味着这种非参数检验在使用 100 个数据时的效力等于 t 检验(在正确模型条件下)使用 95 个数据的效力。 检验力又称检验势,它是用 1―β或[1―(犯第二类错误的概率)]来定义的。 n n En 非参数检验中的 参数检验中的 0 =
也就是说,对于固定的样本容量,检验能够否定错误假设的能力越大,其相对检 验力越大。 第一节符号检验 “符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验 中,对于样本中每个个体的前测与后测,如果我们并不关心(X1-X0)的具体 数值,而只关心是增大了还是减小了。具体来说,就是只研究差值d的符号, 若X1>X0,记作“+” 若X1p(-)域p(+)p(一)
也就是说,对于固定的样本容量,检验能够否定错误假设的能力越大,其相对检 验力越大。 第一节 符号检验 “符号检验”是针对观察结果之差的符号来作估价的。在单一实验组的实验 中,对于样本中每个个体的前测与后测,如果我们并不关心(X1―X0)的具体 数值,而只关心是增大了还是减小了。具体来说,就是只研究差值 d 的符号, 即 若 X1>X0,记作“+”; 若 X1<X0,记作“―”; 若 X1=X0,删去。 那么我们面对的就将是配对样本的“符号检验”问题了。“符号检验”并不 要求配对样本出自同一个总体,重要的是各个对的结果要相互独立。 符号检验的零假设就是配对观察结果的差平均起来等于零:人们期望这些差 中有一半小于零(负号),而另一半大于零(正号),因此符号检验就是对差分布之 中位数为零的零假设检验。现将符号检验的零假设和备择假设表达如下 H0:p (+)=p (―)=0.5 H1:单侧检验 p (+)>p (―)或 p (+)<p (―) 双侧检验 p (+)≠p (―) 很显然,符号检验就是先假设 p=0.5,按二项分布计算正号“+” 出现次数之抽样分布,然后以样本中正号“+”出现的次数 x 作为检验统计量。 如果它是 B(x;n,0.5)下的小概率事件,便否定对差分布之中位数为零的零假设, 即认为两总体存在平均水平上的差别。由此可见,符号检验是二项检验的一种实 际应用。 [例] 假设我们观测 15 个相配的对,获得两个差为零和 13 个差不为零,其 中有 11 个正号,2 个负号,试在 2.5%的显著性水平上进行单侧检验。 [解] H0:p=0.5 H1:p (+)>p (―)
由α=0.025确定否定域,查二项分布表(附表2) (13;13,0.5)=0.000 P(12;13,0.5)=0.002 (11;13,0.5)=0010 (10;13,0.5)=0.0 P(13)+P(12)+P(1)=0.000+0.002+0.010=0.0120025 所以否定域由ⅹ等于11,12,13组成。现检验统计量ⅹ=11, 所以零假设p=0.5在25%显著性水平上被拒绝。 [例]随机地选择13个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在0.05显 著性水平上,用符号检验检验实验无效的零假设。 配对序号 后测/%值d=X-Xd-d (d-d)2 16 328 HI:p(+)>p( 由上例知,B(x;13,0.5)在a=0025显著性水平上,单侧检验(p >0.5)否定域由ⅹ由11,12,13组成 观察前表知,在13个相配的对中,10个差为正号,3个差为负号, 即检验统计量ⅹ=10。所以零假设p=0.5在25%显著性水平上不能被拒绝
由α=0.025 确定否定域,查二项分布表(附表 2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035 P (13) + P(12)+ P (11)=0.000 + 0.002 + 0.010 =0.012<0.025 P (13) + P (12) + P (11) +P(10)= 0.012 + 0.035=0.047>0.025 所以否定域由 x 等于 11,12,13 组成。现检验统计量 x=11, 所以零假设 p=0.5 在 2.5%显著性水平上被拒绝。 [例] 随机地选择 13 个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在 0.05 显 著性水平上,用符号检验检验实验无效的零假设。 [解] H0:p=0.5 H1:p (+)>p (―) 由上例知,B(x;13,0.5)在α=0.025 显著性水平上,单侧检验(p >0.5)否定域由 x 由 11,12,13 组成。 观察前表知,在 13 个相配的对中,10 个差为正号,3 个差为负号, 即检验统计量 x=10。所以零假设 p=0.5 在 2.5%显著性水平上不能被拒绝
对比[例10.31和[例11.1.2]可见,由于符号检验只计及差值d的符号,而没 有计及差值d的大小,所以有时用t检验可以作出拒绝零假设的判定,如改用符 号检验却往往不能作岀这样的判定。因此说,符号检验效力较低。根据计算,就 满足正态分布而言,符号检验法的效率是配对样本t检验的63%。即如果符号 检验法需要样本容量为100的话,那么t检验法只需n=63就可作出相同的检验。 但符号检验运用于定类尺度,对总体分布又无需加以限制,所以就配对样本的显 著性检验而言,其适应面是相当广的。 像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检 验)。 第二节配对符号秩检验 对于配对样本,至此我们已经接触了两种检验,即符号检验和t检验。在符 号检验中,只考虑差值d的符号而不管其大小,并且应用二项分布检验零假设。 另一方面,最有力的检验一—t检验,则不仅需要定距尺度,而且还要求假定 差值d服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力 也介乎两者之间 配对符号秩检验对于非正态分布的d值,是最佳检验,其检验效力大大高 于符号检验。如果t检验的假定成立,配对符号秩检验的检验效力对于大、小 样本都近乎为95%。因此,在定距尺度测量的水平上,若由于样本容量太小而 不能假定正态分布的时候,配对符号秩检验特别有用。 配对符号秩检验的零假设基本上和符号检验以及用于配对样本的t检验 的零假设相同。配对符号秩检验的步骤如下: (1)首先求出每对数据的差值d (2)不计正负,按绝对值大小把差值d按顺序排列起来 (3)绝对值最小者赋秩为l,第二小者赋秩为2,……,绝对 值最大者赋秩为n(其中绝对值相等者,将它们应得的秩均分之),再在差值 前补填上符号。 (4)求得正差值的秩和T+及负差值的秩和T-。我们期望两个秩和
对比[例 10.3.1]和[例 11.1.2]可见,由于符号检验只计及差值 d 的符号,而没 有计及差值 d 的大小,所以有时用 t 检验可以作出拒绝零假设的判定,如改用符 号检验却往往不能作出这样的判定。因此说,符号检验效力较低。根据计算,就 满足正态分布而言,符号检验法的效率是配对样本 t 检验的 63%。即如果符号 检验法需要样本容量为 100 的话,那么 t 检验法只需 n=63 就可作出相同的检验。 但符号检验运用于定类尺度,对总体分布又无需加以限制,所以就配对样本的显 著性检验而言,其适应面是相当广的。 像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检 验)。 第二节 配对符号秩检验 对于配对样本,至此我们已经接触了两种检验,即符号检验和 t 检验。在符 号检验中,只考虑差值 d 的符号而不管其大小,并且应用二项分布检验零假设。 另一方面,最有力的检验—— t 检验,则不仅需要定距尺度,而且还要求假定 差值 d 服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力 也介乎两者之间。 配对符号秩检验对于非正态分布的 d 值,是最佳检验,其检验效力大大高 于符号检验。如果 t 检验的假定成立,配对符号秩检验的检验效力对于大、小 样本都近乎为 95%。因此,在定距尺度测量的水平上,若由于样本容量太小而 不能假定正态分布的时候,配对符号秩检验特别有用。 配对符号秩检验的零假设基本上和符号检验以及用于配对样本的 t 检验 的零假设相同。配对符号秩检验的步骤如下: (1) 首先求出每对数据的差值 d 。 (2) 不计正负,按绝对值大小把差值 d 按顺序排列起来。 (3)绝对值最小者赋秩为 l,第二小者赋秩为 2,……,绝对 值最大者赋秩为 n (其中绝对值相等者,将它们应得的秩均分之),再在差值 前补填上符号。 (4)求得正差值的秩和 T+ 及负差值的秩和 T- 。我们期望两个秩和
应该近似相等。如果T+和T相差太大,就应该否定零假设 (5)取两个秩和中较小的一个,即T=min(T+,「,作为检验统计量 (6)给定显著性水平α。如果n小,从配对符号秩检验表(附表9)中直接查 出临界值Ta(n)。如果n大(n>25),就要应用正态近似法,查出Za(单侧检验) 或Zα2(双侧检验,同时检验统计量Z按下式计算 T-n(n+1)/4 n(n+1)(2n+1)/24 (7)若T≤Ta(n),就拒绝零假设,同时认为总体间有显著性差异。 [例]随杋地选择13个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在005显 著性水平上,用配对符号秩检验检验检验实验无效的零假设。 表11,1 前测/%后测/%差值d1a1的秩负秩绝对值 l.5 (+)12 +)8 H0:T+=,即在总体中,正秩和等于负秩和。 H1:T+> 前表给出了有关资料,由此又列出了配对符号秩检验所需要的数据。 根据表中数据,可以看出负秩和小于正秩和。因此检验统计量T取负秩和。 T==1.5+4+8=13.5 由a=0.025,n=13,查表得单侧检验的
应该近似相等。如果 T+和 T-相差太大,就应该否定零假设。 (5)取两个秩和中较小的一个,即 T=min(T+ ,|T-|),作为检验统计量。 (6)给定显著性水平α。如果 n 小,从配对符号秩检验表(附表 9)中直接查 出临界值 Tα(n)。如果 n 大(n>25),就要应用正态近似法,查出 Zα(单侧检验) 或 Zα/2(双侧检验),同时检验统计量 Z 按下式计算 (7)若 T ≤ Tα(n) ,就拒绝零假设,同时认为总体间有显著性差异。 [例] 随机地选择 13 个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,现试在 0.05 显 著性水平上,用配对符号秩检验检验检验实验无效的零假设。 [解] H0:T+ =|T-|,即在总体中,正秩和等于负秩和。 H1:T+ >|T-|。 前表给出了有关资料,由此又列出了配对符号秩检验所需要的数据。 根据表中数据,可以看出负秩和小于正秩和。因此检验统计量 T 取负秩和。 T =|T-|=1.5 + 4 + 8=13.5 由α=0.025,n=13,查表得单侧检验的 ( 1)(2 1)/ 24 ( 1)/ 4 + + − + = n n n T n n Z
T025(13)=17>13.5,所以否定T+=的零假设,即说明该实验刺激有 将[例1121与[例10.31和[例111,2]对比,可见配对符号秩检验的效力比符 号检验的效力高得多,而很接近于t检验的效力。理论研究表明,对于配对样本 非正态分布的差值d,配对符号秩检验是最佳检验。 虽然本例中n很小,但是为了说明用法,我们仍然使用正态近似法计算 下检验统计量 7(n+1)/4 n(n+1)(2n+1)/24 3.5-13×14/4 24 √13×14×27/24 在单侧检验中,Za=Z0.025=1.96<224,我们可以否定零假设。但必须 指出,正态近似计算法没有把同数值(或同分对)的情况考虑在内而作出修正。 因此,它在同数值的数目很大时不能使用。 第三节秩和检验 前面我们刚刚讨论过的符号检验和配对符号秩检验,都只适用于配对样本 当样本为独立样本时,可采用本节所讨论的秩和检验法。其具体步骤为: (1)设从两个未知的总体1和总体2中分别独立、随机地各抽取一个样本, 样本1的容量为n1,样本2的容量为n2,两样本的数据分别列示如下 样本1:X1,X2,…,Xn1 样本2:Y1,Y2,…,Y (2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的 编号即为它的秩。如果混合样本中有相同数值的数据,则将它们应得的秩均分。 (3)分别计算两样本的秩和:样本1中所有X1,X2,…,Xn1的秩和记作R1
T0.025(13)=l7>13.5,所以否定 T+ =|T-|的零假设,即说明该实验刺激有 效。 将[例 11.2.1]与[例 l0.3.1]和[例 11.1.2]对比,可见配对符号秩检验的效力比符 号检验的效力高得多,而很接近于 t 检验的效力。理论研究表明,对于配对样本 非正态分布的差值 d,配对符号秩检验是最佳检验。 虽然本例中 n 很小,但是为了说明用法,我们仍然使用正态近似法计算一 下检验统计量 在单侧检验中,Zα=Z0.025=1.96<2.24,我们可以否定零假设。但必须 指出,正态近似计算法没有把同数值(或同分对)的情况考虑在内而作出修正。 因此,它在同数值的数目很大时不能使用。 第三节 秩和检验 前面我们刚刚讨论过的符号检验和配对符号秩检验,都只适用于配对样本。 当样本为独立样本时,可采用本节所讨论的秩和检验法。其具体步骤为: (1)设从两个未知的总体 1 和总体 2 中分别独立、随机地各抽取一个样本, 样本 1 的容量为 n1,样本 2 的容量为 n2,两样本的数据分别列示如下: 样本 1:X1,X2,…, X n1 样本 2:Y1,Y2,…, Y n2 (2)把样本 1 和样本 2 混合起来,并按数值从小到大顺序编号,每个数据的 编号即为它的秩。如果混合样本中有相同数值的数据,则将它们应得的秩均分。 (3)分别计算两样本的秩和:样本 l 中所有 X1,X2,…, X n1 的秩和记作 R1; 2.24 13 14 27 / 24 13.5 13 14 / 4 ( 1)(2 1)/ 24 ( 1)/ 4= − = + + − + = n n n T n n Z
样本2中所有Y1,Y2,…Yn2的秩和记作R2 (4)秩和检验是针对两个总体具有完全相同的形式的零假设而进行检验的 在均值差检验中,研究的重点放在中心趋势的差异上,而不是离差的差异或形式 的差异。秩和检验的零假设则可以用任何差异形式表示出来, (5)计算检验统计量U。检验统计量U是对混合样本中n+n2个元素根据 它们的秩和和它们所属的总体标出的双重指标 U1=1n2+(n1+1) R U2=n2+2(m2+1) R 检验统计量U是U1和U2中较小的一个,即U=min(U1,U2),然后用下式 核对计算 U1+U2=nl n2 (6)给出显著性水平α,从秩和检验表(附表10中查出临界值Uα,如果计算 出的U值小于或等于从附表10中查出的临界值Uα(nl,n2),则零假设被拒绝。 [例]设评审专家对19所大专院校按校园环境质量排名次,环境质量最好的学 校记分数为1,环境质量最差的学技记分数为19。其中10所学校是本科院校, 其他9所学校是专科院校。假定这19所学校是分别从全部大专院校中随机地抽 取的,试问:专科类院校和本科类院校的环境质量是否有显著性差异(α=0.05)? 本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17(nl=10) 专科院校环境质量的名次(秩)为: 3,8,10,12,13.15.16,18,19(n2=9) H0:专科类院校和本科类院校的环境质量无差异
样本 2 中所有 Y1,Y2,…,Y n2 的秩和记作 R2。 (4)秩和检验是针对两个总体具有完全相同的形式的零假设而进行检验的。 在均值差检验中,研究的重点放在中心趋势的差异上,而不是离差的差异或形式 的差异。秩和检验的零假设则可以用任何差异形式表示出来。 (5)计算检验统计量 U 。检验统计量 U 是对混合样本中 n1+ n2 个元素根据 它们的秩和和它们所属的总体标出的双重指标 。 检验统计量 U 是 U1 和 U2 中较小的一个,即 U=min(U1,U2),然后用下式 核对计算 U1 + U2 =n1 n2 (6)给出显著性水平α,从秩和检验表(附表 10)中查出临界值 Uα,如果计算 出的 U 值小于或等于从附表 10 中查出的临界值 Uα(n1 ,n2),则零假设被拒绝。 [例] 设评审专家对 19 所大专院校按校园环境质量排名次,环境质量最好的学 校记分数为 1,环境质量最差的学技记分数为 19。其中 10 所学校是本科院校, 其他 9 所学校是专科院校。假定这 19 所学校是分别从全部大专院校中随机地抽 取的,试问:专科类院校和本科类院校的环境质量是否有显著性差异(α=0.05)? 本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10) 专科院校环境质量的名次(秩)为: 3,8,10,12,13.15.16,18,19 (n2=9) [解] H0 :专科类院校和本科类院校的环境质量无差异 1 1 1 1 1 2 2 ( 1) R n n U n n − + = + 2 2 2 2 1 2 2 ( 1) R n n U n n − + = +
HIl:专科类院校和本科类院校的环境质量有差异 根据题意 Rl=12+4+5+6+7+9+11+14+17=76 R2=3+8+10+12+13+15+16+18+19=114 代入下两式得 R1=10×9 76=69 nIna R2=10×9 114=21 2 所以检验统计量 U=min(U1, U2)=U2=21 由a=0.05查附表10得 Ua(nl,n2)=U005(10,9)=20<21 所以不否定零假设,说明在0.05的水平上,不能认为专科类院校和本科类 院校的环境质量有显著性差异。 秩和检验本来可直接用R1和R2,不必求U。但由于对于n小的U,其值 可以准确地从数表中査出,所以在秩和检验中一般使用统计量U比较方便。秩 和检验因而也有了U检验之称。如果n较大,U的抽样分布接近正态分布N(, σ2),可以利用正态分布作近似检验,其均值、标准差和标准正态变量分别是 71 2 12 O,1)
H1:专科类院校和本科类院校的环境质量有差异 根据题意 R1=l+2+4+5+6+7+9+11+14+17=76 R2=3+8+10+12+13+15+16+18+19=114 代入下两式得 所以检验统计量 U=min(U1,U2)=U2=2l 由α=0.05 查附表 10 得 Uα(n1 ,n2)=U 0.05(10 ,9)=20<2l 所以不否定零假设,说明在 0.05 的水平上,不能认为专科类院校和本科类 院校的环境质量有显著性差异。 秩和检验本来可直接用 R1 和 R2,不必求 U 。但由于对于 n 小的 U ,其值 可以准确地从数表中查出,所以在秩和检验中一般使用统计量 U 比较方便。秩 和检验因而也有了 U 检验之称。如果 n 较大,U 的抽样分布接近正态分布 N (μ, σ2),可以利用正态分布作近似检验,其均值、标准差和标准正态变量分别是 76 69 2 10 (10 1) 10 9 2 ( 1) 1 1 1 1 1 2 − = + − = + + = + R n n U n n 114 21 2 9 (9 1) 10 9 2 ( 1) 2 2 2 2 1 2 − = + − = + + = + R n n U n n 2 n1n2 U = 12 ( 1) 1 2 1 + 2 + = n n n n U ~ N(0,1) U Z U U − =
第四节游程检验 游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方 法很简单:先把两个样本混合起来,按大小排列,并赋予其秩。那么,当样本所 属的总体是同分布的话,是不大可能出现来自总体1的样本全是高秩、而来自总 体2的样本全是低秩的情况;反之亦然。可能性最多的情况是,来自总体1和总 体2的样本,其秩是随机交错的。因此,根据混合样本中两样本交错的次数来检 定秩交错次数是随机的零假设,这就是游程检验。其具体步骤如下 (1)设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本, 样本1的容量为n1,样本2的容量为n2。 (2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据 的编号就是它的秩。 (3)点算游程数目。一个游程指混合样本中接连属于一个样本的一串秩, 其前后是另一个样本的秩。 例如,A和B分别代表混合样本中来自第一个样本的秩和来自第二个样 本的秩,这样一来,混合样本被赋予秩的数据序列便呈以下形式 ABBABAAAbAbbAbbAAAbAAB 在此例中,第一个游程由一个A组成,第二个游程由两个B组成,然后 又是一个A组成的游程……,游程的总数为14 (4)根据显著性水平α确定否定域(n1,n2)游程数目r的抽样分布(见附表 l)可用于建立否定零假设的否定域。 (5)检定零假设。以混合样本中的游程数目为检验统计量:如果游程的数目 很大,就表明两个样本混合得很好,不能否定零假设;相反,如果游程的数目较 小,零假设就很可能是错的,应该否定 [例]设评审专家对19所大专院校按校园环境质量排名次,环境质量最好 的学校记分数为1,环境质量最差的学技记分数为19。其中10所学校是本科院 校,其他9所学校是专科院校。假定这19所学校是分别从全部大专院校中随机 地抽取的,试问:专科类院校和本科类院校的环境质量是否有显著性差异(α= 0.05)?(请作游程检验)
第四节 游程检验 游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方 法很简单:先把两个样本混合起来,按大小排列,并赋予其秩。那么,当样本所 属的总体是同分布的话,是不大可能出现来自总体 1 的样本全是高秩、而来自总 体 2 的样本全是低秩的情况;反之亦然。可能性最多的情况是,来自总体 1 和总 体 2 的样本,其秩是随机交错的。因此,根据混合样本中两样本交错的次数来检 定秩交错次数是随机的零假设,这就是游程检验。其具体步骤如下: (1) 设从两个未知的总体 1 和总体 2 中分别独立、随机地各抽取 1 个样本, 样本 1 的容量为 n1,样本 2 的容量为 n2 。 (2) 把样本 1 和样本 2 混合起来,并按数值从小到大顺序编号,每个数据 的编号就是它的秩。 (3) 点算游程数目。一个游程指混合样本中接连属于一个样本的一串秩, 其前后是另一个样本的秩。 例如,A 和 B 分别代表混合样本中来自第一个样本的秩和来自第二个样 本的秩,这样一来,混合样本被赋予秩的数据序列便呈以下形式 ABBABAAABABBABBAAABAAB 在此例中,第一个游程由一个 A 组成,第二个游程由两个 B 组成,然后 又是一个 A 组成的游程……,游程的总数为 14。 (4)根据显著性水平α确定否定域( n1,n2)。游程数目 r 的抽样分布(见附表 11)可用于建立否定零假设的否定域。 (5)检定零假设。以混合样本中的游程数目为检验统计量:如果游程的数目 很大,就表明两个样本混合得很好,不能否定零假设;相反,如果游程的数目较 小,零假设就很可能是错的,应该否定。 [例] 设评审专家对 19 所大专院校按校园环境质量排名次,环境质量最好 的学校记分数为 1,环境质量最差的学技记分数为 19。其中 10 所学校是本科院 校,其他 9 所学校是专科院校。假定这 19 所学校是分别从全部大专院校中随机 地抽取的,试问:专科类院校和本科类院校的环境质量是否有显著性差异(α= 0.05)? (请作游程检验)
本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17(nl=10) 专科院校环境质量的名次(秩)为: 3,8,10,12,13.15.16,18,19(n2=9)。 解]将大专院校按校园环境质量的优劣顺序混合排列,然后在第一个样本 的游程下画上横线,属于第二个样本的游程下则不画横线: 12345678910111213141516171819 得检验统计量r=12 由α=0.05,查表得临界值 ra(nl,n2)=(10,9)=6<n 所以不否定零假设,说明在0.05的水平上,不能说专科类院校和本科类院 校的校园环境质量有显著性差异 对于同一道例题,对照此解和上解,我们看到秩和检验和游程检验做出了相 同的判断。但应用前者,更接近于否定零假设。所以,如果零假设实际上是错误 的,应用秩和检验比应用游程检验犯第二类错误的可能性小。 当n1和n2都小于20时,游程数目r的准确抽样分布可以从附表11中查找。 当n1和n2都大于20时,r的抽样分布近似于正态分布N(μ,2),其均值 标准差及标准正态变量分别是 +1 1,+n 2mm2(2n1n2-n1=n2) (n1+n2)2(n1+n2-1) N(O21
本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10)。 专科院校环境质量的名次(秩)为: 3,8,10,12,13.15.16,18,19 (n2=9)。 [解] 将大专院校按校园环境质量的优劣顺序混合排列,然后在第一个样本 的游程下画上横线,属于第二个样本的游程下则不画横线: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 得检验统计量 r=12 由α=0.05,查表得临界值 rα ( n1,n2)=(10,9)=6<l2 所以不否定零假设,说明在 0.05 的水平上,不能说专科类院校和本科类院 校的校园环境质量有显著性差异。 对于同一道例题,对照此解和上解,我们看到秩和检验和游程检验做出了相 同的判断。但应用前者,更接近于否定零假设。所以,如果零假设实际上是错误 的,应用秩和检验比应用游程检验犯第二类错误的可能性小。 当 n1 和 n2 都小于 20 时,游程数目 r 的准确抽样分布可以从附表 11 中查找。 当 n1 和 n2 都大于 20 时,r 的抽样分布近似于正态分布 N (μ,σ2),其均值、 标准差及标准正态变量分别是 : 1 2 1 2 1 2 + + = n n n n r ( ) ( 1) 2 (2 ) 1 2 2 1 2 1 2 1 2 1 2 + + − − − = n n n n n n n n n n r ~ N(0,1) r Z r r − =