延安大学：《社会统计学 Social Statistics》课程教学资源（电子教案）第十一章非参数检验

在社会研究中我们经常要采用定序尺度，但直到现在，我们都还没有机会讨论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验。与以前所讲的检验不同，使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说，也不是检验总体分布的某些参数(例如均值、成数、方差等)，而是检验总体某些有关的性质，所以称为非参数检验。非参数检验，泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。

团购合买资源类别：文库，文档格式：DOC，文档页数：14，文件大小：342.87KB

第十一章非参数检验在社会研究中我们经常要采用定序尺度,但直到现在,我们都还没有机会讨论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验与以前所讲的检验不同,使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说,也不是检验总体分布的某些参数(例如均值、成数、方差等),而是检验总体某些有关的性质,所以称为非参数检验。非参数检验,泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。与均值差等检验比较,非参数检验有什么优点呢?在对均值差进行t检验时,不仅要有定距尺度的假定,还要有正态总体的假定。当然,对于大样本,正态总体的假定可以放松。但正是对于小样本,这种假定最容易出问题。因此,在满足下面两条件之一时,我们期望用非参数检验代替均值差检验:①没有根据采用定距尺度,但可以安排数据的顺序(即秩);②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此,如果有根据采用定距尺度,并且如果对于小样本能够假定其具有正态性,或对大样本能够放松对正态性假定的要求,一般宁愿使用均值差检验,而不用非参数检验非参数检验,无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是:全部数据或数据对都出自相同的基本总体,且取样是随机的、相互独立的。基于这种原因,非参数检验又称为分布自由(或无分布)检验。“无分布” 不是指总体真的无分布,而是指虽有时对总体分布一无所知,但仍可以进行分析。不仅如此,这些很容易理解的方法还可以用于处理等级的资料和定性的信息。很显然,如果把从一个正态总体中抽取的数据用分布自由来处理,其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”。参数检验中的n n非参数检验中的式中的n0和n分别是两种检验保证实现给定的检验力所需的样本容量。如果说某种非参数检验的检验效率为95%,就意味着这种非参数检验在使用100 个数据时的效力等于t检验(在正确模型条件下)使用95个数据的效力。检验力又称检验势,它是用1一β或[-(犯第二类错误的概率)]来定义的

第十一章非参数检验在社会研究中我们经常要采用定序尺度，但直到现在，我们都还没有机会讨论涉及到定序尺度的显著性检验。本章要讲述某些用于定序尺度的双样本检验。与以前所讲的检验不同，使用这类方法不需要对总体分布作任何事先的假定(例如正态总体)。同时从检验的内容来说，也不是检验总体分布的某些参数(例如均值、成数、方差等)，而是检验总体某些有关的性质，所以称为非参数检验。非参数检验，泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。与均值差等检验比较，非参数检验有什么优点呢？在对均值差进行 t 检验时，不仅要有定距尺度的假定，还要有正态总体的假定。当然，对于大样本，正态总体的假定可以放松。但正是对于小样本，这种假定最容易出问题。因此，在满足下面两条件之一时，我们期望用非参数检验代替均值差检验：①没有根据采用定距尺度，但可以安排数据的顺序（即秩）；②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此，如果有根据采用定距尺度，并且如果对于小样本能够假定其具有正态性，或对大样本能够放松对正态性假定的要求，一般宁愿使用均值差检验，而不用非参数检验。非参数检验，无需做出经典统计所必要的关于分布的任何假设。唯一需要的假设是：全部数据或数据对都出自相同的基本总体，且取样是随机的、相互独立的。基于这种原因，非参数检验又称为分布自由(或无分布)检验。“无分布” 不是指总体真的无分布，而是指虽有时对总体分布一无所知，但仍可以进行分析。不仅如此，这些很容易理解的方法还可以用于处理等级的资料和定性的信息。很显然，如果把从一个正态总体中抽取的数据用分布自由来处理，其效果肯定不如相应的参数检验有力。我们一般用下述指标来确定非参数检验的“效率”。式中的 n 0 和 n 分别是两种检验保证实现给定的检验力所需的样本容量。如果说某种非参数检验的检验效率为 95％，就意味着这种非参数检验在使用 100 个数据时的效力等于 t 检验(在正确模型条件下)使用 95 个数据的效力。检验力又称检验势，它是用 1―β或[1―（犯第二类错误的概率）]来定义的。 n n En 非参数检验中的参数检验中的 0 =

对比[例10.31和[例11.1.2]可见,由于符号检验只计及差值d的符号,而没有计及差值d的大小,所以有时用t检验可以作出拒绝零假设的判定,如改用符号检验却往往不能作岀这样的判定。因此说,符号检验效力较低。根据计算,就满足正态分布而言,符号检验法的效率是配对样本t检验的63%。即如果符号检验法需要样本容量为100的话,那么t检验法只需n=63就可作出相同的检验。但符号检验运用于定类尺度,对总体分布又无需加以限制,所以就配对样本的显著性检验而言,其适应面是相当广的。像符号检验这样的非参数值验,在分布自由检验中称为简便检验(或快速检验)。第二节配对符号秩检验对于配对样本,至此我们已经接触了两种检验,即符号检验和t检验。在符号检验中,只考虑差值d的符号而不管其大小,并且应用二项分布检验零假设。另一方面,最有力的检验一—t检验,则不仅需要定距尺度,而且还要求假定差值d服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征,其效力也介乎两者之间配对符号秩检验对于非正态分布的d值,是最佳检验,其检验效力大大高于符号检验。如果t检验的假定成立,配对符号秩检验的检验效力对于大、小样本都近乎为95%。因此,在定距尺度测量的水平上,若由于样本容量太小而不能假定正态分布的时候,配对符号秩检验特别有用。配对符号秩检验的零假设基本上和符号检验以及用于配对样本的t检验的零假设相同。配对符号秩检验的步骤如下: (1)首先求出每对数据的差值d (2)不计正负,按绝对值大小把差值d按顺序排列起来 (3)绝对值最小者赋秩为l,第二小者赋秩为2,……,绝对值最大者赋秩为n(其中绝对值相等者,将它们应得的秩均分之),再在差值前补填上符号。 (4)求得正差值的秩和T+及负差值的秩和T-。我们期望两个秩和

对比[例 10.3.1]和[例 11.1.2]可见，由于符号检验只计及差值 d 的符号，而没有计及差值 d 的大小，所以有时用 t 检验可以作出拒绝零假设的判定，如改用符号检验却往往不能作出这样的判定。因此说，符号检验效力较低。根据计算，就满足正态分布而言，符号检验法的效率是配对样本 t 检验的 63％。即如果符号检验法需要样本容量为 100 的话，那么 t 检验法只需 n＝63 就可作出相同的检验。但符号检验运用于定类尺度，对总体分布又无需加以限制，所以就配对样本的显著性检验而言，其适应面是相当广的。像符号检验这样的非参数值验，在分布自由检验中称为简便检验(或快速检验)。第二节配对符号秩检验对于配对样本，至此我们已经接触了两种检验，即符号检验和 t 检验。在符号检验中，只考虑差值 d 的符号而不管其大小，并且应用二项分布检验零假设。另一方面，最有力的检验—— t 检验，则不仅需要定距尺度，而且还要求假定差值 d 服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征，其效力也介乎两者之间。配对符号秩检验对于非正态分布的 d 值，是最佳检验，其检验效力大大高于符号检验。如果 t 检验的假定成立，配对符号秩检验的检验效力对于大、小样本都近乎为 95％。因此，在定距尺度测量的水平上，若由于样本容量太小而不能假定正态分布的时候，配对符号秩检验特别有用。配对符号秩检验的零假设基本上和符号检验以及用于配对样本的 t 检验的零假设相同。配对符号秩检验的步骤如下： (1) 首先求出每对数据的差值 d 。 (2) 不计正负，按绝对值大小把差值 d 按顺序排列起来。 (3)绝对值最小者赋秩为 l，第二小者赋秩为 2，……，绝对值最大者赋秩为 n (其中绝对值相等者，将它们应得的秩均分之)，再在差值前补填上符号。 (4)求得正差值的秩和 T+ 及负差值的秩和 T- 。我们期望两个秩和

第四节游程检验游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方法很简单:先把两个样本混合起来,按大小排列,并赋予其秩。那么,当样本所属的总体是同分布的话,是不大可能出现来自总体1的样本全是高秩、而来自总体2的样本全是低秩的情况;反之亦然。可能性最多的情况是,来自总体1和总体2的样本,其秩是随机交错的。因此,根据混合样本中两样本交错的次数来检定秩交错次数是随机的零假设,这就是游程检验。其具体步骤如下 (1)设从两个未知的总体1和总体2中分别独立、随机地各抽取1个样本, 样本1的容量为n1,样本2的容量为n2。 (2)把样本1和样本2混合起来,并按数值从小到大顺序编号,每个数据的编号就是它的秩。 (3)点算游程数目。一个游程指混合样本中接连属于一个样本的一串秩, 其前后是另一个样本的秩。例如,A和B分别代表混合样本中来自第一个样本的秩和来自第二个样本的秩,这样一来,混合样本被赋予秩的数据序列便呈以下形式 ABBABAAAbAbbAbbAAAbAAB 在此例中,第一个游程由一个A组成,第二个游程由两个B组成,然后又是一个A组成的游程……,游程的总数为14 (4)根据显著性水平α确定否定域(n1,n2)游程数目r的抽样分布(见附表 l)可用于建立否定零假设的否定域。 (5)检定零假设。以混合样本中的游程数目为检验统计量:如果游程的数目很大,就表明两个样本混合得很好,不能否定零假设;相反,如果游程的数目较小,零假设就很可能是错的,应该否定 [例]设评审专家对19所大专院校按校园环境质量排名次,环境质量最好的学校记分数为1,环境质量最差的学技记分数为19。其中10所学校是本科院校,其他9所学校是专科院校。假定这19所学校是分别从全部大专院校中随机地抽取的,试问:专科类院校和本科类院校的环境质量是否有显著性差异(α= 0.05)?(请作游程检验)

第四节游程检验游程检验是适用于独立样本的另一种检验法。游程检验的基本原理和计算方法很简单：先把两个样本混合起来，按大小排列，并赋予其秩。那么，当样本所属的总体是同分布的话，是不大可能出现来自总体 1 的样本全是高秩、而来自总体 2 的样本全是低秩的情况；反之亦然。可能性最多的情况是，来自总体 1 和总体 2 的样本，其秩是随机交错的。因此，根据混合样本中两样本交错的次数来检定秩交错次数是随机的零假设，这就是游程检验。其具体步骤如下： (1) 设从两个未知的总体 1 和总体 2 中分别独立、随机地各抽取 1 个样本，样本 1 的容量为 n1，样本 2 的容量为 n2 。 (2) 把样本 1 和样本 2 混合起来，并按数值从小到大顺序编号，每个数据的编号就是它的秩。 (3) 点算游程数目。一个游程指混合样本中接连属于一个样本的一串秩，其前后是另一个样本的秩。例如，A 和 B 分别代表混合样本中来自第一个样本的秩和来自第二个样本的秩，这样一来，混合样本被赋予秩的数据序列便呈以下形式 ABBABAAABABBABBAAABAAB 在此例中，第一个游程由一个 A 组成，第二个游程由两个 B 组成，然后又是一个 A 组成的游程……，游程的总数为 14。 (4)根据显著性水平α确定否定域( n1，n2)。游程数目 r 的抽样分布(见附表 11)可用于建立否定零假设的否定域。 (5)检定零假设。以混合样本中的游程数目为检验统计量：如果游程的数目很大，就表明两个样本混合得很好，不能否定零假设；相反，如果游程的数目较小，零假设就很可能是错的，应该否定。 [例] 设评审专家对 19 所大专院校按校园环境质量排名次，环境质量最好的学校记分数为 1，环境质量最差的学技记分数为 19。其中 10 所学校是本科院校，其他 9 所学校是专科院校。假定这 19 所学校是分别从全部大专院校中随机地抽取的，试问：专科类院校和本科类院校的环境质量是否有显著性差异(α＝ 0.05)? （请作游程检验）

点击下载完整版文档（DOC格式）

共14页，试读已结束，阅读完整版请下载

点击下载（DOC格式）

浏览记录

延安大学：《社会统计学 Social Statistics》课程教学资源（电子教案）第十一章非参数检验

延安大学：《社会统计学 Social Statistics》课程教学资源（电子教案）第十一章 非参数检验

延安大学：《社会统计学 Social Statistics》课程教学资源（电子教案）第十一章非参数检验