第十二章非参数检验 Nonparametric Tests菜单详解 (医学统计之星:张文彤) §12.1概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重 要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及 参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两 比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的 统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大 都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分 析,不如直接用PEMS、 SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半 在SPSS中,几乎所有的非参数分析方法都被放入了 Nonparametric Tests 菜单中,具体来讲有以下几种 Chi- square test:用卡方检验来检验变量的几个取值所占百分比是否和 我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可 以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否 符合我们所给出的一个比例(如分别为10%、30%、40%和20%,我随便写 的)。请注意该检验和我们一般所用的卡方不太一样,我们一般左的卡方 要用 crosstable菜单来完成,而不是这里 Binomial test:用于检测所给的变量是否符合二项分布,变量可以是两 分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。 Runs test:用于检验某变量的取值是否是围绕着某个数值随机地上下波 动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检 验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变 量存在自相关 One- Sample Kolmogorov- Smirnov test:采用柯尔莫诺夫-斯米尔诺夫检 验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、 Poission分布和指数分布。 Two- Independent- Samples tests:即成组设计的两样本均数比较的非参 数检验。 Tests for Several Independent Samples:成组设计的多个样本均数比 较的非参数检验,此处不提供两两比较方法。 Two- Related- Samples tests:配对设计两样本均数的非参数检验
第十二章 非参数检验―― Nonparametric Tests 菜单详解 (医学统计之星:张文彤) §12.1 概论 作为二十一世纪统计理论的三大发展方向之一,非参数统计是统计分析的重 要组成部分。可是与之很不相称的是他针对一般性统计分析的理论发展远远不及 参数检验完善,因而比较完善的可供使用的方法也不多。比如多组均数间的两两 比较,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,几种权威的 统计软件(如 SAS 和 SPSS)均没有提供这方面的方法。 虽然这些洋统计软件没有提供两两比较的非参数方法,但国产的统计软件大 都是提供了的(国情不同嘛),因此建议大家:如果真的要做这方面的非参数分 析,不如直接用 PEMS、SPLMWIN、NOSA 等国产软件,免得用 SPSS 等只能做一半。 在 SPSS 中,几乎所有的非参数分析方法都被放入了 Nonparametric Tests 菜单中,具体来讲有以下几种: • Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和 我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可 以用该方法来分析四种血型所占的比例是否相同(都是 25%),或者是否 符合我们所给出的一个比例(如分别为 10%、30%、40%和 20%,我随便写 的)。请注意该检验和我们一般所用的卡方不太一样,我们一般左的卡方 要用 crosstable 菜单来完成,而不是这里。 • Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两 分类的,也可以使连续性变量,然后按你给出的分界点一刀两断。 • Runs Test:用于检验某变量的取值是否是围绕着某个数值随机地上下波 动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检 验 P 值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变 量存在自相关。 • One-Sample Kolmogorov-Smirnov Test:采用柯尔莫诺夫-斯米尔诺夫检 验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、 Poission 分布和指数分布。 • Two-Independent-Samples Tests:即成组设计的两样本均数比较的非参 数检验。 • Tests for Several Independent Samples:成组设计的多个样本均数比 较的非参数检验,此处不提供两两比较方法。 • Two-Related-Samples Tests:配对设计两样本均数的非参数检验
Tests for Several Related Samples:配伍设计多个样本均数的非参数 检验,此处同样不提供两两比较。 难道两分类的变量还可能不服从二项分布?是的,比如极端的均一分布(取 值都是0或1),负二项分布等。最常见的如传染病的发病,是否发病是绝对不 服从二项分布的(因两个观察结果间会有关联) 由于上述各种统计方法都比较简单,且对话框和结果都比较相似,可以举一 反三,我就不准备一一介绍了,只介绍其中有代表性的两个 Kolmogorov-Smirnov Test Fu Two-Independent-Samples Tests 其实我是想写详细点的,真正阻止我这样作的原因是我实在太忙了,真的真 的太忙了。 812.2 One-Sample Kolmogorov-Smirnov Test 例12.1请判断SPSS自带数据集 anxity.sav中 score的分布是否服从正态 分布。 闲言少叙,操作如下 1. Analyze==>Nonparametic test==>l-sample K-S 2. Test variable list框:选入 score 3. Test distribution复选框组:选中 normal复选框 4.单击OK钮 系统给出的统计分析结果非常简单,具体如下: NPar Tests One-Sample Kolmogorov-Smirnov Test Normal P arameterab Mean Std. Deviation Most Extreme Absolute 106 Positive a. Testaktbati k nornal b. cakikrted tcm dt
• Tests for Several Related Samples:配伍设计多个样本均数的非参数 检验,此处同样不提供两两比较。 难道两分类的变量还可能不服从二项分布?是的,比如极端的均一分布(取 值都是 0 或 1),负二项分布等。最常见的如传染病的发病,是否发病是绝对不 服从二项分布的(因两个观察结果间会有关联)。 由于上述各种统计方法都比较简单,且对话框和结果都比较相似,可以举一 反三,我就不准备一一介绍了,只介绍其中有代表性的两个 --Kolmogorov-Smirnov Test 和 Two-Independent-Samples Tests。 其实我是想写详细点的,真正阻止我这样作的原因是我实在太忙了,真的真 的太忙了。 §12.2 One-Sample Kolmogorov-Smirnov Test 例 12.1 请判断 SPSS 自带数据集 anxity.sav 中 score 的分布是否服从正态 分布。 闲言少叙,操作如下: 1. Analyze==>Nonparametic test==>1-sample K-S 2. Test variable list 框:选入 score 3. Test distribution 复选框组:选中 normal 复选框 4. 单击 OK 钮 系统给出的统计分析结果非常简单,具体如下: NPar Tests
上表给出了所检验变量的常用正态描述指标(即均数、标准差),检验的中 间结果和最终结果。从上可见P值为0.652,即 score是服从正态分布的 上表翻译如下: 变量名 Score 样本量 正态分布参数 均数 10.00 最极端的差异绝对值 106 负值 K检验的统计量Z值 近似P值(双侧 812. 3 Two-Independent-Samples Tests 例12.2请用非参数方法检验 anxity.sav中第一次和第二次的评分结果是否 有差异。 选择 Analyze=) Nonparametic test==>Two- Independent- Samples,弹出的 对话框和大家最初就接触的t检验对话框非常相似,只是在下面一共给出了四种 检验方法,其中第一种Mann- Whitney U检验实际上就是大家都学过的两样本均 数比较的秩和检验,只是换了个名称而已。这里我们就用它。本例的具体操作如 下 1. Analyze==>Nonparametic test==>Two-Independent-Samples 2. Test variable list框:选入 score 3. grouping variables框:选入 trial 4.单击 Define groups钮 5.在 groupl框和 group2框中分别输入1和2 6.单击 continue钮 7. Test type复选框组:选中Mann- Whitney U复选框 8.单击OK钮 前几天有位网友给我来信,问我在这个例子中只比较第一次和第二次的评分 结果有无差异,是不是意味着在做四组间的两两比较?即”成组设计多独立样本 非参数检验”可用"两独立样本Mann- Whitney U检验”来作两两比较?我一看这封 信就吓了一跳!不好意思,引起了如此大的误会!!在这里我严正声明:我在这 里只是为了省事,胡乱拉了一个例子而已。在我看来,"成组设计多独立样本非
上表给出了所检验变量的常用正态描述指标(即均数、标准差),检验的中 间结果和最终结果。从上可见 P 值为 0.652,即 score 是服从正态分布的。 上表翻译如下: 变量名 Score 样本量 48 正态分布参数 均数 10.00 标准差 5.17 最极端的差异绝对值 .106 正值 .088 负值 -.106 K-S 检验的统计量 Z 值 .735 近似 P 值 (双侧) .652 §12.3 Two-Independent-Samples Tests 例 12.2 请用非参数方法检验 anxity.sav 中第一次和第二次的评分结果是否 有差异。 选择 Analyze==>Nonparametic test==>Two-Independent-Samples,弹出的 对话框和大家最初就接触的 t 检验对话框非常相似,只是在下面一共给出了四种 检验方法,其中第一种 Mann-Whitney U 检验实际上就是大家都学过的两样本均 数比较的秩和检验,只是换了个名称而已。这里我们就用它。本例的具体操作如 下: 1. Analyze==>Nonparametic test==>Two-Independent-Samples 2. Test variable list 框:选入 score 3. grouping variables 框:选入 trial 4. 单击 Define groups 钮 5. 在 group1 框和 group2 框中分别输入 1 和 2 6. 单击 continue 钮 7. Test type 复选框组:选中 Mann-Whitney U 复选框 8. 单击 OK 钮 前几天有位网友给我来信,问我在这个例子中只比较第一次和第二次的评分 结果有无差异,是不是意味着在做四组间的两两比较?即"成组设计多独立样本 非参数检验"可用"两独立样本 Mann-Whitney U 检验"来作两两比较?我一看这封 信就吓了一跳!不好意思,引起了如此大的误会!!在这里我严正声明:我在这 里只是为了省事,胡乱拉了一个例子而已。在我看来,"成组设计多独立样本非
参数检验"用"两独立样本Mann- Whitney U检验"来作两两比较完全等价于用t 检验代替方差分析中的的两两比较,如果一定要做,就必须要对 Alpha水准进行 调整(具体方法在倪宗瓒老师主编的《医学统计学》第二版里有),否则自然会 出问题 程序给出的分析结果如下: NPar Tests Mann-Whitney Test Ranks 1771 21250 12 上表为两组秩次情况的报告,可见第一次检查的智次和为212.5,平均秩次 为17.71。第二次检查的则分别为87.5和7.29,显然,差距较大。 Test Statistics b 87500 3664 b G rollag Varek: TrLal 上表为统计分析的结果,分别给出了Man- Whitney U检验值、 Wilcoxon 检验值和Z值,以及近似P值和确切概率值。可见P值远小于0.05,因此刚才 两组的平均秩次之差是有统计学意义的
参数检验"用"两独立样本 Mann-Whitney U 检验"来作两两比较完全等价于用 t 检验代替方差分析中的的两两比较,如果一定要做,就必须要对 Alpha 水准进行 调整(具体方法在倪宗瓒老师主编的《医学统计学》第二版里有),否则自然会 出问题。 程序给出的分析结果如下: NPar Tests Mann-Whitney Test 上表为两组秩次情况的报告,可见第一次检查的智次和为 212.5,平均秩次 为 17.71。第二次检查的则分别为 87.5 和 7.29,显然,差距较大。 上表为统计分析的结果,分别给出了 Mann-Whitney U 检验值、Wilcoxon W 检验值和 Z 值,以及近似 P 值和确切概率值。可见 P 值远小于 0.05,因此刚才 两组的平均秩次之差是有统计学意义的