第十三章非参数检验 第一节Chi- Square过程 13.1.1主要功能 13.1.2实例操作 第二节 Binomial过程 13.2.1主要功能 13.2.2实例操作 第三节Runs过程 13.3.1主要功能 13.3.2实例操作 第四节1-Sa mple K-s 13.4.1主要功能 13.4.2实例操作 第五节2 Independent samples过程 13.5.1主要功能 13.5.2实例操作 第六节 k Independent samples过程 13.6.1主要功能 13.6.2实例操作 第七节2 Related Samples过程 13.7.1主要功能 13.7.2实例操作
第十三章 非参数检验 第一节 Chi-Square 过程 13.1.1 主要功能 13.1.2 实例操作 第二节 Binomial 过程 13.2.1 主要功能 13.2.2 实例操作 第三节 Runs 过程 13.3.1 主要功能 13.3.2 实例操作 第四节 1-Sample K-S 过程 13.4.1 主要功能 13.4.2 实例操作 第五节 2 Independent Samples 过程 13.5.1 主要功能 13.5.2 实例操作 第六节 k Independent Samples 过程 13.6.1 主要功能 13.6.2 实例操作 第七节 2 Related Samples 过程 13.7.1 主要功能 13.7.2 实例操作
第八节 K Related Samples过程 13.8.1主要功能 13.8.2实例操作 许多统计分析方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检 验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或检验总体参数,统称 为参数统计 但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常 不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统 计( Nonparametric tests)。 非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑 第一节Chi- Square过程 13.1.1主要功能 调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于 分析实际频数与某理论频数是否相符。 返回目录返回主页 13.1.2实例操作 [例13-1]某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否 相同? 周日 亡数 二三四五六日 u975569
第八节 K Related Samples 过程 13.8.1 主要功能 13.8.2 实例操作 许多统计分析方法的应用对总体有特殊的要求,如 t 检验要求总体符合正态分布,F 检 验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或检验总体参数,统称 为参数统计。 但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常 不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统 计(Nonparametric tests)。 非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。 第一节 Chi-Square 过程 13.1.1 主要功能 调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验,主要用于 分析实际频数与某理论频数是否相符。 13.1.2 实例操作 [例 13-1]某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否 相同? 周 日 死亡数 一 二 三 四 五 六 日 11 19 17 15 15 16 19
13.1.2.1数据准备 激活数据管理窗口,定义变量名:各周日为day,死亡数为 death。按顺序输入数据,结 果见图13.1。激活Data菜单选 Weight Cases..命令项,弹出 Weight Cases对话框(如图 13.2),选 death点击钮使之进入 Frequency Variable框,定义死亡数为权数,再点击OK 钮即可。 图13.1数据录入窗口 图13.2数据加权对话框 13.1.2.2统计分析 激活 Statistics菜单选 Nonparametric Tests中的Chi- Square..命令项,弹出 Chi- Square Test对话框(图13.3)。现欲对一周内各日的死亡数进行分布分析,故在对话 框左侧的变量列表中选day,点击钮使之进入 Test variable list框,点击OK钮即可
13.1.2.1 数据准备 激活数据管理窗口,定义变量名:各周日为 day,死亡数为 death。按顺序输入数据, 结 果见图 13.1。激活 Data 菜单选 Weight Cases...命令项,弹出 Weight Cases 对话框(如图 13.2),选 death 点击钮使之进入 Frequency Variable 框,定义死亡数为权数,再点击 OK 钮即可。 图 13.1 数据录入窗口 图 13.2 数据加权对话框 13.1.2.2 统计分析 激活 Statistics 菜单选 Nonparametric Tests 中的 Chi-Square...命令项,弹出 Chi-Square Test 对话框(图 13.3)。现欲对一周内各日的死亡数进行分布分析,故在对话 框左侧的变量列表中选 day,点击钮使之进入 Test Variable List 框,点击 OK 钮即可
图13.3卡方检验对话框 13.1.2.3结果解释 在结果输出窗口中将看到如下统计数据 运算结果显示一周内各日死亡的理论数( Expected)为15.71,即一周内各日死亡均数 还算出实际死亡数与理论死亡数的差值( Residual);卡方值x2=3.4000,自由度数(D.F.) =6,P=0.7572,可认为一周内各日的死亡危险性是相同的。 DAY Cases Category Observed Expected Residual 3.00 9753 15.7 4.00 15.71 5.00 15.71 2.71 15.71 D F Significance 3.4000 7572 返回目录返回主页
图 13.3 卡方检验对话框 13.1.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 运算结果显示一周内各日死亡的理论数(Expected)为 15.71,即一周内各日死亡均数; 还算出实际死亡数与理论死亡数的差值(Residual);卡方值χ2 = 3.4000,自由度数(D.F.) = 6 ,P = 0.7572 ,可认为一周内各日的死亡危险性是相同的。 DAY Cases Category Observed Expected Residual 1.00 11 15.71 -4.71 2.00 19 15.71 3.29 3.00 17 15.71 1.29 4.00 15 15.71 -.71 5.00 13 15.71 -2.71 6.00 16 15.71 .29 7.00 19 15.71 3.29 --- Total 110 Chi-Square D.F. Significance 3.4000 6 .7572
第二节 Binomial|过程 13.2.1主要功能 有些总体只能划分为两类,如医学中的生与死、患病的有与无。从这种二分类总体中抽 取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布 调用 Binomial过程可对样本资料进行二项分布分析。 返回目录返回主页 13.2.2实例操作 [例13-2]某地某一时期内出生40名婴儿,其中女性12名(定Sex=0),男性28名(定 Sex=1)。问这个地方出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不 同 13.2.2.1数据准备 激活数据管理窗口,定义性别变量为sex。按出生顺序输入数据,男性为1,女性为0。 13.2.2.2统计分析 激活 Statistics菜单选 Nonparametric Tests中的 Binomial test..命令项,弹出 Binomial test对话框(图13.4)。在对话框左侧的变量列表中选sex,点击钮使之进入Test Variable list框,在 Test Proportion框中键入0.50,再点击OK钮即可
第二节 Binomial 过程 13.2.1 主要功能 有些总体只能划分为两类,如医学中的生与死、患病的有与无。从这种二分类总体中抽 取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。 调用 Binomial 过程可对样本资料进行二项分布分析。 13.2.2 实例操作 [例 13-2]某地某一时期内出生 40 名婴儿,其中女性 12 名(定 Sex=0),男性 28 名(定 Sex=1)。问这个地方出生婴儿的性比例与通常的男女性比例(总体概率约为 0.5)是否不 同? 13.2.2.1 数据准备 激活数据管理窗口,定义性别变量为 sex。按出生顺序输入数据,男性为 1 ,女性为 0。 13.2.2.2 统计分析 激活 Statistics 菜单选 Nonparametric Tests 中的 Binomial Test...命令项,弹出 Binomial Test 对话框(图 13.4)。在对话框左侧的变量列表中选 sex,点击钮使之进入 Test Variable List 框,在 Test Proportion 框中键入 0.50,再点击 OK 钮即可
图13.4二项分布检验对话框 13.2.2.3结果解释 在结果输出窗口中将看到如下统计数据: 二项分布检验表明,女婴12名,男婴28名,观察概率为0.7000(即男婴占70%),检 验概率为0.5000,二项分布检验的结果是双侧概率为0.0177,可认为男女比例的差异有高 度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。 SEX Cases Test 7000 Z Approximation 40 Total 2-Tailed P=, 0177 返回目录返回主页 第三节Runs过程 13.3.1主要功能 依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分称为一个游 程。调用Runs过程可进行游程检验,即用于检验序列中事件发生过程的随机性分析。 返回目录返回主页 13.3.2实例操作 [例13-3]某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为 1”,对非发病的住户标记为“0”,共17户
图 13.4 二项分布检验对话框 13.2.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 二项分布检验表明,女婴 12 名,男婴 28 名,观察概率为 0.7000(即男婴占 70%),检 验概率为 0.5000,二项分布检验的结果是双侧概率为 0.0177,可认为男女比例的差异有高 度显著性,即与通常 0.5 的性比例相比,该地男婴比女婴明显为多。 SEX Cases Test Prop. = .5000 28 = 1.00 Obs. Prop. = .7000 12 = .00 -- Z Approximation 40 Total 2-Tailed P = .0177 第三节 Runs 过程 13.3.1 主要功能 依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分称为一个游 程。调用 Runs 过程可进行游程检验,即用于检验序列中事件发生过程的随机性分析。 13.3.2 实例操作 [例 13-3]某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为 “1”,对非发病的住户标记为“0”,共 17 户:
11000100100001 001000010 问病户的分布排列是呈聚集趋势,还是随机分布? 13.3.2.1数据准备 激活数据管理窗口,定义住户变量为epi。按住户顺序输入数据,发病的住户为1,非 发病的住户为0。 13.3.2.2统计分析 激活 Statistics菜单选 Nonparametric Tests中的 Runs test.项,弹出 Runs test 对话框(图13.5)。在对话框左侧的变量列表中选epi,点击钮使之进入 Test variable list 框。在临界割点 Cut point框中有四个选项: 图13.5游程检验对话框 l、 Median:中位数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点 的为另一类; 2、Mode:众数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为 另一类; 3、Mean:均数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为 另一类 4、 Custom:用户指定临界割点,其值在临界割点之下的为一类,大于或等于临界割点 的为另一类 本例选 Custom项,在其方框中键入1(根据需要选项,本例是0、1二分变量,故临界 割点值用1),再点击0K钮即可 13.3.2.3结果解释 在结果输出窗口中将看到如下统计数据 检验结果可见本例游程个数为14,检验临界割点值( Test value)=1.00,小于1.00 者有17个案例,而大于或等于1.00者有9个案例。Z=0.3246,双侧P=0.7455。所以 认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布
0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 问病户的分布排列是呈聚集趋势,还是随机分布? 13.3.2.1 数据准备 激活数据管理窗口,定义住户变量为 epi。按住户顺序输入数据,发病的住户为 1 ,非 发病的住户为 0。 13.3.2.2 统计分析 激活 Statistics 菜单选 Nonparametric Tests 中的 Runs Test...项,弹出 Runs Test 对话框(图 13.5)。在对话框左侧的变量列表中选 epi,点击钮使之进入 Test Variable List 框。在临界割点 Cut Point 框中有四个选项: 图 13.5 游程检验对话框 1、Median:中位数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点 的为另一类; 2、Mode:众数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为 另一类; 3、Mean:均数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为 另一类; 4、Custom:用户指定临界割点,其值在临界割点之下的为一类,大于或等于临界割点 的为另一类; 本例选 Custom 项,在其方框中键入 1(根据需要选项,本例是 0、1 二分变量,故临界 割点值用 1),再点击 OK 钮即可。 13.3.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 检验结果可见本例游程个数为 14,检验临界割点值(Test value) = 1.00,小于 1.00 者有 17 个案例,而大于或等于 1.00 者有 9 个案例。Z = 0.3246,双侧 P = 0.7455。 所以 认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布
EPI Test value =1. 00 Cases: 17 LT 26 Total 2-Tailed P=.7455 回目录返回主页 第四节1- Sample K-S过程 13.4.1主要功能 调用此过程可对单样本进行 Kolmogorov- Smirnov z检验,它将一个变量的实际频数分 布与正态分布( Normal)、均匀分布( Uniform)、泊松分布( Poisson)进行比较。 返回目录返回主页 13.4.2实例操作 [例13-4]某地正常成年男子144人红细胞计数(万/立方毫米)的频数资料如下,问该 资料的频数是否呈正态分布? 红细胞计数1fad4 width="77 valign="top 红人数 style="width: 58. Opt: background: #FFCC99; mso-shading:H windowtext; mso-pattern: solid #FFCC99; padding: Ocm 5.4pt0cm5.4pt"> 计 人数 440 480 16600-2
EPI Runs: 14 Test value = 1.00 Cases: 17 LT 1.00 9 GE 1.00 Z = .3246 -- 26 Total 2-Tailed P = .7455 第四节 1-Sample K-S 过程 13.4.1 主要功能 调用此过程可对单样本进行 Kolmogorov-Smirnov Z 检验,它将一个变量的实际频数分 布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。 13.4.2 实例操作 [例 13-4]某地正常成年男子 144 人红细胞计数(万/立方毫米)的频数资料如下,问该 资料的频数是否呈正态分布? 红细胞计数 1fad4 width="77" valign="top" style="width:58.0pt;background:#FFCC99;mso-shading: windowtext;mso-pattern:solid #FFCC99;padding:0cm 5.4pt 0cm 5.4pt"> 人数 红 细 胞 计 数 人数 420- 440- 460- 480- 2 4 7 16 540- 560- 580- 600- 24 22 16 2
40 13.4.2.1数据准备 激活数据管理窗口,定义频数变量名为f,依次输入人数资料 13.4.2.2统计分析 激活 Statistics菜单选 Nonparametric Tests中的1- Sample k-S..命令项,弹出 One- Sample Kolmogorov- Smirnov test对话框(图13.6)。在对话框左侧的变量列表中选 f,点击钮使之进入 Test Variable list框,在 Test distribution框中选 Norma项,表明 与正态分布形式相比较,再点击OK钮即可。 图13.6单样本 Kolmogorov- Smirnov Z检验对话框 13.4.2.3结果解释 在结果输出窗口中将看到如下统计数据: K-S正态性检验的结果显示,Z值=0.7032,双侧P值=0.7060,可认为该地正常成年男 子的红细胞计数符合正态分布 Test distribution Standard deviation 9 3808 Mo Absolute Positive Negative 2-Tailed p 20298 16509 7032 7060 目录返回主页
500- 520- 20 25 620- 640- 6 1 13.4.2.1 数据准备 激活数据管理窗口,定义频数变量名为 f,依次输入人数资料。 13.4.2.2 统计分析 激活 Statistics 菜单选 Nonparametric Tests 中的 1-Sample K-S ...命令项,弹出 One-Sample Kolmogorov-Smirnov Test 对话框(图 13.6)。在对话框左侧的变量列表中选 f,点击钮使之进入 Test Variable List 框,在 Test Distribution 框中选 Normal 项,表明 与正态分布形式相比较,再点击 OK 钮即可。 图 13.6 单样本 Kolmogorov-Smirnov Z 检验对话框 13.4.2.3 结果解释 在结果输出窗口中将看到如下统计数据: K-S 正态性检验的结果显示,Z 值=0.7032,双侧 P 值=0.7060,可认为该地正常成年男 子的红细胞计数符合正态分布。 F Test distribution - Normal Mean: 12.0000 Standard Deviation: 9.3808 Cases: 12 Most extreme differences Absolute Positive Negative K-S Z 2-Tailed P .20298 .20298 -.16509 .7032 .7060
第五节2| ndependent samp les过程 13.5.1主要功能 调用此过程可对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验 返回目录返回主页 13.5.2实例操作 [例13-5]调查某厂的铅作业工人7人和非铅作业工人10人的血铅值(ug/100g)如 下,问两组工人的血铅值有无差别? 非铅作业组 556791213151821 铅作业组 17182025344344 13.5.2.1数据准备 激活数据管理窗口,定义分组变量为 group(非铅作业组为1,铅作业组为2),血铅 值为Pb。按顺序输入数据。 13.5.2.2统计分析 激活 Statistics菜单选 Nonparametric Tests中的2 Independent samples.命令项 弹出Two- Independent- Samples-Test对话框(图13.7)。在对话框左侧的变量列表中选Pb, 点击钮使之进入 Test Variable list框:选 group,点击钮使之进入 Grouping Variable 框,点击 Define Groups..钮,在弹出的 Two Independent Samples: Define Groups对话 框内定义 Group1为1, Group2为2,之后点击 Continue钮返回 Two- Independent- Samples-Test对话框;在 Test Type框中有四种检验方法
第五节 2 Independent Samples 过程 13.5.1 主要功能 调用此过程可对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 13.5.2 实例操作 [例 13-5]调查某厂的铅作业工人 7 人和非铅作业工人 10 人的血铅值(μg / 100g)如 下,问两组工人的血铅值有无差别? 非铅作业组 铅作业组 5 5 6 7 9 12 13 15 18 21 17 18 20 25 34 43 44 13.5.2.1 数据准备 激活数据管理窗口,定义分组变量为 group(非铅作业组为 1,铅作业组为 2),血铅 值为 Pb。按顺序输入数据。 13.5.2.2 统计分析 激活 Statistics 菜单选 Nonparametric Tests 中的 2 Independent Samples...命令项, 弹出 Two-Independent-Samples-Test 对话框(图 13.7)。在对话框左侧的变量列表中选 Pb, 点击钮使之进入 Test Variable List 框;选 group,点击钮使之进入 Grouping Variable 框,点击 Define Groups...钮,在弹出的 Two Independent Samples:Define Groups 对话 框内定义 Group 1 为 1 , Group 2 为 2 ,之后点击 Continue 钮返回 Two-Independent-Samples-Test 对话框;在 Test Type 框中有四种检验方法: