要 第七章单因子试验方差分析 课时 10 &7.1方差分析的必要性与作用&7.2方差分析的条件与数据转换 &7.3方差分析及基本原理 &7.4方差分析的类型与分析步骤 &7.5完全随机设计 &7.6随机区组设计 &7.7拉丁方设计 教学 (1)了解方差分析的基本原理和步骤:(2)掌握统计学两类错误:(3)了 目的 解方差分析的基本假定和数据转换方法。(4)学握完全随机设计、随机区 组设计、拉丁方设计等单因子试验资料的方差分析。 1.方差分析的基本原理和步骤 教学 2. 统计学两类错误 3.方差分析的条件和数据转换方法。 重点 4.完全随机设计的方差分析与随机区组设计的方差分析。 1.方差分析的基本原理 2.常用的数据代换的适用范围理解 3.各种试验资料分析方法的判断及分析时异同。 突破方法: 教学 举例与多媒体图形展示讲解。先温习各种设计的特点,使从试验设计 难点 过程中掌握各种设计误差的不同。重点讲透完全随机设计的总平方和的分 解,区组设计只多了项区组平方和等,学生很快就会自己写出拉丁方设计 资料的分析公式。此外,通过再做课堂练习,学生掌握了再往下讲。效果 较好。 相关素材(参考资料、指导学生阅读材料等): 1. 《试验统计方法》,盖钧镫主编,中国农业出版社,2000。 2. 《试验设计与统计分析》,金益主编,中国农业出版社,2007。 3. 《SAS统计分析教程》,唐燕琼主编,中国农业出版社,2006。 4 《试验统计引论》,韩汉鹏主编,中国林业出版社,2006。 5. 《热带作物的试验设计与统计分析》,林德光著,华南热带农业大学,1985 6. 《生物统计的数学原理》,林德光,辽宁人民出版社,1982。 7. 《试验设计与统计分析学习指导》,黄亚群主编,中国农业出版社,2008, 8. 《果树试验设计与统计》,刘权主编,中国农业出版社,1997。 9.《肥料试验及统计分析》,陶勤南主编,中国农业出版社,1997。 10.《食品试验设计与统计分析》,王钦德主编,中国农业出版社,2002 11.《试验设计与分析》,袁志发主编,高等教育出版社,2000
1 章 第七章 单因子试验方差分析 课时 10 节 &7.1 方差分析的必要性与作用 &7.2 方差分析的条件与数据转换 &7.3 方差分析及基本原理 &7.4 方差分析的类型与分析步骤 &7.5 完全随机设计 &7.6 随机区组设计 &7.7 拉丁方设计 教学 目的 (1)了解方差分析的基本原理和步骤;(2)掌握统计学两类错误;(3)了 解方差分析的基本假定和数据转换方法。(4)掌握完全随机设计、随机区 组设计、拉丁方设计等单因子试验资料的方差分析。 教学 重点 1. 方差分析的基本原理和步骤 2. 统计学两类错误 3. 方差分析的条件和数据转换方法。 4. 完全随机设计的方差分析与随机区组设计的方差分析。 教学 难点 1. 方差分析的基本原理 2. 常用的数据代换的适用范围理解 3. 各种试验资料分析方法的判断及分析时异同。 突破方法: 举例与多媒体图形展示讲解。先温习各种设计的特点,使从试验设计 过程中掌握各种设计误差的不同。重点讲透完全随机设计的总平方和的分 解,区组设计只多了项区组平方和等,学生很快就会自己写出拉丁方设计 资料的分析公式。此外,通过再做课堂练习,学生掌握了再往下讲。效果 较好。 相关素材(参考资料、指导学生阅读材料等): 1. 《试验统计方法》,盖钧镒主编,中国农业出版社,2000。 2. 《试验设计与统计分析》,金益主编,中国农业出版社,2007。 3. 《SAS 统计分析教程》,唐燕琼主编,中国农业出版社,2006。 4. 《试验统计引论》,韩汉鹏主编,中国林业出版社,2006。 5. 《热带作物的试验设计与统计分析》,林德光著,华南热带农业大学,1985。 6. 《生物统计的数学原理》,林德光,辽宁人民出版社,1982。 7. 《试验设计与统计分析学习指导》,黄亚群主编,中国农业出版社,2008。 8. 《果树试验设计与统计》,刘权主编,中国农业出版社,1997。 9. 《肥料试验及统计分析》,陶勤南主编,中国农业出版社,1997。 10. 《食品试验设计与统计分析》,王钦德主编,中国农业出版社,2002。 11. 《试验设计与分析》,袁志发主编,高等教育出版社,2000
教师授课思路、设问及讲解要点 一、引言 前面学习的均数差异显著性测验,用于比较两个试验处理的优劣,而科研实 践往往需进行多个处理平均数间差异显著性测验。例如比较5种药剂的抑菌效果 的差异显著性测验。4个菌种在3种不同培养基的生长效果比较试验。这就要用 本章将学的方差分析法,它是解决多个处理效果差异显著性测验的统计方法。 二、教学内容正文(含讲课内容、提问设计、课堂练习等) &7.1方差分析的必要性与作用 一、方差分析的必要性 前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理 的优劣。用于多个平均数间差异显著性测验,就会表现出如下一些问题: 1.多个处理用t测验计算麻烦 前面讲过的t测验,卡平方测验多数只限于2个处理进行比较,而对多个处 教理进行比较,就麻烦,又不能利用资料的全部信息,精确度也不高。例如:有10 个样本,就要测验:u=2,u=u,共C=45个假设,很麻烦。 学 2.推断的可靠性降低,犯α错误的概率增大 两个样本平均数比较采用t测验,a=0.05时犯第一类错误的概率为0.05 过 推断的可靠性为1-a=0.95。 若对5个处理采用t测验进行比较,ā=0.05,需进行10次两两比较,每次 比较的可靠性为1-α=0.95,要求10次都正确的概率为(1-a)10 0.9510=0.5987,因此推断的可靠性由0.95降到0.5987,犯第一类错误的概率则由 0.05上升到(1-0.5987)=0.4013. 3.误差估计的精确性和检验的灵敏性降低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。 采用t测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计 的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低, 容易掩盖差异的显著性,增大犯第二类错误的可能。 譬如,有5个处理,每个处理重复6次,共有观察值30个,若进行t测验每 次只利用12个观察值,误差的自由度为2(6-1)=10,若利用30个观察值估计 试验误差,误差自由度为5(6-1)=25。自由度越小,标准差越大,灵敏度低: 自由度越大,标准差越小,灵敏度高。 因此对多个处理平均数进行差异显著性测验,不宜采用t测验,而需采用 种新的统计方法一一方差分析法
2 教 学 过 程 教师授课思路、设问及讲解要点 一、引言 前面学习的均数差异显著性测验,用于比较两个试验处理的优劣,而科研实 践往往需进行多个处理平均数间差异显著性测验。例如比较 5 种药剂的抑菌效果 的差异显著性测验。4 个菌种在 3 种不同培养基的生长效果比较试验。这就要用 本章将学的方差分析法,它是解决多个处理效果差异显著性测验的统计方法。 二、教学内容正文(含讲课内容、提问设计、课堂练习等) &7.1 方差分析的必要性与作用 一、方差分析的必要性 前面学习了两个样本平均数的假设测验,该法只适用于比较两个试验处理 的优劣。用于多个平均数间差异显著性测验,就会表现出如下一些问题: 1.多个处理用 t 测验计算麻烦 前面讲过的 t 测验,卡平方测验多数只限于2个处理进行比较, 而对多个处 理进行比较,就麻烦,又不能利用资料的全部信息,精确度也不高。例如:有 10 个样本,就要测验:u1=u2, u1=u3 .,共 2 C10=45 个假设,很麻烦。 2.推断的可靠性降低 ,犯α错误的概率增大 两个样本平均数比较采用 t 测验,α=0.05 时犯第一类错误的概率为 0.05, 推断的可靠性为 1-α=0.95。 若对 5 个处理采用 t 测验进行比较,α=0.05, 需进行 10 次两两比较,每次 比 较 的 可 靠 性 为 1-α=0.95 , 要 求 10 次 都 正 确 的 概 率 为 (1-α)10 = 0.9510=0.5987,因此推断的可靠性由 0.95 降到 0.5987,犯第一类错误的概率则由 0.05 上升到(1-0.5987)=0.4013. 3.误差估计的精确性和检验的灵敏性降低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。 采用 t 测验法,每次只能利用两组观察值估计试验误差,与利用全部观察值估计 的试验误差相比,精确性低,误差的自由度也低,从而使检验的灵敏度也降低, 容易掩盖差异的显著性,增大犯第二类错误的可能。 譬如,有 5 个处理,每个处理重复 6 次,共有观察值 30 个,若进行 t 测验每 次只利用 12 个观察值,误差的自由度为 2(6-1)=10,若利用 30 个观察值估计 试验误差,误差自由度为 5(6-1)=25。自由度越小,标准差越大,灵敏度低; 自由度越大,标准差越小,灵敏度高。 因此对多个处理平均数进行差异显著性测验,不宜采用 t 测验,而需采用一 种新的统计方法——方差分析法
&7.2方差分析的条件与数据转换 、方差分析的基本假定(条件)p143 1.正态性:指所有试验误差都是随机的、彼此独立的,且服从正态分布 N(0,σ2),一般量测性资料都满足正态性 2.可加性(独立性):处理效应与环境效应等应该具有可加性。各样本间相 互独立的。 3.方差齐性(同质性):所有处理的误差方差都是同质的。可用卡平方测验 窥测。 对于测量性资料,一般都满足这四条,尽可放心使用方差分析,计数性资料 往往不能满足4点要求,常要进行统计代换,用代换后的数据作方差分析。 二.计数性资料的统计代换 (一)、平方根代换 1.公式:x=√ x=x+1 (x中含0) 教 2适用范围:各组方差与其平均数有某种比例关系的资料。 服从潘松分布的资料,这类资料一般不用百分率来表示,而用计数表示, 学 如每小区的虫数、杂草数、放射性物质在单位时间内的放射次数等,调查总数很 大,但昆虫出现头数极少或某性状出现的次数很少,通常)50。 3,方法:查平方根表或计算器 过 (二)、对数代换 1.公式:x’=1gx(不含0) x’=1g(x+1)(有含0) 程 2,适用范围:数据表现的效应为非可加性,而成倍加性或可乘性,同时平 均数与其极差或s成比例或艰CV接近一常数时。 服从核心分布或负二项分布(嵌纹分布)的资料 核心分布:呈一小群一小群的相对集中的分布,而群与群之间的位置又是随 机的。 嵌纹分布:又负二项分布,即是边缘变化的分布,有的地方很多,而有的地 方又很少,其间断过渡的。 火 资料特点各处理的标准差、极差与其平均数成比例的趋势或变异系数 接近一个常数时。如倍数表现为倍加性或可乘性,对数代换比平方根 更有效。 (三)、反正弦代换 1.公式:用角度表示:x=sn1其中:x为百分率x'为角度值 用弧度表示:0如 2.适用范围:资料系成数或百分数
3 教 学 过 程 &7.2 方差分析的条件与数据转换 一、方差分析的基本假定(条件)p143 1.正态性:指所有试验误差都是随机的、彼此独立的,且服从正态分布 (0, ) 2 N ,一般量测性资料都满足正态性。 2.可加性(独立性):处理效应与环境效应等应该具有可加性。各样本间相 互独立的。 3.方差齐性(同质性):所有处理的误差方差都是同质的。可用卡平方测验 窥测。 对于测量性资料,一般都满足这四条,尽可放心使用方差分析,计数性资料, 往往不能满足4点要求,常要进行统计代换,用代换后的数据作方差分析。 二.计数性资料的统计代换 (一)、 平方根代换 1.公式: x = x x = x +1 (x中含 0) 2.适用范围:各组方差与其平均数有某种比例关系的资料。 服从潘松分布的资料,这类资料一般不用百分率来表示,而用计数表示, 如每小区的虫数、杂草数、放射性物质在单位时间内的放射次数等,调查总数很 大,但昆虫出现头数极少或某性状出现的次数很少,通常 n〉50。 3.方法:查平方根表或计算器 (二)、对数代换 1.公式:x’=lgx(不含 0) x’=lg(x+1)(有含 0) 2.适用范围:数据表现的效应为非可加性,而成倍加性或可乘性,同时平 均数与其极差或 s 成比例或艰 CV 接近一常数时。 服从核心分布或负二项分布(嵌纹分布)的资料。 核心分布:呈一小群一小群的相对集中的分布,而群与群之间的位置又是随 机的。 嵌纹分布:又负二项分布,即是边缘变化的分布,有的地方很多,而有的地 方又很少,其间断过渡的。 * 资料特点各处理的标准差、极差与其平均数成比例的趋势或变异系数 接近一个常数时。如倍数表现为倍加性或可乘性,对数代换比平方根 更有效。 (三)、反正弦代换 1.公式:用角度表示: x x 1 sin − = 其中:x 为百分率 x’为角度值 用弧度表示: x x 1 sin 180 − = 2.适用范围:资料系成数或百分数
原则上当原始资料的可数百分率大部分都在30%至70%之间时可以不用进行 代换(近似服从正态分布),但多在大于70%或小于30%时,必须进行代换。 *用代换后的数据统计分析,但说明统计结论时,要注意原数据的意义。 3.方法:a.查反正弦代换表例:34%-35.67 b.用计算器 (四)采用几个观察值的平均数作方差分析 因均数比单个值更易做成正态分布, (五)倒数转换 1,公式:x=I 2.适用范围:各组数据的s与F成比例的资料。 常用于以出现质反应时间为指标的数据资料,数据两端波动较大的资料, &7.3方差分析及其基本原理 1.方差分析的概念 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相为 教 重要性的一种统计方法。 或k≥3样本平均数的假设测验方法即方差分析。 2.方差分析基本原理 将k个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自 过 由度和平方和分解为度量不同变异来源的自由度与平方和,进而获得不同来源的 总体方差的估计值:通过计算这些总体方差的估计值的适当比值,并测验假设 程 H0:μ1=μ2==μk 就能检验各样本所属总体平均数是否相等。(将在单因子试验分析中细讲) ·、数据结构与变异来源的分解 设有k个处理,每个处理有n个观察值,则共有k个观察值,其数据结构和符 号如表6.1。 处理3 合计,平均.⊙ 1 x2.2. A: x4. Xz? 合计和中 . 表中x表示第i个处理的第j个观测值(i=l,2,.,k:jl,2,.,n): x=立x,表示第i个处理n个规测值的秘=立,1m=X,1n衣示第1个处的平药藏
4 教 学 过 程 原则上当原始资料的可数百分率大部分都在30%至70%之间时可以不用进行 代换(近似服从正态分布),但多在大于 70%或小于 30%时,必须进行代换。 * 用代换后的数据统计分析,但说明统计结论时,要注意原数据的意义。 3.方法:a. 查反正弦代换表 例:34%-35.67 b. 用计算器 (四)采用几个观察值的平均数作方差分析 因均数比单个值更易做成正态分布。 (五)倒数转换 1.公式: x x 1 = 2.适用范围:各组数据的 s与x 2成比例的资料。 常用于以出现质反应时间为指标的数据资料,数据两端波动较大的资料。 &7.3 方差分析及其基本原理 1.方差分析的概念 将试验数据的总变异分解为不同来源的变异,从而评定不同变异来源的相对 重要性的一种统计方法。 或 k 3 样本平均数的假设测验方法即方差分析。 2.方差分析基本原理 将 k 个样本的观察值和平均数作为一个整体加以考虑,把观察值总变异的自 由度和平方和分解为度量不同变异来源的自由度与平方和,进而获得不同来源的 总体方差的估计值;通过计算这些总体方差的估计值的适当比值,并测验假设 H0:μ1= μ2=.= μk 就能检验各样本所属总体平均数是否相等。(将在单因子试验分析中细讲) 一、数据结构与变异来源的分解 设有 k 个处理,每个处理有 n 个观察值,则共有 nk 个观察值,其数据结构和符 号如表 6.1。 表中 ij x 表示第 i 个处理的第 j 个观测值(i=1,2,.,k;j=1,2,.,n); = = n j i ij x x 1 . 表示第i个处理n个观测值的和; x x n xi n n j i ij . / ./ 1 = = = 表示第i个处理的平均数;
女一身表示第个处理个观测值的和: 上一字护宫表标全都观测做的和 黑一空以=年加表示第1个处理的平均数 玉一空艺ax加表标全部观测值的总平约数, 处理间变异ti=(μi-μ) 处理内变异eij=(xijμi) x,=元+1,+e,样本符号 μ表示全试验观测值总体的平均数 由此可推知:k个观察值的总变异可分解为处理间的变异和处理内的变异两 部分。 二、自由度与平方和的分解 教 1、总平方和分解 由表7.1可以看出,k个观察值的变异构成了整个资料的总变异,总变异的 学 平方和即: s-X4-8-君 过 x,-=际-)+6,- 程 =2年-户+2民-X-)+(6-月 =吃属-广+2[属-),-月+22,- 其中2x,-)=0 所吃2-=空低-+224,- 总平方和=处理间平方和+处理内平方和 记为:SST=SSt+SSe 处理间平方和乃各处理的平均数的变异 馬=心低-驴区列- 处理内(误差)平方和乃各组的个观察值与其相应平均数的离差平方和,即 2k-矿=2号买
5 教 学 过 程 = = n j i ij x x 1 . 表示第 i 个处理 n 个观测值的和; = = = = = k i i k i n j ij x x x 1 1 1 . . 表示全部观测值的总和; x x n xi n n j i ij . / ./ 1 = = = 表示第 i 个处理的平均数 x x kn x kn k i n j ij . / ./ 1 1 = = = = 表示全部观测值的总平均数; 处理间变异τi=(μi- μ) 处理内变异εij=( xij- μi) ij i ij x = x + t + e 样本符号 μ表示全试验观测值总体的平均数 由此可推知: nk 个观察值的总变异可分解为处理间的变异和处理内的变异两 部分。 二、自由度与平方和的分解 1、总平方和分解 由表 7.1 可以看出,nk 个观察值的变异构成了整个资料的总变异,总变异的 平方和即: nk T ss x x x T ij ij 2 2 2 =( − ) = − = − + − − + − = − + − − + − − = − + − = = = = = = = = = = = k i n j i j i n j i j i k i k i i i k i n j i i i j i i j i k i n j k i n j i j i i j i n x x x x x x x x x x x x x x x x x x x x x x 1 1 2 1 1 1 2 1 1 2 2 1 1 1 1 2 2 ( . .) 2 [( . .) ( .)] ( .) ( . .) 2( . .)( .) ( .) ( .) ( . .) ( .) = − = n j ij i x x 1 其中 ( . ) 0 = = = = = − = − + − k i n j k i k i n j ij i ij i x x n x x x x 1 1 1 1 1 2 . 2 . . 2 . 所以 ( ) ( ) ( ) 总平方和=处理间平方和+处理内平方和 记为:SST = SSt+ SSe 处理间平方和乃各处理的平均数的变异, = − = − nk T T n ss n x x t i i 2 2 2 ( ) 1 ( ) 处理内(误差)平方和乃各组的 n 个观察值与其相应平均数的离差平方和,即 n T ss x x x i nk ij k n e ij i = − = − 2 1 2 2 1 1 ( )
2。自由度的分解 1、总变异的自由度:dfT=nk-1 2、处理间的自由度:dft=k-1 3、整个资料处理内(即误差项)自由度为: dfe=dfl+df2+.+dfk=k(n-l) 由上述分析可知,整个资料的变异来源可分为:处理间和处理内两个部分。 因此,总平方和=处理间平方和+处理内平方和 SST SSt+SSe 总自由度=处理间自由度+处理内自由度 dfT dft dfe 于是, 处理间均方6一受 变开均方:饭受 处理内均方:心-齐 教 注意:MS,≠MS+MS。 或+++听或=+防++) 学 表6.2表6.1资料的方差分析 变异来源 55 MS 处理间 k-1 SSt MSt MSt/MSe 处理内 k(n-1) SSe MSe 程 总变异 kn-1 SST 三、F分布与F测验 1、F测验的基本原理 由前面的分析可知,表6.1中k个观察值的大小不尽相同,它们之间的变异 构成了整个数据的总变异,其总变异又可分为处理间变异和处理内变异。 处理内变异:同一处理内的各个观察值不完全相同,这是因为它们都会受到 偶然性因素的影响,影响的大小是随机效应,这些随机效应即为随机变异。各个 处理内的随机变异之和就构成了整个资料的误差项变异。 处理间变异:从上述分析可知,各处理平均数之间有不同程度的差异,引起差异 的原因有二:其一是处理的不同;其二是不同处理受偶然因素影响的程度不同。 由第二种原因引起的变异,其性质与处理内变异(即误差变异)性质相同,而且 在一般情况下,可以认为其效应相等。 因此:处理间变异=处理间真实差异+处理内变异 当处理间真实差异=0时,处理间变异=处理内变异 当处理间真实差异>0时,处理间变异>处理内变异
6 教 学 过 程 2. 自由度的分解 1、总变异的自由度:dfT=nk-1 2、处理间的自由度:dft=k-1 3、整个资料处理内(即误差项)自由度为: dfe=df1+df2+.+dfk=k(n-1) 由上述分析可知,整个资料的变异来源可分为:处理间和处理内两个部分。 因此, 总平方和=处理间平方和+处理内平方和 SST = SSt+ SSe 总自由度=处理间自由度+处理内自由度 dfT = dft + dfe 于是, 处理间均方: t t t t df SS MS = S = 2 总变异均方: e e e e df SS MS = S = 2 处理内均方: T T T T df SS MS = S = 2 注意: MST MS MSe t + 2 2 2 2 1 2 e k s s + s ++ s ( ) 1 2 2 2 2 1 2 e k s s s k s = + ++ 表 6.2 表 6.1 资料的方差分析 变异来源 DF SS MS F 处理间 k-1 SSt MSt MSt/MSe 处理内 k(n-1) SSe MSe 总变异 kn-1 SST 三、F 分布与 F 测验 1、F 测验的基本原理 由前面的分析可知,表 6.1 中 nk 个观察值的大小不尽相同,它们之间的变异 构成了整个数据的总变异,其总变异又可分为处理间变异和处理内变异。 处理内变异:同一处理内的各个观察值不完全相同,这是因为它们都会受到 偶然性因素的影响,影响的大小是随机效应,这些随机效应即为随机变异。各个 处理内的随机变异之和就构成了整个资料的误差项变异。 处理间变异:从上述分析可知,各处理平均数之间有不同程度的差异,引起差异 的原因有二:其一是处理的不同;其二是不同处理受偶然因素影响的程度不同。 由第二种原因引起的变异,其性质与处理内变异(即误差变异)性质相同,而且 在一般情况下,可以认为其效应相等。 因此:处理间变异=处理间真实差异+处理内变异 当处理间真实差异=0 时,处理间变异=处理内变异 当处理间真实差异>0 时,处理间变异>处理内变异
F=处理间方差 处理内方差 如果F与“1”相差不多,表明各处理效应在本质上相同,即处理间差异不显著 如果F比“1”大得多,超出了通常偶然因素所能解释的范围,那就说明各 处理效应有本质差异。 关于F值的大小,如何判断是否超过了用误差解释的范围?必须借助F测验, 2、F分布与F测验 F分布:在给定的样本容量l和n2下,从该总体进行一系列的抽样,则可 获得一系列F值,各个F值所具有的概率构成一种分布,这一分布称为F分布。 ,F分布的取值范围为(0,∞) F= 故F分布只有一尾概率(即右尾概率),进行的F测验仅为一尾测验。 F分布是随自由度df1和df2的改变而改变的一组偏态曲线,只有当df1和df 都趋向于∞时,F分布趋于对称分布。因此,F分布某一特定曲线的形状取决于 参数df1和df2。 学 F分布下一定区间的概率可以从己制成的统计表(附表5)中查出。 例如,当df1=4(nl=5),df2=5(n2=6)时,从附表5查得F0.05=5.19, F0.01=11.39,这就表明如以nl=5,n2=6在一正态总体中进行连续抽样,则所 过 得F值大于5.19的仅有5%,大于11.39的仅有1%。 F测验:测验某项变异因素的效应是否真实存在。 程 若各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异: 若各处理的均数不等且差异显著,可以推断处理间有真实差异。 四、多重比较 F值显著或极显著,否定了无效假设O,表明试验的总变异主要来源于处 理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两 个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显 著或极显著差异,哪些差异不显著。 因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间 的差异显著性。 统计上把多个平均数两两间的相互比较称为多重比较(multipl comparisons),。 多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法 (LSR法),现分别介绍如下。 (I)最小显著差数法(LSD法,least significant difference) 具体方法: >
7 教 学 过 程 2 2 e t s s F = = 处理内方差 处理间方差 如果 F 与“1”相差不多,表明各处理效应在本质上相同,即处理间差异不显著。 如果 F 比“1”大得多,超出了通常偶然因素所能解释的范围,那就说明各 处理效应有本质差异。 关于 F 值的大小,如何判断是否超过了用误差解释的范围?必须借助 F 测验。 2、F 分布与 F 测验 F 分布:在给定的 样本容量 n1 和 n2 下,从该总体进行一系列的抽样,则可 获得一系列 F 值,各个 F 值所具有的概率构成一种分布,这一分布称为 F 分布。 2 2 2 1 s s F = ,F 分布的取值范围为〔0,∞〕 故 F 分布只有一尾概率(即右尾概率),进行的 F 测验仅为一尾测验。 F 分布是随自由度 df1 和 df2 的改变而改变的一组偏态曲线,只有当 df1 和 df2 都趋向于∞时,F 分布趋于对称分布。因此, F 分布某一特定曲线的形状取决于 参数 df1 和 df2。 F 分布下一定区间的概率可以从已制成的统计表(附表 5)中查出。 例如,当 df1=4(n1=5) , df2=5(n2=6)时,从附表 5 查得 F0.05=5.19, F0.01=11.39, 这就表明如以 n1=5, n2=6 在一正态总体中进行连续抽样,则所 得 F 值大于 5.19 的仅有 5%,大于 11.39 的仅有 1%。 F 测验: 测验某项变异因素的效应是否真实存在。 若各处理的均数相等或者差异不显著,可以推断处理间不存在真实差异; 若各处理的均数不等且差异显著,可以推断处理间有真实差异。 四、 多重比较 F 值显著或极显著,否定了无效假设 HO ,表明试验的总变异主要来源于处 理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两 个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显 著或极显著差异,哪些差异不显著。 因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间 的差异显著性。 统 计 上 把 多 个 平 均 数 两 两 间 的 相 互 比 较 称 为 多 重 比 较 (multiple comparisons)。 多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法 (LSR 法),现分别介绍如下。 (1)最小显著差数法 (LSD 法,least significant difference) 具体方法:
1.计算均数差异标准误:S2=√2S。/m 其中MS为F检验中的误差均方 2.计算最小显著差数: LSD。=tad或Sa 在F检验显著的前提下,算出LSDa 若民-x>LSDa时,则元与元,在a水平上差异显著:反之。 关于LSD法的应用说明: LSD法实质上就是t检验法。 ->LSD=tS 但是,由于LSD法是利用F检验中的误差自由df。查t.值,利用误差均方 MSe计算均数差异标准误S,因而法又不同于每次利用两组数据进行多个平均 数两两比较的检验法。它解决了本章开头指出的t检验法检验过程烦琐,无统 的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但并未解决推 教断的可靠性降低、犯I型错误的概率变大的问题。其最适宜的比较形式是:在进 行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中 只出较一次。 (2)最小显著极差法(LSR法,Least significant ranges) 不同平均数间的比较采用不同的显著尺度 过 LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包 含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足 程 这些在显著水平ā上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极 差LSR LSR法克服了LSD法的不足,但检验的工作量有所增加。常用的LSR法有g 检验法和新复极差法两种。 1.新复极差法(SSR) 此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SS 法(shortest significant ranges)。 计算平均数的标准误s 根据df。,k查SSR表,计算最小显若极差值LSR,LSRs=gu,S 2.q测验法 计算平均数的标准误一西 根据df。,k查q表,计算最小显著极差值LSR
8 教 学 过 程 1.计算均数差异标准误: S MSe n d = 2 / 其中 MSe为 F 检验中的误差均方 2.计算最小显著差数: a a df d LSD t S e = ( ) 在 F 检验显著的前提下,算出 LSDα 若 >LSDα时,则 i. x 与 j. x 在α水平上差异显著;反之。 关于 LSD 法的应用说明: LSD 法实质上就是 t 检验法。 Sd x x t 1 − 2 = -> Sd LSD = t 但是,由于 LSD 法是利用 F 检验中的误差自由 dfe 查 tα值,利用误差均方 MSe 计算均数差异标准误 d S , 因而法又不同于每次利用两组数据进行多个平均 数两两比较的检验法 。它解决了本章开头指出的 t 检验法检验过程烦琐,无统 一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但并未解决推 断的可靠性降低、犯 I 型错误的概率变大的问题。其最适宜的比较形式是:在进 行试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中 只比较一次。 (2)最小显著极差法(LSR 法 ,Least significant ranges) 不同平均数间的比较采用不同的显著尺度 LSR 法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包 含的处理数(称为秩次距)k 的不同而采用不同的检验尺度,以克服 LSD 法的不足。 这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极 差 LSR。 LSR 法克服了 LSD 法的不足 ,但检验的工作量有所增加。常用的 LSR 法有 q 检验法和新复极差法两种。 1.新复极差法(SSR) 此法是由邓肯 (Duncan) 于 1955 年提出,故又称 Duncan 法,此法还称 SSR 法(shortest significant ranges)。 计算平均数的标准误 n MS s e x = 根据 dfe , k 查 SSR 表,计算最小显著极差值 LSR , LSR k q df k Sx e , = ( , ) 2.q 测验法 计算平均数的标准误 n MS s e x = 根据 dfe , k 查 q 表,计算最小显著极差值 LSR i. j. x − x
LSRA=qad或S 以上介绍的三种多重比较方法,其检验尺度有如下关系: LSD法≤新复极差法≤q检验法 当秩次距k=2时,尺度等:秩次距k≥3时,LSD法的尺度最小,q检验法 尺度最大,新复极差法尺度居中。 试验资料,究竞采用哪一种多重比较方法,主要应根据否定一个正确的H0和接 受一个不正确的H0的相对重要性来决定。如果否定正确的H0是事关重 大或后果严重的,或对试验要求严格时,用q法较为妥当;如果接受一个不正 确的H0是事关重大或后果严重的,则宜用新复极差法。 生物试验中,由于试验误差较大,常采用新复极差法:F检验显著后,为了 简便,也可采用LSD法。 例[6.1]以A,B,C,D4种药剂处理水稻种子其中A为对照,处理各得4个 苗高观察值(cm)其结果如表6.2,试进行方差分析。 表6.2水稻不同处理苗高(cm) 药剂 苗高观察 总和T 平均乃, A 18212013 18 B 20242622 92 23 10151714 56 14 D 28272932 116 99 T=336 y=21 学 第一步:统计假设0:4=凸2=.=4 过 第二步:整理资料,计算矫正数及各种平方和 总和平方T23362 C= 程 观察值个数mn4x47056 5S8=∑∑x2-c=182+212++322-c=602 72 722+922+.+1162 SS处理 -c= -c=504 4 SS银=SSg-55%里=602-504=98 第三步:列方差分析表并进行F测验 变异来源 Df SS■ MS 20.563.49 5.95 12 98 8.17 总变异 15 604 40.13 第四步:多重比较 首先计算比较标准 LSD法 9
9 教 学 过 程 LSRa k qa df k Sx e , = ( , ) 以上介绍的三种多重比较方法,其检验尺度有如下关系: LSD 法≤新复极差法≤q 检验法 当秩次距 k=2 时,尺度等; 秩次距 k ≥3 时,LSD 法的尺度最小,q 检验法 尺度最大,新复极差法尺度居中。 试验资料,究竟采用哪一种多重比较方法,主要应根据否定一个正确的 H0 和接 受一个不正确的 H0 的相对重要性来决定。 如果否定正确的 H0 是事关重 大或后果严重的,或对试验要求严格时,用 q 法较为妥当 ;如果接受一个不正 确的 H0 是事关重大或后果严重的,则宜用新复极差法。 生物试验中,由于试验误差较大,常采用新复极差法;F 检验显著后,为了 简便,也可采用 LSD 法。 例[6.1]以 A,B,C,D4 种药剂处理水稻种子其中 A 为对照,处理各得 4 个 苗高观察值(cm)其结果如表 6.2,试进行方差分析。 表 6.2 水稻不同处理苗高(cm) 药剂 苗高观察 总和 Ti 平均 i y A 18 21 20 13 72 18 B 20 24 26 22 92 23 C 10 15 17 14 56 14 D 28 27 29 32 116 29 T = 336 y = 21 第一步:统计假设 H0: = = = k . 1 2 第二步:整理资料,计算矫正数及各种平方和 mn T C 2 = = 观察值个数 总和平方 = 7056 4 4 3362 = 602 504 98 504 4 72 92 . 116 18 21 . 32 602 2 2 2 2 2 2 2 2 = − = − = − = + + + − = = = − = + + + − = 机误 总 处理 处 处理 总 SS SS ss c c n T ss SS x c c 第三步:列方差分析表并进行 F 测验 第四步:多重比较 首先计算比较标准 LSD 法 变异来源 Df SS MS F F0.05 F0.01 药剂 误差 3 12 504 98 168 8.17 20.56** 3.49 5.95 总变异 15 604 40.13
2x817-202 LSD5=t5nS-,=ts2×2.02=2.179x2.02=4.40 LSD1=00u2×2.02=3.055×2.02=6.17 (2)SSR法,新复极差法(Duncan测验) -平-14218 SE=1n LSR =SE.SSRa. (3)q法(Tukey测验) =1.4292≈1.43 LSR。=9pSE 表6.2资料LSR值的计算(复新极差测验) 教 D SSRo.0s SSRaoL LSRao LSRao 3.08 4.32 4.40 6.18 3 3.23 4.55 4.62 6.51 3.33 4.68 4.76 6.69 过 表6.2资料LSR值的计算(q测验) 程 9a05 9a01 LSRoos LSRoo 2 3.08 4.32 4.40 6.18 3.77 5.04 5.39 7.21 4 4.20 5.50 6.01 7.87 其次进行均数间两两比较 1、列梯形表法 处理 平均数 差异 (卫.) 元-14 元-18 元-23 D 15 11产 B 23 “ 18 2、划线法 29cm (D) 23cm(B) 18cm(A) 14cm(C) 10
10 教 学 过 程 2.02 4 2 2 8.17 2 = − = = n Se S i j x y LSD0.05 = t 0.05, S − = t 0.05,12 2.02 = 2.1792.02 = 4.40 i j dfe x y LSD0.01 = t 0.01,12 2.02 = 3.055 2.02 = 6.17 (2)SSR 法,新复极差法(Duncan 测验) 1.4292 1.43 4 8.17 = = = n MS SE e LSR SE SSR , p . = (3)q 法(Tukey 测验) 1.4292 1.43 4 8.17 = = = n MS SE e LSR = qa;df ; p SE 表 6.2 资料 LSR 值的计算(复新极差测验) p SSR0.05 SSR0.01 LSR0.05 LSR0.01 2 3.08 4.32 4.40 6.18 3 3.23 4.55 4.62 6.51 4 3.33 4.68 4.76 6.69 表 6.2 资料 LSR 值的计算(q 测验) p 0.05 q q0.01 LSR0.05 LSR0.01 2 3.08 4.32 4.40 6.18 3 3.77 5.04 5.39 7.21 4 4.20 5.50 6.01 7.87 其次进行均数间两两比较 1、列梯形表法 处理 平均数 ( i y ) 差异 i y -14 i y -18 i y -23 D 29 ** 15 ** 11 * 6 B 23 ** 9 * 5 A 18 4 C 14 2、划线法 29cm(D) 23cm(B) 18cm(A) 14cm(C)