《生物统计及试验设计》课程教学资源（教案讲义，第三版）第六章方差分析.doc_大学文库

第六章方差分析第五章所介绍的t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为 1、检验过程烦琐例如,一试验包含5个处理,采用t检验法要进行￠=10次两两平均数的差异显著性检验:若有k个处理,则要作kk-2次类似的检验。 2、无统一的试验误差,误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验法作两两比较,由于每次比较需计算一个S-,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。例如,试验有5个处理, 每个处理重复6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10:若利用整个试验的30个观测值估计试验误差, 显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性 3、推断的可靠性低,检验的I型错误率大即使利用资料所提供的全部信息估计了试验误差,若用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。方差分析( analysis of variance)是由英国统计学家 R.A. Fisher于1923年提出的。这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值:通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。本章在讨论方差分析基本原理的基础上,重点介绍单因素试验资料及两因素试验资料的方差分析法。在此之前,先介绍几个常用术语。 1、试验指标( experimental index)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等 2、试验因素( experimental factor)试验中所研究的影响试验指标的因素叫试验因素。如硏究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验:若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、…等表示 3、因素水平 level of facto)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素

75 第六章方差分析第五章所介绍的t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验，但在生产和科学研究中经常会遇到比较多个处理优劣的问题，即需进行多个平均数间的差异显著性检验。这时，若仍采用 t 检验法就不适宜了。这是因为： 1、检验过程烦琐例如，一试验包含 5 个处理，采用 t 检验法要进行 2 C5 =10 次两两平均数的差异显著性检验；若有 k 个处理，则要作 k(k-1)/2 次类似的检验。 2、无统一的试验误差，误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时，应该有一个统一的试验误差的估计值。若用 t 检验法作两两比较，由于每次比较需计算一个 1 2 Sx −x ，故使得各次比较误差的估计不统一，同时没有充分利用资料所提供的信息而使误差估计的精确性降低，从而降低检验的灵敏性。例如，试验有 5 个处理，每个处理重复 6 次，共有 30 个观测值。进行 t 检验时，每次只能利用两个处理共 12 个观测值估计试验误差，误差自由度为 2(6-1)=10；若利用整个试验的 30 个观测值估计试验误差，显然估计的精确性高，且误差自由度为 5(6-1)=25。可见，在用 t 检法进行检验时，由于估计误差的精确性低，误差自由度小，使检验的灵敏性降低，容易掩盖差异的显著性。 3、推断的可靠性低，检验的 I 型错误率大即使利用资料所提供的全部信息估计了试验误差，若用 t 检验法进行多个处理平均数间的差异显著性检验，由于没有考虑相互比较的两个平均数的秩次问题，因而会增大犯 I 型错误的概率，降低推断的可靠性。由于上述原因，多个平均数的差异显著性检验不宜用 t 检验，须采用方差分析法。方差分析(analysis of variance)是由英国统计学家 R.A.Fisher 于 1923 年提出的。这种方法是将 k 个处理的观测值作为一个整体看待，把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度，进而获得不同变异来源总体方差估计值；通过计算这些总体方差的估计值的适当比值，就能检验各样本所属总体平均数是否相等。方差分析实质上是关于观测值变异原因的数量分析，它在科学研究中应用十分广泛。本章在讨论方差分析基本原理的基础上，重点介绍单因素试验资料及两因素试验资料的方差分析法。在此之前，先介绍几个常用术语。 1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低，在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同，选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有：日增重、产仔数、产奶量、产蛋率、瘦肉率、某些生理生化和体型指标(如血糖含量、体高、体重)等。 2、试验因素(experimental factor) 试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时，饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响，均可作为试验因素来考虑。当试验中考察的因素只有一个时，称为单因素试验；若同时研究两个或两个以上的因素对试验指标的影响时，则称为两因素或多因素试验。试验因素常用大写字母 A、B、C、…等表示。 3、因素水平(level of factor) 试验因素所处的某种特定状态或数量等级称为因素水平，简称水平。如比较 3 个品种奶牛产奶量的高低，这 3 个品种就是奶牛品种这个试验因素

的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1, 2,…,来表示。如A1、A2、…,B1、B2、…,等 4、试验处理( treatment事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有3×3=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理 5、试验单位( (experimental unit在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物; 或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。 6、重复 repetition在试验中,将一个处理实施在两个或两个以上的试验单位上, 称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪就说这个处理(饲料)有4次重复第一节方差分析的基本原理与步骤方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。线性模型与基本假定假设某单因素试验有k个处理,每个处理有n次重复,共有Mk个观测值。这类试验资料的数据模式如表6-1所示。表6-1k个处理每个处理有n个观测值的数据模式处理合计x1,平均x x22 x2j x2 xk2 xk k 表中x表示第个处理的第j个观测值(P1,2,…,k户1,2,…,n):x=∑x表示第

76 的 3 个水平；研究某种饲料中 4 种不同能量水平对肥育猪瘦肉率的影响，这 4 种特定的能量水平就是饲料能量这一试验因素的 4 个水平。因素水平用代表该因素的字母加添足标 1， 2，…，来表示。如 A1、A2、…，B1、B2、…，等。 4、试验处理(treatment) 事先设计好的实施在试验单位上的具体项目叫试验处理，简称处理。在单因素试验中，实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时，实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时，试验因素的一个水平就是一个处理。在多因素试验中，实施在试验单位上的具体项目是各因素的某一水平组合。例如进行 3 种饲料和 3 个品种对猪日增重影响的两因素试验，整个试验共有 3×3=9 个水平组合，实施在试验单位(试验猪)上的具体项目就是某品种与某种饲料的结合。所以，在多因素试验时，试验因素的一个水平组合就是一个处理。 5、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中，一只家禽、一头家畜、一只小白鼠、一尾鱼，即一个动物；或几只家禽、几头家畜、几只小白鼠、几尾鱼，即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。 6、重复(repetition) 在试验中，将一个处理实施在两个或两个以上的试验单位上，称为处理有重复；一处理实施的试验单位数称为处理的重复数。例如，用某种饲料喂 4 头猪，就说这个处理(饲料)有 4 次重复。第一节方差分析的基本原理与步骤方差分析有很多类型，无论简单与否，其基本原理与步骤是相同的。本节结合单因素试验结果的方差分析介绍其原理与步骤。一、线性模型与基本假定假设某单因素试验有 k 个处理，每个处理有 n 次重复，共有 nk 个观测值。这类试验资料的数据模式如表 6-1 所示。表 6-1 k 个处理每个处理有 n 个观测值的数据模式处理观测值合计 i. x 平均 i. x A1 x11 x12 … x1j … x1n . 1 x . 1 x A2 x21 x22 … x2j … x2n . 2 x . 2 x    …  …    Ai xi1 xi2 … xij … xin . i x . i x    …  …    Ak xk1 xk2 … xkj … xkn xk. . k x 合计 x.. x.. 表中 ij x 表示第 i 个处理的第 j 个观测值（i=1,2,…,k；j=1,2,…,n）；  = = n j i ij x x 1 . 表示第

77 i 个处理 n 个观测值的和；   = = = = = k i i k i n j ij x x x 1 1 1 .. .表示全部观测值的总和； x x n xi n n j i ij . / ./ 1 = = = 表示第 i 个处理的平均数； x x kn x kn k i n j ij .. / .. / 1 1 = = = = 表示全部观测值的总平均数； ij x 可以分解为 ij i ij x =  + (6-1)  i 表示第 i 个处理观测值总体的平均数。为了看出各处理的影响大小，将  i 再进行分解，令  = = k i i k 1 1   (6-2)  i =  i −  (6-3) 则 ij i ij x =  + + (6-4) 其中μ表示全试验观测值总体的平均数， i 是第 i 个处理的效应（treatment effects）表示处理 i 对试验结果产生的影响。显然有 0 1  = = k i  i (6-5) εij 是试验误差，相互独立，且服从正态分布 N（0，σ 2）。（6-4）式叫做单因素试验的线性模型（linear model）亦称数学模型。在这个模型中 ij x 表示为总平均数μ、处理效应αi、试验误差εij 之和。由εij 相互独立且服从正态分布 N（0， σ 2），可知各处理 Ai(i=1，2，…，k)所属总体亦应具正态性，即服从正态分布 N(μi,σ 2 )。尽管各总体的均数  i 可以不等或相等，σ2 则必须是相等的。所以，单因素试验的数学模型可归纳为：效应的可加性（additivity）、分布的正态性（normality）、方差的同质性（homogeneity）。这也是进行其它类型方差分析的前提或基本假定。若将表（6-1）中的观测值 xij（i=1,2,…,k;j=1,2,…,n）的数据结构（模型）用样本符号来表示，则 ij i ij i i ij x = x + x − x + x − x = x +t +e .. . .. . .. ( ) ( ) (6-6) 与（6-4）式比较可知， .. x 、 i i (x − x ) = t . .. 、 ij i ij (x − x ) = e . 分别是μ、（μi-μ）= i 、（xij-  i ）= ij  的估计值。（6-4）、（6-6）两式告诉我们：每个观测值都包含处理效应（μi-μ或 x . x.. i − ），与误差 ( ij i x −  或 ij i. x − x )，故 kn 个观测值的总变异可分解为处理间的变异和处理内的变异两部分。二、平方和与自由度的剖分

78 我们知道，方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许多优点，而且不用开方，所以在方差分析中是用样本方差即均方（mean squares）来度量资料的变异程度的。表 6-1 中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异，就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和，简称为总平方和，剖分成处理间平方和与处理内平方和两部分；将总均方的分母──称为总自由度，剖分成处理间自由度与处理内自由度两部分来实现的。（一）总平方和的剖分在表 6-1 中，反映全部观测值总变异的总平方和是各观测值 xij 与总平均数 x.. 的离均差平方和，记为 SST。即 = = = − k i n j T ij SS x x 1 1 2 .. ( ) 因为            = = = = = = = = = = = = − + − − + − = − + − − + − − = − + − k i n j i j i n j i j i k i k i i i k i n j i i i j i i j i k i n j k i n j i j i i j i n x x x x x x x x x x x x x x x x x x x x x x 1 1 2 1 1 1 2 1 1 2 2 1 1 1 1 2 2 ( . ..) 2 [( . ..) ( .)] ( .) ( . ..) 2( . ..)( .) ( .) ( ..) ( . ..) ( .) 其中  = − = n j ij i x x 1 ( . ) 0 所以    = = = = = − = − + − k i n j k i k i n j ij i ij i x x n x x x x 1 1 1 1 1 2 . 2 . .. 2 .. ( ) ( ) ( ) （6-7）（6-7）式中， = − k i i n x x 1 2 ( . ..) 为各处理平均数 . i x 与总平均数 x.. 的离均差平方和与重复数 n 的乘积，反映了重复 n 次的处理间变异，称为处理间平方和，记为 SSt，即 = = − k i t i SS n x x 1 2 ( . ..) (6-7)式中，  = = − k i n j ij i x x 1 1 2 . ( ) 为各处理内离均差平方和之和，反映了各处理内的变异即误差，称为处理内平方和或误差平方和，记为 SSe，即  = = = − k i n j e ij i SS x x 1 1 2 . ( ) 于是有 SST =SSt+SSe （6-8） (6-7)，（6-8）两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系

80 A1 31.9 27.9 31.8 28.4 35.9 155.9 31.18 A2 24.8 25.7 26.8 27.9 26.2 131.4 26.28 A3 22.1 23.6 27.3 24.9 25.8 123.7 24.74 A4 27.0 30.8 29.0 24.5 28.5 139.8 27.96 合计 x.. =550.8 这是一个单因素试验，处理数 k=4，重复数 n=5。各项平方和及自由度计算如下：矫正数 / 550.8 /(4 5) 15169.03 2 2 C = x.. nk =  = 总平方和 SST =  xijl −C = + + + −C 2 2 2 2 31.9 27.9  28.5 =15368 .7 −15169 .03 =199.67 处理间平方和 15283 .3 15169 .03 114.27 (155.9 131.4 123.7 139.8 ) 5 1 . 1 2 2 2 2 2 = − = = x − C = + + + − C n SS i t 处理内平方和 SSe = SST − SSt =199.67 −114.27 = 85.40 总自由度 dfT = nk −1 = 54 −1 =19 处理间自由度 dft = k −1 = 4 −1 = 3 处理内自由度 dfe = dfT − dft =19 − 3 =16 用 SSt、SSe分别除以 dft 和 dfe便得到处理间均方 MSt 及处理内均方 MSe。 / 85.40 /16 5.34 / 114.27 / 3 38.09 = = = = = = e e e t t t MS SS df MS SS df 因为方差分析中不涉及总均方的数值，所以不必计算之。三、期望均方如前所述，方差分析的一个基本假定是要求各处理观测值总体的方差相等，即 2 2 2 2 2 2 1 ,  = =  = k =  i （i=1,2,…,k）表示第 i 个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求，那么各处理的样本方差 S 2 1，S 2 2，…，S 2 k都是σ2 的无偏估计（unbiased estimate）量。 2 i S (i=1,2,…,k)是由试验资料中第 i 个处理的 n 个观测值算得的方差。显然，各 2 i S 的合并方差 2 e S （以各处理内的自由度 n-1 为权的加权平均数）也是σ2 的无偏估计量，且估计的精确度更高。很容易推证处理内均方 MSe就是各 2 i S 的合并。 2 2 1 2 2 2 2 2 2 1 1 1 2 1 2 2 . ( 1) ( 1) ( ) = ⎯ ⎯→ + + + + + + = + + + + + + = − = − − = =   估计 e k k k k i k i ij e e e S df df df df S df S df S df df df SS SS SS k n SS k n x x df SS MS     其中 SSi、dfi（i=1,2,…,k）分别表示由试验资料中第 i 个处理的 n 个观测值算得的平方和与自由度。这就是说，处理内均方 MSe是误差方差σ2 的无偏估计量。试验中各处理所属总体的本质差异体现在处理效应  i 的差异上。我们把

81 /( 1) ( ) /( 1) 2 2 ai k − =   i −  k − 称为效应方差，它也反映了各处理观测值总体平均数  i 的变异程度，记为 2  。 1 2 2 −  = k i a   (6-13) 因为各  i 未知，所以无法求得 2   的确切值，只能通过试验结果中各处理均数的差异去估计。然而， ( ) /( 1) 2  xi. − x.. k − 并非 2   的无偏估计量。这是因为处理观测值的均数间的差异实际上包含了两方面的内容：一是各处理本质上的差异即αi（或μi）间的差异，二是本身的抽样误差。统计学上已经证明， ( ) /( 1) 2  xi. − x.. k − 是 2   +σ 2 /n 的无偏估计量。因而，我们前面所计算的处理间均方 MSt 实际上是 n 2   +σ2 的无偏估计量。因为 MSe 是σ2 的无偏估计量，MSt 是 n 2   +σ2 的无偏估计量，所以σ2 为 MSe 的数学期望（mathematical expectation），n 2   +σ 2 为 MSt 的数学期望。又因为它们是均方的期望值（expected value），故又称期望均方，简记为 EMS（expected mean squares）。当处理效应的方差 2   =0，亦即各处理观测值总体平均数  i （i=1，2，…,k）相等时，处理间均方 MSt 与处理内均方一样，也是误差方差σ2 的估计值，方差分析就是通过 MSt 与 MSe的比较来推断 2   是否为零即  i 是否相等的。四、F 分布与 F 检验（一）F 分布设想我们作这样的抽样试验，即在一正态总体 N（μ，σ 2）中随机抽取样本含量为 n 的样本 k 个，将各样本观测值整理成表 6-1 的形式。此时所谓的各处理没有真实差异，各处理只是随机分的组。因此，由（6-12）式算出的 2 t S 和 2 e S 都是误差方差 2  的估计量。以 2 e S 为分母， 2 t S 为分子，求其比值。统计学上把两个均方之比值称为 F 值。即 2 2 / F = St Se （6-14） F 具有两个自由度： 1, ( 1) df1 = dft = k − df2 = dfe = k n − 。若在给定的 k 和 n 的条件下，继续从该总体进行一系列抽样，则可获得一系列的 F 值。这些 F 值所具有的概率分布称为 F 分布（F distribution）。F 分布密度曲线是随自由度 df1、 df2 的变化而变化的一簇偏态曲线，其形态随着 df1、df2 的增大逐渐趋于对称，如图 6-1 所示。图 6-1 F 分布密度曲线

82 F 分布的取值范围是（0，+∞），其平均值  F =1。用 f (F) 表示 F 分布的概率密度函数，则其分布函数 ) ( F F 为：  =  =    F F(F ) P(F F ) f (F)dF (6-15) 因而 F 分布右尾从 F 到+∞的概率为：  +  = − =    F P(F F ) 1 F(F ) f (F)dF (6-16) 附表 4 列出的是不同 df1 和 df2 下，P（F≥ F ）=0.05 和 P（F≥ F ）=0.01 时的 F 值，即右尾概率α=0.05 和α=0.01 时的临界 F 值，一般记作 0.05( , ) df1 df2 F ， 0.01( , ) df1 df2 F 。如查附表 4，当 df1=3，df2=18 时，F0.05(3,18)=3.16，F0.01(3,18)=5.09，表示如以 df1=dft=3，df2=dfe=18 在同一正态总体中连续抽样，则所得 F 值大于 3.16 的仅为 5%，而大于 5.09 的仅为 1%。 (二)F 检验附表 4 是专门为检验 2 t S 代表的总体方差是否比 2 e S 代表的总体方差大而设计的。若实际计算的 F 值大于 0.05( , ) df1 df2 F ，则 F 值在α=0.05 的水平上显著，我们以 95% 的可靠性(即冒 5%的风险)推断 2 t S 代表的总体方差大于 2 e S 代表的总体方差。这种用 F 值出现概率的大小推断两个总体方差是否相等的方法称为 F 检验(F-test)。在方差分析中所进行的 F 检验目的在于推断处理间的差异是否存在，检验某项变异因素的效应方差是否为零。因此，在计算 F 值时总是以被检验因素的均方作分子，以误差均方作分母。应当注意，分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决定的。在单因素试验结果的方差分析中，无效假设为 H0：μ1=μ2=…=μk，备择假设为 HA：各 μi 不全相等，或 H0 ： 2   =0,HA: 2   ≠0；F=MSt/MSe，也就是要判断处理间均方是否显著大于处理内(误差)均方。如果结论是肯定的，我们将否定 H0；反之，不否定 H0。反过来理解：如果 H0 是正确的，那么 MSt与 MSe都是总体误差σ2 的估计值，理论上讲 F 值等于 1；如果 H0 是不正确的，那么 MSt 之期望均方中的 2   就不等于零，理论上讲 F 值就必大于 1。但是由于抽样的原因，即使 H0 正确，F 值也会出现大于 1 的情况。所以，只有 F 值大于 1 达到一定程度时，才有理由否定 H0。实际进行 F 检验时，是将由试验资料所算得的 F 值与根据 df1=dft(大均方，即分子均方的自由度)、df2=dfe(小均方，即分母均方的自由度)查附表 4 所得的临界 F 值 0.05( , ) df1 df2 F ， 0.01( , ) df1 df2 F 相比较作出统计推断的。若 F＜ 0.05( , ) df1 df2 F ，即 P＞0.05，不能否定 H0，统计学上，把这一检验结果表述为：各处理间差异不显著，在 F 值的右上方标记“ns”，或不标记符号；若 0.05( , ) df1 df2 F ≤F＜ 0.01( , ) df1 df2 F ，即 0.01＜P≤0.05，否定 H0，接受 HA，统计学上，把这一检验结果表述为：各处理间差异显著，在 F 值的右上方标记“*”；若 F≥ 0.01( , ) df1 df2 F ，即 P≤0.01，否定 H0，接受 HA，统计学上，把这一检验结果表述为：各处理间差异极显著，在 F 值的右上方标记“**”。对于【例 6.1】，因为 F=MSt/MSe=38.09/5.34=7.13**；根据 df1=dft=3，df2=dfe=16 查附表

83 4，得 F＞F0.01(3，16) =5.29,P＜0.01，表明四种不同饲料对鱼的增重效果差异极显著，用不同的饲料饲喂，增重是不同的。在方差分析中，通常将变异来源、平方和、自由度、均方和 F 值归纳成一张方差分析表，见表 6-3。表 6-3 表 6-2 资料方差分析表变异来源平方和自由度均方 F 值处理间 114.27 3 38.09 7.13** 处理内 85.40 16 5.34 总变异 199.67 19 表中的 F 值应与相应的被检验因素齐行。因为经 F 检验差异极显著，故在 F 值 7.13 右上方标记“**”。在实际进行方差分析时，只须计算出各项平方和与自由度，各项均方的计算及 F 值检验可在方差分析表上进行。五、多重比较 F 值显著或极显著，否定了无效假设 HO，表明试验的总变异主要来源于处理间的变异，试验中各处理平均数间存在显著或极显著差异，但并不意味着每两个处理平均数间的差异都显著或极显著，也不能具体说明哪些处理平均数间有显著或极显著差异，哪些差异不显著。因而，有必要进行两两处理平均数间的比较，以具体判断两两处理平均数间的差异显著性。统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。多重比较的方法甚多，常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法)，现分别介绍如下。（一）最小显著差数法 (LSD 法，least significant difference) 此法的基本作法是：在 F 检验显著的前提下，先计算出显著水平为α的最小显著差数 LSD ，然后将任意两个处理平均数的差数的绝对值 i. j. x − x 与其比较。若 i. j. x − x ＞LSDa 时，则 i. x 与 j. x 在α水平上差异显著；反之，则在α水平上差异不显著。最小显著差数由(6-17)式计算。 . . ( ) e i j a a df Sx x LSD t = − (6-17) 式中： ( ) dfe t 为在 F 检验中误差自由度下，显著水平为α的临界 t 值， . . i j Sx −x 为均数差异标准误，由(6-18)式算得。 Sx x MSe n i j 2 / . . − = (6-18) 其中 MSe 为 F 检验中的误差均方，n 为各处理的重复数。当显著水平α=0.05 和 0.01 时，从 t 值表中查出 0.05( ) dfe t 和 0.01( ) dfe t ，代入(6-17)式得： . . . . 0.01 0.01( ) 0.05 0.05( ) e i j e i j df x x df x x LSD t S LSD t S − − = = (6-19)

利用LSD法进行多重比较时,可按如下步骤进行 (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列: 2)计算最小显著差数LSD0os和LSD (3)将平均数多重比较表中两两平均数的差数与 LSD、LSDo比较,作出统计推断。对于【例6.1】,各处理的多重比较如表6-4所示。表6-4四种饲料平均增重的多重比较表(LSD法) 平均数 -24.74 26.28 AAAA 3 1.685 24.74 注:表中A与A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著因为,S5=√2MS/n=√2×534/5=1462;查t值表得:10(m=0=2.120, lo o1(dfe)=la 01(16)=2. 921 所以,显著水平为0.05与0.01的最小显著差数为 LSD0s=1o04)S-,=2120×1462=3099 LSD01=100d)3元 =2921×1462=4271 将表6-4中的6个差数与 LSD,LSDo比较:小于 LSD者不显著,在差数的右上方标记“ns”,或不标记符号;介于 LSD与LSDo之间者显著,在差数的右上方标记“*”; 大于LSDω者极显著,在差数的右上方标记“*”。检验结果除差数1.68、1.54不显著 3.22显著外,其余两个差数6.44、4.90极显著。表明A饲料对鱼的增重效果极显著高于 A2和A3,显著高于A4:A饲料对鱼的增重效果极显著高于A3饲料;A与A、A2与A3的增重效果差异不显著,以A饲料对鱼的增重效果最佳。关于LSD法的应用有以下几点说明 1、LSD法实质上就是t检验法。它是将t检验中由所求得的t之绝对值 (=(-x,)/S-5)与临界值的比较转为将各对均数差值的绝对值际一与最小显著差数lS-,的比较而作出统计推断的但是,由于LSD法是利用F检验中的误差自由度d 查临界t值,利用误差均方MS计算均数差异标准误S;-ξ,因而LSD法又不同于每次利用两组数据进行多个平均数两两比较的t检验法。它解决了本章开头指出的t检验法检验过程烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但LSD法并未解决推断的可靠性降低、犯Ⅰ型错误的概率变大的问题。 2、有人提出,与检验任何两个均数间的差异相比较,LSD法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特( Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。 3、因为LSD法实质上是t检验,故有人指出其最适宜的比较形式是:在进行试验设计时就确定各处理只是固定的两个两个相比每个处理平均数在比较中只

84 利用 LSD 法进行多重比较时，可按如下步骤进行： (1)列出平均数的多重比较表，比较表中各处理按其平均数从大到小自上而下排列； (2)计算最小显著差数 LSD0.05 和 LSD0.01 ； (3)将平均数多重比较表中两两平均数的差数与 LSD0.05 、 LSD0.01 比较，作出统计推断。对于【例 6.1】，各处理的多重比较如表 6-4 所示。表 6-4 四种饲料平均增重的多重比较表(LSD 法) 处理平均数 i. x i. x -24.74 i. x -26.28 i. x -27.96 A1 31.18 6.44** 4.90** 3.22* A4 27.96 3.22* 1.68 ns A2 26.28 1.54ns A3 24.74 注：表中 A4与 A3的差数 3.22 用 q 检验法与新复极差法时，在α=0.05 的水平上不显著。因为， 2 / 2 5.34 / 5 1.462 . . Sx −x = MSe n =  = i j ;查 t 值表得：t0.05(dfe) =t0.05(16) =2.120, t0.01(dfe)=t0.01(16)=2.921 所以，显著水平为 0.05 与 0.01 的最小显著差数为 2.921 1.462 4.271 2.120 1.462 3.099 . . . . 0.01 0.01( ) 0.05 0.05( ) = =  = = =  = − − e i j e i j df x x df x x LSD t S LSD t S 将表 6-4 中的 6 个差数与 LSD0.05 ，LSD0.01 比较：小于 LSD0.05 者不显著,在差数的右上方标记“ns”，或不标记符号；介于 LSD0.05 与 LSD0.01 之间者显著，在差数的右上方标记“*”；大于 LSD0.01 者极显著，在差数的右上方标记“**”。检验结果除差数 1.68、1.54 不显著、 3.22 显著外，其余两个差数 6.44、4.90 极显著。表明 A1 饲料对鱼的增重效果极显著高于 A2 和 A3，显著高于 A4；A4 饲料对鱼的增重效果极显著高于 A3 饲料；A4 与 A2、A2 与 A3 的增重效果差异不显著，以 A1 饲料对鱼的增重效果最佳。关于 LSD 法的应用有以下几点说明： 1、 LSD 法实质上就是 t 检验法。它是将 t 检验中由所求得的 t 之绝对值 ( ( ) / ) . . . . i j i j Sx x t x x = − − 与临界 a t 值的比较转为将各对均数差值的绝对值 i. j. x − x 与最小显著差数 i. j. a Sx x t − 的比较而作出统计推断的。但是，由于 LSD 法是利用 F 检验中的误差自由度 dfe 查临界 a t 值，利用误差均方 MSe 计算均数差异标准误 i. j. Sx −x ，因而 LSD 法又不同于每次利用两组数据进行多个平均数两两比较的 t 检验法。它解决了本章开头指出的 t 检验法检验过程烦琐，无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但 LSD 法并未解决推断的可靠性降低、犯 I 型错误的概率变大的问题。 2、有人提出，与检验任何两个均数间的差异相比较， LSD 法适用于各处理组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更适用的方法有顿纳特(Dunnett)法(关于此法，读者可参阅其它有关统计书籍)。 3、因为 LSD 法实质上是 t 检验，故有人指出其最适宜的比较形式是：在进行试验设计时就确定各处理只是固定的两个两个相比，每个处理平均数在比较中只

《生物统计及试验设计》课程教学资源（教案讲义，第三版）第六章 方差分析

《生物统计及试验设计》课程教学资源（教案讲义，第三版）第六章方差分析