§81方差分析 、 单因子方差分析 在工农业生产和科学研究中我们经常遇到这样的问题:影响产品质量、质量的因素很 多,例如影响某种农作物单位面积产量就有品种、施肥种类、施肥量等许多因素,我们需要 了解在这么多的因素之中那些因素对产品的产量、质量有显著的影响。方差分析就是分析测 试结果的一种方法 为了方便起见,我们常称试验中变化的因素为因子,用A、B、C、…表示,因子在试 验中所取得不同状态水平称为水平,因子A的的r个不同水平用A、A2、…,A,表示。 从本章其不在总用希腊字母5,n,…代表随即变量和拉丁字母x,y,…代表随即变量所取 的值 例8.1(略)(P372 实际上,方差分析是检验同方差的若干正态母体均值是否相等的一种统计分析方法。 在实际问题中影响母体均值的因素可能不止一。我们按试验因子的个数,可以有单因 子方差分析、二因子方差分析,多因子方差分析等。 设在某试验中,因子A有4、A,、,A,在A,水平下的试验结果,服从N(4, σ2),=1,2,…,1,且Y,Y2,…,y,间相互独立,现在A水平下做了t次试验,获 得了t个试验少g,j1,2,…,。由于yg(4,。2),故g与4,的差可以看成一个随 机误差,6N(0,σ2)。这样一米,可以假定y,具有下述数据结构式: yy=4+Ey,=1,2,,【,j=1,2,,t 其中诸6,相互独立,均服从N(0,σ2)分布,要检验的假设是 H:4,=4h==4, 为了今后方便起见,把参数的形式改变,记: ,=4,-4,=l,2,…,r 称4为一般平均,a,为因子Ade第I个水平效应,看出r个效益满足关系式: 2q0 在这样的改变下,单因子方差分析模型中数据结构式可以写成: yg=4+a+6w,曰l,2,…,,jPl,2,…,t
§ 8.1 方差分析 —、 单因子方差分析 在工农业生产和科学研究中我们经常遇到这样的问题:影响产品质量、质量的因素很 多,例如影响某种农作物单位面积产量就有品种、施肥种类、施肥量等许多因素,我们需要 了解在这么多的因素之中那些因素对产品的产量、质量有显著的影响。方差分析就是分析测 试结果的一种方法。 为了方便起见,我们常称试验中变化的因素为因子,用 A、B、C、…表示,因子在试 验中所取得不同状态水平称为水平,因子 A 的的 r 个不同水平用 A1、 A2 、…, Ar 表示。 从本章其不在总用希腊字母 , ,…代表随即变量和拉丁字母 x,y,…代表随即变量所取 的值。 例 8.1(略)(P372) 实际上,方差分析是检验同方差的若干正态母体均值是否相等的一种统计分析方法。 在实际问题中影响母体均值的因素可能不止一。我们按试验因子的个数,可以有单因 子方差分析、二因子方差分析,多因子方差分析等。 设在某试验中,因子 A 有 A1、A2 、…, Ar ,在 Ai 水平下的试验结果 Yi 服从 N( i , 2 ),I=1,2,…,r,且 Y1,Y2 ,…, Yr 间相互独立,现在 Ar 水平下做了 t 次试验,获 得了 t 个试验 ij y ,j=1,2,…,r。由于 ij y ~( i , 2 ),故 ij y 与 i 的差可以看成一个随 机误差 ij , ij ~N(0, 2 )。这样一来,可以假定 ij y 具有下述数据结构式: ij y = i + ij ,I=1,2,…,r,j=1,2,…,t 其中诸 ij 相互独立,均服从 N(0, 2 )分布,要检验的假设是 H0 : i = 2 =…= r 为了今后方便起见,把参数的形式改变,记: = = r i i r 1 1 i = i — ,I=1,2,…,r 称 为一般平均, i 为因子 Ade 第 I 个水平效应,看出 r 个效益满足关系式: − r i i a 1 =0 在这样的改变下,单因子方差分析模型中数据结构式可以写成: ij y = + i + ij ,I=1,2,…,r,j=1,2,…,t
n 所要检验的假设(8.3)可以写成: H0:a1=a2==a,=0 通常我们可以用y于样本总平均少之间的偏差平方和菜反映,之间的波动。令 其中了=∑之,啊·称S,为总的偏差平方和若令 n 儿2元 从数据结构式: y=4+a,+8 y=4+8 则 8-226,-0 反映了误差的波动,称它为误差的偏差平方和,而 S,=∑a,+6-) 在假设为真时,它反映了误差的波动。在假设为假时,他反映因子A的不同水平效 应间的差异,称它为因子A的偏差平方和。 定理8.1(柯赫伦定理)设X,X2,,Xn为n个相互独立的N(0,1)变量, QX为产(m变量.若Q+0++0.,其中0,为聚些正态变量的平方和, 这些变量分别是X1,X2,…,X,的线性组合。其自由度为厂。则诸Q,相互独立,且 诸x()变量的充要条件是立,n 证明:(见书P378) 在我们所研究的问题中,从(8.8)可以看出,S,是r个正态变量的平方和,由于它
− r i i a 1 =0 所要检验的假设(8.3)可以写成: H0 : 1 a = 2 a =…= r a =0 通常我们可以用 ij y 于样本总平均 __ y 之间的偏差平方和莱反映 ij y 之间的波动。令 T S = ( )2 __ 1 1 y y r i t j ij − = = 其中 __ y = = = r i t j ij y n 1 1 1 ,n=r·t.称 T S 为总的偏差平方和.若令 i. y == t y ij y 1 , __ i. y = . 1 i y t 从数据结构式: __ i. y = __ ai i. + + __ y = + __ 则 e S == = − r i t j ij i 1 1 2 __ . ( ) 反映了误差的波动,称它为误差的偏差平方和,而 A S == + − r i ai i t 1 2 __ __ . ( ) 在假设为真时,它反映了误差的波动。在假设为假时,他反映因子 A 的不同水平效 应间的差异,称它为因子 A 的偏差平方和。 定理 8.1(柯赫伦定理)设 X1, X2 ,…, X n 为 n 个相互独立的 N(0,1)变量, Q= = n i Xi 1 2 为 2 x (n)变量。若 Q= Q1 + Q2 +…+ Qk ,其中 Qi 为某些正态变量的平方和, 这些变量分别是 X1, X2 ,…, X n 的线性组合。其自由度为 1 f 。则诸 Qi 相互独立,且 诸 ( ) 2 i x f 变量的充要条件是 = k i i f 1 =n。 证明:(见书 P378) 在我们所研究的问题中,从(8.8)可以看出, A S 是 r 个正态变量的平方和,由于它
们之间有一个线性关系式 盒i- 故S,的自由度为l,由于 5-(1) 且S,与S,独立。至此,用于检验假设(8.5)的统计量的分布全确定。对给定的显 著性水平a,当F>F(-l,-r)时拒绝H。,并认为个水平的效应间在a显著水平上有显 著差异。 在具体计算时,S。,S,得计算可简化如下: -ny,S=r-1 (8.15) S。=S,-S4,。=fr-fa 并将结果列为方差分析表 方兼分析表 来源 平方和 自由度 均方和 F比 因子A R-1 E-SAr-1) r-1 S./(n-r) 误差e S,=S1-S n-r S n-r 总合 S,-22-n 若因子的每一水平下所进行的试验次数不等,设在第个水平下重复了1,次,-1, 2,,「,那么重复上述推导,可得到完全类似的结论。 例题(见书381) 二、二因子方差分析 设在某试验中,有两个因子子阿变动,因子A取r个不同水平A、A、…,A
们之间有一个线性关系式 [ ( ) __ __ . 1 t t y y i r i − = =0 故 A S 的自由度为 r-1,由于 n-1=(r - 1)+ (n - r) 科赫伦定理得条件全部满足,故有 2 S A 1 ~ 2 x (r-1) 且 A S 与 e S 独立。至此,用于检验假设(8.5)的统计量的分布全确定。对给定的显 著性水平 ,当 F> F1−a (r-1,n-r)时拒绝 H0 ,并认为个水平的效应间在 显著水平上有显 著差异。 在具体计算时, e S , A S 得计算可简化如下: = − = − = − = − = − = = = e T A e T A r i A i A r i t j T ij S S S f f f n y S r t y S S y n y f , , 1 ,, = n -1 1 __ 2 2 . 1 1 r __ 2 2 (8.15) 并将结果列为方差分析表。 方差分析表 来源 平方和 自由度 均方和 F 比 因子 A = − r i i n y t y 1 __ 2 2 . R—1 r −1 S A F= /( ) /( 1) S n r S r e A − − 误差 e Se = ST − S A n-r n r Se − 总合 = = = − r i t j T ij S y n y 1 1 __ 2 2 n-1 若因子的每一水平下所进行的试验次数不等,设在第 I 个水平下重复了 i t 次,I=1, 2,…,r ,那么重复上述推导,可得到完全类似的结论。 例题(见书 381) 二、二因子方差分析 设在某试验中,有两个因子子阿变动,因子 A 取 r 个不同水平 A1、 A2 、…, Ar
因子B去s个不同水平B、B,、、B、,在(A,B,)水平组合下的试验结果独立 服从N(4,2)分布。 下面我们将分两种情况进行讨论。 1. 若4,=4+a,+B,我们称这种方差模型为无交互作用的方差分析模型.此 时只需对(A,B,)的每个组合各做一次试验,记结果为y,则 g=u+a,+月,+6m,i=1,2.八,j=l,25 ∑a,=0,∑B,=0 (8.17) 诸ε间相互独立,且服从N(0,σ2 这就是无交互作用的方差分析模型对这个模型所要检验的假设有两个: H1:a,=a2=.…=a,=0 H2:B=B2==B,=0 (8.18) 若检验结果拒绝H,(Hm),则认为因子A(B)的不同水平对结果有显著影响 若二者均不拒绝,就说明因子A与B的不同水平组合对结果无显著影响. 20 若4≠4+a,+B,则我们称 Yy=4g-4-a,-B, 为因子A的第I个水平与因子的第j个水平的交互效应,他们满足关系: 2,0,.2,…r 为了研究家户效应是否对结果有影响,那么在(A,B,)水平组合下至 少要做t(≥2)次试验,记结果为y· 这就算有交互作用的方差分析模型。对此模型,除了要检验(818)中有 关假设外还要检验霞设 H:对一切i,j有y=0 (8.20) 下面给出检验模型(8.17),(8.19)中有关假设所需要的统计量。(见书 P384)
因子 B 去 s 个不同水平 B1、 B2 、…、 BS ,在( Ai , Bj )水平组合下的试验结果独立 服从 N( ij , 2 )分布。 下面我们将分两种情况进行讨论。 1. 若 ij = + i a + j ,我们称这种方差模型为无交互作用的方差分析模型.此 时只需对( Ai , Bj )的每个组合各做一次试验,记结果为 ij y ,则 = = = + + + = = = = 2 i j 1 1 N 0 0, 0 , 1,2,.... , 1,2,.... 诸 间相互独立,且服从 ( , r i s j i j ij i i ij y a i r j s (8.17) 这就是无交互作用的方差分析模型.对这个模型所要检验的假设有两个: H01 : ai = a2 = = ar = 0 H02 : i = 2 = = s = 0 (8.18) 若检验结果拒绝 ( ) H01 H02 ,则认为因子A(B)的不同水平对结果有显著影响. 若二者均不拒绝,就说明因子 A 与 B 的不同水平组合对结果无显著影响. 2.0 若 ij ≠ + i a + j ,则我们称 ij = ij — — i a — Bj 为因子 A 的第 I 个水平与因子的第 j 个水平的交互效应,他们满足关系: = r i ij 1 =0,j=1,2,…,s = s j ij 1 =0,I=1,2,…,r 为了研究家户效应是否对结果有影响,那么在( Ai ,Bj )水平组合下至 少要做 t(≥2)次试验,记结果为 ijk y 。 这就算有交互作用的方差分析模型。对此模型,除了要检验(8.18)中有 关假设外还要检验假设 H03 : 对一切i, j有 ij = 0 (8.20) 下面给出检验模型(8.17),(8.19)中有关假设所需要的统计量.(见书 P384)