§8.1方差分析 一、 单因子方差分析 在工农业生产和科学研究中我们经常遇到这样的问题: 影响产品质量、质量的因素很多,例如影响某种农作物单位 面积产量就有品种、施肥种类、施肥量等许多因素,我们需 要了解在这么多的因素之中那些因素对产品的产量、质量有 显著的影响。方差分析就是分析测试结果的一种方法。 为了方便起见,我们常称试验中变化的因素为因子,用 A、B、C、…表示,因子在试验中所取得不同状态水平称为 水平,因子A的的r个不同水平用A、A2、…,A,表示。 从本章其不在总用希腊字母,”,代表随即变量和拉丁字 母名,y,…代表随即变量所取的值
§ 8.1 方差分析
例8.1(略)(P372) 实际上,方差分析是检验同方差的若干正态母体均值是 否相等的一种统计分析方法。 在实际问题中影响母体均值的因素可能不止一.我们按 试验因子的个数,可以有单因子方差分析、二因子方差分析, 多因子方差分析等。 设在某试验中,因子A有A、A2、…,A,在A水 平下的试验结果Y服从N(4,2),1=1,2,,且Y, Y2,…,Y,间相互独立,现在A水平下做了t次试验,获 得了t个试验y,j1,2,r。由于y~(4,2)
故y与4的差可以看成-个随机误差’EN(0,了2)。 这样一来,可以假定y具有下述数据结构式: y=4+E,=1,2,…,,j=1,2,…,t 其中诸E相互独立,均服从N(0,G2)分布,要检 验的假设是 H0:4=42==4, 为了今后方便起见,把参数的形式改变,记: = i-l
=43一4,I=1,2,…,1 称H为一般平均,化,为因子Ae第I个水平效应, 看出r个效益满足关系式: 在这样的改变下,单因子方差分析模型中数据结构 式可以写成: y=4+:+E,I=1,2,,j=1,2,…,t 0
所要检验的假设(8.3)可以写成: H0:a1=a2==a,=0 通常我们可以用y于样本总平均y之间的偏差平方 和莱反映y之间的波动。令 =20%-2 1-1 其中少=1月 记2%’时·t称S,为总的偏差平方 2i-1-1 和若令
2. 从数据结构式: .=H+4,+ y=4+E 则 -Z(-)2 反映了误差的波动,称它为误差的偏差平方和,而 ∑t(a:+.-)2 i.】
在假设为真时,它反映了误差的波动.在假设为假时, 他反映因子A的不同水平效应间的差异,称它为因子A的 偏差平方和。 定理8.1(柯赫伦定理)设X1,X2,,名w为n 个相互独立的N(0,1)变量,Q=∑X好为x2(n)变量。 i 若Q=Q1+Q++Q,其中Q:为某些正态变量的平方和, 这些变量分别是X1,X2,…,X的线性组合。其自由 度为方。则诸Q,相互独立,且诸x2()变量的充要条件
证明:(见书P378) 在我们所研究的问题中,从(8.8)可以看出,S4是 r个正态变量的平方和,由于它们之间有一个线性关系式 会4vic-列-0 故S4的自由度为r-1,由于 n-1=(r-1)+(n-r) 科赫伦定理得条件全部满足,故有
且S4与S独立。至此,用于检验假设(8.5)的统计 量的分布全确定。对给定的显著性水平,当 F>-.(r-1,n-r)时拒绝H。,并认为个水平的效应间在ax显 著水平上有显著差异。 在具体计算时,S。,S得计算可简化如下:
S= 2-=n-1 i1- 4--7,4=-1 t Se=Sr-SA,f。=fr-fa (8.15) 并将结果列为方差分析表