第九章方差分析 在工农业生产和科学研究中经常遇到这样的 问题影响产品产量、质量的因素很多我们需要 了解在这众多的因素中,哪些因素对影响产品产 量、质量有显著影响为此要先做试验然后对 中测试的结果进行分析方差分析就是分析测试结 果的一种方法. 在方差分析中把在试验中变化的因素称为因 中子用A、B、C、…表示因子在试验中所取的不 同状态称为水平因子A的个不同水平用A A2、 ·非 A表示 上页
第九章 方差分析 • 在工农业生产和科学研究中,经常遇到这样的 问题:影响产品产量、质量的因素很多,我们需要 了解在这众多的因素中,哪些因素对影响产品产 量、质量有显著影响.为此,要先做试验,然后对 测试的结果进行分析.方差分析就是分析测试结 果的一种方法. • 在方差分析中,把在试验中变化的因素称为因 子,用A、B、C、...表示;因子在试验中所取的不 同状态称为水平,因子A的r个不同水平用A1、 A2、...、Ar表示
§1单因子方差分析 王511基本概念 为了考察某个因素A对试验指标(即随机变量Ⅹ) 的影响在试验时保持其他因素不变,而仅让因素A 上改变这种试验称为单因子(单因素试验设试验结 水平 观测值 A 12 In1 A 2 21 22 2n2 A rnr 上页 下页
§1 单因子方差分析 §1.1 基本概念 为了考察某个因素 A 对试验指标(即随机变量 X) 的影响,在试验时,保持其他因素不变,而仅让因素 A 改变,这种试验称为单因子(单因素)试验. 设试验结 果如下表: 水平 观测值 A1 x11 x12 ... x1n1 A2 x21 x22 … x2n2 … … … … … Ar xr1 xr2 … xrnr
王 例:为寻求适应本地区的高产油菜品种,今选了 上五种不同品种进行试验每_品种在四块试验田上 二得到在每一块田上的亩产量如下 牛品种 田块4,A2 A3 A4A5 2562442028206 234 222300277280212 280290230315220 ↓298275322259212 我们要研究的问题是诸不同品种的平均亩产 量是否有显著差异. 上页
• 例:为寻求适应本地区的高产油菜品种,今选了 五种不同品种进行试验,每一品种在四块试验田上 得到在每一块田上的亩产量如下: 品种 田块 A1 A2 A3 A4 A5 1 256 244 250 288 206 2 222 300 277 280 212 3 280 290 230 315 220 4 298 275 322 259 212 • 我们要研究的问题是诸不同品种的平均亩产 量是否有显著差异
王 王五个不同品种就是该因子的五个不同水平由于同 品种在不同田块上的亩产量不同我们可以认为 个品种的亩产量就是一个总体在方差分析中总 平假定各总体独立地服从同方差正态分布即第个品 上种的亩产量是一个随机变量,它服从分布N(μ1 i=12,345 ·试验的目的就是要检验假设 H0:1=μ2=3=μ4=5 是否成立若是拒绝,那么我们就认为这五种品种 的平均亩产量之间有显著差异反之就认为各品种 间产量的不同是由随机因素引起的方差分析就是 检验假设的一种方法
• 试验的目的就是要检验假设 H0 :μ1=μ2=μ3=μ4=μ5 是否成立.若是拒绝 ,那么我们就认为这五种品种 的平均亩产量之间有显著差异;反之,就认为各品种 间产量的不同是由随机因素引起的.方差分析就是 检验假设的一种方法. • 在本例中只考虑品种这一因子对亩产量的影响, 五个不同品种就是该因子的五个不同水平.由于同 一品种在不同田块上的亩产量不同,我们可以认为 一个品种的亩产量就是一个总体,在方差分析中总 假定各总体独立地服从同方差正态分布,即第i个品 种的亩产量是一个随机变量,它服从分布N(μi ,σ2 ), i=1,2,3,4,5
实际上方差分析是检验同方差的若干正态总体均 值是否相等的一种统计方法 在实际问题中影响总体均值的因素可能不止 平个我们按试验中因子的个数可以有单因子方差分 析双因子分析多因子分析等例中是一个单因子方 差分析问题 设在某试验中因子A有个不同水平A1A2…,An 在A水平下的试验结果X服从正态分布 N(中 1,×x2…,X间相互独立现在 牛水平A下做了n次试验素得了个试验结果 X=12…n这可以看成是取自X的一个容量为n 王的样本|=12 上页
• 设在某试验中,因子A有r个不同水平A1 ,A2 ,...,Ar , 在Ai水平下的试验结果Xi服从正态分布 N(μi ,σ2 ),i=1,2,...,r,且X1 ,X2 ,...,Xr间相互独立.现在 水平Ai下做了ni次试验,获得了ni个试验结果 Xij,j=1,2,...,ni这可以看成是取自Xi的一个容量为ni 的样本,i=1,2,...,r. • 实际上,方差分析是检验同方差的若干正态总体均 值是否相等的一种统计方法. • 在实际问题中影响总体均值的因素可能不止一 个.我们按试验中因子的个数,可以有单因子方差分 析,双因子分析,多因子分析等.例中是一个单因子方 差分析问题
王 上由于XNH)故X与山的差可以看成个随机 二误差NO)这样一来可以假定X具有下述数据 王结构式 Ⅹ叶+c1=1,2,…rj=1,2,n 平其中诸N(O)且相互独立要检验的假设是 H1=2 为了今后方便起见把参数的形式改变一下并记 n=>n C1=11=1, 称u为一般平均G为因子A的第个水平的效应 上页
• 由于Xij~N(μi ,σ2 ) ,故Xij与μi的差可以看成一个随机 误差εij~N(0,σ2 ) .这样一来,可以假定Xij具有下述数据 结构式: , 1,2,..., , 1 1 1 i r n n n n i i r i i r i i i = − = = = = = • 为了今后方便起见,把参数的形式改变一下,并记 称μ为一般平均,αi为因子A的第i 个水平的效应. Xij= μi+ εij,i=1,2,...,r;j=1,2,...,ni 其中诸εij~N(0,σ2 ),且相互独立.要检验的假设是 H0 :μ1=μ2=…=μr
·在这样的改变下,单因子方差分析模型中的数据 结构式可以写成 X0=+a1+En,i=1,2…,,j=1,2,,n nc2=0 上所要检验的假设可以写成 Ho:1=2=…=,=0 为了导出检验假设的统计量下面我们分析一下 什么是引起诸X波动的原因. 上页
• 在这样的改变下,单因子方差分析模型中的数据 结构式可以写成: 所要检验的假设可以写成: i j i i j ni X = + + , i =1,2,...,r; j =1,2,..., H0 :1 = 2 = ... = r = 0 • 为了导出检验假设的统计量,下面我们分析一下 什么是引起诸Xij 波动的原因. = = r i i i n 1 0
p512平方和分解公式 引起诸X波动的原因有两个个是假设h为真 时诸X的波动纯粹是随机性引起的另一个可能是 王划诸入之间的波动并把起波动的两个原因用另 不两个量表示出来这就是方差分析中常用的平方和 分解法 通常用X与样本总平均X之间的偏差平方和来 上反映X之间的波动令 =∑∑ (X-X 其中X=∑∑不 n;=1/=1 上页
• 引起诸Xij 波动的原因有两个:一个是假设H0为真 时,诸Xij的波动纯粹是随机性引起的;另一个可能是 假设H0不真而引起的.因而我们就想用一个量来刻 划诸Xij之间的波动,并把引起波动的两个原因用另 两个量表示出来,这就是方差分析中常用的平方和 分解法. = = = − r i n j T ij i S X X 1 1 2 ( ) = = = r i n j ij i X n X 1 1 1 其中 反映 之间的波动令 通常用 与样本总平均 之间的偏差平方和来 . i j i j X X X §1.2 平方和分解公式
王 王令x=∑X,x=n∑X j=1 则s,=∑(x2-x)=(x1-+-x) xx-x}+x+立xX-x j=1 ∑(x2x)+∑(xx 其中交叉乘积项 c22∑(X-XXx-x)=2(X-X∑(X0-x,) J =2∑(X,-X)X-t1,)=0 上页
= = = = = − = − + − r i n j i j i i r i n j T i j i i S X X X X X X 1 1 2 1 1 2 则 ( ) ( . . ) 其中交叉乘积项 = = = = − − = − − i ni j i j i r i i i r i n j Xi j Xi X X X X X X 1 1 1 1 2 ( .)( . ) 2 ( . ) ( .) = = = = i ni j i j i i n j i i j X n X X X 1 1 1 令 . , . = = = = − + − r i i i r i n j Xi j Xi n X X i 1 2 2 1 1 ( .) ( . ) 2 ( . )( . .) 0 1 = − − = = i i r i Xi X X tX ( .) ( . ) 2 ( .)( . ) 1 1 1 1 2 1 1 2 X X X X X X Xi X r i n j i j i r i n j i r i n j i j i i i i = − + − + − − = = = = = =
记S=2>(x-x)S2=∑(x一) c则Sn=S+S为一个平方和分解式 下面我们来看各式的意义 X=n2∑x是所有数据的平均值.为总平均值 x=1∑x是从第个总体中抽得的样本平均值称 n1j=1 为组平均值 上页
. ( .) ( . ) 1 2 2 1 1 则 为一个平方和分解式 记 T E A r i A i i r i n j E i j i S S S S X X S n X X i = + = − = − = = = 下面我们来看各式的意义 , . 1 1 1 是所有数据的平均值 称为总平均值 = = = r i n j i j i X n X . , 1 . 1 为组平均值 X 是从第i个总体中抽得的样本平均值 称 n X ni j i j i i = =