第九章方差分析 第一节方差分析的意义 当试验的 时,不能直接应用t测验及u测验 的两两测验方法进行平均数假设测验的原因有三 1.当有K个处理平均数时,将有[k(k-1)]/2个差数, 要对这诸多差数逐一进行比较测验,程序实为繁琐。 2.试验误差估计的精确度要受到损失 3.两两测验的方法会随着K的增加而大大增加犯α错误 的概率。 因此,当处理数目K≥3时应该采用方差分析法。方差分 析的特点是将全部数据看成是一个整体,分析构成变量的变 异原因,进而计算不同变异来源的总体方差的估值。然后
第九章 方差分析 第一节 方差分析的意义 当试验的处理数目K≥3时,不能直接应用t测验及u测验 的两两测验方法进行平均数假设测验的原因有三: 1. 当有K个处理平均数时,将有[k(k-1)]/2 个差数, 要对这诸多差数逐一进行比较测验,程序实为繁琐。 2. 试验误差估计的精确度要受到损失。 3. 两两测验的方法会随着K的增加而大大增加犯α错误 的概率。 因此,当处理数目K≥3时应该采用方差分析法。方差分 析的特点是将全部数据看成是一个整体,分析构成变量的变 异原因,进而计算不同变异来源的总体方差的估值。然后
进行F测验,判断各样本的总体平均数是否有显著差异,在 达到差异显著的基础上,再对两两样本的总体平均数间的 差异显著性作出判断。(看表9-1解释) 表9-1kn个观察值的单向分组资料的模式 处理 观察值x 总和平均x 12 X 2 X2 k k3 000。0 X ∑ 注:i=1,2,3,……k;j=1,2,3 n
表9-1 kn个观察值的单向分组资料的模式 处理 观察值 x 总和Ti 平均 1 2 ┋ ┋ k x11 x12 x13 … … … x1n x21 x22 x 23 … … … x2n ┋ ┋ xk1 xk2 xk3 … … … xkn T1 T2 ┋ ┋ Tk ┋ ┋ Σxij T xi x1 x2 k x x x 注:i = 1,2,3, … … k ; j = 1,2,3, … … n 进行F测验,判断各样本的总体平均数是否有显著差异,在 达到差异显著的基础上,再对两两样本的总体平均数间的 差异显著性作出判断。(看表9-1解释)
第二节方差分析的基本步骤及原理 (以单向分组资料为例,资料的整理模式见9-1) 平方和与自由度的分解 C=T2/kn 总平方和SSn=∑x2-C 处理平方和SS=(∑T2/n)-C 误差平方和SS。=SSr-SS1总自由度df1=kn-1 处理自由度df=k-1 误差自由度df=dfr-df 此步骤分析的目的是要求出各个变因方差S2的相应估计值σ2。 、F测验 S2=SS/dftS2=SS。/df F=S/Se2 此步骤分析的目的是判断各个处理平均数之间是否存在显著差异。 、多重比较
第二节 方差分析的基本步骤及原理 (以单向分组资料为例,资料的整理模式见9-1) 一、平方和与自由度的分解 C=T2 /kn 总平方和 SST = ∑ x 2 - C 处理平方和 SSt = (∑Ti 2/n)- C 误差平方和 SSe = SST – SSt 总自由度 dfT = kn-1 处理自由度 dft= k-1 误差自由度 dfe = dfT – dft 此步骤分析的目的是要求出各个变因方差S 2的相应估计值σ2。 二、F测验 St 2 = SSt / dft Se 2 = SSe/ dfe F = St 2 / Se 2 此步骤分析的目的是判断各个处理平均数之间是否存在显著差异。 三、多重比较 SST =
此步骤分析的目的是在F测验结果达到显著以后,进一步判断两两 处理平均数之间的差异显著性 多重比较常用的方法有以下两种: (一)保护性最小显著差数法,即PLSD法 步骤:1.根据df查出ta。 2.计算平均数差数标准误 3.计算显著尺度 PLSD值: PLSD=ta×平均数差数标准误 4.将处理平均数由大到小排序,并依次求出各处理之间的差值, 将各差值均与 PLSD相比较,作出差异显著性判断 PLSDoc1>平均数差值≥PLSD0s,则两处理平均数间差异为显著 平均数差值≥ PLSDOO1,则两处理平均数间差异为极显著 PLSDO0s〉平均数差值,则两处理平均数间差异为不显著
此步骤分析的目的是在F测验结果达到显著以后,进一步判断两两 处理平均数之间的差异显著性。 多重比较常用的方法有以下两种: (一)保护性最小显著差数法,即PLSD法。 步骤:1. 根据 dfe 查出 tα 。 2. 计算平均数差数标准误 3. 计算显著尺度PLSDα值: PLSDα = tα × 平均数差数标准误 4. 将处理平均数由大到小排序,并依次求出各处理之间的差值, 将各差值均与PLSDα相比较,作出差异显著性判断。 PLSD0.01 > 平均数差值 ≥ PLSD0.05,则两处理平均数间差异为显著; 平均数差值 ≥ PLSD0.01,则两处理平均数间差异为极显著; PLSD0.05 > 平均数差值 ,则两处理平均数间差异为不显著
(二)最小显著极差法,即LSR法 包含有SR法和q测验法,主要介绍SSR法。SSR法即邓肯氏新复极差法 步骤:1.根据平均数秩次距k和df查出SSRa值 2.计算平均数标准误。 3.计算各秩次距下的显著尺度LSRa或Ra值 秩次距是指当平均数由大到小排序后,相比较的两个平均数之间(含这 两个平均数)包含的平均数个数。 4.将处理平均数由大到小排序,并依次求出各处理之间的差值,将各 差值与相应秩次距下的Ra相比较,作出差异显著性判断。同样有: 相应秩次距的R01>平均数差值≥相应秩次距的R0os,则两处理平均 数间差异为显著; 平均数差值≥相应秩次距的Rou,则两处理平均数间差异为极显著 相应秩次距的Rs〉平均数差值,则两处理平均数间差异为不显著。 可将此方法求出的Ra以表表示更为清楚方便,见表9-2
(二)最小显著极差法,即LSR法。 包含有SSR法和q测验法,主要介绍SSR法。SSR法即邓肯氏新复极差法。 步骤:1. 根据平均数秩次距k和dfe查出SSRα值。 2. 计算平均数标准误。 3. 计算各秩次距下的显著尺度LSRα或Rα值。 秩次距是指当平均数由大到小排序后,相比较的两个平均数之间(含这 两个平均数)包含的平均数个数。 4. 将处理平均数由大到小排序,并依次求出各处理之间的差值,将各 差值与相应秩次距下的Rα相比较,作出差异显著性判断。同样有: 相应秩次距的 R0.01 > 平均数差值 ≥ 相应秩次距的R0.05,则两处理平均 数间差异为显著; 平均数差值 ≥相应秩次距的 R0.01 ,则两处理平均数间差异为极显著; 相应秩次距的R0.05 > 平均数差值 ,则两处理平均数间差异为不显著。 可将此方法求出的Rα以表表示更为清楚方便,见表9-2
表9-2各秩次距下的Ra K 2 3 4 SSRoOS SSROO1 R 0.05 0.01 上面介绍的是当试验各个处理的重复次数相等时进行方差分析的 方法。这种资料的分析例子可见教案例9-1。 如果各处理的重复次数不相等,在分析过程中注意与上述方法仅 有的区别为以下三点,其余步骤完全相同(可见教案例9-7)。 1.矫正数C=2/∑n 2.处理平方和SS=∑(T;2/n)-C 3.以n代替n进行平均数差数标准误和平均数标准误的计算 no=(1/k-1)(∑n;∑n12/∑n)
表9-2 各秩次距下的Rα 上面介绍的是当试验各个处理的重复次数相等时进行方差分析的 方法。这种资料的分析例子可见教案例9-1。 如果各处理的重复次数不相等,在分析过程中注意与上述方法仅 有的区别为以下三点,其余步骤完全相同(可见教案例9-7)。 1. 矫正数 C =T2 / ∑ni 2. 处理平方和 SSt = ∑(Ti 2/ni)- C 3. 以n0代替n进行平均数差数标准误和平均数标准误的计算。 n0 = ( 1/k-1)( ∑ni- ∑ni 2/ ∑ni) K 2 3 4 … … … SSR0.05 SSR0.01 R0.05 R0.01
四、方差分析的数学模型 (一)线性可加模型(仍以上述单项分组资料为例) 方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模 型是指每一个观察值可以化分成若干个线性组成部分,它是分解平方和与 自由度的理论依据,即 SST= SS+ Ss dfr=dft t dfe 因此该资料观察值的数学模型为: u+τi+ε 效应。为任意观察值,山为总体平均数,T;为处理效应,为误差 不同类型资料的线性可加模型是各不相同的。 二)期望均方(EMS) S2的EMS是0。2;S2的EMS是o2+n02 F=S2/S2=(02+n0r2)/oa2
四、方差分析的数学模型 (一)线性可加模型 (仍以上述单项分组资料为例) 方差分析是建立在一定的线性可加模型的基础上的。所谓线性可加模 型是指每一个观察值可以化分成若干个线性组成部分,它是分解平方和与 自由度的理论依据,即: SST = SSt + SSe dfT =dft + dfe 因此该资料观察值的数学模型为: x ij = μ + τi + εij x ij为任意观察值,μ为总体平均数,τi为处理效应,εij为误差 效应。 不同类型资料的线性可加模型是各不相同的。 (二)期望均方(EMS) Se 2的EMS是σ e 2; St 2的EMS是σ e 2+n στ 2 ∴ F = St 2 / Se 2 = (σe 2+n στ 2 )/ σe 2
(三)固定模型和随机模型 在上述模型中,由于处理效应τ的不同又有固定模型和随机模型的区 分 固定模型是指试验的各处理都抽自特定的处理总体,这些总体遵循 N(1,02),因而处理效应τi=(11-p)是固定的,我们分析的目的 就在于研究τi,如果重复做试验,所用的处理仍然是原来那些处理,而所 要测验的假设则是:H:Ti=0或H:pi=p对H4:11、p μk不相等。因此我们的推断也仅限于供试处理的范围之内。 随机模型是指试验中的各处理皆是随机抽自N(0,σ-2)的一组随机样 本,因而处理效应τi是随机的,它会随试验的不同而不同。对于随机模型, 如果重复做试验,则必然是从总体N(0,o2)中随机抽取一组新的样本 我们分析的目的不在于研究处理效应,而是在于研究的变异度,因此我们的 推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。所以方 差分析要测验的假设是H:012=0对H:012>0
(三)固定模型和随机模型 在上述模型中,由于处理效应τi的不同又有固定模型和随机模型的区 分。 固定模型是指试验的各处理都抽自特定的处理总体,这些总体遵循 N(μi, σ e 2),因而处理效应τi =(μi - μ)是固定的,我们分析的目的 就在于研究τi ,如果重复做试验,所用的处理仍然是原来那些处理,而所 要测验的假设则是:H0: τi =0或 H0: μi = μ 对HA: μ1 、μ2 、 … μk不相等。因此我们的推断也仅限于供试处理的范围之内。 随机模型是指试验中的各处理皆是随机抽自N(0, στ 2 )的一组随机样 本,因而处理效应τi是随机的,它会随试验的不同而不同。对于随机模型, 如果重复做试验,则必然是从总体N(0, στ 2 )中随机抽取一组新的样本。 我们分析的目的不在于研究处理效应,而是在于研究的变异度,因此我们的 推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。所以方 差分析要测验的假设是H0: στ 2 =0对HA: στ 2 > 0