第六章方差分析 第五章所介绍的t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著 性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数 间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为 1、检验过程烦琐例如,一试验包含5个处理,采用t检验法要进行¢=10次两两 平均数的差异显著性检验:若有k个处理,则要作kk-2次类似的检验。 2、无统一的试验误差,误差估计的精确性和检验的灵敏性低对同一试验的 多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验法作两两比较,由 于每次比较需计算一个S-,故使得各次比较误差的估计不统一,同时没有充分利用资料 所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。例如,试验有5个处理, 每个处理重复6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测 值估计试验误差,误差自由度为2(6-1)=10:若利用整个试验的30个观测值估计试验误差, 显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t检法进行检验时,由于估 计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性 3、推断的可靠性低,检验的I型错误率大即使利用资料所提供的全部信息估 计了试验误差,若用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互 比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性 由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。 方差分析( analysis of variance)是由英国统计学家 R.A. Fisher于1923年提出的。这种方 法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应 于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值:通过计算这些 总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上 是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。 本章在讨论方差分析基本原理的基础上,重点介绍单因素试验资料及两因素试验资料的 方差分析法。在此之前,先介绍几个常用术语。 1、试验指标( experimental index)为衡量试验结果的好坏或处理效应的高低,在 试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也 不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉 率、某些生理生化和体型指标(如血糖含量、体高、体重)等 2、试验因素( experimental factor)试验中所研究的影响试验指标的因素叫试验因 素。如硏究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对 日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试 验:若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。 试验因素常用大写字母A、B、C、…等表示 3、因素水平 level of facto)试验因素所处的某种特定状态或数量等级称为因素水 平,简称水平。如比较3个品种奶牛产奶量的高低,这3个品种就是奶牛品种这个试验因素
75 第六章 方差分析 第五章所介绍的t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著 性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数 间的差异显著性检验。这时,若仍采用 t 检验法就不适宜了。这是因为: 1、检验过程烦琐 例如,一试验包含 5 个处理,采用 t 检验法要进行 2 C5 =10 次两两 平均数的差异显著性检验;若有 k 个处理,则要作 k(k-1)/2 次类似的检验。 2、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的 多个处理进行比较时,应该有一个统一的试验误差的估计值。若用 t 检验法作两两比较,由 于每次比较需计算一个 1 2 Sx −x ,故使得各次比较误差的估计不统一,同时没有充分利用资料 所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。例如,试验有 5 个处理, 每个处理重复 6 次,共有 30 个观测值。进行 t 检验时,每次只能利用两个处理共 12 个观测 值估计试验误差,误差自由度为 2(6-1)=10;若利用整个试验的 30 个观测值估计试验误差, 显然估计的精确性高,且误差自由度为 5(6-1)=25。可见,在用 t 检法进行检验时,由于估 计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。 3、推断的可靠性低,检验的 I 型错误率大 即使利用资料所提供的全部信息估 计了试验误差,若用 t 检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互 比较的两个平均数的秩次问题,因而会增大犯 I 型错误的概率,降低推断的可靠性。 由于上述原因,多个平均数的差异显著性检验不宜用 t 检验,须采用方差分析法。 方差分析(analysis of variance)是由英国统计学家 R.A.Fisher 于 1923 年提出的。这种方 法是将 k 个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应 于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些 总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。方差分析实质上 是关于观测值变异原因的数量分析,它在科学研究中应用十分广泛。 本章在讨论方差分析基本原理的基础上,重点介绍单因素试验资料及两因素试验资料的 方差分析法。在此之前,先介绍几个常用术语。 1、试验指标(experimental index) 为衡量试验结果的好坏或处理效应的高低,在 试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也 不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉 率、某些生理生化和体型指标(如血糖含量、体高、体重)等。 2、试验因素(experimental factor) 试验中所研究的影响试验指标的因素叫试验因 素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对 日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试 验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。 试验因素常用大写字母 A、B、C、…等表示。 3、因素水平(level of factor) 试验因素所处的某种特定状态或数量等级称为因素水 平,简称水平。如比较 3 个品种奶牛产奶量的高低,这 3 个品种就是奶牛品种这个试验因素
的3个水平;研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,这4种特定的能量 水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1, 2,…,来表示。如A1、A2、…,B1、B2、…,等 4、试验处理( treatment事先设计好的实施在试验单位上的具体项目叫试验处理,简 称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进 行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以 进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位 上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两 因素试验,整个试验共有3×3=9个水平组合,实施在试验单位(试验猪)上的具体项目就是某 品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理 5、试验单位( (experimental unit在试验中能接受不同试验处理的独立的试验载体叫 试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物; 或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往 往也是观测数据的单位。 6、重复 repetition在试验中,将一个处理实施在两个或两个以上的试验单位上, 称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪 就说这个处理(饲料)有4次重复 第一节方差分析的基本原理与步骤 方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试 验结果的方差分析介绍其原理与步骤。 线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n次重复,共有Mk个观测值。这类试验资 料的数据模式如表6-1所示。 表6-1k个处理每个处理有n个观测值的数据模式 处理 合计x1,平均x x22 x2j x2 xk2 xk k 表中x表示第个处理的第j个观测值(P1,2,…,k户1,2,…,n):x=∑x表示第
76 的 3 个水平;研究某种饲料中 4 种不同能量水平对肥育猪瘦肉率的影响,这 4 种特定的能量 水平就是饲料能量这一试验因素的 4 个水平。因素水平用代表该因素的字母加添足标 1, 2,…,来表示。如 A1、A2、…,B1、B2、…,等。 4、试验处理(treatment) 事先设计好的实施在试验单位上的具体项目叫试验处理,简 称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进 行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以 进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位 上的具体项目是各因素的某一水平组合。例如进行 3 种饲料和 3 个品种对猪日增重影响的两 因素试验,整个试验共有 3×3=9 个水平组合,实施在试验单位(试验猪)上的具体项目就是某 品种与某种饲料的结合。所以,在多因素试验时,试验因素的一个水平组合就是一个处理。 5、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体叫 试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物; 或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往 往也是观测数据的单位。 6、重复(repetition) 在试验中,将一个处理实施在两个或两个以上的试验单位上, 称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂 4 头猪, 就说这个处理(饲料)有 4 次重复。 第一节 方差分析的基本原理与步骤 方差分析有很多类型,无论简单与否,其基本原理与步骤是相同的。本节结合单因素试 验结果的方差分析介绍其原理与步骤。 一、线性模型与基本假定 假设某单因素试验有 k 个处理,每个处理有 n 次重复,共有 nk 个观测值。这类试验资 料的数据模式如表 6-1 所示。 表 6-1 k 个处理每个处理有 n 个观测值的数据模式 处理 观 测 值 合计 i. x 平均 i. x A1 x11 x12 … x1j … x1n . 1 x . 1 x A2 x21 x22 … x2j … x2n . 2 x . 2 x … … Ai xi1 xi2 … xij … xin . i x . i x … … Ak xk1 xk2 … xkj … xkn xk. . k x 合计 x.. x.. 表中 ij x 表示第 i 个处理的第 j 个观测值(i=1,2,…,k;j=1,2,…,n); = = n j i ij x x 1 . 表示第
个处理n个观测值的和2+=∑x表示全部观测值的总和:元 /n=x1./n 表示第i个处理的平均数:菜=∑∑x/An=x,km表示全部观测值的总平均数:x可以分 解为 (6-1) 共表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将共再进行分解 令 (6- 1=H-H (6-3) xy=a+ai+ey 其中μ表示全试验观测值总体的平均数,a1是第i个处理的效应( treatment effects)表示 处理i对试验结果产生的影响。显然有 0 E;是试验误差,相互独立,且服从正态分布N(0,σ2)。 (6-4)式叫做单因素试验的线性模型( linear model)亦称数学模型。在这个模型中xy 表示为总平均数μ、处理效应a;、试验误差εσ之和。由ε;相互独立且服从正态分布N(0, σ2),可知各处理A(=-1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μ,o2)。 尽管各总体的均数可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型 可归纳为:效应的可加性( additivity)、分布的正态性( normality)、方差的同质性 ( homogeneity)。这也是进行其它类型方差分析的前提或基本假定。 若将表(6-1)中的观测值x(=1,2,…,k;广产1,2,…,n)的数据结构(模型)用样本符 号来表示,则 x=x+(x2-x)+(x-x)=x+1+e (6-6) 与(6-4)式比较可知,王、(x-)=1、(x1-x)=en分别是μ、(u;-u)=a1、 (x共)=En的估计值。 (6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(μ;-μ或x,一x),与误差 (xn-,或x一x),故如个观测值的总变异可分解为处理间的变异和处理内的变异两部分 平方和与自由度的剖分
77 i 个处理 n 个观测值的和; = = = = = k i i k i n j ij x x x 1 1 1 .. .表示全部观测值的总和; x x n xi n n j i ij . / ./ 1 = = = 表示第 i 个处理的平均数; x x kn x kn k i n j ij .. / .. / 1 1 = = = = 表示全部观测值的总平均数; ij x 可以分 解为 ij i ij x = + (6-1) i 表示第 i 个处理观测值总体的平均数。为了看出各处理的影响大小,将 i 再进行分解, 令 = = k i i k 1 1 (6-2) i = i − (6-3) 则 ij i ij x = + + (6-4) 其中μ表示全试验观测值总体的平均数, i 是第 i 个处理的效应(treatment effects)表示 处理 i 对试验结果产生的影响。显然有 0 1 = = k i i (6-5) εij 是试验误差,相互独立,且服从正态分布 N(0,σ 2)。 (6-4)式叫做单因素试验的线性模型(linear model)亦称数学模型。在这个模型中 ij x 表示为总平均数μ、处理效应αi、试验误差εij 之和。由εij 相互独立且服从正态分布 N(0, σ 2),可知各处理 Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布 N(μi,σ 2 )。 尽管各总体的均数 i 可以不等或相等,σ2 则必须是相等的。所以,单因素试验的数学模型 可归纳为:效应的可加性(additivity)、分布的正态性(normality)、方差的同质性 (homogeneity)。这也是进行其它类型方差分析的前提或基本假定。 若将表(6-1)中的观测值 xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符 号来表示,则 ij i ij i i ij x = x + x − x + x − x = x +t +e .. . .. . .. ( ) ( ) (6-6) 与(6-4)式比较可知, .. x 、 i i (x − x ) = t . .. 、 ij i ij (x − x ) = e . 分别是μ、(μi-μ)= i 、 (xij- i )= ij 的估计值。 (6-4)、(6-6)两式告诉我们:每个观测值都包含处理效应(μi-μ或 x . x.. i − ),与误差 ( ij i x − 或 ij i. x − x ),故 kn 个观测值的总变异可分解为处理间的变异和处理内的变异两部分。 二、平方和与自由度的剖分
我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许 多优点,而且不用开方,所以在方差分析中是用样本方差即均方( mean squares)来度量资 料的变异程度的。表6-1中全部观测值的总变异可以用总均方来度量。将总变异分解为处理 间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过 将总均方的分子—称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内 平方和两部分;将总均方的分母—称为总自由度,剖分成处理间自由度与处理内自由度两 部分来实现的。 (一)总平方和的剖分在表6-1中,反映全部观测值总变异的总平方和是各观测 值x与总平均数x的离均差平方和,记为SSr。即 SSr=∑∑(x-x)2 因为 ∑∑x-x)2=∑∑[元-x)+(x1-x ∑∑x-x)+21-Xx1-3)+(x- i=1j= 心(x-x)+2x-x(1-x+(x-x 其中 所以 ∑(x-x)=心(一)+∑∑(x一元 (6-7)式中,心(一)2为各处理平均数元,与总平均数的离均差平方和与重复 数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SS,即 S=n∑(x-x)2 (6-7)式中,∑∑(x1-)2为各处理内离均差平方和之和,反映了各处理内的变异即 i=l j= 误差,称为处理内平方和或误差平方和,记为SS,即 于是有 SST=SS +SSe (6-8) (6-7),(6-8)两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系
78 我们知道,方差与标准差都可以用来度量样本的变异程度。因为方差在统计分析上有许 多优点,而且不用开方,所以在方差分析中是用样本方差即均方(mean squares)来度量资 料的变异程度的。表 6-1 中全部观测值的总变异可以用总均方来度量。将总变异分解为处理 间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过 将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内 平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两 部分来实现的。 (一)总平方和的剖分 在表 6-1 中,反映全部观测值总变异的总平方和是各观测 值 xij 与总平均数 x.. 的离均差平方和,记为 SST。即 = = = − k i n j T ij SS x x 1 1 2 .. ( ) 因为 = = = = = = = = = = = = − + − − + − = − + − − + − − = − + − k i n j i j i n j i j i k i k i i i k i n j i i i j i i j i k i n j k i n j i j i i j i n x x x x x x x x x x x x x x x x x x x x x x 1 1 2 1 1 1 2 1 1 2 2 1 1 1 1 2 2 ( . ..) 2 [( . ..) ( .)] ( .) ( . ..) 2( . ..)( .) ( .) ( ..) ( . ..) ( .) 其中 = − = n j ij i x x 1 ( . ) 0 所以 = = = = = − = − + − k i n j k i k i n j ij i ij i x x n x x x x 1 1 1 1 1 2 . 2 . .. 2 .. ( ) ( ) ( ) (6-7) (6-7)式中, = − k i i n x x 1 2 ( . ..) 为各处理平均数 . i x 与总平均数 x.. 的离均差平方和与重复 数 n 的乘积,反映了重复 n 次的处理间变异,称为处理间平方和,记为 SSt,即 = = − k i t i SS n x x 1 2 ( . ..) (6-7)式中, = = − k i n j ij i x x 1 1 2 . ( ) 为各处理内离均差平方和之和,反映了各处理内的变异即 误差,称为处理内平方和或误差平方和,记为 SSe,即 = = = − k i n j e ij i SS x x 1 1 2 . ( ) 于是有 SST =SSt+SSe (6-8) (6-7),(6-8)两式是单因素试验结果总平方和、处理间平方和、处理内平方和的关系
式。这个关系式中三种平方和的简便计算公式如下 -sS 其中,C=x2.称为矫正数 (二)总自由度的剖分在计算总平方和时,资料中的各个观测值要受 2(x-)=0这条件的约来故总自由度等于资料中观测值的总个数减一,即 总自由度记为4,即4=k-1 在计算处理间平方和时,各处理均数x要受∑(x一)=0这一条件的约束,故处理间 自由度为处理数减一,即k-1。处理间自由度记为d,即d=-1 在计算处理内平方和时,要受k个条件的约束,即∑(xn-x)=0(=1,2,…k)。故 处理内自由度为资料中观测值的总个数减k,即-k。处理内自由度记为dc,即 dJC=n-k=k(mn-1)。 因为 nk-1=(k-1)+(nk-k)=(k-1)+k(n-1) 所以 r =d, +df e 综合以上各式得: dfr =kn-1 d=k-1 dfe =dfr -dr 各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 (MS或S2)、MS(或S2)和MS2(或S2)。即 MSr= sf= ssr /dr MS,=Sf=SS, /dr MSe=se= sse /dfe (6-12) 总均方一般不等于处理间均方加处理内均方 例6.1】某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基 本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果 列于下表 表6-2饲喂不同饲料的鱼的增重 (单位:10g) 饲料 鱼的增重(x;)
79 式。这个关系式中三种平方和的简便计算公式如下: x C n SS SS x C i k i t ij n j k i T = − = − = = = 2 . 1 2 1 1 1 (6-9) SSe = SST − SSt 其中,C=x2 ··/kn 称为矫正数。 (二)总自由度的剖分 在计 算总平方和时 ,资料中的 各个观测值要受 = = − = k i n j ij x x 1 1 ( ..) 0 这一条件的约束,故总自由度等于资料中观测值的总个数减一,即 kn-1。 总自由度记为 dfT,即 dfT=kn-1。 在计算处理间平方和时,各处理均数 i. x 要受 = − = k i i x x 1 ( . .. ) 0 这一条件的约束,故处理间 自由度为处理数减一,即 k-1。处理间自由度记为 dft,即 dft=k-1。 在计算处理内平方和时,要受 k 个条件的约束,即 = − = n j ij i x x 1 ( . ) 0 (i=1,2,…,k)。故 处理内自由度为资料中观测值的总个数减 k,即 kn-k 。处理内自由度记为 dfe,即 dfe=kn-k=k(n-1)。 因为 nk −1= (k −1) + (nk − k) = (k −1) + k(n −1) 所以 dfT = dft + dfe (6-10) 综合以上各式得: e T t t T df df df df k df kn = − = − = − 1 1 (6-11) 各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为 (MST 或 2 T S )、MSt(或 2 t S )和 MSe(或 2 e S )。即 MST ST SST dfT / 2 = = MSt St SSt dft / 2 = = MSe Se SSe dfe / 2 = = (6-12) 总均方一般不等于处理间均方加处理内均方。 【例 6.1】 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基 本相同的鱼 20 尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果 列于下表。 表 6-2 饲喂不同饲料的鱼的增重 (单位:10g) 饲料 鱼的增重(xij) 合计 i. x 平均 i. x
31 28.4 35.9155.931.18 AAAA 24.8 27.9 26.2 14 26.28 6 24.9 25.8 24. 27.030.829.024.528.5139. 27.96 合计 X.=550.8 这是一个单因素试验,处理数k=4,重复数n=5。各项平方和及自由度计算如下 矫正数 C=x2/nk=55082/4×5)=1516903 总平方和 SSr=∑∑x2-C=3192+2792+…1+2852-C 153687-1516903=19967 处理间平方和 ∑x2-C==(5592+13142+12372+1398)-C 152833-1516903=11427 处理内平方和 SS=SSr-SS1=19967-114.27=8540 总自由度 dr =nk-1=5 处理间自由度 df1=k-1=4-1=3 处理内自由度 dfe=dr-d1=19-3=16 用SS、S分别除以d和d便得到处理间均方MS及处理内均方MS MS=SS/dh=114.27/3=38.09 MS=SS/d∈=8540/16=534 因为方差分析中不涉及总均方的数值,所以不必计算之。 、期望均方 如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即 σ2=σ2=…=a2=σ2a2(=1,2,…,k)表示第i个处理观测值总体的方差。如果所分析的 资料满足这个方差同质性的要求,那么各处理的样本方差S,S2,…,S4都是σ2的无偏估 计( unbiased estimate)量。S2(=1,2,…,k)是由试验资料中第i个处理的n个观测值算得 的方差 显然,各S2的合并方差S2(以各处理内的自由度m-1为权的加权平均数)也是o2的无 偏估计量,且估计的精确度更高。很容易推证处理内均方MS就是各S2的合并 S5∑∑(-元 S1+SS2+… MS.=dk(n-1)k(n-1)41+f2+… df1S+d2S2+…+dfSk df+d2+…+d 其中SS、d(=1,2,…,k)分别表示由试验资料中第i个处理的n个观测值算得的平 方和与自由度。这就是说,处理内均方MS是误差方差σ的无偏估计量。 试验中各处理所属总体的本质差异体现在处理效应∝1的差异上。我们把
80 A1 31.9 27.9 31.8 28.4 35.9 155.9 31.18 A2 24.8 25.7 26.8 27.9 26.2 131.4 26.28 A3 22.1 23.6 27.3 24.9 25.8 123.7 24.74 A4 27.0 30.8 29.0 24.5 28.5 139.8 27.96 合计 x.. =550.8 这是一个单因素试验,处理数 k=4,重复数 n=5。各项平方和及自由度计算如下: 矫正数 / 550.8 /(4 5) 15169.03 2 2 C = x.. nk = = 总平方和 SST = xijl −C = + + + −C 2 2 2 2 31.9 27.9 28.5 =15368 .7 −15169 .03 =199.67 处理间平方和 15283 .3 15169 .03 114.27 (155.9 131.4 123.7 139.8 ) 5 1 . 1 2 2 2 2 2 = − = = x − C = + + + − C n SS i t 处理内平方和 SSe = SST − SSt =199.67 −114.27 = 85.40 总自由度 dfT = nk −1 = 54 −1 =19 处理间自由度 dft = k −1 = 4 −1 = 3 处理内自由度 dfe = dfT − dft =19 − 3 =16 用 SSt、SSe分别除以 dft 和 dfe便得到处理间均方 MSt 及处理内均方 MSe。 / 85.40 /16 5.34 / 114.27 / 3 38.09 = = = = = = e e e t t t MS SS df MS SS df 因为方差分析中不涉及总均方的数值,所以不必计算之。 三、期望均方 如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即 2 2 2 2 2 2 1 , = = = k = i (i=1,2,…,k)表示第 i 个处理观测值总体的方差。如果所分析的 资料满足这个方差同质性的要求,那么各处理的样本方差 S 2 1,S 2 2,…,S 2 k都是σ2 的无偏估 计(unbiased estimate)量。 2 i S (i=1,2,…,k)是由试验资料中第 i 个处理的 n 个观测值算得 的方差。 显然,各 2 i S 的合并方差 2 e S (以各处理内的自由度 n-1 为权的加权平均数)也是σ2 的无 偏估计量,且估计的精确度更高。很容易推证处理内均方 MSe就是各 2 i S 的合并。 2 2 1 2 2 2 2 2 2 1 1 1 2 1 2 2 . ( 1) ( 1) ( ) = ⎯ ⎯→ + + + + + + = + + + + + + = − = − − = = 估计 e k k k k i k i ij e e e S df df df df S df S df S df df df SS SS SS k n SS k n x x df SS MS 其中 SSi、dfi(i=1,2,…,k)分别表示由试验资料中第 i 个 处理的 n 个观测值算得的平 方和与自由度。这就是说,处理内均方 MSe是误差方差σ2 的无偏估计量。 试验中各处理所属总体的本质差异体现在处理效应 i 的差异上。我们把
∑a2(k-1)=∑(H1-)2Ak-1)称为效应方差,它也反映了各处理观测值总体平均数1的 变异程度,记为G2。 因为各以未知,所以无法求得σ2的确切值,只能通过试验结果中各处理均数的差异去 估计。然而,∑-)2(k-1)并非2的无偏估计量。这是因为处理观测值的均数间的差 异实际上包含了两方面的内容:一是各处理本质上的差异即a(或u)间的差异,二是本 身的抽样误差。统计学上已经证明,∑-)(k-1)是a+0n的无偏估计量。因而, 我们前面所计算的处理间均方MS实际上是na2+o2的无偏估计量 因为MS是σ2的无偏估计量,M是na2+σ2的无偏估计量,所以σ2为MS的数学 期望( mathematical expectation),na2+σ2为MS的数学期望。又因为它们是均方的期望 值( expected value),故又称期望均方,简记为EMsS( expected mean squares 当处理效应的方差σ2=0,亦即各处理观测值总体平均数1(=1,2,…k)相等时,处 理间均方MS与处理内均方一样,也是误差方差σ2的估计值,方差分析就是通过MS与 MS的比较来推断G。是否为零即μ是否相等的 四、F分布与F检验 (一)F分布设想我们作这样的抽样试验,即在一正态总体N(μ,o2)中随机 抽取样本含量为n的样本k个,将各样本观测值整理成表6-1的形式。此时所谓的各处理没 有真实差异,各处理只是随机分的组。因此,由(6-12)式算出的S2和S2都是误差方差2 的估计量。以S2为分母,S2为分子,求其比值。统计学上把两个均方之比值称为F值 F具有两个自由度:d=d1=k-1,df2=d=k(n-1) 若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值 这些F值所具有的概率分布称为F分布( Distribution)。F分布密度曲线是随自由度d d的变化而变化的一簇偏态曲线,其形态随着、4的增大逐渐趋于对称,如图6-1所示 1.0hdf=2,df=5 dfi=8, df 0.2 图6-1F分布密度曲线
81 /( 1) ( ) /( 1) 2 2 ai k − = i − k − 称为效应方差,它也反映了各处理观测值总体平均数 i 的 变异程度,记为 2 。 1 2 2 − = k i a (6-13) 因为各 i 未知,所以无法求得 2 的确切值,只能通过试验结果中各处理均数的差异去 估计。然而, ( ) /( 1) 2 xi. − x.. k − 并非 2 的无偏估计量。这是因为处理观测值的均数间的差 异实际上包含了两方面的内容:一是各处理本质上的差异即αi(或μi)间的差异,二是本 身的抽样误差。统计学上已经证明, ( ) /( 1) 2 xi. − x.. k − 是 2 +σ 2 /n 的无偏估计量。因而, 我们前面所计算的处理间均方 MSt 实际上是 n 2 +σ2 的无偏估计量。 因为 MSe 是σ2 的无偏估计量,MSt 是 n 2 +σ2 的无偏估计量,所以σ2 为 MSe 的数学 期望(mathematical expectation),n 2 +σ 2 为 MSt 的数学期望。又因为它们是均方的期望 值(expected value),故又称期望均方,简记为 EMS(expected mean squares)。 当处理效应的方差 2 =0,亦即各处理观测值总体平均数 i (i=1,2,…,k)相等时,处 理间均方 MSt 与处理内均方一样,也是误差方差σ2 的估计值,方差分析就是通过 MSt 与 MSe的比较来推断 2 是否为零即 i 是否相等的。 四、F 分布与 F 检验 (一)F 分布 设想我们作这样的抽样试验,即在一正态总体 N(μ,σ 2)中随机 抽取样本含量为 n 的样本 k 个,将各样本观测值整理成表 6-1 的形式。此时所谓的各处理没 有真实差异,各处理只是随机分的组。因此,由(6-12)式算出的 2 t S 和 2 e S 都是误差方差 2 的估计量。以 2 e S 为分母, 2 t S 为分子,求其比值。统计学上把两个均方之比值称为 F 值。 即 2 2 / F = St Se (6-14) F 具有两个自由度: 1, ( 1) df1 = dft = k − df2 = dfe = k n − 。 若在给定的 k 和 n 的条件下,继续从该总体进行一系列抽样,则可获得一系列的 F 值。 这些 F 值所具有的概率分布称为 F 分布(F distribution)。F 分布密度曲线是随自由度 df1、 df2 的变化而变化的一簇偏态曲线,其形态随着 df1、df2 的增大逐渐趋于对称,如图 6-1 所示。 图 6-1 F 分布密度曲线
F分布的取值范围是(0,+∞),其平均值μF=1 用f(F)表示F分布的概率密度函数,则其分布函数F(Fa为 F(Fa)=P(F0.05,不能否定H,统计学上,把这一检验结果表述为:各 处理间差异不显著,在F值的右上方标记“n,或不标记符号:若F0)≤F<F0的两), 即0.01<P≤0.05,否定H,接受HA,统计学上,把这一检验结果表述为:各处理间差异 显著,在F值的右上方标记“*”;若F≥F04,,即P≤0.01,否定Ho,接受H4,统计 学上,把这一检验结果表述为:各处理间差异极显著,在F值的右上方标记“*”。 对于【例6.1】,因为F=MSMS=38.09/5.3=7.13”;根据d=MG=3,4E=d=16查附表
82 F 分布的取值范围是(0,+∞),其平均值 F =1。 用 f (F) 表示 F 分布的概率密度函数,则其分布函数 ) ( F F 为: = = F F(F ) P(F F ) f (F)dF (6-15) 因而 F 分布右尾从 F 到+∞的概率为: + = − = F P(F F ) 1 F(F ) f (F)dF (6-16) 附表 4 列出的是不同 df1 和 df2 下,P(F≥ F )=0.05 和 P(F≥ F )=0.01 时的 F 值, 即右尾概率α=0.05 和α=0.01 时的临界 F 值,一般记作 0.05( , ) df1 df2 F , 0.01( , ) df1 df2 F 。如查附表 4, 当 df1=3,df2=18 时,F0.05(3,18)=3.16,F0.01(3,18)=5.09,表示如以 df1=dft=3,df2=dfe=18 在同一正 态总体中连续抽样,则所得 F 值大于 3.16 的仅为 5%,而大于 5.09 的仅为 1%。 (二)F 检验 附表 4 是专门为检验 2 t S 代表的总体方差是否比 2 e S 代表的总体方差大而 设计的。若实际计算的 F 值大于 0.05( , ) df1 df2 F ,则 F 值在α=0.05 的水平上显著,我们以 95% 的可靠性(即冒 5%的风险)推断 2 t S 代表的总体方差大于 2 e S 代表的总体方差。这种用 F 值出现 概率的大小推断两个总体方差是否相等的方法称为 F 检验(F-test)。 在方差分析中所进行的 F 检验目的在于推断处理间的差异是否存在,检验某项变异因 素的效应方差是否为零。因此,在计算 F 值时总是以被检验因素的均方作分子,以误差均 方作分母。应当注意,分母项的正确选择是由方差分析的模型和各项变异原因的期望均方决 定的。 在单因素试验结果的方差分析中,无效假设为 H0:μ1=μ2=…=μk,备择假设为 HA:各 μi 不全相等,或 H0 : 2 =0,HA: 2 ≠0;F=MSt/MSe,也就是要判断处理间均方是否显 著大于处理内(误差)均方。如果结论是肯定的,我们将否定 H0;反之,不否定 H0。反过来 理解:如果 H0 是正确的,那么 MSt与 MSe都是总体误差σ2 的估计值,理论上讲 F 值等于 1; 如果 H0 是不正确的,那么 MSt 之期望均方中的 2 就不等于零,理论上讲 F 值就必大于 1。 但是由于抽样的原因,即使 H0 正确,F 值也会出现大于 1 的情况。所以,只有 F 值大于 1 达到一定程度时,才有理由否定 H0。 实际进行 F 检验时,是将由试验资料所算得的 F 值与根据 df1=dft(大均方,即分子均方 的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表 4 所得的临界 F 值 0.05( , ) df1 df2 F , 0.01( , ) df1 df2 F 相比较作出统计推断的。 若 F< 0.05( , ) df1 df2 F ,即 P>0.05,不能否定 H0,统计学上,把这一检验结果表述为:各 处理间差异不显著,在 F 值的右上方标记“ns”,或不标记符号;若 0.05( , ) df1 df2 F ≤F< 0.01( , ) df1 df2 F , 即 0.01<P≤0.05,否定 H0,接受 HA,统计学上,把这一检验结果表述为:各处理间差异 显著,在 F 值的右上方标记“*”;若 F≥ 0.01( , ) df1 df2 F ,即 P≤0.01,否定 H0,接受 HA,统计 学上,把这一检验结果表述为:各处理间差异极显著,在 F 值的右上方标记“**”。 对于【例 6.1】,因为 F=MSt/MSe=38.09/5.34=7.13**;根据 df1=dft=3,df2=dfe=16 查附表
4,得F>Foia,16=5.29,PLSD时,则与买在a水平上差 异显著:反之,则在α水平上差异不显著。最小显著差数由(6-17)式计算。 LSDa=ta(d, Si-i (6-17) 式中:mu,为在F检验中误差自由度下,显著水平为a的临界r值,Sx一,为均数差 异标准误,由(6-18)式算得。 2MSe /n (6-18) 其中M为F检验中的误差均方,n为各处理的重复数 当显著水平a=0.05和0.01时,从t值表中查出s,和10,代入(6-17)式得: L5D0s=052 (6-19) LSD 0=od)-
83 4,得 F>F0.01(3,16) =5.29,P<0.01,表明四种不同饲料对鱼的增重效果差异极显著,用不同 的饲料饲喂,增重是不同的。 在方差分析中,通常将变异来源、平方和、自由度、均方和 F 值归纳成一张方差分析 表,见表 6-3。 表 6-3 表 6-2 资料方差分析表 变异来源 平方和 自由度 均方 F 值 处理间 114.27 3 38.09 7.13** 处理内 85.40 16 5.34 总变异 199.67 19 表中的 F 值应与相应的被检验因素齐行。因为经 F 检验差异极显著,故在 F 值 7.13 右 上方标记“**”。 在实际进行方差分析时,只须计算出各项平方和与自由度,各项均方的计算及 F 值检 验可在方差分析表上进行。 五、多重比较 F 值显著或极显著,否定了无效假设 HO,表明试验的总变异主要来源于处理间的变异, 试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都 显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。 因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。 统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。 多重比较的方法甚多,常用的有最小显著差数法(LSD 法)和最小显著极差法(LSR 法), 现分别介绍如下。 (一)最小显著差数法 (LSD 法,least significant difference) 此法的基本作法是: 在 F 检验显著的前提下,先计算出显著水平为α的最小显著差数 LSD ,然后将任意两个处 理平均数的差数的绝对值 i. j. x − x 与其比较。若 i. j. x − x >LSDa 时,则 i. x 与 j. x 在α水平上差 异显著;反之,则在α水平上差异不显著。最小显著差数由(6-17)式计算。 . . ( ) e i j a a df Sx x LSD t = − (6-17) 式中: ( ) dfe t 为在 F 检验中误差自由度下,显著水平为α的临界 t 值, . . i j Sx −x 为均数差 异标准误,由(6-18)式算得。 Sx x MSe n i j 2 / . . − = (6-18) 其中 MSe 为 F 检验中的误差均方,n 为各处理的重复数。 当显著水平α=0.05 和 0.01 时,从 t 值表中查出 0.05( ) dfe t 和 0.01( ) dfe t ,代入(6-17)式得: . . . . 0.01 0.01( ) 0.05 0.05( ) e i j e i j df x x df x x LSD t S LSD t S − − = = (6-19)
利用LSD法进行多重比较时,可按如下步骤进行 (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列: 2)计算最小显著差数LSD0os和LSD (3)将平均数多重比较表中两两平均数的差数与 LSD、LSDo比较,作出统计推断。 对于【例6.1】,各处理的多重比较如表6-4所示。 表6-4四种饲料平均增重的多重比较表(LSD法) 平均数 -24.74 26.28 AAAA 3 1.685 24.74 注:表中A与A3的差数3.22用q检验法与新复极差法时,在α=0.05的水平上不显著 因为,S5=√2MS/n=√2×534/5=1462;查t值表得:10(m=0=2.120, lo o1(dfe)=la 01(16)=2. 921 所以,显著水平为0.05与0.01的最小显著差数为 LSD0s=1o04)S-,=2120×1462=3099 LSD01=100d)3元 =2921×1462=4271 将表6-4中的6个差数与 LSD,LSDo比较:小于 LSD者不显著,在差数的右上方 标记“ns”,或不标记符号;介于 LSD与LSDo之间者显著,在差数的右上方标记“*”; 大于LSDω者极显著,在差数的右上方标记“*”。检验结果除差数1.68、1.54不显著 3.22显著外,其余两个差数6.44、4.90极显著。表明A饲料对鱼的增重效果极显著高于 A2和A3,显著高于A4:A饲料对鱼的增重效果极显著高于A3饲料;A与A、A2与A3的增 重效果差异不显著,以A饲料对鱼的增重效果最佳。 关于LSD法的应用有以下几点说明 1、LSD法实质上就是t检验法。它是将t检验中由所求得的t之绝对值 (=(-x,)/S-5)与临界值的比较转为将各对均数差值的绝对值际一与最小显著 差数lS-,的比较而作出统计推断的但是,由于LSD法是利用F检验中的误差自由度d 查临界t值,利用误差均方MS计算均数差异标准误S;-ξ,因而LSD法又不同于每次利用 两组数据进行多个平均数两两比较的t检验法。它解决了本章开头指出的t检验法检验过程 烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但LSD法并 未解决推断的可靠性降低、犯Ⅰ型错误的概率变大的问题。 2、有人提出,与检验任何两个均数间的差异相比较,LSD法适用于各处理 组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更 适用的方法有顿纳特( Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。 3、因为LSD法实质上是t检验,故有人指出其最适宜的比较形式是:在进行 试验设计时就确定各处理只是固定的两个两个相比每个处理平均数在比较中只
84 利用 LSD 法进行多重比较时,可按如下步骤进行: (1)列出平均数的多重比较表,比较表中各处理按其平均数从大到小自上而下排列; (2)计算最小显著差数 LSD0.05 和 LSD0.01 ; (3)将平均数多重比较表中两两平均数的差数与 LSD0.05 、 LSD0.01 比较,作出统计推断。 对于【例 6.1】,各处理的多重比较如表 6-4 所示。 表 6-4 四种饲料平均增重的多重比较表(LSD 法) 处理 平均数 i. x i. x -24.74 i. x -26.28 i. x -27.96 A1 31.18 6.44** 4.90** 3.22* A4 27.96 3.22* 1.68 ns A2 26.28 1.54ns A3 24.74 注:表中 A4与 A3的差数 3.22 用 q 检验法与新复极差法时,在α=0.05 的水平上不显著。 因为, 2 / 2 5.34 / 5 1.462 . . Sx −x = MSe n = = i j ;查 t 值表得:t0.05(dfe) =t0.05(16) =2.120, t0.01(dfe)=t0.01(16)=2.921 所以,显著水平为 0.05 与 0.01 的最小显著差数为 2.921 1.462 4.271 2.120 1.462 3.099 . . . . 0.01 0.01( ) 0.05 0.05( ) = = = = = = − − e i j e i j df x x df x x LSD t S LSD t S 将表 6-4 中的 6 个差数与 LSD0.05 ,LSD0.01 比较:小于 LSD0.05 者不显著,在差数的右上方 标记“ns”,或不标记符号;介于 LSD0.05 与 LSD0.01 之间者显著,在差数的右上方标记“*”; 大于 LSD0.01 者极显著,在差数的右上方标记“**”。检验结果除差数 1.68、1.54 不显著、 3.22 显著外,其余两个差数 6.44、4.90 极显著。表明 A1 饲料对鱼的增重效果极显著高于 A2 和 A3,显著高于 A4;A4 饲料对鱼的增重效果极显著高于 A3 饲料;A4 与 A2、A2 与 A3 的增 重效果差异不显著,以 A1 饲料对鱼的增重效果最佳。 关于 LSD 法的应用有以下几点说明: 1、 LSD 法实质 上就 是 t 检验法。 它是将 t 检验 中由所 求得的 t 之绝 对值 ( ( ) / ) . . . . i j i j Sx x t x x = − − 与临界 a t 值的比较转为将各对均数差值的绝对值 i. j. x − x 与最小显著 差数 i. j. a Sx x t − 的比较而作出统计推断的。但是,由于 LSD 法是利用 F 检验中的误差自由度 dfe 查临界 a t 值,利用误差均方 MSe 计算均数差异标准误 i. j. Sx −x ,因而 LSD 法又不同于每次利用 两组数据进行多个平均数两两比较的 t 检验法。它解决了本章开头指出的 t 检验法检验过程 烦琐,无统一的试验误差且估计误差的精确性和检验的灵敏性低这两个问题。但 LSD 法并 未解决推断的可靠性降低、犯 I 型错误的概率变大的问题。 2、有人提出,与检验任何两个均数间的差异相比较, LSD 法适用于各处理 组与对照组比较而处理组间不进行比较的比较形式。实际上关于这种形式的比较更 适用的方法有顿纳特(Dunnett)法(关于此法,读者可参阅其它有关统计书籍)。 3、因为 LSD 法实质上是 t 检验,故有人指出其最适宜的比较形式是:在进行 试验设计时就确定各处理只是固定的两个两个相比,每个处理平均数在比较中只