第五章 方差分析 t检验法适用于样本平均数与总体平均数以及 两个样本平均数间的差异显著性检验,但在生产和 科学研究中经常会遇到比较多个处理优劣的问题, 即需进行多个平均数间的差异显著性检验。 上一张 下一张 主 页 退 出 多个样本平均数间的差异显著性检验, t检验法是不适宜的,原因有三:
第五章 方差分析 t检验法适用于样本平均数与总体平均数以及 两个样本平均数间的差异显著性检验,但在生产和 科学研究中经常会遇到比较多个处理优劣的问题, 即需进行多个平均数间的差异显著性检验。 上一张 下一张 主 页 退 出 多个样本平均数间的差异显著性检验, t检验法是不适宜的,原因有三:
例如,一试验包含5个处理,如采用t检验法进行检验,需作 =10次两两平均数的差异显著性检验;若有k个处理, 则要作 k(k-1)/2次类似的检验。 2 C5 上一张 下一张 主 页 退 出 1、检验过程烦琐 2、无统一的试验误差,试验误差估计的精确 性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试 验误差的估计值。若用 t 检验法作两两比较,由于每次比 较需估计一个 ,故使得各次比较误差的估计不统一, 同时没有充分利用资料所提供的信息而使误差估计的精确 性降低,从而降低检验的灵敏性。 x xj i S −
例如,一试验包含5个处理,如采用t检验法进行检验,需作 =10次两两平均数的差异显著性检验;若有k个处理, 则要作 k(k-1)/2次类似的检验。 2 C5 上一张 下一张 主 页 退 出 1、检验过程烦琐 2、无统一的试验误差,试验误差估计的精确 性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试 验误差的估计值。若用 t 检验法作两两比较,由于每次比 较需估计一个 ,故使得各次比较误差的估计不统一, 同时没有充分利用资料所提供的信息而使误差估计的精确 性降低,从而降低检验的灵敏性。 x xj i S −
例如,试验有5个处理 ,每个处理 重复 6次,共有30个 观测值。进行t检验时,每次只能利用两个处理共12个观 测值估计试验误差 ,误差自由度为 2(6-1)=10 ;若利 用整个试验的30个观测值估计试验误差 ,显然估计的精 确性高,且误差自由度为5(6-1)=25。可见,在用t检 法进行检验时 ,由 于估计误差的精确性低,误差自由度 小,使检验的灵敏性降低,容易掩盖差异的显著性。 上一张 下一张 主 页 退 出 3、推断的可靠性低,犯 I 型错误的概率增大 即使利用资料所提供的全部信息估计了试验误差,若用t 检验法进行多个处理平均数间的差异显著性检验,由于没 有考虑相互比较的两个平均数的秩次问题,因而会增大犯 I型错误的概率,降低推断的可靠性。 所以,多个平均数的差异显著性检验不宜 用 t 检验,须采用方差分析法
例如,试验有5个处理 ,每个处理 重复 6次,共有30个 观测值。进行t检验时,每次只能利用两个处理共12个观 测值估计试验误差 ,误差自由度为 2(6-1)=10 ;若利 用整个试验的30个观测值估计试验误差 ,显然估计的精 确性高,且误差自由度为5(6-1)=25。可见,在用t检 法进行检验时 ,由 于估计误差的精确性低,误差自由度 小,使检验的灵敏性降低,容易掩盖差异的显著性。 上一张 下一张 主 页 退 出 3、推断的可靠性低,犯 I 型错误的概率增大 即使利用资料所提供的全部信息估计了试验误差,若用t 检验法进行多个处理平均数间的差异显著性检验,由于没 有考虑相互比较的两个平均数的秩次问题,因而会增大犯 I型错误的概率,降低推断的可靠性。 所以,多个平均数的差异显著性检验不宜 用 t 检验,须采用方差分析法
方差分析是将k个处理的观测值作为一个整体 看待,把观测值总变异的偏差平方和及自由度分解 为相应于不同变异来源的偏差平方和及自由度,进 而获得不同变异来源的总体方差估计值;由总体方 差估计值构造F统计量,计算F值,检验各样本所属 总体平均数是否相等。 上一张 下一张 主 页 退 出 方差分析 (analysis of variance) 是由英国统计学家 R.A.Fisher于1923年提出的。 方差分析实质上是关于观测值变异原因的数量分析
方差分析是将k个处理的观测值作为一个整体 看待,把观测值总变异的偏差平方和及自由度分解 为相应于不同变异来源的偏差平方和及自由度,进 而获得不同变异来源的总体方差估计值;由总体方 差估计值构造F统计量,计算F值,检验各样本所属 总体平均数是否相等。 上一张 下一张 主 页 退 出 方差分析 (analysis of variance) 是由英国统计学家 R.A.Fisher于1923年提出的。 方差分析实质上是关于观测值变异原因的数量分析
1 方差分析的基本原理与步骤 1.1 线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n 次重复,共有nk个观测值。试验资料的数据模式 如表5-1所示。 上一张 下一张 主 页 退 出
1 方差分析的基本原理与步骤 1.1 线性模型与基本假定 假设某单因素试验有k个处理,每个处理有n 次重复,共有nk个观测值。试验资料的数据模式 如表5-1所示。 上一张 下一张 主 页 退 出
上一张 下一张 主 页 退 出 表5-1 k个处理每个处理有n个观测值的数据模式 表中 表示第i个处理的第j个观测值 i=1,2,.,k; j=1,2,.,n); ij x
上一张 下一张 主 页 退 出 表5-1 k个处理每个处理有n个观测值的数据模式 表中 表示第i个处理的第j个观测值 i=1,2,.,k; j=1,2,.,n); ij x
= = n j xi xij 1 . = = = = = k i i k i n j ij x x x 1 1 1 . . x x n xi n n j i ij . / ./ 1 = = = x x k n x k n k i n j i j . / . / 1 1 = = = = xij 上一张 下一张 主 页 退 出 表示第i个处理n个观测值之和; 表示全部观测值的总和; 表示第i个处理的平均数; 表示全部观测值的总平均数; 可以分解为: ij i ij x = + i 表示第i个处理n个观测值的总体平均数。 (5-1)
= = n j xi xij 1 . = = = = = k i i k i n j ij x x x 1 1 1 . . x x n xi n n j i ij . / ./ 1 = = = x x k n x k n k i n j i j . / . / 1 1 = = = = xij 上一张 下一张 主 页 退 出 表示第i个处理n个观测值之和; 表示全部观测值的总和; 表示第i个处理的平均数; 表示全部观测值的总平均数; 可以分解为: ij i ij x = + i 表示第i个处理n个观测值的总体平均数。 (5-1)
为了比较各处理的影响大小,将 再进行 分解,令 (5-2) (5-3) 则 (5-4) 其中μ表示所有试验观测值(nk个)总体的平均数; = = k i i k 1 1 i = i − ij i ij x = + + 上一张 下一张 主 页 退 出 i
为了比较各处理的影响大小,将 再进行 分解,令 (5-2) (5-3) 则 (5-4) 其中μ表示所有试验观测值(nk个)总体的平均数; = = k i i k 1 1 i = i − ij i ij x = + + 上一张 下一张 主 页 退 出 i
ai 是 第 i 个 处理的效应 (treatment effects)表示处理i对试验结果产生的影响。 显然有 (5-5) εij是试验误差,相互独立,且服从 正态分 布N(0,σ2)。 叫做单因素试验的线性模型 (linear model)亦称数学模型。 观察值xij表示为总平均数μ、处理效应αi、 试验误差εij之和。 0 1 = = k i i 上一张 下一张 主 页 退 出 ij i ij x = + +
ai 是 第 i 个 处理的效应 (treatment effects)表示处理i对试验结果产生的影响。 显然有 (5-5) εij是试验误差,相互独立,且服从 正态分 布N(0,σ2)。 叫做单因素试验的线性模型 (linear model)亦称数学模型。 观察值xij表示为总平均数μ、处理效应αi、 试验误差εij之和。 0 1 = = k i i 上一张 下一张 主 页 退 出 ij i ij x = + +
由εij 相互独立且服从正态分布N(0, σ2),可知各处理Ai(i=1,2,.,k)所属 总体亦应具正态性,即服从正态分布N(μi, σ2)。尽管各总体的均数 可以不等或相等, σ2则必须是相等的(外界试验条件尽可能保持一致,处 理效应才可比)。 所以,单因素试验的数学模型可归纳为: 效应的可加性(additivity)、分布的 正态性(normality)、方差的同质性 (homogeneity)。这是方差分析的前提条 件或基本假定。 上一张 下一张 主 页 退 出 i
由εij 相互独立且服从正态分布N(0, σ2),可知各处理Ai(i=1,2,.,k)所属 总体亦应具正态性,即服从正态分布N(μi, σ2)。尽管各总体的均数 可以不等或相等, σ2则必须是相等的(外界试验条件尽可能保持一致,处 理效应才可比)。 所以,单因素试验的数学模型可归纳为: 效应的可加性(additivity)、分布的 正态性(normality)、方差的同质性 (homogeneity)。这是方差分析的前提条 件或基本假定。 上一张 下一张 主 页 退 出 i