第三章方差分析
1 第三章 方差分析
案例1哪种促销方式效果最好? 某大型连锁超市为研究各种促销方式的效果, 选择小包装食品在其下属五个门店分别采用某种 促销方式各进行了4个月的试验。试验前该类食 品在这五个门店的月销售额基本相同。试验结果 如下: 促销方式 月销售额(万元) A1(通常销售)12.515.411.813.2 A2广告宣传)13.114.712313.6 A3(有奖销售)15.616.513.413.1 A4(特价销售)17.919.621.820.4 A5(买一送一)18.217.116.516.2
2 案例1 哪种促销方式效果最好? 某大型连锁超市为研究各种促销方式的效果, 选择小包装食品在其下属五个门店分别采用某种 促销方式各进行了4个月的试验。试验前该类食 品在这五个门店的月销售额基本相同。试验结果 如下: 促销方式 月销售额(万元) A1(通常销售) 12.5 15.4 11.8 13.2 A2(广告宣传) 13.1 14.7 12.3 13.6 A3(有奖销售) 15.6 16.5 13.4 13.1 A4(特价销售) 17.9 19.6 21.8 20.4 A5(买一送一) 18.2 17.1 16.5 16.2
案例2如何确定最优生产工艺? 影响某化工厂化工产品得率的主要因素是反应温度和 使用的催化剂种类。为研究产品的最优生产工艺,在其 他条件不变的情况下,选择了四种温度和三种催化剂, 在不同温度和催化剂的组合下各做了一次试验,测得结 果如下: 化工产品得率试验(得率:% 催化剂 温度 A1(6O℃C) 66 A2(70℃) 81 96 53 A2(80) 97 79 66 A4(90) 79 76 88
3 案例2 如何确定最优生产工艺? 影响某化工厂化工产品得率的主要因素是反应温度和 使用的催化剂种类。为研究产品的最优生产工艺,在其 他条件不变的情况下,选择了四种温度和三种催化剂, 在不同温度和催化剂的组合下各做了一次试验,测得结 果如下: 化工产品得率试验(得率:%) 催化剂 温度 B1 B2 B3 A1(60 O C) 66 73 70 A2(70 O C) 81 96 53 A3(80 O C) 97 79 66 A4(90 O C) 79 76 88
案例2要研究的问题 1.温度是否对该产品的得率有显著影响?若确 有显著影响,应将温度控制在什么范围内可使得 率最高? 2.催化剂是否对该产品的得率有显著影响?若 确有显著影响,哪种催化剂的效果最好? 3.温度和催化剂的不同组合是否对产品得率 有显著影响?如确有显著影响,哪种温度和催 化剂的组合可使得率最高?
4 案例2要研究的问题 1.温度是否对该产品的得率有显著影响?若确 有显著影响,应将温度控制在什么范围内可使得 率最高? 2.催化剂是否对该产品的得率有显著影响?若 确有显著影响,哪种催化剂的效果最好? 3.温度和催化剂的不同组合是否对产品得率 有显著影响?如确有显著影响,哪种温度和催 化剂的组合可使得率最高?
§31方差分析概述 方差分析的基本概念 试验中状态发生变化的因素用字母A,B,C…表示;称 因素在试验中所取的不同状态为水平。因素A的a个水平 记为A1:A2,A3,…,Aa;因素B的b个水平记为B1,B2…,Bb等。 若试验中只有一个变动的因素,就称为单因素试验; 若有两个变动的因素,就称为双因素试验;若有两个以 上的变动因素,则称为多因素试验 、方差分析的基本假设 设因素A在水平A下的某项指标为总体X,i=1,2,a, 则假定各X服从相互独立的同方差正态分布,即 X~N(μ1,σ2),X1相互独立
5 §3.1 方差分析概述 一. 方差分析的基本概念 试验中状态发生变化的因素用字母A,B,C … 表示;称 因素在试验中所取的不同状态为水平。因素A的a个水平 记为A1 ,A2 ,A3 ,…,Aa;因素B的b个水平记为B1 ,B2 ,…,Bb等。 若试验中只有一个变动的因素,就称为单因素试验; 若有两个变动的因素,就称为双因素试验;若有两个以 上的变动因素,则称为多因素试验。 二、方差分析的基本假设 设因素A在水平Ai下的某项指标为总体Xi,i=1,2,…,a, 则假定各Xi服从相互独立的同方差正态分布,即 Xi ~N(i,2 ), Xi相互独立
方差分析的目的 方差分析的目的,就是要检验原假设 0:μ1= 是否成立。若拒绝H,就说明因素A对试验结 果有显著影响,进一步还应确定使效果达到最佳 的水平;若不能拒绝H,则说明因素A对该项指 标无显著影响,试验结果中的差异主要是由其他 未加控制的因素和试验误差所引起的。 虽然可以通过对各u用两两t检验法来检验各H 间是否存在显著差异,但t检验无法检验多个因素 间的交互效应,而这正是方差分析要解决的主要 问题
6 三. 方差分析的目的 方差分析的目的,就是要检验原假设 H0: 1 = 2 = … = a 是否成立。若拒绝H0,就说明因素A对试验结 果有显著影响,进一步还应确定使效果达到最佳 的水平;若不能拒绝H0,则说明因素A对该项指 标无显著影响,试验结果中的差异主要是由其他 未加控制的因素和试验误差所引起的。 虽然可以通过对各i用两两t检验法来检验各i 间是否存在显著差异,但t检验无法检验多个因素 间的交互效应,而这正是方差分析要解决的主要 问题
§32单因素方差分析 单因素试验的数据模型 设水平A下的n个试验结果为x 1,2,3.,a,j=1,2,3.,n;它们是总体X的一组 样本观察值,。则x,;有如下数据模型: x=1+81=12,…,a;j=1,2,…,n1(3.2-1 E;~N(O,a2),且相互独立 其中:x是可以观察到的试验结果;6;是由各 种无法控制的因素引起的,称为不可观察的随机 误差或试验误差
7 §3.2 单因素方差分析 一.单因素试验的数据模型 设水平Ai下的 ni个试验结果为 xij ; i=1,2,3…,a,j=1,2,3…,ni;它们是总体Xi的一组 样本观察值,。则 xij 有如下数据模型: xij= i+ ij,i=1,2,…,a;j=1,2,…,ni (3.2-1) ij ~N(0, 2 ),且相互独立 其中:xij 是可以观察到的试验结果;ij是由各 种无法控制的因素引起的,称为不可观察的随机 误差或试验误差
二.需要引进的记号 称11=∑niu;(N=∑n)为一般平均,它是a个不 同水平总体均值的加权平均;称 C iμ; a 为水平A1的效应,它反映了X的均值与一般平均的差 异,于是,(3,2-1)式可改写为 C;+8 上式表明任一观察值由一般平均、水平的效应和试验 误差三部分组成。于是要检验的原假设也可改写为: 0:C1=02 0
8 二. 需要引进的记号 称 ( N= ni ) 为一般平均,它是a个不 同水平总体均值的加权平均;称 i= i-;i=1,2,…,a 为水平Ai 的效应,它反映了Xi 的均值与一般平均的差 异,于是,(3.2-1)式可改写为 xij= + i+ ij 上式表明任一观察值由一般平均、水平的效应和试验 误差三部分组成。于是要检验的原假设也可改写为: H0:1= 2=…=a=0 = i niμ i N 1 μ
偏差平方和及其分解 1.总的偏差平方和 称S1=∑∑(x-x)2:(x=N∑∑x) 为总的偏差平方和,它反映了数据x间总的 波动量大小。 为便于对Sr进行分解,记 ∑
9 三.偏差平方和及其分解 1.总的偏差平方和 称 ;( ) 为总的偏差平方和,它反映了数据 xij 间总的 波动量大小。 为便于对 ST 进行分解,记 = − i j 2 T S (x x) ij = i j x xij N 1 = j ij i i x n x 1
2.平方和的分解 r=∑∑(x-x)+∑n1(x-x)=S。+SA 其中 S。=∑∑(xn-x)2;SA=Σn1(x-x)2 S反映了各样本内的数据波动,它主要是由随 机误差所引起的,称为误差平方和或组内平方和 SA反映了各样本间数据的差异,主要是由A的 不同水平的效应间的差异所引起的,称为因素A 的平方和或组间平方和
10 2.平方和的分解 其中 ; Se反映了各样本内的数据波动,它主要是由随 机误差所引起的,称为误差平方和或组内平方和。 SA反映了各样本间数据的差异,主要是由A的 不同水平的效应间的差异所引起的,称为因素A 的平方和或组间平方和。 e A i j i 2 2 ST = (xi j − xi ) + ni (xi − x) = S +S = − i j 2 e S ( ) ij i x x = − i 2 A S n (x x) i i