第四章方差分析 第一节概述 第二节单因素试验方差分析 第三节双因素试验方差分析 第四节多重比较
第四章 方差分析 第一节 概述 第二节 单因素试验方差分析 第三节 双因素试验方差分析 第四节 多重比较
什么是方差分析? (概念要点) 1、检验多个总体均值是否相等 通过对各观察数据误差来源的分析 来判断多个总体均值是否相等 2、变量 个定类尺度的自变量 2个或多个(k个)处理水平或分类 个定距或比例尺度的因变量 3、用于分析完全随机化试验设计
什么是方差分析? (概念要点) 1、检验多个总体均值是否相等 ▪ 通过对各观察数据误差来源的分析 来判断多个总体均值是否相等 2、变量 – 一个定类尺度的自变量 2个或多个 (k 个) 处理水平或分类 – 一个定距或比例尺度的因变量 3、用于分析完全随机化试验设计
什么是方差分析? (一个例子) 【例81】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种, 分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道 价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、 经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见 表8-1。试分析饮料的颜色是否对销售量产生影响。 表8-1该饮料在五家超市的销售情况 超市无色粉色橘黄色色 26.5 31.2 27.9 30.8 12345 28.7 28.3 25.1 29.6 25.1 30.8 28.5 32.4 29.1 27.9 24.2 31.7 27.2 29.6 26.5 32.8
什么是方差分析? (一个例子) 表8-1 该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色 1 2 3 4 5 26.5 28.7 25.1 29.1 27.2 31.2 28.3 30.8 27.9 29.6 27.9 25.1 28.5 24.2 26.5 30.8 29.6 32.4 31.7 32.8 【例8.1】某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种, 分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道 、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、 经营规模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见 表8-1。试分析饮料的颜色是否对销售量产生影响
什么是方差分析? (例子的进一步分析) ①检验饮料的颜色对销售量是否有影响,也就 是检验四种颜色饮料的平均销售量是否相同 ②设μ为无色饮料的平均销售量,μ2粉色饮料的 平均销售量,μ3为橘黄色饮料的平均销售量 μ4为绿色饮料的平均销售量,也就是检验下 面的假设 ①H:μ1=μ2=3= ②H,2,3,4不全相等 ③检验上述假设所采用的方法就是方差分析
什么是方差分析? (例子的进一步分析) ① 检验饮料的颜色对销售量是否有影响,也就 是检验四种颜色饮料的平均销售量是否相同 ② 设1为无色饮料的平均销售量,2粉色饮料的 平均销售量,3为橘黄色饮料的平均销售量, 4为绿色饮料的平均销售量,也就是检验下 面的假设 ① H0 : 1 = 2 = 3 = 4 ② H1 : 1 , 2 , 3 , 4 不全相等 ③ 检验上述假设所采用的方法就是方差分析
第一节概述 、方差分析的必要性 二、方差分析的基本思想 、方差分析的几点基本条件
第一节 概 述 一、方差分析的必要性 二、方差分析的基本思想 三、方差分析的几点基本条件
、方差分析的必要性 t检验法适用于样本平均数与总体平均数及两样本 平均数间的差异显著性检验,但在生产和科学研究中 经常会遇到比较多个处理优劣的问题,即需进行多个 平均数间的差异显著性检验。这时,若仍采用t检验法 就不适宜了。这是因为: 1、对原始资料的利用率很低; 2、破坏了原先的整体设计,将本属于单因素多水 平或者多因素设计或重复测量设计割裂成多个单因素 二水平的设计;
一、方差分析的必要性 t检验法适用于样本平均数与总体平均数及两样本 平均数间的差异显著性检验,但在生产和科学研究中 经常会遇到比较多个处理优劣的问题,即需进行多个 平均数间的差异显著性检验。这时,若仍采用t检验法 就不适宜了。这是因为: 1、对原始资料的利用率很低; 2、破坏了原先的整体设计,将本属于单因素多水 平或者多因素设计或重复测量设计割裂成多个单因素 二水平的设计;
3犯假阳性错误的概率大大增加,因为检验只 能将每次比较时犯假阳性错误的概率控制在规定的显 著性水平上(即事先给定的值),而多次检验之后 犯假阳性错误的总概率将随着比较的次数n的增大而 趋向于1 4.当实验中同时涉及二个或二个以上处理因素时, 因素之间往往存在不可忽视的交互作用,而团检验割 裂了因素之间的内在联系,无法考察交互作用是否具 有显著性意义;
3.犯假阳性错误的概率大大增加,因为t检验只 能将每次比较时犯假阳性错误的概率控制在规定的显 著性水平上(即事先给定的α值),而多次t检验之后 犯假阳性错误的总概率将随着比较的次数n的增大而 趋向于1; 4.当实验中同时涉及二个或二个以上处理因素时, 因素之间往往存在不可忽视的交互作用,而t检验割 裂了因素之间的内在联系,无法考察交互作用是否具 有显著性意义;
5由于不同组均数之间比较的t检验所用的标准 误(即公式的分母)在不断改变,t统计量的自由度小 (因为资料的利用率低)。所以,多次运用检验的过 程中,评价标准不统一。 综上所述,充分说明用检验处理非单因素 水平的设计资料是不合适的。 因此对于多个总体样本均值的假设检验,需要用 方差分析方法
5.由于不同组均数之间比较的t检验所用的标准 误(即公式的分母)在不断改变,t统计量的自由度小 (因为资料的利用率低)。所以,多次运用t检验的过 程中,评价标准不统一。 综上所述,充分说明用t检验处理非单因素一、二 水平的设计资料是不合适的。 因此对于多个总体样本均值的假设检验,需要用 方差分析方法
二、方差分析的基本思想 方差分析( analysis of variance)是由英国统计学家 R.A. Fisher于1923年提出的。 方差分析的实质就是检验多个正态总体均值是否相等。 假设某单因素试验有k个处理,每个处理有n次重复, 共有nk个观测值。这类试验资料的数据模式如表所示。 处理 观 值 合计x,平均 A x x E1.+2 A 21 x22+ 和 2 A x;: x XsI. Xs,+ 合计 x
二、方差分析的基本思想 方差分析(analysis of variance) 是由英国统计学家 R.A.Fisher于1923年提出的。 方差分析的实质就是检验多个正态总体均值是否相等。 假设某单因素试验有k个处理,每个处理有n次重复, 共有nk个观测值。这类试验资料的数据模式如表所示
表中的数据是参差不齐的,数据波动的可能原因来 自两个方面:一是由于因素的水平不同,二是来自偶然 误差。因素的水平的变化引起的试验数据波动称为条件 误差;由随机因素引起的试验数据波动称为随机误差或 试验误差。 方差分析就是把试验数据的总波动分解为两部分, 部分反映由条件误差引起的波动,另一部分反映由试 验误差引起的波动
表中的数据是参差不齐的,数据波动的可能原因来 自两个方面:一是由于因素的水平不同,二是来自偶然 误差。因素的水平的变化引起的试验数据波动称为条件 误差;由随机因素引起的试验数据波动称为随机误差或 试验误差。 方差分析就是把试验数据的总波动分解为两部分, 一部分反映由条件误差引起的波动,另一部分反映由试 验误差引起的波动