第六章试验设计与方差分析 、试验设计初步。 1、试验及其模型; 2、处理设计:单因素试验、多因素试验; 3、试验误差:系统误差、随机误差、错失误差; 4、试验的排列:设置重复、随机化、区组化、拉丁方试验。 二、方差分析一 ANOVA 方差分析( analysis of variance, ANOVA) 在研究一个变量时,能够解决多个总体的均值是否相等的检验问题 在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量 影响的一种方法。 1.方差分析的内容 首先我们对多个总体均值是否相等这一假设进行检验。 例6.1 某饮料生产企业硏制岀一种新型饮料.饮料的颜色共有四种:橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能
第六章 试验设计与方差分析 一、试验设计初步。 1 、试验及其模型; 2 、处理设计:单因素试验、多因素试验; 3 、试验误差:系统误差、随机误差、错失误差; 4 、试验的排列:设置重复、随机化、区组化、拉丁方试验。 二、方差分析 —ANOVA 方差分析( analysis of variance , ANOVA ) 在研究一个变量时,能够解决多个总体的均值是否相等的检验问题; 在研究多个变量对不同总体的影响时,它也是分析各个自变量对因变量 影响的一种方法。 1 .方差分析的内容 首先我们对多个总体均值是否相等这一假设进行检验。 例 6.1 某饮料生产企业研制出一种新型饮料 . 饮料的颜色共有四种 : 橘黄 色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能
影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收 集了该种饮料的销售情况。 该饮料在五家超市的销售情况 超市 无色 粉色 橘黄色 绿色 1 26.5 31.2 27.9 30.8 28.7 28.3 25.1 29.6 25.1 30.8 28.5 29.1 27.9 24.2 31.7 27.2 29.6 26.5 32.8 均值 27.32 29.56 26.44 31.46 进行方差分析 问题:饮料的颜色是否对销售量产生影响 在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验 饮料颜色对销售量是否有影响 H0:==H3=P4 H:PH2.,H不先全相筝 即
影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超市上收 集了该种饮料的销售情况。 该饮料在五家超市的销售情况: 超市 无色 粉色 橘黄色 绿色 1 2 3 4 5 26.5 28.7 25.1 29.1 27.2 31.2 28.3 30.8 27.9 29.6 27.9 25.1 28.5 24.2 26.5 30.8 29.6 32.4 31.7 32.8 均值 27.32 29.56 26.44 31.46 进行方差分析: 问题:饮料的颜色是否对销售量产生影响? 在其他条件相同的情况下,上述问题就归结为一个检验问题,即:检验 饮料颜色对销售量是否有影响? 即:
2.方差分析的原理 从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等, 我们可用方差比较的方法来判断 首先,四种颜色的销售情况可看作为分为四个组 组内平均数组内平方和SsA 组间平方和SSE 颜色 ∑2-x ∑(x-对 无色 27.32 10.688 粉色 29.56 8.572 橘黄色 26.44 13.192 68455 绿色 31.46 6.632 合计 39084 总平方和SST ∑(x-x =1T5.9295 由此可知:差异的产生来自两个方面 方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了 影响 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误 差,如相同颜色的饮料在不同的商场销售量也不同。 这两个方面产生的差异可以用两个方差来计量
2 .方差分析的原理 从方差分析的目的看,是要检验四种颜色的饮料的销售均值是否相等, 我们可用方差比较的方法来判断。 首先,四种颜色的销售情况可看作为分为四个组: 颜色 组内平均数 组内平方和 SSA 组间平方和 SSE 无色 27.32 10.688 76.8455 粉色 29.56 8.572 橘黄色 26.44 13.192 绿色 31.46 6.632 合计 - 39.084 总平方和 SST 由此可知:差异的产生来自两个方面: 一方面是由不同颜色的差异造成的,既不同的饮料颜色对销售量产生了 影响 另一方面是由于抽选样本的随机性而产生的差异,即各颜色内的随机误 差,如相同颜色的饮料在不同的商场销售量也不同。 这两个方面产生的差异可以用两个方差来计量:
一个称为水平之间(组间)差(组间平方和除以自由度(r-1),r为 组数),一个称为水平内部(组内)方差(组内平方和除以自由度(n-1),n 为样本容量总数 水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差 仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平 之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方 差就应该近似,从而应有 水平之而紅问)的方姜 水平内部狐而)方葚 即,两个方差的比值就会接近于1。反之,水平之间的方差就会大于 水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断 既不同的水平之间存在着显著差异。 因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝 原假设的判断。 F=平之严血河者丢→F(r-1,n一r)分布 水平内敏h基 水平间的方差和水平内方差之比是一个统计量,这个统计量服从F分 布
一个称为水平之间(组间)方差 ( 组间平方和除以自由度 (r-1) ,r 为 组数 ) ,一个称为水平内部(组内)方差(组内平方和除以自由度( n-1) , n 为样本容量总数)。 水平之间的方差既包括系统性因素,也包括随机性因素;水平内部方差 仅包括随机性因素。如果不同的水平(饮料颜色)对结果没有影响,那么在水平 之间的方差中,就仅仅有随机因素的差异,而没有系统性差异,它与水平内部方 差就应该近似,从而应有: 即,两个方差的比值就会接近于 1 。反之,水平之间的方差就会大于 水平内的方差,当这个比值达到某个程度,或者说达到某临界点,就可做出判断, 既不同的水平之间存在着显著差异。 因此,方差分析就是通过不同方差的比价,做出拒绝原假设或不能拒绝 原假设的判断。 水平间的方差和水平内方差之比是一个统计量,这个统计量服从 F 分 布:
3.方差分析的种类 单因素的方差分析 ne-Way ANOVA 分析一个变量时 多因素的方差分析 Univariate 分析多个变量时,称为多元方差分析 Multivariate 4.应用方差分析的条件 各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本 各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的 一元单因素方差分析 例6.1中有一个变量和一个因素,即:变量 dependent variable 饮料的销售量;因素 factor:饮料的颜色。 用Spss处理数据 spss数据:饮料的颜色 spss选项: Analyze- Compare Mean- One-Way ANOVA SPSS输出结果:
3 .方差分析的种类 分析多个变量时,称为多元方差分析 Multivariate 4 .应用方差分析的条件 各组的观察数据,要看作是从服从正态分布的总体随机抽取的样本; 各组的观察数据,是从具有相同方差的相互独立的总体中抽取得到的。 三、一元单因素方差分析 例 6.1 中有一个变量和一个因素,即:变量 dependent variable : 饮料的销售量;因素 factor :饮料的颜色。 用 Spss 处理数据: Spss 数据:饮料的颜色 Spss 选项: Analyze — Compare Mean — One-Way ANOVA SPSS 输出结果:
ANOVA 销售情况 Sum of Squares Mean Square Between Groups 76.846 3 25.615 10.486 000 Within Groups 39084 2.443 Total 115.929 19 SPSS单因素方差分析的进一步分析 SpSs单因素方差分析的前提检验 由于方差分析的前提是各水平下的总体服从方差相等的正态分布。其 中,正态分布的要求不是很严格,但对于方差相等的要求是比较严格的,因此, 我们有必要对方差分析的前提进行检验。检验的方法是: Homogeneity-of Varlance spss选项:在 One-Way aNOVA中选择 Option,选定 Homogeneity-of- varlance即可。 spSs输出结果 Test of Homogeneity of variances 销售情况 如mm 282 168381 spss单因素方差分析的多重比较检验 通过上面的检验我们只能判断控制变量的不同水平是否对观察变量产 生了显著影响。我们还想进一步了解:究竟是哪一个水平对观察变量产生了显著
SPSS 单因素方差分析的进一步分析 Spss 单因素方差分析的前提检验 由于方差分析的前提是各水平下的总体服从方差相等的正态分布。其 中,正态分布的要求不是很严格,但对于方差相等的要求是比较严格的,因此, 我们有必要对方差分析的前提进行检验。检验的方法是: Homogeneity-of -variance Spss 选项:在 One-Way ANOVA 中选择 Option ,选定 Homogeneity-of –variance 即可。 Spss 输出结果: Spss 单因素方差分析的多重比较检验 通过上面的检验,我们只能判断控制变量的不同水平是否对观察变量产 生了显著影响。我们还想进一步了解:究竟是哪一个水平对观察变量产生了显著
影响,即那种颜色的饮料对销售量有显著影响。这就是单因素方差分析的多重比 较检验。检验结果输出如下 Dependent variable:销售情况 95% Confidence interval 颜色(J颜色 Std erro Lower Bound Up 2.24000 98848 4.3355 1445 3.00 880098848 387 -1.2155 2.9755 -414000*98848 6.2355 -2.0445 2.00100 2.24000*98848 1445 4.3355 3.00 31200098848 006 1.0245 5.2155 98848 -39955 3.00 00 -80098848 387 -29755 1.2155 2.00 -3.1200098848 006 -5.2155 -1.0245 4.00 502000 2.9245 4.00 414000*98848 001 2.0445 6.2355 2.00 190000 98848 073 3.9955 3.00 2.9245 The mean difference is significant at the 05 level 四、一元多因素方差分析 1、只考虑主效应的方差分析 2、考虑交互效应的方差分析; 3、考虑多变量的方差分析 4、协方差分析。 例62 某商家有如下的数据研究这个问题的主要目的是看销售额是否受到促 销方式、售后服务和奖金这三个自变量的影响,以及怎样的影响
影响,即那种颜色的饮料对销售量有显著影响。这就是单因素方差分析的多重比 较检验。检验结果输出如下: 四、一元多因素方差分析。 1 、只考虑主效应的方差分析; 2 、考虑交互效应的方差分析; 3 、考虑多变量的方差分析; 4 、协方差分析。 例 6.2 某商家有如下的数据,研究这个问题的主要目的是看销售额是否受到促 销方式、售后服务和奖金这三个自变量的影响,以及怎样的影响
Dependent variable因变量:销售额 Factor因素:促销方式、售后服务 Covariate协变量:奖金 数据文件: Sales.sav 促销方式 售后服务 销售额 奖金 无(0) 无(0) 23.00 2.00 无(0) 无(0) 19.00 1.50 无(0) 无(0) 17.00 2.00 无(0) 无(0) 26.00 2.10 无(0) 有(1) 28.00 1.50 无(0) 有(1) 23.00 1.20 无(0) 有(1) 24.00 1.60 无(0) 有(1) 30.00 1.80 被动促销(1) 无(0) 26.00 1.80 被动促销(1) 无(0) 被动促销(1) 无(0) 20 被动促销(1) 无(0) 2.10 被动促销(1 有(1) 36 2.10 被动促销(1) 有(1) 28.00 1.21 被动促销(1) 有(1) 30.00 1.91 被动促销(1) 有(1) 主动促销(2) 无(0) 主动促销(2) 无(0) 23.00 主动促销(2) 无(0) 25 1.30 主动促销(2) 无(0) 32.00 192 主动促销(2) 有(1) 48.00 1.70 主动促销(2) 有(1 40.00 主动促销(2) 有(1) 41.00 1.20 主动促销(2) 有(1) 46.00 1.81 当有两个或两个以上因素,进行方差分析时,不仅要考虑每个因素的主效 应,往往还要考虑因素与因素之间的交互效应
Dependent variable 因变量:销售额 Factor 因素:促销方式、售后服务 Covariate 协变量:奖金 数据文件: Sales.sav 当有两个或两个以上因素,进行方差分析时,不仅要考虑每个因素的主效 应,往往还要考虑因素与因素之间的交互效应
主效应就是每个因素对因变量的单独影响而交互效应是当两个或更多 的因素的某些水平同时出现时除了主效应之外的附加影响 1.只考虑主效应的方差分析 首先假定自变量受到的仅仅有不同因素的主效应( main effect)而 没有交互效应( Interaction)和协变量的影响 即 因变量=因素A主效应+因素B的主效应+随机误差项 销售额=促销方式+售后服务+随机误差项 以例6.2来说,当只考虑主效应时,假定主动促销比被动促销可以多 产生8万元效益,而有售后服务比没有售后服务多产生9万元效益。那么在 没有交互作用时,同时采取主动促销和售后服务会产生8+9=17万元的 效益(称为可加的) 但如果存在交互效应,那么同时采取主动促销和售后服务会产生一个附 加的效应即交互效应(一般来说也可能是正面的,也可能是负面的),这时的总 效应就不是17万元了 用Spss处理数据 Spss itLi: Analyze- Gereral Linear Model- Univariate 选择效应分析:M。 del- custom- Main effect
主效应就是每个因素对因变量的单独影响,而交互效应是当两个或更多 的因素的某些水平同时出现时除了主效应之外的附加影响。 1 .只考虑主效应的方差分析 首先假定自变量受到的仅仅有不同因素的主效应( main effect )而 没有交互效应( interaction )和协变量的影响。 即: 因变量 = 因素 A 主效应 + 因素 B 的主效应 + 随机误差项 销售额 = 促销方式 + 售后服务 + 随机误差项 以例 6.2 来说,当只考虑主效应时,假定主动促销比被动促销可以多 产生 8 万元效益,而有售后服务比没有售后服务多产生 9 万元效益。那么在 没有交互作用时,同时采取主动促销和售后服务会产生 8 + 9 = 17 万元的 效益(称为可加的)。 但如果存在交互效应,那么同时采取主动促销和售后服务会产生一个附 加的效应即交互效应(一般来说也可能是正面的,也可能是负面的),这时的总 效应就不是 17 万元了。 用 Spss 处理数据: Spss 选项: Analyze— Gereral Linear Model — Univariate 选择效应分析: Model— custom— Main effect
sts of Between - Suh bjects]Effects Dependent Variable: sales Type Ill Sum of Squares df Mean S Corrected Model 11112923 37043117752 000 Intercept 20358375 20358375975641 579.250 289625 13880 00 serice 532042 53204225497 000 Error 17.333 20 21887.000 a R Squared=. 727(Adjusted R Squared= 686) SpSs主效应输出结果 Estimated Marginal Means of SALES SERVICE 没有交互作用的模型可以从下面点图中直观看出。图中下面一条折线连接 了没有售后服务时三种促销状况的销售均值而上面一条连接了有售后服务时 种促销状况的销售均值。由于模型选择为无交互作用,所以这两条线是平行的。 从该图可以看出,两个因子效应综合效应是简单的加法 考虑交互效应的方差分析
Spss 主效应输出结果: 没有交互作用的模型可以从下面点图中直观看出。图中下面一条折线连接 了没有售后服务时三种促销状况的销售均值,而上面一条连接了有售后服务时三 种促销状况的销售均值。由于模型选择为无交互作用,所以这两条线是平行的。 从该图可以看出,两个因子效应综合效应是简单的加法。 2 .考虑交互效应的方差分析