《生物统计》第六章协方差分析

协方差分析是把方差分析与回归分析结合起来的一种统计分析方法。它用于比较一个变量Y在一个或几个因素不同水平上的差异,但Y在受这些因素影响的同时,还受到另个变量X的影响,而且X变量的取值难以人为控制,不能作为方差分析中的一个因素处理。此时如果X与Y之间可以建立回归关系,则可用协方差分析的方法排除X对Y的影响,然后用方差分析的方法对各因素水平的影响作出统计推断。

团购合买资源类别：文库，文档格式：DOC，文档页数：10，文件大小：259.5KB

第六章协方差分析协方差分析是把方差分析与回归分析结合起来的一种统计分析方法。它用于比较一个变量Y在一个或几个因素不同水平上的差异,但Y在受这些因素影响的同时,还受到另一个变量X的影响,而且X变量的取值难以人为控制,不能作为方差分析中的一个因素处理。此时如果X与Y之间可以建立回归关系,则可用协方差分析的方法排除X对Y的影响,然后用方差分析的方法对各因素水平的影响作出统计推断。在协方差分析中,我们称Y为因变量,X 为协变量也许有人会问随机因素的影响也是不能人为控制的,为什么不能把X作为一种随机因素处理呢?这里的差异主要在于作为随机因素处理时虽然每一水平的影响是不能人为控制的, 但我们至少可以得到几个属于同一水平的重复,因此可以把它们分别用另一因素的不同水平处理。最后在进行方差分析时,我们才能排除这一随机因素的影响,对另一因素的各水平进行比较。这一点可从以下的计算公式中看出来: Ss4=∑(x-X)2 SSB=∑(x-x)2 在上述公式中,如果第一个下标i变化时相同的j所代表的第二个因素的水平都不相同,就没有理由认为下面的(*)式一定会成立,也就不能认为SSA仅是第一个因素的影响对于系统分组的方差分析,虽然不同的i中同一个j的取值可以不同,但仍要求 ∑B()=0,i=12…a 这样就保证了在x中可以消去第二个因素的影响。如果我们对第二个因素的取值完全无法控制,那就意味着对于不同的i,β的变化是完全没有规律的,当然也就不可能满足上述的 (*)式,此时就没有办法采用方差分析的方法,只能把第二个因素视为另一个变量X,试试用协方差分析的方法排除它的影响了例如当我们考虑动物窝别对增重的影响时,一般我们可把它当作随机因素处理,这一方面是由于它不容易数量化,另一方面是同一窝一般有几只动物,可分别接受另一因素不同水平的处理;如果我们考虑试验开始前动物初始体重的影响,这时一般方法是选初始重量相同的动物作为一组,分别接受另一因素的不同水平处理,此时用方差分析也无问题。但若可供试验的动物很少,初始体重又有明显差异,无法选到相同体重的动物,那就只好认为初始体重X与最终体重Y有回归关系,采用协方差分析的方法排除初始体重的影响,再来比较其他因素例如饲料种类,数量对增重的影响了消除初始体重影响的另一种方法是对最终体重与初始体重的差值即yⅹ进行统计分析这种方法与协方差分析的生物学意义是不同的。对差值进行分析是假设初始体重对以后的体重增量没有任何影响,而协方差分析则是假设最终体重中包含初始体重的影响,这种影响的大小与初始体重成正比。如果这一比值为1,协方差分析与对差值进行方差分析是相同的。但如果比值不为1,它们的结果将是不同的。也就是说协方差分析是假设使初始体重不同的因素在以后的生长过程中也会发挥作用,而对差值进行方差分析是假设这些因素以后不再发挥作用:这两种生物学假设显然是不同。希望同学们在学习一种统计方法时不仅要注意它与

第六章协方差分析协方差分析是把方差分析与回归分析结合起来的一种统计分析方法。它用于比较一个变量 Y 在一个或几个因素不同水平上的差异，但 Y 在受这些因素影响的同时，还受到另一个变量 X 的影响，而且 X 变量的取值难以人为控制，不能作为方差分析中的一个因素处理。此时如果 X 与 Y 之间可以建立回归关系，则可用协方差分析的方法排除 X 对 Y 的影响，然后用方差分析的方法对各因素水平的影响作出统计推断。在协方差分析中，我们称 Y 为因变量，X 为协变量。也许有人会问随机因素的影响也是不能人为控制的，为什么不能把 X 作为一种随机因素处理呢？这里的差异主要在于作为随机因素处理时虽然每一水平的影响是不能人为控制的，但我们至少可以得到几个属于同一水平的重复，因此可以把它们分别用另一因素的不同水平处理。最后在进行方差分析时，我们才能排除这一随机因素的影响，对另一因素的各水平进行比较。这一点可从以下的计算公式中看出来： 2 . .. = ( − ) i SS A Xi X =   − j SSB X j X 2 .. ( ) 在上述公式中，如果第一个下标 i 变化时相同的 j 所代表的第二个因素的水平都不相同，就没有理由认为下面的（*）式一定会成立，也就不能认为 SSA 仅是第一个因素的影响了。对于系统分组的方差分析，虽然不同的 i 中同一个 j 的取值可以不同，但仍要求 = = = b j j i i a 1  ( ) 0, 1,2, （*）这样就保证了在 X i. 中可以消去第二个因素的影响。如果我们对第二个因素的取值完全无法控制，那就意味着对于不同的 i，βj 的变化是完全没有规律的，当然也就不可能满足上述的（*）式，此时就没有办法采用方差分析的方法，只能把第二个因素视为另一个变量 X，试试用协方差分析的方法排除它的影响了。例如当我们考虑动物窝别对增重的影响时，一般我们可把它当作随机因素处理，这一方面是由于它不容易数量化，另一方面是同一窝一般有几只动物，可分别接受另一因素不同水平的处理；如果我们考虑试验开始前动物初始体重的影响，这时一般方法是选初始重量相同的动物作为一组，分别接受另一因素的不同水平处理，此时用方差分析也无问题。但若可供试验的动物很少，初始体重又有明显差异，无法选到相同体重的动物，那就只好认为初始体重 X 与最终体重 Y 有回归关系，采用协方差分析的方法排除初始体重的影响，再来比较其他因素例如饲料种类，数量对增重的影响了。消除初始体重影响的另一种方法是对最终体重与初始体重的差值即 y-x 进行统计分析。这种方法与协方差分析的生物学意义是不同的。对差值进行分析是假设初始体重对以后的体重增量没有任何影响，而协方差分析则是假设最终体重中包含初始体重的影响，这种影响的大小与初始体重成正比。如果这一比值为 1，协方差分析与对差值进行方差分析是相同的。但如果比值不为 1，它们的结果将是不同的。也就是说协方差分析是假设使初始体重不同的因素在以后的生长过程中也会发挥作用，而对差值进行方差分析是假设这些因素以后不再发挥作用；这两种生物学假设显然是不同。希望同学们在学习一种统计方法时不仅要注意它与

其他方法算法上有什么不同，更要注意算法背后的生物学假设有什么不同，这种深层次的理解有助于我们在今后的工作中选取正确的统计方法。由于协方差分析的过程包含了对协变量影响是否存在及其大小等一系列统计检验与估计，它显然比对差值进行分析等方法有更广泛的适用范围，因此除非有明显证据说明对差值进行分析的生物学假设是正确的，一般情况下还是应采用协方差分析的方法。协方差分析的计算是比较复杂的。在本章中我们重点介绍最简单的协方差分析的算法，即一个协变量，单因素的协方差分析。 §6.1 协方差分析的基本原理我们以最简单的情况：一个协变量，单因素的协方差分析为例对协方差分析的基本原理加以说明。一、统计模型：在协方差分析中，我们认为每一个因变量的观察值可分解为以下各部分的和： ij i ij ij y =  + + (x − x..) +  （6.1） i = 1, 2 … a, j = 1, 2 … n。其中 yij：第 i 水平的第 j 次观察值。 xij：i 水平的 j 次观察的协变量取值。 .. x ：xij 的总平均数。  ：yij 的总平均数。  i :第 i 水平的效应。 β：Y 对 X 的线性回归系数。 ij  ：随机误差。需要满足的条件为：（1） ij  ~NID(0, σ2 ) （2）β≠0，即 Y 与 X 存在线性关系，且各水平回归系数相等，即协变量的影响不随水平的变化而改变。（3）处理效应之和为 0，即： = = a i i 1  0 。上述第三个条件说明该因素为固定因素。若为随机因素，则应该为处理效应的方差为 0。模型（6.1）式也可写为： ij i ij ij y =  + + x +  ，（6.2）这种写法看起来简单一点，它的缺点是不再是 Y 的总平均值，因为 y.. x..  =  +  。我们以后的讨论针对(6.1)式进行。二、协方差分析的统计量：进行协方差分析需计算以下统计量：

点击下载完整版文档（DOC格式）

已到末页，全文结束

点击下载（DOC格式）

浏览记录

《生物统计》第六章协方差分析

《生物统计》第六章 协方差分析

《生物统计》第六章协方差分析