《生物统计》第五章回归分析

前几章的方法都只涉及一种变量,主要是比较它的各组值之间的差异。但生物学所涉及的问题是多种多样的,对许多问题的研究需要考虑不只一个变量,例如生物的生长发育速度就与温度,营养,湿度……等许多因素有关,我们常常需要研究类似的多个变量之间的关系这种关系可分为两大类,即相关关系与回归关系。

团购合买资源类别：文库，文档格式：DOC，文档页数：29，文件大小：994.5KB

第五章回归分析前几章的方法都只涉及一种变量,主要是比较它的各组值之间的差异。但生物学所涉及的问题是多种多样的,对许多问题的研究需要考虑不只一个变量,例如生物的生长发育速度就与温度,营养,湿度……等许多因素有关,我们常常需要研究类似的多个变量之间的关系这种关系可分为两大类,即相关关系与回归关系。相关关系:两变量Ⅹ,Y均为随机变量,任一变量的每一可能值都有另一变量的一个确定分布与之对应回归关系:ⅹ是非随机变量或随机变量,Y是随机变量,对ⅹ的每一确定值ⅹ都有Y的一个确定分布与之对应从上述定义可看出相关关系中的两个变量地位是对称的,可以认为它们互为因果:而回归关系中则不是这样,我们常称回归关系中的X是自变量,而Y是因变量。即把X视为原因,而把Y视为结果。这两种关系尽管有意义上的不同,分析所用的数学概念与推导过程也有所不同,但如果我们使用共同的标准即使y的残差平方和最小(最小二乘法,详见下述),则不管是回归关系还是相关关系都可以得到相同的参数估计式。因此本章将集中讨论数学处理较简单的回归关系,且Ⅹ限定为非随机变量。从这些讨论中所得到的参数估计式也可用于X为随机变量的情况,但我们不再讨论X为随机变量时的证明与推导。另外,回归分析和相关分析的目的也有所不同。回归分析研究的重点是建立X与Y之间的数学关系式,这种关系式常常用于预测,即知道一个新的X取值,然后预测在此情况下的Y的取值:而相关分析的重点则放在研究ⅹ与Y两个随机变量之间的共同变化规律例如当X增大时Y如何变化,以及这种共变关系的强弱。由于这种研究目的的不同,有时也会引起标准和方法上的不同,我们将在相关分析一节中作进一步介绍从两个变量间相关(或回归)的程度来看,可分为以下三种情况: (1)完全相关。此时一个变量的值确定后,另一个变量的值就可通过某种公式求出来:即一个变量的值可由另一个变量所完全决定。这种情况在生物学研究中是不太多见的 (2)不相关。变量之间完全没有任何关系。此时知道一个变量的值不能提供有关另一个变量的任何信息。 (3)统计相关(不完全相关)。介于上述两种情况之间。也就是说,知道一个变量的值通过某种公式就可以提供关于另一个变量一些信息,通常情况下是提供有关另一个变量的均值的信息。此时知道一个变量的取值并不能完全决定另一个变量的取值,但可或多或少地决定它的分布。这是科研中最常遇到的情况。本章讨论主要针对这种情况进行。为简化数学推导, 本章中如无特别说明,一律假设Ⅹ为非随机变量,即ⅹ只是一般数字,并不包含有随机误差。但所得结果可以推广到ⅹ为随机变量的情况按相关中涉及公式类型可把相关关系分为线性相关和非线性相关。在多数情况下,我们提到相关关系时都是指线性相关,这是因为线性相关的理论已经很完善,数学处理也很简单而非线性问题则需要具体问题具体分析,常常没有什么好的解决方法,理论上能得到的结果也很有限(详见§5.4)。因此在一般情况下我们常常只能解决线性相关的问题。也正是因为如此,在不加说明的情况下提到相关时常常是指线性相关;如概率论基础部分曾提到独立可以推出不相关,而逆命题不成立。讨论回归关系时也有类似现象下面我们就来讨论回归关系中最简单的情况:一元线性回归。 §5.1一元线性回归

第五章回归分析前几章的方法都只涉及一种变量，主要是比较它的各组值之间的差异。但生物学所涉及的问题是多种多样的，对许多问题的研究需要考虑不只一个变量，例如生物的生长发育速度就与温度，营养，湿度……等许多因素有关，我们常常需要研究类似的多个变量之间的关系。这种关系可分为两大类，即相关关系与回归关系。相关关系：两变量 X，Y 均为随机变量，任一变量的每一可能值都有另一变量的一个确定分布与之对应。回归关系：X 是非随机变量或随机变量，Y 是随机变量，对 X 的每一确定值 xi 都有 Y 的一个确定分布与之对应。从上述定义可看出相关关系中的两个变量地位是对称的，可以认为它们互为因果；而回归关系中则不是这样，我们常称回归关系中的 X 是自变量，而 Y 是因变量。即把 X 视为原因，而把 Y 视为结果。这两种关系尽管有意义上的不同，分析所用的数学概念与推导过程也有所不同，但如果我们使用共同的标准即使 y 的残差平方和最小（最小二乘法，详见下述），则不管是回归关系还是相关关系都可以得到相同的参数估计式。因此本章将集中讨论数学处理较简单的回归关系，且 X 限定为非随机变量。从这些讨论中所得到的参数估计式也可用于 X 为随机变量的情况，但我们不再讨论 X 为随机变量时的证明与推导。另外，回归分析和相关分析的目的也有所不同。回归分析研究的重点是建立 X 与 Y 之间的数学关系式，这种关系式常常用于预测，即知道一个新的 X 取值，然后预测在此情况下的 Y 的取值；而相关分析的重点则放在研究 X 与 Y 两个随机变量之间的共同变化规律，例如当 X 增大时 Y 如何变化，以及这种共变关系的强弱。由于这种研究目的的不同，有时也会引起标准和方法上的不同，我们将在相关分析一节中作进一步介绍。从两个变量间相关（或回归）的程度来看，可分为以下三种情况：（1）完全相关。此时一个变量的值确定后，另一个变量的值就可通过某种公式求出来；即一个变量的值可由另一个变量所完全决定。这种情况在生物学研究中是不太多见的。（2）不相关。变量之间完全没有任何关系。此时知道一个变量的值不能提供有关另一个变量的任何信息。（3）统计相关（不完全相关）。介于上述两种情况之间。也就是说，知道一个变量的值通过某种公式就可以提供关于另一个变量一些信息，通常情况下是提供有关另一个变量的均值的信息。此时知道一个变量的取值并不能完全决定另一个变量的取值，但可或多或少地决定它的分布。这是科研中最常遇到的情况。本章讨论主要针对这种情况进行。为简化数学推导，本章中如无特别说明，一律假设 X 为非随机变量，即 X 只是一般数字，并不包含有随机误差。但所得结果可以推广到 X 为随机变量的情况。按相关中涉及公式类型可把相关关系分为线性相关和非线性相关。在多数情况下，我们提到相关关系时都是指线性相关，这是因为线性相关的理论已经很完善，数学处理也很简单；而非线性问题则需要具体问题具体分析，常常没有什么好的解决方法，理论上能得到的结果也很有限（详见§5.4）。因此在一般情况下我们常常只能解决线性相关的问题。也正是因为如此，在不加说明的情况下提到相关时常常是指线性相关；如概率论基础部分曾提到独立可以推出不相关，而逆命题不成立。讨论回归关系时也有类似现象。下面我们就来讨论回归关系中最简单的情况：一元线性回归。 §5.1 一元线性回归

点击下载完整版文档（DOC格式）

共29页，试读已结束，阅读完整版请下载

点击下载（DOC格式）

浏览记录

《生物统计》第五章回归分析

《生物统计》第五章 回归分析

《生物统计》第五章回归分析