第7章回归分析和方差分析 回归分析是描述数据处理方法的 门应用学科,是统计学者常用的工具, 本章对回归分析的基础知识和应用作简 单介绍
第7章 回归分析和方差分析 回归分析是描述数据处理方法的一 门应用学科,是统计学者常用的工具, 本章对回归分析的基础知识和应用作简 单介绍
71一元线性回归 变量之间的关系大致可分为两大类: 1确定性的关系:可以用精确的函数关系来表 达。例如矩形面积S与边长a,b的关系。 2.非确定性的关系:变量之间既互相联系但又 不是完全确定的关系,称为相关关系。例如 人的身高与体重、农作物产量与降雨量等的 关系
7.1 一元线性回归 变量之间的关系大致可分为两大类: 1.确定性的关系:可以用精确的函数关系来表 达。例如矩形面积S与边长a,b的关系。 2.非确定性的关系:变量之间既互相联系但又 不是完全确定的关系,称为相关关系。例如 人的身高与体重、农作物产量与降雨量等的 关系
从数量的角度去研究这种非确定性的关 系,是数理统计的一个任务.包括通过观察和 试验数据去判断变量之间有无关系,对其关 系大小作数量上的估计、推断和预测等等 回归分析就是研究相关关系的一种重 要的数理统计方法
从数量的角度去研究这种非确定性的关 系,是数理统计的一个任务. 包括通过观察和 试验数据去判断变量之间有无关系,对其关 系大小作数量上的估计、推断和预测,等等. 回归分析就是研究相关关系的一种重 要的数理统计方法
、一元正态线性回归模型 只有两个变量的回归分析,称为一元回归 分析;超过两个变量时称为多元回归分析 变量之间成线性关系时,称为线性回归 变量间不具有线性关系时,称为非线性回归
只有两个变量的回归分析, 称为一元回归 分析; 超过两个变量时称为多元回归分析. 一、一元正态线性回归模型 变量之间成线性关系时, 称为线性回归, 变量间不具有线性关系时, 称为非线性回归
设随机变量Y,对于x的每一个值,Y均有自 己的分布若EY存在,则它一定是x的函数 ,记为u(x),其值可通过样本进行估计,对于x 的一组值x;(i=1,…,n),作独立试验,对y得出 n个观测结果y(÷=1,,n),即有n次独立观察, 得样本观测值:(x13v1),(x2J2),…,,( 我们要解决的问题是:如何利用这些样本观测 值来估计u(x),当然,首先要推测其形式,一般可以 作出散点图,从中可粗略看出y与x的关系
设随机变量Y,对于x的每一个值, Y 均有自 己的分布 .若EY 存在,则它一定是x的函数 ,记为 u(x),其值可通过样本进行估计,对于x 的一组值xi (i=1,…,n),作独立试验,对Y 得出 n个观测结果yi (i=1,…,n) ,即有n次独立观察, 得样本观测值: 我们要解决的问题是:如何利用这些样本观测 值来估计u(x).当然,首先要推测其形式,一般可以 作出散点图,从中可粗略看出 y与x的关系. (x1 ,y1 ) , (x2 ,y2 ) ,… , (xn ,yn )
若y和x之间大体上呈现线性关系,可假定 a+beta 其中a和b是未知常数,表示其它随机因素的影 响.通常假定e服从正态分布N0,σ32,即 E(E)=0 D(G)=a2>0 其中a2为未知参数
其中a 和 b是未知常数, ε表示其它随机因素的影 响. 2 ( ) 0 ( ) 0 E D = = y = a + b x +ε 若y和x之间大体上呈现线性关系, 可假定 通常假定ε服从正态分布N(0,σ2 ), 即 其中 为未知参数. 2
称y=a+bx+,E~N0,02)(1) 为一元线性回归模型 由()得E()=a+bx 用E()作为y的估计y得 y=a+bx(2) 称(2)为y关于x的一元线性回归方程
称 y = a + b x +ε, ε ~N(0,σ2 ) (1) 为一元线性回归模型. 由(1)得 E(y)=a+bx 称(2)为 y 关于 x 的一元线性回归方程 . y a bx ˆ = + (2) 用E(y)作为y 的估计 y 得
模型(1)中的变量x,y进行n次独立观察,得样本 观测值: (x1y1),…,( (3) 由此样本得方程组: y=a+bx+E1,i=1,2,…,n 这里G;是第i次观察时的随机误差,它是不可观 察的随机变量
模型(1)中的变量x , y进行n次独立观察, 得样本 观测值: (x1 ,y1 ) ,… , (xn ,yn ) (3) 由此样本得方程组: , 1, 2, , (4) i i i y a bx i n = + + = 这里εi 是第 i 次观察时的随机误差,它是不可观 察的随机变量
由于各次观察独立,故有 E(G;)=0 (5 D(E)=a2>0 (4)式和(5)式结合,给出了样本 (x11),…,(xnn)的概率性质.它是对理论模型进 行统计分析推断的依据.也常称(4)+5)为一元线性 回归模型即 y=a+bx,+E 1E(a)=0,D(6)=02>0
2 ( ) 0 , 1, 2, , (5) ( ) 0 i i E i n D = = = (4) 式 和 (5) 式 结 合 , 给 出 了 样 本 (x1 ,y1 ),…,(xn ,yn ) 的概率性质. 它是对理论模型进 行统计分析推断的依据. 也常称(4)+(5)为一元线性 回归模型.即 由于各次观察独立,故有 2 , 1, 2, , ( ) 0 , ( ) 0 i i i i i y a bx i n E D = + + = = =
回归分析的任务是利用n组独立观察数据 (x1u1),…,(xnn)来估计a和b以估计值a和b 分别代替(2)式中的和b,得回归方程 y=a+bx 由于方程(6)的建立依赖于通过观察或试验取 得的数据,故又称其为经验回归方程或经验公式 a和b称为未知参数a,b的回归系数 问题:如何利用n组独立观察数据来估计a和b?
由于方程(6)的建立依赖于通过观察或试验取 得的数据, 故又称其为经验回归方程或经验公式. ˆ y a bx ˆ = + ˆ (6) 回归分析的任务是利用n组独立观察数据 (x1 ,y1 ),…,(xn ,yn )来估计a和b, 以估计值 a ˆ 和 b ˆ 分别代替(2)式中的a和b, 得回归方程 问题:如何利用n组独立观察数据来估计a和b? ˆ a b ˆ 和 称为未知参数 a,b 的回归系数