第二章元线性回归模型 (双变量线性回归模型) Simple Linear Regression Model)
第二章 一元线性回归模型 (双变量线性回归模型) (Simple Linear Regression Model)
§21一元线性回归模型的概述
2 §2.1 一元线性回归模型的概述
回归模型的基本思想 (一)问题的提出 Y=a+βX (1)确定方程(两个公理) ?消费习惯、价格水平、 未来收入的预期、线性关系的近似 =>Y=a+βX+u (2)随机方程、回归方程 将以上被省略或无法表示出来的、以及 些误差因素统统归结为一个随机误差项,则 可能得到更符合实际情况的关系 =>?对于随机方程如何求解 对u作出一系列假定的基础上, 运用最小二乘估计
一. 回归模型的基本思想 (一)问题的提出 Y = + X (1) 确定方程(两个公理) ?消费习惯、价格水平、 未来收入的预期、线性关系的近似 => Y = + X + u (2) 随机方程、回归方程 将以上被省略或无法表示出来的、以及一 些误差因素统统归结为一个随机误差项,则 可能得到更符合实际情况的关系 => ?对于随机方程如何求解 --对u作出一系列假定的基础上, 运用最小二乘估计
引入随机扰动项u的小结 随机扰动项U称为观察值围绕它的期望值的离差 ( deviation),是一个不可观测的随机变量,又称为随机干 扰项( stochastic disturbance)或随机误差项 (stochastic error ; -E(YX) 1.引入u,将变量之间的关系用随机方程来描述,用随机数学 的方法来估计方程中的参数,这就是线性回归模型的特征 2客观经济现象的复杂性,很难用有限个变量,或某一确定的 形式来描述,这就是设置u的原因。 3.U主要包括以下因素:
4 引入随机扰动项u的小结 随机扰动项u称为观察值围绕它的期望值的离差 (deviation),是一个不可观测的随机变量,又称为随机干 扰项(stochastic disturbance)或随机误差项 (stochastic error) 1.引入u,将变量之间的关系用随机方程来描述,用随机数学 的方法来估计方程中的参数,这就是线性回归模型的特征。 2.客观经济现象的复杂性,很难用有限个变量,或某一确定的 形式来描述,这就是设置u的原因。 3. u主要包括以下因素: ( | ) i = Yi − E Y X i
(1)模型中被省略的变量:真正的关系是Y=f 2 ),但X2 2,439·· 相对不重要,用u 代表之。(省略原则) (2)形式设定的错误:两变量之间的关系可能不 是严格线性的,u反映了与直线的偏差。 (3)经济行为是随机的(心理、偏好、预期), 我们能够用Y=a+BX,解释“典型”的行为,而用u 来表示个体偏差。 (4)总会出现测量误差,使得任何精确的关系不 可能存在 小结:1包含了大量的信息,是线性回归中一个非常 重要的因素,许多方法就是从对u的假设开始的
(1)模型中被省略的变量:真正的关系是Y = f (X1, X2,… ),但X2 , X3 ,…, 相对不重要,用u 代表之。(省略原则) (2)形式设定的错误:两变量之间的关系可能不 是严格线性的,u反映了与直线的偏差。 (3)经济行为是随机的(心理、偏好、预期), 我们能够用 Y=α+βX,解释“典型”的行为,而用u 来表示个体偏差。 (4)总会出现测量误差, 使得任何精确的关系不 可能存在。 小结: u包含了大量的信息,是线性回归中一个非常 重要的因素,许多方法就是从对u的假设开始的
(二)一元线性回归模型的统计假设 应用最小二乘法的前提;注意,是针对 (1)。Eu=0,t=1,2,…,n 即扰动项的均值(期望值)为0 (2).E(u)=0j 即各期扰动项互不相关 (3)E(u2)=σ2,t=1,2,…n 即各期扰动项方差是一常数 (4)。解释变量X为非随机量 即x的取值是确定的 (5).ut~N(0,a2),t=1,2 即各期扰动项服从正态分布
(二)一元线性回归模型的统计假设 -------应用最小二乘法的前提;注意,是针对 u (1). E(ut) = 0, t= 1, 2, ...,n 即扰动项的均值(期望值)为0. (2). E(uiuj) = 0 i j 即各期扰动项互不相关. (3). E(ut 2 ) = 2 , t= 1, 2, ...,n 即各期扰动项方差是一常数. (4). 解释变量Xt 为非随机量 即Xt的取值是确定的 (5). ut ~ N( 0, 2 ) , t= 1, 2, ...,n 即各期扰动项服从正态分布
下面简单讨论一下上述假设条件。 (1)E(u)=0,t=1,2,,n 均值为0的假设反映了这样一个事实: 扰动项被假定为那些对因变量的不能列为模型主 要部分的微小影响。没有理由相信这样一些影响会以 种系统的方式使因变量增加或减小。因此扰动项均 值为0的假设是合理的。 反之,则说明u中含有某些系统因素应该进入模型
下面简单讨论一下上述假设条件。 (1)E(ut ) = 0, t=1,2,…,n 均值为0的假设反映了这样一个事实: 扰动项被假定为那些对因变量的不能列为模型主 要部分的微小影响。没有理由相信这样一些影响会以 一种系统的方式使因变量增加或减小。因此扰动项均 值为0的假设是合理的。 反之,则说明u中含有某些系统因素应该进入模型
(2)E(up)=0,i 也就是假定它们之间无自相关或无序列相关。 实际上该假设等同于 cOV U Ui= 这是因为: cov(ur,u)=E{u-E(u川 Equ; i 根据假设(1) 否则说明u存在某种系统趋势,可能遗漏重 要变量
(2)E(uiuj ) = 0, i≠j 也就是假定它们之间无自相关或无序列相关。 实际上该假设等同于: cov( uI , uj ) = 0, i≠j 这是因为:cov(uI , uj ) = E{[ui - E(ui )][uj - E(uj )]} = E(uiuj ) ——根据假设(1) ---否则说明u存在某种系统趋势,可能遗漏重 要变量
(3)E(u12)=o2,t=1,2,n (波动的稳定性),也就是假定各扰动项具有同方 差性。 实际上该假设等同于 Ⅴar(u=0,i#j 这是因为: var(u=E{[uE(u)=E(u12)根据假设(1)
(3)E(ut 2 )= 2 , t=1,2,…,n (波动的稳定性),也就是假定各扰动项具有同方 差性。 实际上该假设等同于: Var( ut ) = 0, i≠j 这是因为: Var(ut )=E{[ut -E(ut )]2 }= E(ut 2 )——根据假设(1))
(4)X为非随机量 有的书上采用弱一些的条件:E(Xu=0, 卯解释变量X与扰动项u不相关; 否则分不清是谁对y的影响 (5)u4~N(0,a2),t=1,2,…,n 构造建议统计量的性质保证,旦服从正态分布 的偎设不成立,仍可证明OLS估计量为BLUE,但不 可能再证明OLS估计量服从正态分布。在这种情况下, 我们只有转而求助于渐近正态性,即只要观测值的数 目足够多,我们仍可假定OLS估计量近似地服从正态 分布
(4) Xt为非随机量 有的书上采用弱一些的条件:E(Xtut ) = 0, 即解释变量X与扰动项u不相关; ---否则分不清是谁对y的影响 (5)ut ~ N( 0, 2 ) , t= 1, 2, ...,n 构造建议统计量的性质保证,ut服从正态分布 的假设不成立,仍可证明OLS估计量为BLUE,但不 可能再证明OLS估计量服从正态分布。在这种情况下, 我们只有转而求助于渐近正态性,即只要观测值的数 目足够多,我们仍可假定OLS估计量近似地服从正态 分布