第三章双变量线性回归模型 (简单线性回归模型) (Simple linear regression Model
第三章 双变量线性回归模型 (简单线性回归模型) (Simple Linear Regression Model)
第一节双变量线性回归模型的估计 一.双变量线性回归模型的概念 设Y=消费,Ⅹ=收入,我们根据数据画出散点图 这意味着 Y=+阝X 我们写出计量经济模型 Y=0+阝X+u 其中u=扰动项或误差项 Y为因变量或被解释变量 图1 Ⅹ为自变量或解释变量 和β为未知参数
第一节 双变量线性回归模型的估计 一. 双变量线性回归模型的概念 设 Y = 消费, X = 收入, 我们根据数据画出散点图 Y * 这意味着 * Y = + X (1) * 我们写出计量经济模型 * Y = + X + u (2) * 其中 u = 扰动项或 误差项 Y为因变量或被解释变量 图1 X X为自变量或解释变量 和 为未知参数
设我们有Y和X的n对观测值数据,则根据(2)式, 变量Y的每个观测值应由下式决定: Y1=a+βx1+u1,1=1,2,…,n(3) (3)式称为双变量线性回归模型或简单线性回归模 型。其中α和β为未知的总体参数,也称为回归模型 的系数( coefficients)。下标i是观测值的序号 当数据为时间序列时,往往用下标t来表示观测 值的序号,从而(3)式变成 Yt=a+阝xt+u,t=1,2,…,n(3)
设我们有Y和X的n对观测值数据,则根据(2)式, 变量Y的每个观测值应由下式决定: Yi = + Xi + ui , i = 1, 2, ...,n (3) (3)式称为双变量线性回归模型或简单线性回归模 型。其中 和 为未知的总体参数,也称为回归模型 的系数( coefficients)。下标 i是观测值的序号。 当数据为时间序列时,往往用下标 t来表示观测 值的序号,从而(3)式变成 Yt = + Xt + ut , t = 1, 2, ...,n (3’)
为何要在模型中包括扰动项u 我们在上一章中已初步介绍了为什么要在模型中包 括扰动项u,下面进一步说明之: (1)真正的关系是Y=f(X1,X2,X),但X2, X32,Y相对不重要,用u代表之 (2)两变量之间的关系可能不是严格线性的,u反 映了与直线的偏差。 (3)经济行为是随机的,我们能够用Y=a+BX 解释“典型”的行为,而用u来表示个体偏差 (4)总会出现测量误差,使得任何精确的关系不 可能存在
为何要在模型中包括扰动项u 我们在上一章中已初步介绍了为什么要在模型中包 括扰动项u,下面进一步说明之: (1)真正的关系是Y = f (X1, X2,… ),但X2 , X3 ,…, 相对不重要,用u代表之。 (2)两变量之间的关系可能不是严格线性的,u反 映了与直线的偏差。 (3)经济行为是随机的,我们能够用 Y=α+βX 解释“典型”的行为,而用u来表示个体偏差。 (4)总会出现测量误差, 使得任何精确的关系不 可能存在。 X X
普通最小二乘法(OIS法, Ordinary Least squares) 1双变量线性回归模型的统计假设 我们的模型是: Yt=a+阝xt+u 这里α和β为未知总体参数,下一步的任务是应 用统计学的方法,由Y和X的观测值(即样本数据) 来估计α和β的总体值,常用的估计方法就是最小 乘法。为了应用最小二乘法,得到好的估计量,双 变量线性回归模型需要满足一些统计假设条件,这 些统计假设是:
二. 普通最小二乘法(OLS法, Ordinary Least squares) 1.双变量线性回归模型的统计假设 我们的模型是: Yt = + Xt + ut , t = 1, 2, ...,n 这里 和 为未知总体参数,下一步的任务是应 用统计学的方法,由Y和X的观测值(即样本数据) 来估计和 的总体值,常用的估计方法就是最小二 乘法。为了应用最小二乘法,得到好的估计量,双 变量线性回归模型需要满足一些统计假设条件,这 些统计假设是:
双变量线性回归模型的统计假设 (1).E(u=0,t=1,2,…,n 即各期扰动项的均值(期望值)为0 (2).E(u)=0 即各期扰动项互不相关 (3).E(u2)=o2,t=1,2,…,n 即各期扰动项方差是一常数 解释变量X为非随机量 即X的取值是确定的,而不是随机的 ⑤5).ut~N(0,a2),t=1,2,…,n 即各期扰动项服从正态分布
双变量线性回归模型的统计假设 (1). E(ut ) = 0, t= 1, 2, ...,n 即各期扰动项的均值(期望值)为0. (2). E(uiuj ) = 0 i j 即各期扰动项互不相关. (3). E(ut 2 ) = 2 , t= 1, 2, ...,n 即各期扰动项方差是一常数. (4). 解释变量Xt 为非随机量 即Xt的取值是确定的, 而不是随机的. (5). ut ~ N( 0, 2 ) , t= 1, 2, ...,n 即各期扰动项服从正态分布
下面简单讨论一下上述假设条件。 (1)F(u)=0,t=1,2,…n 即各期扰动项的均值(期望值)均为0 均值为0的假设反映了这样一个事实:扰动项被假 定为对因变量的那些不能列为模型主要部分的微小影 响。没有理由相信这样一些影响会以一种系统的方式 使因变量增加或减小。因此扰动项均值为0的假设是 合理的
下面简单讨论一下上述假设条件。 (1)E(ut ) = 0, t=1,2,…,n 即各期扰动项的均值(期望值)均为0。 均值为0的假设反映了这样一个事实:扰动项被假 定为对因变量的那些不能列为模型主要部分的微小影 响。没有理由相信这样一些影响会以一种系统的方式 使因变量增加或减小。因此扰动项均值为0的假设是 合理的
(2)E(uu)=0,i 即各期扰动项互不相关。也就是假定它们之间无 自相关或无序列相关。 实际上该假设等同于: cov( uI, ui)=0, ifj 这是因为:covu,u)=E{[u;-E(u)[u-E(u)} Equus 根据假设(1)
(2)E(uiuj ) = 0, i≠j 即各期扰动项互不相关。也就是假定它们之间无 自相关或无序列相关。 实际上该假设等同于: cov( uI , uj ) = 0, i≠j 这是因为:cov(uI , uj ) = E{[ui - E(ui )][uj - E(uj )]} = E(uiuj ) ——根据假设(1)
(3)E(u2)=σ2,t=1,2,,n 即各期扰动项的方差是一常数,也就是假定各 扰动项具有同方差性。 实际上该假设等同于: Var( ut)=0, ifj 这是因为: Var(u=Elu E(u ])=E(u2) 根据假设(1)
(3)E(ut 2 )= 2 , t=1,2,…,n 即各期扰动项的方差是一常数,也就是假定各 扰动项具有同方差性。 实际上该假设等同于: Var( ut ) = 0, i≠j 这是因为: Var(ut )=E{[ut -E(ut )]2}= E(ut 2 ) ——根据假设(1))
(4)Ⅹ为非随机量 即Ⅹ的取值是确定的,而不是随机的。 有的书上采用弱一些的条件: E(X1u)=0,t=12,,n 即解释变量Ⅹ与扰动项u不相关。 (5)u1~N(0,o2),t1,2,…,n 即扰动项服从正态分布 满足条件(1)—(4)的线性回归模型称为古典线 性回归模型(CLR模型)
(4) Xt为非随机量 即Xt的取值是确定的, 而不是随机的。 有的书上采用弱一些的条件: E(Xtut ) = 0, t=1,2,…,n 即解释变量X与扰动项u不相关。 (5)ut ~ N( 0, 2 ) , t= 1, 2, ...,n 即扰动项服从正态分布。 满足条件(1)—(4)的线性回归模型称为古典线 性回归模型(CLR模型)