
第2章一元线性回归模型模型的建立及其假定条件最小二乘估计(OLS)OLS回归函数的性质最小二乘估计量的特性y,的分布和β的分布α2的估计拟合优度的测量回归参数的显著性检验与置信区间yF的点预测与区间预测file:li-2-1案例分析file:li-2-3相关系数file:case1file:5kepler3EViews操作file:food
第2章 一元线性回归模型 模型的建立及其假定条件 最小二乘估计(OLS) OLS回归函数的性质 最小二乘估计量的特性 yt的分布和 的分布 的估计 拟合优度的测量 回归参数的显著性检验与置信区间 yF 的点预测与区间预测 案例分析 相关系数 EViews操作 1 ˆ file: li-2-1 file: li-2-3 file: case1 file: 5kepler3 file: food

第2章一元线性回归模型1.模型的建立及其假定条件一元线性回归模型(各部分名称)Y, = βo + β,X,+ ut28Y24.20.16-=p+8xt128.X(第4版教材第7页)4.30204050601070
第2章 一元线性回归模型 1. 模型的建立及其假定条件 一元线性回归模型 Yt = 0 + 1 Xt + ut (第4版教材第7页) (各部分名称)

回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。回归模型存在两个特点。(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。通常线性回归函数E(y)=β+βix是观察不到的,利用样本得到的只是对E(y)=β+βx的估计,即对β和β的估计。在对回归函数进行估计之前应该对模型解释变量和误差项u,做出如下假定。(1)ut是一个随机变量,ut的取值服从概率分布。(2) E(u) = 0。(3) D(u)=E[ut-E(u)}=E(u)=。称ui具有同方差性。(4)ut为正态分布(根据中心极限定理)。以上四个假定可作如下表达。ut~N(0,2)
回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略, (2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5) 测量误差等。 回归模型存在两个特点。(1)建立在某些假定条件不变前提下抽象出来的回归 函数不能百分之百地再现所研究的经济过程。(2)也正是由于这些假定与抽象,才 使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。 通常线性回归函数E(yt ) = 0 + 1 xt 是观察不到的,利用样本得到的只是对E(yt ) = 0 + 1 xt 的估计,即对0 和1的估计。 在对回归函数进行估计之前应该对模型解释变量和误差项 ut做出如下假定。 (1) ut 是一个随机变量,ut 的取值服从概率分布。 (2) E(ut ) = 0。 (3) D(ut ) = E[ut - E(ut ) ]2 = E(ut ) 2 = 2 。称 ui 具有同方差性。 (4) ut 为正态分布(根据中心极限定理)。 以上四个假定可作如下表达。ut N (0, )

(5) Cov(ui, u) = E[(ui- E(ui)) (u; - E(u))] =E(ui, u,) = 0, (i±j)含义是不同观测值所对应的随机项相互独立。称为u:的非自相关性。(6)x;是非随机的。(7) Cov(ui, x) =E[(ui - E(u) ) (xi- E(x))] =E[u; (x; - E(x) ]=E[u;x; - u; E(x) ] = E(u;x) = 0.ui与x;相互独立。否则,分不清是谁对yt的贡献。(8)对于多元线性回归模型,解释变量之间不能完全相关或高度相关(非多重共线性)。在假定(1),(2),(6)成立条件下有E(y)=E(B+ βix,+ ut)=B+ βixt (第4版教材第9页)
(第4版教材第9页) (5) Cov(ui , uj ) = E[(ui - E(ui ) ) ( uj - E(uj ) )] = E(ui , uj ) = 0,(i j )。 含义是不同观测值所对应的随机项相互独立。称为 ui 的非自相关性。 (6) xi是非随机的。 (7) Cov(ui , xi ) = E[(ui - E(ui ) ) (xi - E(xi ) )] = E[ui (xi - E(xi ) ] = E[ui xi - ui E(xi ) ] = E(ui xi ) = 0. ui 与 xi 相互独立。否则,分不清是谁对 yt的贡献。 (8) 对于多元线性回归模型,解释变量之间不能完全相关或高度 相关(非多重共线性)。 在假定(1),(2),(6)成立条件下有 E(yt ) = E(0 + 1 xt + ut ) = 0 + 1 xt

2.2最小二乘估计(OLS)通常真实的回归直线是观测不到的。收集样本的自的就是要对这条真实的回归直线做出估计。Y,=βo+ β,X,表示。其中Y,称Y,的拟合值(fittedvalue),β.和β,分别是β和β,的估计量。观测值到这条直线的纵向距离用,表示,称为残差。(课本上用e表示。)28Y24.22016.J.=128.X420304050106070(第4版第10页)
(第4版第10页) 2.2 最小二乘估计(OLS) 通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线 做出估计。 Yt ˆ = 0 ˆ + 1 ˆ Xt 表示。其中Yt ˆ 称 Yt 的拟合值(fitted value), 0 ˆ 和 1 ˆ 分别是0 和1 的估计量。观 测值到这条直线的纵向距离用ut ˆ 表示,称为残差。(课本上用 ei表示。)

估计的模型。Y,=Y +u,=βo+β, X,+u最小二乘法的原则是以“残差平方和最小”确定直线位置设残差平方和用0表示,Q= Za2= (i-)2= (i-Bo-ix)2i=1i-1i=1求Q对β。和β,的偏导数并令其为零,得正规方程TaQ= 2 (Yf - βo - βiX,)(-1) = 0apoi=1TaQ2 Z(t -βo -β1XI)(-X) =0ap,(第4版第11页)i=1
估计的模型。 Yt =Yt ˆ + ut ˆ = 0 ˆ + 1 ˆ Xt +ut ˆ 最小二乘法的原则是以“残差平方和最小”确定直线位置。 设残差平方和用 Q 表示, Q = = T i t u 1 2 ˆ = = − T i Yt Yt 1 2 ) ˆ ( = = − − T i Yt Xt 1 2 0 1 ) ˆ ˆ ( 求 Q 对 0 ˆ 和 1 ˆ 的偏导数并令其为零,得正规方程 0 ˆ Q = 2 = − − T i Yt Xt 1 0 1 ) ˆ ˆ ( (-1) = 0 1 ˆ Q = 2 = − − T i Yt Xt 1 0 1 ) ˆ ˆ ( (- Xt ) = 0 (第4版第11页)

TZ(Yt -βo -βiX)= 0(3)i=lZ(t-Bo -BiX)Xi=0(4)i=1(3)式两侧用T除,并整理得,βo=-βX。把上式代入(4)式并整理,得,(第4版第13页)1Z[(Y, -Y)-βi(X, - X)]X,= 0i=1TT(课本上用英文小写字母表示离差)Z(Yf -Y)Xt -βZ(X, -X)X, =0i=1i=lZxi(t -Y)EX(Yt -Y)-Zx(Yt-Y)E(Xt -X)(Yf -Y)βE(X, -X)x,Z(X, -x)X, -Zx(X, -x)E(X, -X)2谁提出的OLS估计方法?
(第4版第13页) 谁提出的OLS估计方法? = − − T i Yt Xt 1 0 1 ) ˆ ˆ ( = 0 (3) = − − T i Yt Xt 1 0 1 ) ˆ ˆ ( Xt = 0 (4) (3)式两侧用 T 除,并整理得, 0 ˆ =Y − ˆ 1 X 。 把上式代入(4)式并整理,得, ( )] ˆ [( ) 1 1 = − − − T i Yt Y Xt X Xt = 0 = = − − − T i t t T i Yt Y Xt X X X 1 1 1 ( ) ˆ ( ) = 0 1 ˆ = − − t t t t X X X X Y Y ( ) ( ) = − − − − − − ( ) ( ) ( ) ( ) X X X X X X X Y Y X Y Y t t t t t t = − − − 2 ( ) ( )( ) X X X X Y Y t t t (课本上用英文小写字母表示离差)

(C F Gauss, 1777-1855)CFGauss1809年提出OLS估计方法
(C F Gauss, 1777-1855) C F Gauss 1809年提出OLS估计方法

例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系(file: li-2-1)DependentVariable:YY:千克Method:Least SquaresDate:02/12/07Time:08:46X:元Sample:1988 199820Includedobservations:1119-Prob.VariableStd.ErrorCoefficientt-Statistic1817c10.766161.3967367.7080870.0000X0.0050690.00200.0011834.28332816-15R-squared0.67089516.57273Meandependentvarx140.6343281.845042AdjustedR-squaredS.D.dependent var80090010001100120013001400150016001700S.E. of regression1.1157133.219829Akaike info criterion11.203333.292174Sum squared residSchwarz criterion15.7090618.34690Log likelihoodF-statistic1.320391Durbin-Watson statProb(F-statistic)0.002040OLS估计结果:Y;=10.7662+0.0051X(第4版第15页)
例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 OLS估计结果: Yi 0051Xi 10.7662 0. ˆ = + (第4版第15页) (file: li-2-1) Yt:千克 Xt:元

3.OLS回归函数的性质(第4版第13页),Zi,=0(1)残差和等于零,由正规方程 2Z(Y-βo-β,X)(-1)=0得 Z(Y-βo-β,X)=Z(Y,-Y)=Z(u)= 0(2)估计的回归直线 ,=β。+β, X,过(x,)点。(Y,-βo-β,X)=0两侧同除样本容量T,得正规方程= βo+β X证毕。Y=Y.(3)yt的拟合值的平均数等于其样本观测值的平均数,=E,-Z(Bo+B X)=βo+BX=证毕
3. OLS回归函数的性质 (第4版第13页) (1) 残差和等于零, ut ˆ = 0 由正规方程 2(Yt - 0 ˆ - 1 ˆ Xt ) (-1) = 0 得 (Yt - 0 ˆ - 1 ˆ Xt ) = (Yt -Yt ˆ ) = ( ut ˆ ) = 0 (2) 估计的回归直线 Yt ˆ = 0 ˆ + 1 ˆ Xt 过( X ,Y )点。 正规方程 (Yt - 0 ˆ - 1 ˆ Xt ) = 0 两侧同除样本容量 T,得 Y = 0 ˆ + 1 ˆ X 证毕。 (3) yt 的拟合值的平均数等于其样本观测值的平均数,Yt ˆ =Y 。 Yt ˆ = T 1 Yt ˆ = T 1 ( 0 ˆ + 1 ˆ Xt ) = 0 ˆ + 1 ˆ X =Y 证毕