吉林大学：《数量经济软件选讲》课程教学资源（PPT课件讲稿）EViews基础——第14章其他回归方法

本章讨论加权最小二乘估计，异方差性和自相关一致协方差估计，两阶段最小二乘估计（TSLS），非线性最小二乘估计和广义矩估计（GMM）。这里的大多数方法在“联立方程系统”一章中也适用。

团购合买资源类别：文库，文档格式：PPS，文档页数：43，文件大小：381KB

第十四章其他回归方法本章讨论加权最小二乘估计,异方差性和自相关一致协方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘估计和广义矩估计(GMM)。这里的大多数方法在“联立方程系统”一章中也适用

1 第十四章其他回归方法本章讨论加权最小二乘估计，异方差性和自相关一致协方差估计，两阶段最小二乘估计（TSLS），非线性最小二乘估计和广义矩估计（GMM）。这里的大多数方法在“联立方程系统”一章中也适用

线性回归模型的基本假设 y,=Bo+B,x+B B,xk+ 在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出若干基本假设: 1.解释变量之间互不相关: 2.随机误差项具有0均值和同方差。即 E(l1)=0 arlu 即随机误差项的方差是与观测时点t无关的常数 3.不同时点的随机误差项互不相关(序列不相关),即 Covu,,u_=0 s≠O,i=1,2,…,n 4.随机误差项与解释变量之间互不相关。即 Cov(,u=0 k 随机误差项服从0均值、同方差的正态分布。即 1~N(0,a2 当随机误差项满足假定1~4时,将回归模型称为“标准回归模型”,当随机误差项淸足偎定1~5时,将回归模型称为“标准正态回归模型”。如果实际模型满足不了这些假定,普通最小二乘法就不再适用,而要发展其他方法来估计模型

2 线性回归模型的基本假设 t i i k ki ui y =  0 + 1 x1 +  2 x2 ++  x + i = 1 , 2 , … , n 在普通最小二乘法中，为保证参数估计量具有良好的性质，通常对模型提出若干基本假设： 1．解释变量之间互不相关； 2．随机误差项具有0均值和同方差。即 E(ui ) = 0 2 Var(ui ) =  i = 1 , 2 , … , n 即随机误差项的方差是与观测时点t无关的常数； 3．不同时点的随机误差项互不相关（序列不相关），即 Cov(ui ,ui−s ) = 0 4．随机误差项与解释变量之间互不相关。即 Cov(x ji ,ui ) = 0 5．随机误差项服从0均值、同方差的正态分布。即 ui ~ (0, ) 2 N  当随机误差项满足假定1 ~ 4时，将回归模型称为“标准回归模型”，当随机误差项满足假定1 ~ 5时，将回归模型称为“标准正态回归模型”。如果实际模型满足不了这些假定，普通最小二乘法就不再适用，而要发展其他方法来估计模型。 j = 1 , 2 , … , k , i = 1 , 2 , … , n i = 1 , 2 , … , n s ≠ 0, i = 1 , 2 , … , n

§141加权最小二乘估计古典线性回归模型的一个重要假设是总体回归方程的随机扰动项同方差,即他们具有相同的方差σ如果随机扰动项的方差随观测值不同而异,即1的方差为a2,就是异方差。用符号表示异方差为E(2)=a 异方差性在许多应用中都存在,但主要出现在截面数据分析中。例如我们调査不同规模公司的利润,会发现大公司的利润变化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小公司利润的方差大。利润方差的大小取决于公司的规模、产业特点、研究开发支出多少等因素。又如在分析家庭支出模式时,我们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大的方差

3 古典线性回归模型的一个重要假设是总体回归方程的随机扰动项同方差，即他们具有相同的方差。如果随机扰动项的方差随观测值不同而异，即的方差为，就是异方差。用符号表示异方差为。异方差性在许多应用中都存在，但主要出现在截面数据分析中。例如我们调查不同规模公司的利润，会发现大公司的利润变化幅度要比小公司的利润变化幅度大，即大公司利润的方差比小公司利润的方差大。利润方差的大小取决于公司的规模、产业特点、研究开发支出多少等因素。又如在分析家庭支出模式时，我们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大的方差。 ui 2  2  i 2 2 ( ) E ui =  i ui §14.1 加权最小二乘估计

表1中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出单位:元变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出地区 CUM 地区 CUM 甘肃40961 15960 新疆500.79 212.30 山西 4098.73 137.11 河北508464 270.09 宁夏 4112.41 231.51 四川5127.08 212.46 吉林 4206.64 17265 山东5380.08 255.53 河南 421942 193.65 广西5412.24 252.37 陕西 4220.24 191.76 湖南|5434.26 255.79 青海 4240.13 197.04 重庆5466.57 337.83 江西 4251.42 17639 江苏6017.85 255.65 黑龙江 4268.50 185.78 云南6042.78 266.48 内蒙古435302 206.91 福建648563 346.75 贵州 4565.39 227.21 天津|711054 258.56 辽宁 4617.24 201.87 浙江7836.76 388.79 安徽 4770.47 237.16 北京847198 36954 湖北 4826.36 214.37 上海8773.10 384.49 海南 4852.87 265.98 广东883968 640.56

4 变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出地区 IN CUM 地区 IN CUM 甘肃山西宁夏吉林河南陕西青海江西黑龙江内蒙古贵州辽宁安徽湖北海南 4009.61 4098.73 4112.41 4206.64 4219.42 4220.24 4240.13 4251.42 4268.50 4353.02 4565.39 4617.24 4770.47 4826.36 4852.87 159.60 137.11 231.51 172.65 193.65 191.76 197.04 176.39 185.78 206.91 227.21 201.87 237.16 214.37 265.98 新疆河北四川山东广西湖南重庆江苏云南福建天津浙江北京上海广东 5000.79 5084.64 5127.08 5380.08 5412.24 5434.26 5466.57 6017.85 6042.78 6485.63 7110.54 7836.76 8471.98 8773.10 8839.68 212.30 270.09 212.46 255.53 252.37 255.79 337.83 255.65 266.48 346.75 258.56 388.79 369.54 384.49 640.56 表1 中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出单位：元

我们研究人均家庭交通及通讯支出(CUM和可支配收入(ⅣN)的关系, 考虑如下方程:CUM=B+B1N+l 利用普通最小二乘法,得到如下回归模型 CUM-56917+0.05807*N (1.57)(8.96) R2=0.74DW=200 CUM VS IN 70o 6OO 5Oo 400 300 200 10O 2000 4000 6OOO

5 我们研究人均家庭交通及通讯支出(CUM)和可支配收入(IN )的关系，考虑如下方程： CUM=B0 + B1 IN + ui 利用普通最小二乘法，得到如下回归模型： CUM= -56.917+ 0.05807*IN (1.57) (8.96) R2=0.74 D.W.=2.00 100 200 300 400 500 600 700 2000 4000 6000 8000 10000 IN CUM CUM vs. IN

从图形上可以看出,平均而言,城镇居民家庭交通和通讯支出随可支配收入的增加而增加。但是,值得注意的是:随着可支配收入的增加,交通和通讯支出的变动幅度也增大了,可能存在异方差。如果我们把回归方程中得到的残差对各个观测值作图,则可以清楚地看到这一点。异方差的存在并不破坏普通最小二乘法的无偏性,但是估计量却不是有效的,即使对大样本也是如此,因为缺乏有效性, 所以通常的假设检验值不可靠。因此怀疑存在异方差或者已经检测到异方差的存在,则采取补救措施就很重要假设有已知形式的异方差性,并且有序列,其值与误差杉准差的倒数成比例。这时可以采用权数序列为的加权最小乘估计来修正异方差性

6 从图形上可以看出，平均而言，城镇居民家庭交通和通讯支出随可支配收入的增加而增加。但是，值得注意的是：随着可支配收入的增加，交通和通讯支出的变动幅度也增大了，可能存在异方差。如果我们把回归方程中得到的残差对各个观测值作图，则可以清楚地看到这一点。异方差的存在并不破坏普通最小二乘法的无偏性，但是估计量却不是有效的，即使对大样本也是如此，因为缺乏有效性，所以通常的假设检验值不可靠。因此怀疑存在异方差或者已经检测到异方差的存在，则采取补救措施就很重要。假设有已知形式的异方差性，并且有序列w，其值与误差标准差的倒数成比例。这时可以采用权数序列为w的加权最小二乘估计来修正异方差性

对加权自变量和因变量最小化残差平方和得到估计结果 B)=2(,-xB)B是维向量在矩阵概念下,令权数序列v在权数矩阵的对角线上,其他地方是零,即W矩阵是对角矩阵,y和X是因变量和自变量矩阵。则加权最小二乘估计量为 bwIs =(XwwX) Xwwy 估计协方差矩阵为: ∑ms=s2(XWWx)

7 对加权自变量和因变量最小化残差平方和得到估计结果 : 2 2 () ( ) t t t t S = w y − x  在矩阵概念下，令权数序列w在权数矩阵W的对角线上，其他地方是零，即W 矩阵是对角矩阵， y和X是因变量和自变量矩阵。则加权最小二乘估计量为： β是k维向量估计协方差矩阵为： b X W WX X W Wy WLS =     −1 ( ) 2 1 ( ) ˆ − WLS = s X WWX

由于一般不知道异方差的形式,人们通常采用的经验方法是,并不对原模型进行异方差检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差性,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。具体步骤是 1.选择普通最小二乘法估计原模型,得到随机误差项的近似估计量e,; 2.建立1/|的数据序列 3.选择加权最小三乘法,以1/2序列作为权,进行估计得到参数估计量。实际上是以/2|乘原模型的两边,得到一个新模型,采用普通最小二乘法估计新模型。 EViews的加权最小二乘估计方法为,首先把权数序列用均值除,然后与对应的每个观测值相乘,权数序列已被标准化故对参数结果没有影响同时使加权残差比未加权残差更具可比性。然而,标准化意味着 EViews的加权最小二乘在残差序列相关时不适用

8 由于一般不知道异方差的形式，人们通常采用的经验方法是，并不对原模型进行异方差检验，而是直接选择加权最小二乘法，尤其是采用截面数据作样本时。如果确实存在异方差性，则被有效地消除了；如果不存在异方差性，则加权最小二乘法等价于普通最小二乘法。具体步骤是： 1．选择普通最小二乘法估计原模型，得到随机误差项的近似估计量； 2．建立的数据序列； 3．选择加权最小二乘法，以序列作为权，进行估计得到参数估计量。实际上是以乘原模型的两边，得到一个新模型，采用普通最小二乘法估计新模型。 EViews 的加权最小二乘估计方法为，首先把权数序列用均值除，然后与对应的每个观测值相乘，权数序列已被标准化故对参数结果没有影响同时使加权残差比未加权残差更具可比性。然而，标准化意味着EViews的加权最小二乘在残差序列相关时不适用。 i e ~ i e ~ 1 i e ~ 1 i e ~ 1

使用加权最小二乘法估计方程,首先到主菜单中选 Quick/Estimate Equation…,然后选择LS- Least squares( NLS and arma)。在对话框中输入方程说明和样本,然后按 Options钮,出现如下对话框 Estimation Options LS &TSls options Iteration control Heteroskedasticity Consistent Max Iterations: 500 Coefficient Covariance C Whit Convergence: 0.0001 Newey Wesl 厂 Display settings 厂 Weighted LS/TsLs (not available with ARMA] Derivatives Weight Select method to favor A ARMA options C Speed Starting coefficient values 厂 Use numeric only OLS/TSLS v Backcast MA terms Cancel 单击 Weighted LS/ISLS选项在 Weighted项后填写权数序列名,单击OK

9 使用加权最小二乘法估计方程，首先到主菜单中选Quick/ Estimate Equation … , 然后选择LS-Least Squares(NLS and ARMA)。在对话框中输入方程说明和样本，然后按Options钮,出现如下对话框：单击Weighted LS/TSLS选项在Weighted 项后填写权数序列名，单击OK

Dependent variable: CUM Method: Least Squares Date:10/163Tme:07:44 Sample: 1 30 Included obserations. 30 Weighting series: E1 Variable Coefficient Std Error t-Statistic Prob C -459912692384535086485000 N 0056230000171732745880000 Weighted Statistics R-squared 1.000000 Mean dependent var 255 4733 Adjusted R-squared 1.000000 S.D. dependent va 1396.545 S.E. of regression 0. 025540 Akaike info criterion -4,432801 Sum squared resid 0. 018264 Schwarz criterion -4.33938 Log likelihood 68.49201 F-statistic 1072292 Durbin-Watson stat 2.575154 Prob(F-statistic Unweighted Statistics R-squared 0.740752 Mean dependent var 256 8727 Adjusted R-squared 0.731494 S.D. dependent var S.E. of regression 50.55628 Sum squared resid 71566 25 Durbin- WAtson stat 1998810

点击下载完整版文档（PPS格式）

共43页，可试读15页，点击继续阅读 ↓↓

点击下载（PPS格式）

浏览记录