第五章线性回归的定式偏差
1 第五章 线性回归的定式偏差
■前面介绍的线性回归分析建立在模型假 设成立的基础上,但这些假设并不必然 成立 ■本章讨论变量关系非线性、存在异常值 规律性扰动和解释变量缺落等,导致线 性回归模型前两条假设不成立的定式偏 差,包括它们对线性回归分析的影响, 判断和处理的方法等
2 ◼ 前面介绍的线性回归分析建立在模型假 设成立的基础上,但这些假设并不必然 成立。 ◼ 本章讨论变量关系非线性、存在异常值、 规律性扰动和解释变量缺落等,导致线 性回归模型前两条假设不成立的定式偏 差,包括它们对线性回归分析的影响, 判断和处理的方法等
本章结构 第一节变量关系非线性 第二节异常值 第三节规律性扰动 第四节解释变量缺落 第五节参数变化
3 本章结构 第一节 变量关系非线性 第二节 异常值 第三节 规律性扰动 第四节 解释变量缺落 第五节 参数变化
第一节变量关系非线性 问题 二、发现与判断 三、问题处理和非线性回归
4 第一节 变量关系非线性 一、问题 二、发现与判断 三、问题处理和非线性回归
问题 线性回归模型都假设变量关系是线性随机函数 关系,或者经过特定数学变换以后是线性随机 函数关系。 ■但实际变量关系可能会存在偏差,存在用线性 模型分析非线性关系的可能性。 ■把非线性变量关系当作线性关系处理,也可以 说是违反误差项均值为0的假设,对线性回归 分析的有效性有根本性的破坏作用
5 一、问题 ◼ 线性回归模型都假设变量关系是线性随机函数 关系,或者经过特定数学变换以后是线性随机 函数关系。 ◼ 但实际变量关系可能会存在偏差,存在用线性 模型分析非线性关系的可能性。 ◼ 把非线性变量关系当作线性关系处理,也可以 说是违反误差项均值为0的假设,对线性回归 分析的有效性有根本性的破坏作用
■例如若两个变量之间的真实关系为: Y=Bo+B,X4+8 其中E满足E(ε)=0和线性回归模型的其他假 设,但如果我们直接用:Y=+BX+E′进行 回归分析,那么因为: E'=(0-)+(x2-mx)+ 因此:B()=(B0-B1)+(Bx2-Bx) ■E(E)显然不可能始终为0
6 ◼ 例如若两个变量之间的真实关系为: ◼ 其中 满足 =0和线性回归模型的其他假 设,但如果我们直接用: 进行 回归分析,那么因为: ◼ 因此: ◼ 显然不可能始终为0。 = + + 2 Y 0 1 X E( ) Y = + X + 0 1 = ( − )+ ( X − X )+ 1 2 0 0 1 E( ) ( ) ( X X ) 1 2 = 0 − 0 + 1 − E()
■把非线性变量关系作为线性关系进行分 析是变量关系的误识别。 ■不仅会使得回归分析的拟合程度降低, 还会对经济规律作出错误判断,以及导 致较大的预测偏差,属于计量经济分析 比较严重的问题
7 ◼ 把非线性变量关系作为线性关系进行分 析是变量关系的误识别。 ◼ 不仅会使得回归分析的拟合程度降低, 还会对经济规律作出错误判断,以及导 致较大的预测偏差,属于计量经济分析 比较严重的问题
发现与判断 由于有随机扰动因素的影响,线性回归 模型的错误设定并不是很容易发现的。 发现和判断变量关系非线性,首先是用 数理经济分析的方法,对模型的函数关 系进行更深入的分析。 ■其次是根据数据和及其分布图形、散点 图进行直接判断
8 二、发现与判断 ◼ 由于有随机扰动因素的影响,线性回归 模型的错误设定并不是很容易发现的。 ◼ 发现和判断变量关系非线性,首先是用 数理经济分析的方法,对模型的函数关 系进行更深入的分析。 ◼ 其次是根据数据和及其分布图形、散点 图进行直接判断
更重要的方法是根据回归残差序列,从技术角 度发现和判断异常值问题。 ■回归残差序列根据被解释变量的实际值和回归 理论值之差计算。 在 EViews软件进行回归分析时,可以在得到回 归结果后在回归结果窗口点击View/ Actua, Fitted, Residual/ Actual, fitted, residual table,直接得到回归残差序列和残差序列图。 ■如果模型存在变量关系非线性问题,回归残差 序列会表现出有规律的变化
9 ◼ 更重要的方法是根据回归残差序列,从技术角 度发现和判断异常值问题。 ◼ 回归残差序列根据被解释变量的实际值和回归 理论值之差计算。 ◼ 在EViews软件进行回归分析时,可以在得到回 归结果后在回归结果窗口点击View/Actual, Fitted,Residual/ Actual,fitted,residual table,直接得到回归残差序列和残差序列图。 ◼ 如果模型存在变量关系非线性问题,回归残差 序列会表现出有规律的变化
■例如当发现模型的回归残差序列有图5.1所示 的规律性变化,就应该考虑存在把非线性关系 (二次函数等)当作线性关系进行回归的问题 必须进行处理 图51非线性变量关系的残差序列
10 ◼ 例如当发现模型的回归残差序列有图5.1所示 的规律性变化,就应该考虑存在把非线性关系 (二次函数等)当作线性关系进行回归的问题, 必须进行处理。 图5.1 非线性变量关系的残差序列 e i