第五章模型的建立与估计中的 问题及对策
1 第五章 模型的建立与估计中的 问题及对策
我们已学到了许多有用的计量经济分析方法,如建立 模型、估计参数、假设检验、预测、非线性模型的线性 化,用虚拟变量将定性因素引入模型等 可是,我们所使用的最小二乘法,以及由此而得到的 OLS估计量令人满意的性质,是根据一组假设条件而得到 的。在实践中,如果某些假设条件不能满足,则OLS就不 再适用于模型的估计。在这种情况下,分析方法就需要 改变。下面列出实践中可能碰到的一些常见问题: 误设定( Misspecification或 specification error) 多重共线性( Multicollinearity) 异方差性( Heteroscedasticity) 自相关( Autocorrelation 本章将对上述问题作简要讨论,主要介绍问题的后果 检测方法和解决途径
2 我们已学到了许多有用的计量经济分析方法,如建立 模型、估计参数、假设检验、预测、非线性模型的线性 化,用虚拟变量将定性因素引入模型等。 可是,我们所使用的最小二乘法,以及由此而得到的 OLS估计量令人满意的性质,是根据一组假设条件而得到 的。在实践中,如果某些假设条件不能满足,则OLS就不 再适用于模型的估计。在这种情况下,分析方法就需要 改变。下面列出实践中可能碰到的一些常见问题: l 误设定(Misspecification 或specification error) l 多重共线性(Multicollinearity) l 异方差性(Heteroscedasticity) l 自相关(Autocorrelation) 本章将对上述问题作简要讨论,主要介绍问题的后果、 检测方法和解决途径
第一节误设定 采用OLS法估计模型时,实际上有一个隐含的 假设,即模型是正确设定的。这包括两方面的含 义:函数形式正确和解释变量选择正确。在实践 中,这样一个假设或许从来也不现实。我们可能 犯下列三个方面的错误: 选择错误的函数形式 遗漏有关的解释变量 包括无关的解释变量 从而造成所谓的“误设定”问题
3 第一节 误设定 采用OLS法估计模型时,实际上有一个隐含的 假设,即模型是正确设定的。这包括两方面的含 义:函数形式正确和解释变量选择正确。在实践 中,这样一个假设或许从来也不现实。我们可能 犯下列三个方面的错误: 选择错误的函数形式 遗漏有关的解释变量 包括无关的解释变量 从而造成所谓的“误设定”问题
选择错误的函数形式 这类错误中比较常见的是将非线性关系作为线性关系处理 函数形式选择错误,所建立的模型当然无法反映所研究现象 的实际情况,后果是显而易见的。因此,我们应当根据实际 问题,选择正确的函数形式 我们在前面各章的介绍中采用的函数形式以线性函数为主, 上一章介绍了应变量和解释变量都采用对数的双对数模型, 下面再介绍几种比较常见的函数形式的模型,为读者的回归 实践多提供几种选择方案。这几种模型是: 半对数模型 双曲函数模型 多项式回归模型
4 一. 选择错误的函数形式 这类错误中比较常见的是将非线性关系作为线性关系处理。 函数形式选择错误,所建立的模型当然无法反映所研究现象 的实际情况,后果是显而易见的。因此,我们应当根据实际 问题,选择正确的函数形式。 我们在前面各章的介绍中采用的函数形式以线性函数为主, 上一章介绍了应变量和解释变量都采用对数的双对数模型, 下面再介绍几种比较常见的函数形式的模型,为读者的回归 实践多提供几种选择方案。这几种模型是: • 半对数模型 • 双曲函数模型 • 多项式回归模型
半对数模型 半对数模型指的是应变量和解释变量中一个为对数形式而 另一个为线性的模型。应变量为对数形式的称为对数-线性模 型( log-lin model)。解释变量为对数形式的称为线性-对数模 型( lin-log model)。我们先介绍前者,其形式如下: In Y=Bo+Bx+u 对数-线性模型中,斜率的含义是Y的百分比变动,即解释 变量X变动一个单位引起的应变量Y的百分比变动。这是因 为,利用微分可以得出: dhny1dydy B1 a(人a/=r(:a=
5 1. 半对数模型 半对数模型指的是应变量和解释变量中一个为对数形式而 另一个为线性的模型。应变量为对数形式的称为对数-线性模 型(log-lin model)。解释变量为对数形式的称为线性-对数模 型(lin-log model)。我们先介绍前者,其形式如下: 对数-线性模型中,斜率的含义是Y的百分比变动,即解释 变量X变动一个单位引起的应变量Y的百分比变动。这是因 为,利用微分可以得出: Yt = 0 + 1 Xt +ut ln ( 1) ln 1 1 = = = = dX Y dY dX dY dX Y d Y
这表明,斜率度量的是解释变量X的单位变动所 引起的应变量Y的相对变动。将此相对变动乘以100, 就得到Y的百分比变动,或者说得到Y的增长率 由于对数-线性模型中斜率系数的这一含义,因而也 叫增长模型( growth model)。增长模型通常用于测 度所关心的经济变量(如GDP)的增长率。例如 我们可以通过估计下面的半对数模型 hn( GDP)=o+Bt+u 得到一国GDP的年增长率的估计值,这里t为时间趋 势变量
6 这表明,斜率度量的是解释变量X的单位变动所 引起的应变量Y的相对变动。将此相对变动乘以100, 就得到Y的百分比变动,或者说得到Y的增长率。 由于对数-线性模型中斜率系数的这一含义,因而也 叫增长模型 (growth model)。增长模型通常用于测 度所关心的经济变量(如GDP)的增长率。例如, 我们可以通过估计下面的半对数模型 得到一国GDP的年增长率的估计值,这里t为时间趋 势变量。 t ut ln(GDP) = 0 + 1 t +
线性对数模型的形式如下 Y,=Bo+B,In X, +u 与前面类似,我们可用微分得到 B1 dydy 因此B1=X 这表明的绝对变动△Y X的相对变动△X/X △X △Y=B 上式表明,Y的绝对变动量等于B1乘以X的相对变动量。因 此,线性-对数模型通常用于研究解释变量每变动1%引起的 因变量的绝对变动量是多少这类问题
7 线性-对数模型的形式如下: 与前面类似,我们可用微分得到 因此 这表明 t t t Y = + ln X +u 0 1 = dX X dY 1 1 dX X dY dX dY 1 = X = X X Y X Y = = 的相对变动 的绝对变动 1 = X X Y 1 上式表明,Y的绝对变动量等于 乘以X的相对变动量。因 此, 线性-对数模型通常用于研究解释变量每变动1%引起的 因变量的绝对变动量是多少这类问题。 1
2.双曲函数模型 双曲函数模型的形式为: =B0+B1 不难看出,这是一个仅存在变量非线性的模型,很容易用 重新定义的方法将其线性化 双曲函数模型的特点是,当X趋向无穷时,Y趋向B,反 映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线 (Y=B0)。 双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯 曲线
8 2. 双曲函数模型 双曲函数模型的形式为: 不难看出,这是一个仅存在变量非线性的模型,很容易用 重新定义的方法将其线性化。 双曲函数模型的特点是,当X趋向无穷时,Y趋向 ,反 映到图上,就是当X趋向无穷时,Y将无限靠近其渐近线 (Y= )。 双曲函数模型通常用于描述著名的恩格尔曲线和菲利普斯 曲线。 t t t u X Y + = + 1 0 1 0 0
3.多项式回归模型 多项式回归模型通常用于描述生产成本函数,其一般形式 为: =8+x2+3 bX+St 其中Y表示总成本,Ⅹ表示产出,P为多项式的阶数,一般 不超过四阶。 多项式回归模型中,解释变量Ⅹ以不同幂次出现在方程的 右端。这类模型也仅存在变量非线性,因而很容易线性化, 可用OLS法估计模型
9 3. 多项式回归模型 多项式回归模型通常用于描述生产成本函数,其一般形式 为: 其中Y表示总成本,X表示产出,P为多项式的阶数,一般 不超过四阶。 多项式回归模型中,解释变量X以不同幂次出现在方程的 右端。这类模型也仅存在变量非线性,因而很容易线性化, 可用OLS法估计模型。 i P i i i P i Y = + X + X +......+ X + u 2 0 1 2
遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的 后果是:将使模型参数估计量不再是无偏估计量 包括无关的解释变量 模型中包括无关的解释变量,参数估计量仍无偏, 但会增大估计量的方差,即增大误差。 [注]有关上述两点结论的说明请参见教科书P101-102
10 二. 遗漏有关的解释变量 模型中遗漏了对因变量有显著影响的解释变量的 后果是:将使模型参数估计量不再是无偏估计量。 三. 包括无关的解释变量 模型中包括无关的解释变量,参数估计量仍无偏, 但会增大估计量的方差,即增大误差。 [注] 有关上述两点结论的说明请参见教科书P101-102