第五章经典单方程计量经济学模型:专门问题 、内容提要 本章主要讨论了经典单方程回归模型的几个专门题。 第一个专题是虚拟解释变量问题。虚拟变量将经济现象中的一些定性因素引入到可以 进行定量分析的回归模型,拓展了回归模型的功能。本专题的重点是如何引入不同类型的虚 拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法 方式以及二者的组合方式。在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基 准,二是避免出现“虚拟变量陷阱”。 第二个专题是滞后变量问题。滞后变量包括滞后解释变量与滞后被解释变量,根据模型 中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模 型等三类。本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、 分布滞后模型的修正估计方法以及自回归模型的估计方法。如对分布滞后模型可采用经验加 权法、 A lmon多项式法、 Koyck方法来减少滞项的数目以使估计变得更为可行。而对自回归 模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具 变量法或OLS法进行估计。由于滞后变量的引入,回归模型可将静态分析动态化,因此,可 通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数 第三个专题是模型设定偏误问题。主要讨论当放宽“模型的设定是正确的”这一基本假 定后所产生的问题及如何解决这些问题。模型设定偏误的类型包括解释变量选取偏误与模型 函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。在漏 选相关变量的情况下,OLS估计量在小样本下有偏,在大样本下非一致:当多选了无关变 量时,OLS估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS估 计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。 在模型设定的检验方面,检验是否含有无关变量,可用传统的t检验与F检验进行;检验是 否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验( RESET检验) 进行。本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法 第四个专题是关于建模一般方法论的问题。重点讨论了传统建模理论的缺陷以及为避 免这种缺陷而由 Hendry提出的“从一般到简单”的建模理论。传统建模方法对变量选取的
第五章 经典单方程计量经济学模型:专门问题 一、内容提要 本章主要讨论了经典单方程回归模型的几个专门题。 第一个专题是虚拟解释变量问题。虚拟变量将经济现象中的一些定性因素引入到可以 进行定量分析的回归模型,拓展了回归模型的功能。本专题的重点是如何引入不同类型的虚 拟变量来解决相关的定性因素影响的分析问题,主要介绍了引入虚拟变量的加法方式、乘法 方式以及二者的组合方式。在引入虚拟变量时有两点需要注意,一是明确虚拟变量的对比基 准,二是避免出现“虚拟变量陷阱”。 第二个专题是滞后变量问题。滞后变量包括滞后解释变量与滞后被解释变量,根据模型 中所包含滞后变量的类别又可将模型划分为自回归分布滞后模型与分布滞后模型、自回归模 型等三类。本专题重点阐述了产生滞后效应的原因、分布滞后模型估计时遇到的主要困难、 分布滞后模型的修正估计方法以及自回归模型的估计方法。如对分布滞后模型可采用经验加 权法、Almon多项式法、Koyck方法来减少滞项的数目以使估计变得更为可行。而对自回归 模型,则根据作为解释变量的滞后被解释变量与模型随机扰动项的相关性的不同,采用工具 变量法或OLS法进行估计。由于滞后变量的引入,回归模型可将静态分析动态化,因此,可 通过模型参数来分析解释变量对被解释变量影响的短期乘数和长期乘数。 第三个专题是模型设定偏误问题。主要讨论当放宽“模型的设定是正确的”这一基本假 定后所产生的问题及如何解决这些问题。模型设定偏误的类型包括解释变量选取偏误与模型 函数形式选取取偏误两种类型,前者又可分为漏选相关变量与多选无关变量两种情况。在漏 选相关变量的情况下,OLS 估计量在小样本下有偏,在大样本下非一致;当多选了无关变 量时,OLS 估计量是无偏且一致的,但却是无效的;而当函数形式选取有问题时,OLS 估 计量的偏误是全方位的,不仅有偏、非一致、无效率,而且参数的经济含义也发生了改变。 在模型设定的检验方面,检验是否含有无关变量,可用传统的 t 检验与 F 检验进行;检验是 否遗漏了相关变量或函数模型选取有错误,则通常用一般性设定偏误检验(RESET 检验) 进行。本专题最后介绍了一个关于选取线性模型还是双对数线性模型的一个实用方法。 第四个专题是关于建模一般方法论的问题。重点讨论了传统建模理论的缺陷以及为避 免这种缺陷而由 Hendry 提出的“从一般到简单”的建模理论。传统建模方法对变量选取的
“偿试”性使得实际建模过程存在“数据开采”问题而受到质疑。 Hendry提出的约化建模 型理论正是针对这一缺陷而提出的一套全新的建模理论。该理论认为,在模型的最初设定上, 就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,然 后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。约化 建模理论的主要优点就在于,提出了一个对不同先验假设的更为系统的检验程序:同时由于 它的初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采” 问题:另外,由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在 相同的约化程序下,最后得到的最终模型也应该是相同的。本专题重点介绍了一个“一般” 模型所应具有的基本特征、“从一般到简单”的约化过程、相关的非嵌套检验以及约化模型 的准则 二、典型例题分析 例1.一个由容量为209的样本估计的解释CEO薪水的方程为 n(salary)=4.59 +0.257In(sales)+0.O1lroe-+0. 158finance +0. 181consprod-0. 283utility (15.3)(8.03) (2.75)(1.775) (-2.895) 其中, salary表示年薪水(万元) sales表示年收入(万元)、roe表示公司股票收益(万元); finance、 conrod和 utility均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设 对比产业为交通运输业。 (1)解释三个虚拟变量参数的经济含义 (2)保持 sales和roe不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异 这个差异在1%的显著水平上是统计显著的吗? (3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接 检验这个差异是否统计显著的方程。 解答: (1) finance的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的 CEO要比交通运输业的CEO多获薪水158个百分点。其他两个可类似解释。 (2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的 utility 的参数,即为283%。由于参数的t统计值为-2895,它大于1%显著性水平下自由度为203 的t分布的临界值1.96,因此这种差异是统计上显著的
“偿试”性使得实际建模过程存在“数据开采”问题而受到质疑。Hendry 提出的约化建模 型理论正是针对这一缺陷而提出的一套全新的建模理论。该理论认为,在模型的最初设定上, 就设立一个“一般”的模型,它包括了所有先验经济理论与假设中所应包括的全部变量,然 后在模型的估计过程中逐渐剔除不显著的变量,最后得到一个较“简单”的最终模型。约化 建模理论的主要优点就在于,提出了一个对不同先验假设的更为系统的检验程序;同时由于 它的初始模型就是一个包括所有可能变量的“一般”模型,也就避免了过度的“数据开采” 问题;另外,由于初始模型的“一般”性,所有研究者的“起点”都有是相同的,因此,在 相同的约化程序下,最后得到的最终模型也应该是相同的。本专题重点介绍了一个“一般” 模型所应具有的基本特征、“从一般到简单”的约化过程、相关的非嵌套检验以及约化模型 的准则。 二、典型例题分析 例 1.一个由容量为 209 的样本估计的解释 CEO 薪水的方程为 Ln(salary)=4.59 +0.257ln(sales)+0.011roe+0.158finance +0.181consprod – 0.283utility (15.3) (8.03) (2.75) (1.775) (2.130) (-2.895) 其中,salary 表示年薪水(万元)、sales 表示年收入(万元)、roe 表示公司股票收益(万元); finance、consprod 和 utility 均为虚拟变量,分别表示金融业、消费品工业和公用事业。假设 对比产业为交通运输业。 (1)解释三个虚拟变量参数的经济含义; (2)保持 sales 和 roe 不变,计算公用事业和交通运输业之间估计薪水的近似百分比差异。 这个差异在 1%的显著水平上是统计显著的吗? (3)消费品工业和金融业之间估计薪水的近似百分比差异是多少?写出一个使你能直接 检验这个差异是否统计显著的方程。 解答: (1)finance 的参数的经济含义为:当销售收入与公司股票收益保持不变时,金融业的 CEO 要比交通运输业的 CEO 多获薪水 15.8 个百分点。其他两个可类似解释。 (2)公用事业和交通运输业之间估计薪水的近似百分比差异就是以百分数解释的 utility 的参数,即为 28.3%。由于参数的 t 统计值为-2.895,它大于 1%显著性水平下自由度为 203 的 t 分布的临界值 1.96,因此这种差异是统计上显著的
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为158%与 18.1%,因此它们间的差异为18.1%-158%=23%。一个能直接检验这一差异是否显著的方 程为 In( salary )=Bo +B, In( salse)+B, roe +a,consprod+a,utilty +a, trans +u 其中, trans为交通运输业虚拟变量。这里对比基准为金融业,因此a1表示了消费品工业与 金融业薪水的百分数差异,其t统计值可用来进行显著性检验。 例2.假设货币需求关系式为M1=a+BY+yR,式中,M,为时间t的实际现金余 额;Y”为时间t的“期望”实际收入;R为时间t的利率。根据适应规则, =X1+(1-A)Y1+1,0<λ<1修改期望值。已知y,M1,R,的数据,但Y的 数据未知 (1)建立一个可以用于推导a,B,y和估计值的经济计量模型 (2)假设E(共)=0,E(Ax2)=a2,E(11)=0,.≠0,Y1,R,M1和R1与共都不相 关。OLS估计值是1)无偏的:2)一致的吗?为什么? (3)假设1=PH11+E,E1的性质类似(2)部分。那么,本例中OLS估计值是1)无偏 的:2)一致的吗?为什么? 解答: (1)由于 BY+yR ”=RY1-1+(1-4)Y1=1+ (2) 第二个方程乘以β有 (1-m)Bri_+BA 由第一个方程得 Br =M,-a-XR BY_=M 代入方程(3)得 M1-a-成=4BY-1+(1-4)B(M/-1-a-nR1)+B
(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为 15.8%与 18.1%,因此它们间的差异为 18.1% - 15.8% = 2.3%。一个能直接检验这一差异是否显著的方 程为 ln(salary) = 0 + 1 ln(salse) + 2 roe +1 consprod + 2utilty +3 trans + u 其中,trans 为交通运输业虚拟变量。这里对比基准为金融业,因此 1 表示了消费品工业与 金融业薪水的百分数差异,其 t 统计值可用来进行显著性检验。 例 2.假设货币需求关系式为 M Y R t t t = + + ,式中, Mt 为时间 t 的实际现金余 额; Yt 为时间 t 的“ 期望”实 际收入 ; Rt 为时间 t 的利 率。根 据适应规 则, 1 1 (1 ) Y Y Y t t t t = + − + − − ,0 1 修改期望值。已知 Yt ,Mt , Rt 的数据,但 Yt 的 数据未知。 (1)建立一个可以用于推导 , , 和 估计值的经济计量模型。 (2)假设 2 2 1 ( ) 0, ( ) , ( ) 0, 0; , , E E E s Y R t t t t s t t = = = − − Mt−1 和 Rt−1 与 t 都不相 关。OLS 估计值是 1)无偏的;2)一致的吗?为什么? (3)假设 t = 1 , t t − + t 的性质类似(2)部分。那么,本例中 OLS 估计值是 1)无偏 的;2)一致的吗?为什么? 解答: (1)由于 M Y R t t t = + + (1) 1 1 (1 ) Y Y Y t t t t = + − + − − (2) 第二个方程乘以 有 1 1 (1 ) Y Y Y t t t t = + − + − − (3) 由第一个方程得 Yt Mt Rt = − − * 1 1 * Yt−1 = Mt− − − Rt− 代入方程(3)得 Mt Rt Yt Mt Rt t − − = −1 + (1− )( −1 − − −1 ) +
整理得 M1=a-a(1-A)+2B1+yR(1-A)M/1-(1-A)yR-1+B By1+(1-A)M/1+yR-(1-A)yR1+B 该模型可用来估计并计算出a,B,y和元。 (2)在给定的假设条件下,尽管H1与M,相关,但1与模型中出现的任何解释变量都 不相关,因此只是μ与M存在异期相关,所以OLS估计是一致的,但却是有偏的估计值 (3)如果H1=pH1-1+E1,则M1和1相关,因为M/1与1相关。所以OLS估计 结果有偏且不一致 3、一个估计某行业ECO薪水的回归模型如下 In( salary)=Po+B, In( sales )+B, In( mktvab+B3 profmarg +B2ceoten+ Bs comten+u 其中, salary为年薪 sales为公司的销售收入, mktva为公司的市值, promary为利润占销 售额的百分比, ceoten为其就任当前公司CEO的年数, comte为其在该公司的年数。一个 有177个样本数据集的估计得到R2=0353。若添加 ceoten2和 comte2后,R2=0.375。问:此 模型中是否有函数设定的偏误? 解答 若添加 ceoten2和 comte2后,估计的模型为 In( salary)=Bo+B, In( sales)+B2 In( mktval+B, profmarg +B2ceoten+ Bs comten +B ceoten"+B,comten +u 如果β6、β7是统计上显著不为零的,则有理由认为模型设定是有偏误的。而这一点可以通过 第三章介绍的受约束F检验来完成: (0.375-0.353)/2 =2.97 (1-0.375)(177-8) 在10%的显著性水平下,自由度为(2,∞)的F分布的临界值为2.30;在5%的显著性水平 下,临界值为3.0。由此可知在10%的显著性水平下拒绝β6=β=0的假设,表明原模型有 设定偏误问题;而在5%的显著性水平下则不拒绝β6=B7=0的假设,表明原模型没有设定 偏误问题
整理得 1 (1 ) M Y R t t t = − − + + − 1 1 (1 ) (1 ) − − − + M R t t t − − = 1 1 1 (1 ) (1 ) + + − + − − + Y M R R t t t t t − − − 该模型可用来估计并计算出 , , 和 。 (2)在给定的假设条件下,尽管 t 与 Mt 相关,但 t 与模型中出现的任何解释变量都 不相关,因此只是与 M 存在异期相关,所以 OLS 估计是一致的,但却是有偏的估计值。 (3)如果 t t t = + −1 ,则 Mt−1 和 t 相关,因为 Mt−1 与 t−1 相关。所以 OLS 估计 结果有偏且不一致。 3、一个估计某行业 ECO 薪水的回归模型如下 + + + = + + + ceoten comten salary sales mktval profm 4 5 0 1 2 3 ln( ) ln( ) ln( ) arg 其中,salary 为年薪 sales 为公司的销售收入,mktval 为公司的市值,profmarg 为利润占销 售额的百分比,ceoten 为其就任当前公司 CEO 的年数,comten 为其在该公司的年数。一个 有 177 个样本数据集的估计得到 R 2=0.353。若添加 ceoten2 和 comten2 后,R 2=0.375。问:此 模型中是否有函数设定的偏误? 解答: 若添加 ceoten2 和 comten2 后,估计的模型为 + + + + + = + + + 2 7 2 4 5 6 0 1 2 3 ln( ) ln( ) ln( ) arg ceoten comten ceoten comten salary sales mktval profm 如果6、7 是统计上显著不为零的,则有理由认为模型设定是有偏误的。而这一点可以通过 第三章介绍的受约束 F 检验来完成: 2.97 (1 0.375)/(177 8) (0.375 0.353)/ 2 = − − − F = 在 10%的显著性水平下,自由度为(2,)的 F 分布的临界值为 2.30;在 5%的显著性水平 下,临界值为 3.0。由此可知在 10%的显著性水平下拒绝6=7=0的假设,表明原模型有 设定偏误问题;而在 5%的显著性水平下则不拒绝6=7=0的假设,表明原模型没有设定 偏误问题
三、习题 (一)基本知识类题型 5-1.解释下列概念: 1)虚拟变量 5)分布滞后模型 2)虚拟因变量模型 6)自回归模型 7)h检验 4)滞后效应 8)有限最小二乘法 5-2.在建立计量经济模型时,什么时候、为什么要引入虚拟变量? 5-3.举例说明虚拟变量在模型中的作用 5-4.什么是“虚拟变量陷阱”? (二)基本证明与问答类题型 5-5.对包含常数项的季节变量模型运用最小二乘法时,如果模型中引入4个季节虚拟变量, 其估计结 果会出现什么问题? 5-6.滞后外生变量模型和滞后内生变量模型的概念是什么? 5-7.滞后变量模型有哪几种类型?外生变量分布滞后模型使用OLS方法存在哪些问题? 5-8.产生模型设定偏误的主要原因是什么?模型设定偏误的后果以及检验方法有哪些? 5-9.试在消费函数Y=a+BX+E中(以加法形式)引入虚拟变量,用以反映季节因素(淡 旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式 5-10.现有如下估计的利润函数: Y.=221.37+04537X+7863D+00037XD (3578)(8.86)(286 其中:Y、X分别为销售利润和销售收入:D为虚拟变量,旺季时D=1,淡季时D=0 XD=X·D,试分析:(1)季节因素的影响情况: (2)写出模型的等价形式。 5-11.如何确定有限分布滞后模型中的滞后期长度? 5-12.被解释变量对于一个或者多个解释变量反应滞后的原因是什么?给出一些分布滞后模 型的例子
三、习题 (一)基本知识类题型 5-1.解释下列概念: 1) 虚拟变量 2) 虚拟因变量模型 3) 滞后变量 4) 滞后效应 5) 分布滞后模型 6) 自回归模型 7) h 检验 8) 有限最小二乘法 5-2.在建立计量经济模型时,什么时候、为什么要引入虚拟变量? 5-3.举例说明虚拟变量在模型中的作用。 5-4.什么是“虚拟变量陷阱”? (二)基本证明与问答类题型 5-5.对包含常数项的季节变量模型运用最小二乘法时,如果模型中引入 4 个季节虚拟变量, 其估计结 果会出现什么问题? 5-6.滞后外生变量模型和滞后内生变量模型的概念是什么? 5-7.滞后变量模型有哪几种类型?外生变量分布滞后模型使用 OLS 方法存在哪些问题? 5-8.产生模型设定偏误的主要原因是什么?模型设定偏误的后果以及检验方法有哪些? 5-9.试在消费函数 Y = + X + 中(以加法形式)引入虚拟变量,用以反映季节因素(淡、 旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式。 5-10.现有如下估计的利润函数: Yt Xi Di 0037XDi 221.37 0.4537 78.63 0. ˆ = + + + (35.78) (8.86) (2.86) 其中: Y 、 X 分别为销售利润和销售收入; D 为虚拟变量,旺季时 D =1 ,淡季时 D = 0 ; XD= X D ,试分析:(1)季节因素的影响情况; (2)写出模型的等价形式。 5-11.如何确定有限分布滞后模型中的滞后期长度? 5-12.被解释变量对于一个或者多个解释变量反应滞后的原因是什么?给出一些分布滞后模 型的例子
5-13.简述约化建模理论与传统建模理论的联系与区别:变量的外生性概念在约化建模理论 与传统建模理论中有何不同? 5-14.局部调整方法用于多元回归模型会出现什么问题? 5-15.在计量经济模型定式中,解释变量设定误差有几类?各有什么特点? 5-16.在实际建模中如何保证约化过程的有效性?人们有时将约化建模理论称为“TTT方法 论”,意思是“检验、检验、再检验”,谈谈你对此的看法。 5-17.说明使用代理变量的条件。 5-18.叙述用阿尔蒙多项式法估计外生变量有限分布滞后模型的方法步骤,对多项式的次数 r有哪些限制,为什么? 5-19.如果一个定性变量含有k个类别,为什么不能设k个虚拟变量? (三)基本计算类题型 5-20.假设利率R<008时,投资/取决于利润X:而利率R≥008时,投资I同时取决 于利润X和利润R:试用一个可以检验的模型来表达上述关系 5-21.考虑以下模型: Vi=ao+aixi ++Ei (在农村) Vi=Po+BiXu+B2x2i+a (在城镇) 若假设H0:a2=B2,即不论在农村或在城镇,模型中第二个系数a2、B2是相同的;如何 检验这个假设? 5-22.假设某投资函数:1,=a+B0X1+B1X-1+B2X12+…+B,Xx=,+l 其中:1,为t期的投资;X1表示t期的销售量 假定滞后形式为倒“V”型,简述如何设计权数估计此模型 5-23.设不含设定误差的回归模型为: y=B1+B2X2+B3X13+l1 如果遗漏了重要解释变量X,而错误地定式为: =B1+B2X2+1 请给出在此条件下的OLS估计参数b1、b2的偏倚公式,并给予说明。 5-24.请判断下列陈述是否正确: (1)在回归模型y=B1+B2D4+l1中,如果虚拟变量D2的取值为0或2,而非通常情况
5-13.简述约化建模理论与传统建模理论的联系与区别;变量的外生性概念在约化建模理论 与传统建模理论中有何不同? 5-14.局部调整方法用于多元回归模型会出现什么问题? 5-15.在计量经济模型定式中,解释变量设定误差有几类?各有什么特点? 5-16.在实际建模中如何保证约化过程的有效性?人们有时将约化建模理论称为“TTT 方法 论”,意思是“检验、检验、再检验”,谈谈你对此的看法。 5-17.说明使用代理变量的条件。 5-18.叙述用阿尔蒙多项式法估计外生变量有限分布滞后模型的方法步骤,对多项式的次数 r 有哪些限制,为什么? 5-19.如果一个定性变量含有 k 个类别,为什么不能设 k 个虚拟变量? (三)基本计算类题型 5-20.假设利率 R 0.08 时,投资 I 取决于利润 X ;而利率 R 0.08 时,投资 I 同时取决 于利润 X 和利润 R ;试用一个可以检验的模型来表达上述关系。 5-21.考虑以下模型: i i i i y = + x + x + 0 1 1 2 2 (在农村) i i i i y = + x + x + 0 1 1 2 2 (在城镇) 若假设 0 2 2 H : = ,即不论在农村或在城镇,模型中第二个系数 2 、 2 是相同的;如何 检验这个假设? 5-22.假设某投资函数: t Xt Xt Xt s Xt s ut I = + 0 + 1 −1 + 2 −2 ++ − + 其中: t I 为 t 期的投资; Xt 表示 t 期的销售量。 假定滞后形式为倒“V”型,简述如何设计权数估计此模型。 5-23.设不含设定误差的回归模型为: Yi = 1 + 2Xi2 + 3Xi3 + ui 如果遗漏了重要解释变量 X3,而错误地定式为: Yi = 1 + 2Xi2 + ui 请给出在此条件下的 OLS 估计参数 1 b 、b2 的偏倚公式,并给予说明。 5-24.请判断下列陈述是否正确: (1)在回归模型 Yi = 1 + 2Di + ui 中,如果虚拟变量 Di 的取值为 0 或 2,而非通常情况
下的为0或1,那么参数B2的估计值将减半,其T值也将减半 (2)在引入虚拟变量后,普通最小二乘法的估计值只有在大样本情况下才是无偏的 5-25.根据美国1961年第一季度至1977年第二季度的季度数据,我们得到了如下的咖啡需 求函数的回归方程 hQ=1.2789-0.1647+0.5115hl1+0.1483hP-000897-00961D1 (-214)(1.23) (0.55)(-3.36)(-3.74) -0.1570D2-0.0097D (-6.03)(-0.37) R2=080 其中:ρ—一—人均咖啡消费量(单位:磅) P—一咖啡的价格(以1967年价格为不变价格) P’一一茶的价格(1/4磅,以1967年价格为不变价格) T—一时间趋势变量(1%61年第一季度为1,……1977年第二季度为66) D1-—1:第一季度;D2--1:第二季度;D3-—1:第三季度 要求回答下列问题 (1)模型中P、Ⅰ和P'的系数的经济含义是什么? (2)咖啡的价格需求是否很有弹性? (3)咖啡和茶是互补品还是替代品? (4)如何解释时间变量T的系数? (5)如何解释模型中虚拟变量的作用? (6)哪一个虚拟变量在统计上是显著的? (7)咖啡的需求是否存在季节效应? 5-26.为了研究体重与身高的关系,我们随机抽样调查了51名学生(其中36名男生,15 名女生),并得到如下两种回归模型: W=-232.06551+5.5662h 52066)(86246) W=-1229621+238238D+3.7402h (b)
下的为 0 或 1,那么参数 2 的估计值将减半,其 T 值也将减半; (2)在引入虚拟变量后,普通最小二乘法的估计值只有在大样本情况下才是无偏的; 5-25.根据美国 1961 年第一季度至 1977 年第二季度的季度数据,我们得到了如下的咖啡需 求函数的回归方程: t t t Pt T D t Q P I 0961 1 1.2789 0.1647 0.5115ln 0.1483ln 0.0089 0. ˆ ln = − + + − − (−2.14) (1.23) (0.55) (−3.36) (−3.74) D2t 0097D3t − 0.1570 − 0. (−6.03) (−0.37) 0.80 2 R = 其中: Q ——人均咖啡消费量(单位:磅) P ——咖啡的价格(以 1967 年价格为不变价格) P ——茶的价格(1/4 磅,以 1967 年价格为不变价格) T ——时间趋势变量(1961 年第一季度为 1,……1977 年第二季度为 66) D1——1:第一季度; D2——1:第二季度; D3 ——1:第三季度 要求回答下列问题: (1)模型中 P 、 I 和 P 的系数的经济含义是什么? (2)咖啡的价格需求是否很有弹性? (3)咖啡和茶是互补品还是替代品? (4)如何解释时间变量 T 的系数? (5)如何解释模型中虚拟变量的作用? (6)哪一个虚拟变量在统计上是显著的? (7)咖啡的需求是否存在季节效应? 5-26.为了研究体重与身高的关系,我们随机抽样调查了 51 名学生(其中 36 名男生,15 名女生),并得到如下两种回归模型: W ˆ = −232.06551+ 5.5662h (a) (−5.2066) (8.6246) W ˆ = −122.9621+ 23.8238D + 3.7402h (b)
(-2.5884)(4.0149)(5.1613) 其中:W( weight)一—体重(单位:磅) h( height)——身高(单位:英寸) 0,女 要求回答下列问题 (1)你将选择哪一个模型?为什么? (2)如果模型(b)确实更好而你选择了(a),你犯了什么错误? (3)D的系数说明了什么? 5-27.某商品销售量y与个人收入x的季度数据建立如下模型 y,=Bo+B, Du +B2 D2+B, D3+ B4D4 +Bsx,+u 其中定义虚拟变量D,为第i季度时其数值取1,其余为0,这时会发生什么问题,参数是否 能够用最小二乘法进行估计? 5-28.考虑如下三个有关成本函数的模型: 函数形常数项 线性函16646719933 084090.716 se=(19021)(3.066) 次函22383-80252.542 0.92841.038 se=(23489(9.809)069 三次函141.76763478-129620939099832.10 8e=(6375)(478)(0986)(059 其中:x—一产出,d—DW统计量, 标准偏差 要求回答下列问题: (1)假定样本容量为15,显著性水平为5%,以上三个模型中的杜宾一沃森d的d、d2分 别为多少? (2)以上线性模型中是否存在自相关?如果存在,意味着什么? (3)以上二次函数模型中是否存在自相关?如果存在,意味着什么?
(−2.5884) (4.0149) (5.1613) 其中: W (weight)——体重(单位:磅) h (height)——身高(单位:英寸) = 女 男 0; 1; D 要求回答下列问题: (1)你将选择哪一个模型?为什么? (2)如果模型(b)确实更好而你选择了(a),你犯了什么错误? (3)D 的系数说明了什么? 5-27.某商品销售量 y 与个人收入 x 的季度数据建立如下模型: t t t t t t ut y = 0 + 1D1 + 2D2 + 3D3 + 4D4 + 5 x + 其中定义虚拟变量 Dit 为第 i 季度时其数值取 1,其余为 0,这时会发生什么问题,参数是否 能够用最小二乘法进行估计? 5-28.考虑如下三个有关成本函数的模型: 其中: x ——产出, d ——D-W 统计量, se ——标准偏差 要求回答下列问题: (1)假定样本容量为 15,显著性水平为 5%,以上三个模型中的杜宾—沃森 d 的 u d 、 L d 分 别为多少? (2)以上线性模型中是否存在自相关?如果存在,意味着什么? (3)以上二次函数模型中是否存在自相关?如果存在,意味着什么? 函数形 式 常数项 x 2 x 3 x 2 R d 线性函 数 166.467 19.933 —— —— 0.8409 0.716 se = (19.021) (3.066) 二次函 数 222.383 −8.025 2.542 —— 0.9284 1.038 se = (23.488) (9.809) (0.869) 三次函 数 141.767 63.478 −12.962 0.939 0.9983 2.10 se = (6.375) (4.778) (0.986) (0.059)
(4)以上三次函数模型中是否存在自相关?如果不存在,意味着什么? (5)以上三个模型中的边际生产成本是什么? (6)从经济意义上讲,以上哪个模型更合理?为什么? 5-29.下面是1982年-1986年按季节全国酒销售量Y(单位:万吨)的数据。试建立酒销 售量Y对时间t的季节销售模型 1982.1 92.7 1984.3 19822 93.6 1982.3 1985.1 111.5 19824 1985.2 98.4 1983.1 04.1 1985.3 1983.2 89.7 19854 1983.3 1986.1 l15.2 19834 1986.2 113.8 1984.1 1079 1986.3 l192 1984.2 1986.4 l11.1 (四)自我综合练习类题型 5-30.分析一个具体的经济问题,如某耐用消费品的购买情况,学生可以分组(3到4人 组)调查有关情况,如:家庭可支配收入、住房情况、子女状况、户主年龄、婚姻状况、银 行存款等 要求:(1)样本数>5C (2)线性概率模型进行估计 (3)逻辑模型进行估计 (4)对所得结果进行必要的分析
(4)以上三次函数模型中是否存在自相关?如果不存在,意味着什么? (5)以上三个模型中的边际生产成本是什么? (6)从经济意义上讲,以上哪个模型更合理?为什么? 5-29.下面是 1982 年—1986 年按季节全国酒销售量 Yi (单位:万吨)的数据。试建立酒销 售量 Yi 对时间 t 的季节销售模型。 i Yi t i Yi t 1982.1 92.7 1 1984.3 97.8 11 1982.2 79.3 2 1984.4 93.6 12 1982.3 80.1 3 1985.1 111.5 13 1982.4 86.7 4 1985.2 98.4 14 1983.1 104.1 5 1985.3 97.7 15 1983.2 89.7 6 1985.4 94.0 16 1983.3 90.2 7 1986.1 115.2 17 1983.4 90.2 8 1986.2 113.8 18 1984.1 107.9 9 1986.3 119.2 19 1984.2 96.7 10 1986.4 111.1 20 (四)自我综合练习类题型 5-30.分析一个具体的经济问题,如某耐用消费品的购买情况,学生可以分组(3 到 4 人一 组)调查有关情况,如:家庭可支配收入、住房情况、子女状况、户主年龄、婚姻状况、银 行存款等。 要求:(1)样本数>50; (2)线性概率模型进行估计; (3)逻辑模型进行估计; (4)对所得结果进行必要的分析
四、习题解答 5-1.解释下列概念 (1)在建立模型时,有一些影响经济变量的因素无法定量描述,如:职业、性别对收入的 影响,教育程度、季节等需要用定性变量度量。为了在模型中反映这类因素的影响,并提高 模型的精度,需要将这类变量“量化”,根据这类变量的属性类型,构造仅取“0”或“1 的人工变量,通常称这类变量为“虚拟变量”。 (②)也称“虚拟被解释变量模型”,指被解释变量也用虚拟变量表示,如:就业与否受年 龄、身体状况、学历、性别、收入等许多因素影响,但最终的结果只有两个,要么就业,要 么失业。这类模型一般被用来研究某一决策和结果的可能性。 (3)在现实经济运行中,某些经济变量不仅受同期各种因素的影响,而且也受到过去某些 时期的各种因素的影响,甚至受到自身的过去值的影响,如:居民的消费需求不仅受本期收 入的影响还受到上期收入的影响,通常把这种过去时期的、具有滞后作用的变量称为“滞后 变量”。 (4)对于解释变量的任何变化,被解释变量必然会做出反映,而这些反映往往是要经过 段时间之后才会表现出来,称这种现象为滞后效应 5模型中没有滞后被解释变量,本期被解释变量Y仅与解释变量的当期值X,及其若干 期的滞后值,3X2,…等有关,这样的模型就是分布滞后模型。其普遍形式为(以一元 为例 Y=a+Box,+BX++BrX-k+u 6)自回归模型指被解释变量的滞后变量}1作为解释变量的模型,由于是被解释变量 的滞后期变量对被解释变量现期的回归,即自己回归自己而得名 (7h检验是 Durbin于1970年提出,是针对自回归模型中含有滞后变量Y1作为解释变 量时,检验随机扰动项是否具有自相关的DW检验已不在适用的情况下提出的,这种识用 于大样本情形下检验自回归模型有无一阶自相关的方法称为h检验法。该法定义统计量为: h=p V(. (8)回归模型中的参数满足一定的限制条件,再根据该限制条件间接利用OLS法回归样
四、习题解答 5-1.解释下列概念: ⑴在建立模型时,有一些影响经济变量的因素无法定量描述,如:职业、性别对收入的 影响,教育程度、季节等需要用定性变量度量。为了在模型中反映这类因素的影响,并提高 模型的精度,需要将这类变量“量化”,根据这类变量的属性类型,构造仅取“0”或“1” 的人工变量,通常称这类变量为“虚拟变量”。 ⑵也称“虚拟被解释变量模型”,指被解释变量也用虚拟变量表示,如:就业与否受年 龄、身体状况、学历、性别、收入等许多因素影响,但最终的结果只有两个,要么就业,要 么失业。这类模型一般被用来研究某一决策和结果的可能性。 ⑶在现实经济运行中,某些经济变量不仅受同期各种因素的影响,而且也受到过去某些 时期的各种因素的影响,甚至受到自身的过去值的影响,如:居民的消费需求不仅受本期收 入的影响还受到上期收入的影响,通常把这种过去时期的、具有滞后作用的变量称为“滞后 变量”。 ⑷对于解释变量的任何变化,被解释变量必然会做出反映,而这些反映往往是要经过一 段时间之后才会表现出来,称这种现象为滞后效应。 ⑸模型中没有滞后被解释变量,本期被解释变量 Yt 仅与解释变量的当期值 Xt 及其若干 期的滞后值 Xt−1 , Xt−2 , 等有关,这样的模型就是分布滞后模型。其普遍形式为(以一元 为例): Yt = + 0Xt + 1Xt−1 ++ k Xt−k + ut ⑹自回归模型指被解释变量 Y 的滞后变量 Yt−1 作为解释变量的模型,由于是被解释变量 的滞后期变量对被解释变量现期的回归,即自己回归自己而得名。 ⑺h 检验是 Durbin 于 1970 年提出,是针对自回归模型中含有滞后变量 Yt−1 作为解释变 量时,检验随机扰动项是否具有自相关的 DW 检验已不在适用的情况下提出的,这种识用 于大样本情形下检验自回归模型有无一阶自相关的方法称为 h 检验法。该法定义统计量为: ) ˆ ( 1 ˆ ˆ 2 nV n h − = ⑻回归模型中的参数满足一定的限制条件,再根据该限制条件间接利用 OLS 法回归样