第二十五章时间序列/截面数据模型 在经典计量经济学模型中,所利用的数据(样本观测值)的一个特征是, 或者只利用时间序列数据( (time series),或者只利用截面数据( cross section) 我们经常遇到在同一时间包含不同截面成员信息的数据,或在若干时间区间 观测到相关的一些截面成员的数据。例如许多欧洲国家的GDP时间序列数据, 或者是一段时间不同地区的失业状态数据。我们称这些数据为联合利用时间 序列/截面数据( Pooled time series, cross section)。有的书中也称这类数据 为面板数据( panel data),指在时间序列上取多个截面,在这些截面上同时选 取样本观测值所构成的样本数据。 处理时间序列/截面数据的 EViews对象称为一个Pool。 EViews提供了许多 专用工具处理Pool数据,包括数据管理,选择时间序列长度和截面成员的多 少,以及进行数据估计。 本章将主要介绍怎样建立Pool数据以及定义和处理Pool对象
1 第二十五章 时间序列/截面数据模型 在经典计量经济学模型中,所利用的数据(样本观测值)的一个特征是, 或者只利用时间序列数据(time series),或者只利用截面数据(cross section)。 我们经常遇到在同一时间包含不同截面成员信息的数据,或在若干时间区间 观测到相关的一些截面成员的数据。例如许多欧洲国家的GDP时间序列数据, 或者是一段时间不同地区的失业状态数据。我们称这些数据为联合利用时间 序列/截面数据(Pooled time series,cross section)。有的书中也称这类数据 为面板数据(panel data),指在时间序列上取多个截面,在这些截面上同时选 取样本观测值所构成的样本数据。 处理时间序列/截面数据的EViews对象称为一个Pool。EViews提供了许多 专用工具处理Pool数据,包括数据管理,选择时间序列长度和截面成员的多 少,以及进行数据估计。 本章将主要介绍怎样建立Pool数据以及定义和处理Pool对象
§251P0o对象 Pool对象的核心是建立用来表示截面成员的名称表。为明显起见,名 称要相对较短。例如,国家作为截面成员时,可以使用USA代表美国, CAN代表加拿大,UK代表英国 定义了Pool的截面成员名称就等于告诉了 EViews,模型的数据结构。 在上面的例子中, EViews会自动把这个Poo理解成对每个国家使用单独的 时间序列 必须注意,Poo对象本身不包含序列或数据。一个Pool对象只是对基 本数据结构的一种描述。因此,删除一个Pool并不会同时删除它所使用的 序列,但修改Poo使用的原序列会同时改变Poo中的数据
2 §25.1 Pool对象 Pool对象的核心是建立用来表示截面成员的名称表。为明显起见,名 称要相对较短。例如,国家作为截面成员时,可以使用USA代表美国, CAN代表加拿大,UK代表英国。 定义了Pool的截面成员名称就等于告诉了EViews,模型的数据结构。 在上面的例子中,EViews会自动把这个Pool理解成对每个国家使用单独的 时间序列。 必须注意,Pool对象本身不包含序列或数据。一个Pool对象只是对基 本数据结构的一种描述。因此,删除一个Pool并不会同时删除它所使用的 序列,但修改Pool使用的原序列会同时改变Pool中的数据
创建P00对象 在本章中,使用的是一个研究投资需求的例子,包括了五家企业和三 个变量的20个年度观测值的时间序列: 5家企业 3个变量: CM:通用汽车公司 I:总投资 CH:克莱斯勒公司 F:前一年企业的市场价值 GE:通用电器公司 S:前一年末工厂存货和设备的价值 WE:西屋公司 US:美国钢铁公司 要创建Po对象,选择 Objects/New Object/Pool.并在编辑窗口中输入 截面成员的识别名称:
3 一、创建Pool对象 在本章中,使用的是一个研究投资需求的例子,包括了五家企业和三 个变量的20个年度观测值的时间序列: 5家企业: 3个变量: CM:通用汽车公司 I :总投资 CH:克莱斯勒公司 F :前一年企业的市场价值 GE:通用电器公司 S :前一年末工厂存货和设备的价值 WE:西屋公司 US:美国钢铁公司 要创建Pool对象,选择Objects/New Object/Pool…并在编辑窗口中输入 截面成员的识别名称:
EViews File Edit Objects view Procs Quick Options Window Help View Procs Objects Print Name Freeze Estimatel Define PoolGerr Sheet Cross Section Identifiers:(Enter identifiers below this line GM CH GE WVE J Path= d: \eviews\example filesilogl DB none WF= poo13 对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建 立合法的 EViews序列名称。此处推荐在每个识别名中使用“”字符,它不 是必须的,但把它作为序列名的一部分,可以很容易找到识别名称
4 对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建 立合法的EViews序列名称。此处推荐在每个识别名中使用“_”字符,它不 是必须的,但把它作为序列名的一部分,可以很容易找到识别名称
二、观察或编辑Pol定义 要显示Pool中的截面成员识别名称,单击工具条的 Define按钮,或选择 View/ Cross-Section Identifiers。如果需要,也可以对识别名称列进行编辑 三、使用P0o和序列 Pool中使用的数据都存在普通 EViews序列中。这些序列可以按通常方式 使用:可以列表显示,图形显示,产生新序列,或用于估计。也可以使用 Pool对象来处理各单独序列 四、序列命名 在Poo中使用序列的关键是序列命名:使用基本名和截面识别名称组合 命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可 例如,现有一个Pool对象含有识别名JPN,USA,UK,想建立 每个截面成员的GDP的时间序列,我们就使用“GDP作为序列的基本名。 可以把识别名称放在基本名的后面,此时序列名为 GDP JPN,GDP USA, GDP UK;或者把识别名称放在基本名的前面,此时序列名为JPN GDP, USA GDP, UK GDP
5 二、观察或编辑Pool定义 要显示Pool中的截面成员识别名称,单击工具条的Define按钮,或选择 View/Cross-Section Identifiers。如果需要,也可以对识别名称列进行编辑。 三、使用Pool和序列 Pool中使用的数据都存在普通EViews序列中。这些序列可以按通常方式 使用:可以列表显示,图形显示,产生新序列,或用于估计。也可以使用 Pool对象来处理各单独序列。 四、序列命名 在Pool中使用序列的关键是序列命名:使用基本名和截面识别名称组合 命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可。 例如,现有一个Pool对象含有识别名 _JPN, _USA,_UK,想建立 每个截面成员的GDP的时间序列,我们就使用“GDP”作为序列的基本名。 可以把识别名称放在基本名的后面,此时序列名为GDP_JPN,GDP_ USA,GDP_UK;或者把识别名称放在基本名的前面,此时序列名为JPN_ GDP,USA_GDP,UK_GDP
把识别名称放在序列名的前面,中间或后面并没什么关系,只要易于识 别就行了。但是必须注意要保持一致,不能这样命名序列: JPNGDP GDPUSA, UKGDP1,因为 EViews无法在Poo对象中识别这些序列 五、P0o序列 旦选定的序列名和Poo中的截面成员识别名称相对应,就可以利用这 些序列使用Pol了。其中关键是要理解Pool序列的概念。 一个Poo序列实际就是一组序列,序列名是由基本名和所有截面识别名构 成的。POol序列名使用基本名和“?”占位符,其中“?”代表截面识别名。 如果序列名为 GDPJPN, GDPUSA, GDPUK,相应的Poo序列为GDP?。如果 序列名为 JPNGDP, USAGDP, UKGDP,相应的Poo序列为?GDP。 当使用一个Poo序列名时, EViews认为将准备使用Pool序列中的所有序 列。EⅤews会自动循环查找所有截面识别名称并用识别名称替代“?”。然 后会按指令使用这些替代后的名称了。Pool序列必须通过Pool对象来定义 因为如果没有截面识别名称,占位符“?”就没有意义
6 把识别名称放在序列名的前面,中间或后面并没什么关系,只要易于识 别就行了。但是必须注意要保持一致,不能这样命名序列:JPNGDP, GDPUSA,UKGDP1,因为EViews无法在Pool对象中识别这些序列。 五、Pool序列 一旦选定的序列名和Pool中的截面成员识别名称相对应,就可以利用这 些序列使用Pool了。其中关键是要理解Pool序列的概念。 一个Pool序列实际就是一组序列, 序列名是由基本名和所有截面识别名构 成的。Pool序列名使用基本名和“?”占位符,其中“?”代表截面识别名。 如果序列名为GDPJPN,GDPUSA,GDPUK,相应的Pool序列为GDP?。如果 序列名为JPNGDP,USAGDP,UKGDP,相应的Pool序列为?GDP。 当使用一个Pool序列名时,EViews认为将准备使用Pool序列中的所有序 列。EViews会自动循环查找所有截面识别名称并用识别名称替代“?”。然 后会按指令使用这些替代后的名称了。Pool序列必须通过Pool对象来定义, 因为如果没有截面识别名称,占位符“?”就没有意义
§252输入Pool数据 有很多种输入数据的方法,在介绍各种方法之前,首先要理解时间序列/ 截面数据的结构,区别堆积数据和非堆积数据形式 时间序列/截面数据的数据信息用三维表示:时期,截面成员,变量。例 如:1950年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有几种常用的方法 非堆积数据 存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成 员、给定变量的观测值放在一起,但和其他变量、其他截面成员的数据分开。 例如,假定我们的数据文件为下面的形式
7 §25.2 输入Pool数据 有很多种输入数据的方法,在介绍各种方法之前,首先要理解时间序列/ 截面数据的结构,区别堆积数据和非堆积数据形式。 时间序列/截面数据的数据信息用三维表示:时期,截面成员,变量。例 如:1950年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有几种常用的方法。 一、非堆积数据 存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成 员、给定变量的观测值放在一起,但和其他变量、其他截面成员的数据分开。 例如,假定我们的数据文件为下面的形式:
I GM I CH I WE I US F GM 1935317.600402900033.100012.9300020990003078500 193631.80072.7600045000025900035530004661.700 1937410.60066.2600077.20003.05004699005387100 193827.700051.6000044.60002.8900262.30002792.200 1939330.80052.410004.100018.840023040004313.200 1940461.20069.4100074.40003.570026160004643900 1941512.000068.35000113.000048.510047280004551.200 1942448.000046.8000091.900043.340044560003244.100 194349960047.400006.3000 020036160004053.700 194457.50005957000580003.8100028820004379300 194551.20088.780009.60003.2700258.70004840900 194668.10074.12000159.9005.460042030004900900 其中基本名I代表企业总投资、F代表前一年企业的市场价值、S代表前 年末工厂存货和设备的价值。每个企业都有单独的I、F、S数据。 EⅤiews会自动按第四章介绍的标准输入程序读取非堆积数据。并把每个 截面变量看作一个单独序列。注意要按照上述的Pool命名规则命名
8 其中基本名I代表企业总投资、F代表前一年企业的市场价值、S代表前 一年末工厂存货和设备的价值。每个企业都有单独的I、F、S数据。 EViews会自动按第四章介绍的标准输入程序读取非堆积数据。并把每个 截面变量看作一个单独序列。注意要按照上述的Pool命名规则命名
二、堆积数据 选择 View/Spreadsheet( stacked data), EViews会要求输入序列名列表 Ser ries list X List of ordinary and pool (specified with ] series K Cancel 确认后 EViews会打开新建序列的堆积式数据表。我们看到的是按截 面成员堆积的序列,Pool序列名在每列表头,截面成员/年代识别符标识 每行
9 确认后EViews会打开新建序列的堆积式数据表。我们看到的是按截 面成员堆积的序列,Pool序列名在每列表头,截面成员/年代识别符标识 每行: 二、堆积数据 选择View/Spreadsheet(stacked data),EViews会要求输入序列名列表
Pool数据排列成堆积形式,一个变量的所有数据放在一起,和其他 变量的数据分开。大多数情况下,不同截面成员的数据从上到下依次堆 积,每一列代表一个变量: Pool: COPA. Workfile: 21 1 view Procs objects Print Name Freeze Edit+-loOrder+- Smpl+-ITitle Est os F S? GM1935317600307850028000 CH19354029000417500010.5000 GE19353310 1170600978000 WE193512.93001915001800000 US193520990001362400538000 GM193639180004661700526000 CH19367276000837800010.2000 GE19364500002015800104400 WE1936259000516000080000 US193635530001807100505000 GM193741060005387.100156900 CH19376626000889000347000 GE19377720002803300118000 WE19373505000729000740000 US193746990026763001181000 GM1938
10 Pool数据排列成堆积形式,一个变量的所有数据放在一起,和其他 变量的数据分开。大多数情况下,不同截面成员的数据从上到下依次堆 积,每一列代表一个变量: