第二十五章肘间序列/截面数据模型 在经典计量经济学模型中,所利用的数据(样本观测值)的一个特征是, 或者只利用时间序列数据( time series),或者只利用截面数据( cross section)。 我们经常遇到在同时间包含不同截面成员信息的数据,或在若干时间区间 观测到相关的一些截面成员的数据。例如许多欧洲国家的GDP时间序列数据, 或者是一段时间不同地区的失业状态数据。我们称这些数据为联合利用时间 序列截面数据( Pooled time series, cross section)。有的书中也称这类数据 为面板数据( panel data),指在时间序列上取多个截面,在这些截面上同时选 取样本观测值所构成的样本数据。 处理时间序列/截面数据的EVew对象称为一个Pool。Eew提供了许多 专用工具处理Pool数据,包括数据管理,选择时间序列长度和截面成员的多 少,以及进行数据估计 本章将主要介绍怎样建立Poo数据以及定义和处理Pool对象
1 第二十五章 时间序列/截面数据模型 在经典计量经济学模型中,所利用的数据(样本观测值)的一个特征是, 或者只利用时间序列数据(time series),或者只利用截面数据(cross section)。 我们经常遇到在同一时间包含不同截面成员信息的数据,或在若干时间区间 观测到相关的一些截面成员的数据。例如许多欧洲国家的GDP时间序列数据, 或者是一段时间不同地区的失业状态数据。我们称这些数据为联合利用时间 序列/截面数据(Pooled time series,cross section)。有的书中也称这类数据 为面板数据(panel data),指在时间序列上取多个截面,在这些截面上同时选 取样本观测值所构成的样本数据。 处理时间序列/截面数据的EViews对象称为一个Pool。EViews提供了许多 专用工具处理Pool数据,包括数据管理,选择时间序列长度和截面成员的多 少,以及进行数据估计。 本章将主要介绍怎样建立Pool数据以及定义和处理Pool对象
§251Po0对象 POol对象的核心是建立用来表示截面成员的名称表。为明显起见,名 称要相对较短。例如,国家作为截面成员时,可以使用USA代表美国, CAN代表加拿大,UK代表英国。 定义了Pool的截面成员名称就等于告诉了 EViews,模型的数据结构。 在上面的例子中, EViews会自动把这个Pool理解成对每个国家使用单独的 时间序列。 必须注意,Pool对象本身不包含序列或数据。一个Poo对象只是对基 本数据结构的一种描述。因此,删除一个Pol并不会同时删除它所使用的 序列,但修改Pool使用的原序列会同时改变Pool中的数据
2 §25.1 Pool对象 Pool对象的核心是建立用来表示截面成员的名称表。为明显起见,名 称要相对较短。例如,国家作为截面成员时,可以使用USA代表美国, CAN代表加拿大,UK代表英国。 定义了Pool的截面成员名称就等于告诉了EViews,模型的数据结构。 在上面的例子中,EViews会自动把这个Pool理解成对每个国家使用单独的 时间序列。 必须注意,Pool对象本身不包含序列或数据。一个Pool对象只是对基 本数据结构的一种描述。因此,删除一个Pool并不会同时删除它所使用的 序列,但修改Pool使用的原序列会同时改变Pool中的数据
创建Po0对象 在本章中,使用的是一个研究投资需求的例子,包括了五家企业和三 个变量的20个年度观测值的时间序列 5家企业 个变量 CM:通用汽车公司 Ⅰ:总投资 CH:克莱斯勒公司 F:前一年企业的市场价值 GE:通用电器公司 S:前一年末工厂存货和设备的价值 WE:西屋公司 US:美国钢铁公司 要创建Pool对象,选择 Objects/New Object/Pool.并在编辑窗口中输入 截面成员的识别名称
3 一、创建Pool对象 在本章中,使用的是一个研究投资需求的例子,包括了五家企业和三 个变量的20个年度观测值的时间序列: 5家企业: 3个变量: CM:通用汽车公司 I :总投资 CH:克莱斯勒公司 F :前一年企业的市场价值 GE:通用电器公司 S :前一年末工厂存货和设备的价值 WE:西屋公司 US:美国钢铁公司 要创建Pool对象,选择Objects/New Object/Pool…并在编辑窗口中输入 截面成员的识别名称:
盟 EViews File Edit Objects view Procs Quick Options Window Help View Procs Objects Print Name Freeze Estimate Define PoolGenr Sheet Cross Section Identifiers:(Enter identifiers below this line CH GE WVE I Path= d: \eviews\ex ample files(logl DB none WF pool3 对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建 立合法的 EViews序列名称。此处推荐在每个识别名中使用“”字符,它不 是必须的,但把它作为序列名的一部分,可以很容易找到识别名称
4 对截面成员的识别名称没有特别要求,但必须能使用这些识别名称建 立合法的EViews序列名称。此处推荐在每个识别名中使用“_”字符,它不 是必须的,但把它作为序列名的一部分,可以很容易找到识别名称
二、观察或编辑Pool定义 要显示Po中的截面成员识别名称,单击工具条的 Define按钮,或选择 vew( ross-Section Identifiers。如果需要,也可以对识别名称列进行编辑 三、使用P0o和序列 Pool中使用的数据都存在普通 EViews序列中。这些序列可以按通常方式 使用:可以列表显示,图形显示,产生新序列,或用于估计。也可以使用 Pool对象来处理各单独序列。 四、序列命名 在Pool中使用序列的关键是序列命名:使用基本名和截面识别名称组合 命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可, 例如,现有一个Pool对象含有识别名JPN,USA,UK,想建立 每个截面成员的GDP的时间序列,我们就使用“GDP作为序列的基本名。 可以把识别名称放在基本名的后面,此时序列名为 GDP JPN,GDP USA, GDP UK;或者把识别名称放在基本名的前面,此时序列名为JPN GDP, USA GDP, UK GDP
5 二、观察或编辑Pool定义 要显示Pool中的截面成员识别名称,单击工具条的Define按钮,或选择 View/Cross-Section Identifiers。如果需要,也可以对识别名称列进行编辑。 三、使用Pool和序列 Pool中使用的数据都存在普通EViews序列中。这些序列可以按通常方式 使用:可以列表显示,图形显示,产生新序列,或用于估计。也可以使用 Pool对象来处理各单独序列。 四、序列命名 在Pool中使用序列的关键是序列命名:使用基本名和截面识别名称组合 命名。截面识别名称可以放在序列名中的任意位置,只要保持一致即可。 例如,现有一个Pool对象含有识别名 _JPN, _USA,_UK,想建立 每个截面成员的GDP的时间序列,我们就使用“GDP”作为序列的基本名。 可以把识别名称放在基本名的后面,此时序列名为GDP_JPN,GDP_ USA,GDP_UK;或者把识别名称放在基本名的前面,此时序列名为JPN_ GDP,USA_GDP,UK_GDP
把识别名称放在序列名的前面,中间或后面并没什么关系,只要易于识 别就行了。但是必须注意要保持一致,不能这样命名序列: JPNGDP, GDPUSA, UKGDP1,因为EVew无法在POO对象中识别这些序列 五、PoO序列 日选定的序列名和Poo中的截面成员识别名称相对应,就可以利用这 些序列使用Pool了。其中关键是要理解Pool序列的概念。 个Po列实际就是一组序列,序列名是由基本名和所有截面识别名构 成的。POo序列名使用基本名和“?”占位符,其中“?”代表截面识别名。 如果序列名为 GDPJPN, GDPUSA, GDPUK,相应的Poo序列为GDP?。如果 序列名为 JPNGDP, USAGDP, UKGDP,相应的POol序列为?GDP。 当使用一个Poo序列名时,EⅤews认为将准备使用Poo序列中的所有序 列。 EViews会自动循环査找所有截面识别名称并用识别名称替代“?”。然 后会按指令使用这些替代后的名称了。Pool序列必须通过Pool对象来定义, 因为如果没有截面识别名称,占位符“?”就没有意义
6 把识别名称放在序列名的前面,中间或后面并没什么关系,只要易于识 别就行了。但是必须注意要保持一致,不能这样命名序列:JPNGDP, GDPUSA,UKGDP1,因为EViews无法在Pool对象中识别这些序列。 五、Pool序列 一旦选定的序列名和Pool中的截面成员识别名称相对应,就可以利用这 些序列使用Pool了。其中关键是要理解Pool序列的概念。 一个Pool序列实际就是一组序列, 序列名是由基本名和所有截面识别名构 成的。Pool序列名使用基本名和“?”占位符,其中“?”代表截面识别名。 如果序列名为GDPJPN,GDPUSA,GDPUK,相应的Pool序列为GDP?。如果 序列名为JPNGDP,USAGDP,UKGDP,相应的Pool序列为?GDP。 当使用一个Pool序列名时,EViews认为将准备使用Pool序列中的所有序 列。EViews会自动循环查找所有截面识别名称并用识别名称替代“?”。然 后会按指令使用这些替代后的名称了。Pool序列必须通过Pool对象来定义, 因为如果没有截面识别名称,占位符“?”就没有意义
§252输入Pool数据 有很多种输入数据的方法,在介绍各种方法之前,首先要理解时间序列/ 截面数据的结构,区别堆积数据和非堆积数据形式。 时间序列/截面数据的数据信息用三维表示:时期,截面成员,变量。例 如:1950年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有几种常用的方法 非堆积数据 存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成 员、给定变量的观测值放在一起,但和其他变量、其他截面成员的数据分开 例如,假定我们的数据文件为下面的形式
7 §25.2 输入Pool数据 有很多种输入数据的方法,在介绍各种方法之前,首先要理解时间序列/ 截面数据的结构,区别堆积数据和非堆积数据形式。 时间序列/截面数据的数据信息用三维表示:时期,截面成员,变量。例 如:1950年,通用汽车公司,投资数据。 使用三维数据比较困难,一般要转化成二维数据。有几种常用的方法。 一、非堆积数据 存在工作文件的数据都是这种非堆积数据,在这种形式中,给定截面成 员、给定变量的观测值放在一起,但和其他变量、其他截面成员的数据分开。 例如,假定我们的数据文件为下面的形式:
obs I GM I CH I GE I WE US F GM 193531760040.290003.100012.93002099003078500 1936391.800727600045000025900035530004661700 1937410.60066.260007.20003050046990005387.100 1938257.700051.600004.60002.8900262.30002792.200 1939330.80052.4100048.100018.8400023040004313200 1940461.200694100074.40003.570026160004643900 194151200068.35000113000048.510047280004551.200 194244800046.8000091.900043.3400044560003244.100 194349960047.4000061.30003020036160004053.700 1944547.50059.570005.800038100288.20004379300 1945551.20088.780009.60003.2700258.70004840900 1946688.100074.1200015990053.460042030004900900 其中基本名代表企业总投资、F代表前一年企业的市场价值、S代表前 一年末工厂存货和设备的价值。每个企业都有单独的Ⅰ、F、S数据 EViews会自动按第四章介绍的标准输入程序读取非堆积数据。并把每个 截面变量看作一个单独序列。注意要按照上述的Pol命名规则命名
8 其中基本名I代表企业总投资、F代表前一年企业的市场价值、S代表前 一年末工厂存货和设备的价值。每个企业都有单独的I、F、S数据。 EViews会自动按第四章介绍的标准输入程序读取非堆积数据。并把每个 截面变量看作一个单独序列。注意要按照上述的Pool命名规则命名
二、堆积数据 选择 View/Spreadsheet( stacked data), EViews会要求输入序列名列表 Series List List of ordinary and pool [specified with ] series ?门?s OK Cancel 确认后 EViews会打开新建序列的堆积式数据表。我们看到的是按截 面成员堆积的序列,Po序列名在每列表头,截面成员/年代识别符标识 每行:
9 确认后EViews会打开新建序列的堆积式数据表。我们看到的是按截 面成员堆积的序列,Pool序列名在每列表头,截面成员/年代识别符标识 每行: 二、堆积数据 选择View/Spreadsheet(stacked data),EViews会要求输入序列名列表
Po数据排列成堆积形式,一个变量的所有数据放在一起,和其他 变量的数据分开。大多数情况下,不同截面成员的数据从上到下依次堆 积,每一列代表一个变量 a Pool: COPA orkfile: 21 1 View Procsobjects Print NamelFreeze Edit+-lorder+-1Smplt-ITitlelEstime obs 1? _GM1935317500307850028000 CH193540.290004175000105000 GE1935331000117060097:000 WE1935129300019150016000 US1952099001362400538000 GM1935639180004661700526000 CH19367276008378000102000 GE193645000020158001044000 WE19362590005160000800000 US193635530001807.100505000 GM193了74106006387100156900 CH19376626000883900347000 GE1937772000203001180000 WE19373505000729000740000 US19374699002676.300118100 GM19384
10 Pool数据排列成堆积形式,一个变量的所有数据放在一起,和其他 变量的数据分开。大多数情况下,不同截面成员的数据从上到下依次堆 积,每一列代表一个变量: