第六章短面板
第六章 短面板
主要内容 ◆面板数据的特点 ◆组间估计量 ◆面板数据的估计策略◆拟合优度的度量 ◆混合回归 ◆非平衡面板 ◆个体固定效应模型◆究竞该用固定效应还是 ◆时间固定效应 随机效应模型 ◆一阶差分法 ◆个体时间趋势 ◆随机效应模型 ◆短面板的 STATA命令及 实例
2 主要内容 面板数据的特点 面板数据的估计策略 混合回归 个体固定效应模型 时间固定效应 一阶差分法 随机效应模型 组间估计量 拟合优度的度量 非平衡面板 究竟该用固定效应还是 随机效应模型 个体时间趋势 短面板的STATA命令及 实例
61面板数据的特点 ◆面板数据,指的是在一段时间内跟踪同一组个体的数 据。它既有横截面的维度(n个个体),又有时间维度(T 个时期)。 一个T=3的面板数据结构如表6.1 表6.1面板数据的结构 Individual n: t=3 3
3 6.1 面板数据的特点 面板数据,指的是在一段时间内跟踪同一组个体的数 据。它既有横截面的维度(n个个体),又有时间维度(T 个时期)。 一个 的面板数据结构如表6.1: 表6.1面板数据的结构 T = 3 Individual 1:t=1 Individual 1:t=2 Individual 1:t=3 。。。。。 Individual n:t=1 Individual n:t=2 Individual n:t=3
61面板数据的特点 面板数据的分类 ◆如果面板数据T较小,而n较大,在使用大样本理论时让n 趋于无穷大。这种面板数据被称为“短面板”;反之, 如果T较大,而n较小,则被称为“长面板”。 ◆在面板模型中,如果解释变量包含被解释变量的滞后值, 则称为“动态面板”;反之,则称为“静态面板” ◆如果在面板数据中,每个时期在样本中的个体完全一样, 则称为“平衡面板数据”;反之,则称为“非平衡面板 数据
4 6.1 面板数据的特点 面板数据的分类 如果面板数据T较小,而n较大,在使用大样本理论时让n 趋于无穷大。这种面板数据被称为“短面板”;反之, 如果T较大,而n较小,则被称为“长面板” 。 在面板模型中,如果解释变量包含被解释变量的滞后值, 则称为“动态面板”;反之,则称为“静态面板” 。 如果在面板数据中,每个时期在样本中的个体完全一样, 则称为“平衡面板数据”;反之,则称为“非平衡面板 数据”
61面板数据的特点 面板数据的优点: ◆(1)解决遗漏变量问题: 遗漏变量常由不可观测的个体差异或“异质性造成。如果 个体差异“不随时间而改变”则面板数据可解决遗漏变量 问题。 ◆(2)提供个体动态行为的信息: 例:考虑区分规模效应与技术进步对企业生产效率的影响 。对于截面数据,没有时间维度,无法观测到技术进步。 对于时间序列,无法区分生产效率的提高究竟有多少由于 规模扩大,有多少由于技术进步
5 6.1 面板数据的特点 面板数据的优点: (1)解决遗漏变量问题: 遗漏变量常由不可观测的个体差异或“异质性造成。如果 个体差异“不随时间而改变”则面板数据可解决遗漏变量 问题。 (2)提供个体动态行为的信息: 例:考虑区分规模效应与技术进步对企业生产效率的影响 。对于截面数据,没有时间维度,无法观测到技术进步。 对于时间序列,无法区分生产效率的提高究竟有多少由于 规模扩大,有多少由于技术进步
61面板数据的特点 面板数据的优点: ◆(3)样本容量较大:同时有截面维度与时间维度,面板 数据的样本容量更大,可提高估计精度。 面板数据的缺点: ◆面板数据也会带来问题,比如,数据通常不满足独立同 分布的假定,因为同一个体在不同期的扰动项一般存在 自相关。 ◆面板数据的收集成本通常较高,不易获得
6 6.1 面板数据的特点 面板数据的优点: (3)样本容量较大:同时有截面维度与时间维度,面板 数据的样本容量更大,可提高估计精度。 面板数据的缺点: 面板数据也会带来问题,比如,数据通常不满足独立同 分布的假定,因为同一个体在不同期的扰动项一般存在 自相关。 面板数据的收集成本通常较高,不易获得
62面板数据的估计策略 一个极端策略是将其看成是截面数据而进行混合 回归( pooled regression),要求样本中每个个 体拥有相同的回归方程 ◆此策略忽略个体间不可观测或被遗漏的异质性 ( heterogeneity),而该异质性可能与解释变量 相关,导致估计不一致
7 6.2 面板数据的估计策略 一个极端策略是将其看成是截面数据而进行混合 回归(pooled regression),要求样本中每个个 体拥有相同的回归方程。 此策略忽略个体间不可观测或被遗漏的异质性 (heterogeneity),而该异质性可能与解释变量 相关,导致估计不一致
62面板数据的估计策略 ◆另一极端策略则是,为每个个体估计一个单独的 回归方程。此策略忽略了个体的共性,可能没有 足够大的样本容量。 ◆实践中常采用折衷的估计策略,即假定个体的回 归方程拥有相同的斜率,但可有不同的截距项, 以此来捕捉异质性
8 6.2 面板数据的估计策略 另一极端策略则是,为每个个体估计一个单独的 回归方程。此策略忽略了个体的共性,可能没有 足够大的样本容量。 实践中常采用折衷的估计策略,即假定个体的回 归方程拥有相同的斜率,但可有不同的截距项, 以此来捕捉异质性
62面板数据的估计策略 个体效应模型 yn=x1B+x106+l1+En(i=1…,m,t=1…,) z为不随时间而变的个体特征,比如性别 ◆x1可随个体及时间而变; ◆扰动项(u1+En)由两部分构成,称为“复合扰动项”不 可观测的随机变量L,是代表个体异质性的截距项
9 6.2 面板数据的估计策略 个体效应模型 为不随时间而变的个体特征,比如性别; 可随个体及时间而变; 扰动项 由两部分构成,称为“复合扰动项”不 可观测的随机变量 是代表个体异质性的截距项。 ( 1, , ; 1, , ) it it i i it y u = + + + x z i n t T = = i z it x ( ) i it u + i u
62面板数据的估计策略 ◆c随个体与时间而改变的扰动项。假设{En为id,且与 v不相关。 ◆如果与某个解释变量相关,则称为“固定效应模型”此 时,OLS不一致 ◆如果u.与所有解释变量(x12x)均不相关,则称为“随机 效应模型(简记RE)。 10
10 6.2 面板数据的估计策略 随个体与时间而改变的扰动项。假设 为iid,且与 不相关。 如果 与某个解释变量相关,则称为“固定效应模型”此 时,OLS不一致。 如果 与所有解释变量 均不相关,则称为“随机 效应模型(简记RE)。 it { }it i u i u i u ( , ) it i x z