第9章随机实验与自然实验
第9章 随机实验与自然实验
主要内容 ◆实验数据 ◆理想的随机实验 ◆引入更多的解释变量 ◆随机实验执行过程中可能出现的问题 ◆自然实验 ◆双重差分法 ◆三重差分法(选读) ◆观测数据的处理效应
2 主要内容 实验数据 理想的随机实验 引入更多的解释变量 随机实验执行过程中可能出现的问题 自然实验 双重差分法 三重差分法(选读) 观测数据的处理效应
91实验数据 假设研究x是否导致y。偎定{x,x,…xk} 包含所有影响y的因素。 不同学科采用不同的实验方法,大致分为以 下几类。 (1)控制实验 (2)随机(控制)实验 (3)自然实验或准实验 (4)思想实验
3 9.1 实验数据 假设研究 是否导致y。假定 包含所有影响y的因素。 不同学科采用不同的实验方法,大致分为以 下几类。 (1)控制实验 (2)随机(控制)实验 (3)自然实验或准实验 (4)思想实验 1 x x x x 1 2 , , , K
92理想的随机实验 在理想的随机实验中,实验组与控制组的成员决定完 全随机,比如,通过抛硬币或电脑随机数来决定。 个体究竟分在哪一组或得到多大的实验“处理水平”, 与个体的特征或其他可能影响实验结果的因素完全独立。 解释变量“处理水平”与被遗漏的扰动项不相关, 可避免遗漏变量偏差或内生变量偏差。 考虑以下回归模型: y=a+ Bx,+E
4 9.2 理想的随机实验 在理想的随机实验中,实验组与控制组的成员决定完 全随机,比如,通过抛硬币或电脑随机数来决定。 个体究竟分在哪一组或得到多大的实验“处理水平” , 与个体的特征或其他可能影响实验结果的因素完全独立。 解释变量“处理水平”与被遗漏的扰动项不相关, 可避免遗漏变量偏差或内生变量偏差。 考虑以下回归模型: i i i y x = + +
92理想的随机实验 x完全随机地决定。由于x与61相互独立 故cov(x,2)=0,无论遗漏多少变量,OLs都一致。 由于x与E相互独立,故E(E;1|x,…,xn)=0,也满 足小样本理论的严格外生性假定,故OLS无偏。 在理想的随机实验中,X对y的因果效应表现在条件 期望的差别,即 E(X=x)E(LX=0) 称为“处理效应
5 9.2 理想的随机实验 完全随机地决定 。 由 于 与 相 互 独 立 , 故 ,无论遗漏多少变量,OLS都一致。 由于 与 相互独立,故 ,也满 足小样本理论的严格外生性假定,故OLS无偏。 在理想的随机实验中,X对y的因果效应表现在条件 期望的差别,即 称为“处理效应” 。 i x i x i Cov( , ) 0 i i x = i x i E( | , , ) 0 i n 1 x x = E( | ) E( | 0) y X x y X = − =
92理想的随机实验 如果x={0}为虚拟变量,则方程的oLs估计量为 BoLs =Treat -y control 元为实验组的样本均值, control为控制组的样本均值。 在回归方程中加入虚拟变量的效果就相当于给予实验 组与控制组不同的截距项。而当{y}对常数项回归,系数 估计值就是j 因此, oLs=control, aOLS BoLs =)treat 由于os等于实验组均值与控制组均值之差,故称为 差分估计量” 6
6 9.2 理想的随机实验 如果 为虚拟变量,则方程的OLS估计量为 为实验组的样本均值, 为控制组的样本均值。 在回归方程中加入虚拟变量的效果就相当于给予实验 组与控制组不同的截距项。而当 对常数项回归,系数 估计值就是 。 因此, , 由于 等于实验组均值与控制组均值之差,故称为 “差分估计量” 。 xi =0,1 OLS treat control ˆ = − y y treat y control y yi y OLS control ˆ = y OLS OLS treat ˆ ˆ + = y OLS ˆ
93引入更多的解释变量 在理想的随机实验条件下,OLS(即差分估计量)一致且 无偏,但由于遗漏较多变量,E;的方差可能较大,OLS可能 效率不高 引入某些遗漏变量,可改善此问题;也提供了检验x 是否完全随机的机会。 假设引入的其他解释变量为{=n,…k y=a+Bx1+1=1+…+k=k+E1 如果x完全随机,则{=n…,Ek应对x,没有解释力。 可把x对{=n,…-k}回归,并检验此方程的整体显著性
7 9.3 引入更多的解释变量 在理想的随机实验条件下,OLS(即差分估计量)一致且 无偏,但由于遗漏较多变量, 的方差可能较大,OLS可能 效率不高。 引入某些遗漏变量,可改善此问题;也提供了检验 是否完全随机的机会。 假设引入的其他解释变量为 , 如果 完全随机,则 应对 没有解释力。 可把 对 回归,并检验此方程的整体显著性。 i xi z z i iK 1 , , i i i K iK i 1 1 y x z z = + + + + + xi z z i iK 1 , , xi xi z z i iK 1 , ,
94随机实验执行过程中可能出现的问题 在随机实验的执行过程中,可能出现的问题包括 内部有效性问题”与“外部有效性问题” 1.内部有效性问题: (1)未能完全随机分组 可把x对个体特征{=n…,Ek回归,并检验该回归方 程的整体显著性。 (2)未能完全遵从实验设计 可使用工具变量法来解决x的内生性问题,以“设计 处理水平”(记为w1)作为“实际处理水平”(记为x) 的工具变量
8 9.4 随机实验执行过程中可能出现的问题 在随机实验的执行过程中,可能出现的问题包括, “内部有效性问题”与“外部有效性问题” 。 1.内部有效性问题: (1)未能完全随机分组 可把 对个体特征 回归,并检验该回归方 程的整体显著性。 (2)未能完全遵从实验设计 可使用工具变量法来解决 的内生性问题,以“设计 处理水平”(记为 )作为“实际处理水平”(记为 ) 的工具变量。 xi z z i iK 1 , , xi wi xi
94随机实验执行过程中可能出现的问题 (3)中途退出实验 如果退出原因与实验无关,则不会造成选择性偏差。 (4)实验效应或霍桑效应 参加实验本身可能改变个体的心理或行为,从而影响 实验结果。对于药物疗效实验,可以通过使用双盲法来避 免这种效应,称为“霍桑效应” (5)样本过小:由于实验成本高,实验的样本容量可能 较小
9 9.4 随机实验执行过程中可能出现的问题 (3)中途退出实验 如果退出原因与实验无关,则不会造成选择性偏差。 (4)实验效应或霍桑效应 参加实验本身可能改变个体的心理或行为,从而影响 实验结果。对于药物疗效实验,可以通过使用双盲法来避 免这种效应,称为“霍桑效应” 。 (5)样本过小:由于实验成本高,实验的样本容量可能 较小
94随机实验执行过程中可能出现的问题 2.外部有效性问题: (1)样本的代表性不足 (2)小型实验的条件与大规模推广时的现实条 件不同 (3)一般均衡效应 (4)自我选择效应 10
10 9.4 随机实验执行过程中可能出现的问题 2.外部有效性问题: (1)样本的代表性不足 (2)小型实验的条件与大规模推广时的现实条 件不同 (3)一般均衡效应 (4)自我选择效应