《工程科学学报》录用稿,htps:/doi.org/10.13374/i,issn2095-9389.2021.07.04.002©北京科技大学2020 《工程科学学报》编辑部 因果推断三种分析框架及其应用综述1 马忠贵,徐晓晗,刘雪儿 北京科技大学计算机与通信工程学院,北京100083 ☒通信作者,E-ail:g_runeko@163.com 摘要探寻事物之间的因果效应在统计学、计算机科学、计量经济学等许多领域都是一个焕具力的研究课题。伴 随着2021年约书亚·安格里斯特(Joshua D.Angrist)和圭多·因本斯(GuidoW.Imbens)因对因果关系分析的 方法学贡献”而获得诺贝尔经济学奖,因果推断必将在这些领域大放异彩。本文简要众绍闲果推断所涉及的基本概 念及其三种分析框架:反事实框架、潜在结果模型和结构因果模型。首先,从反事实椎架介绍因果效应的发端:然后, 从基于反事实的两个因果推断分析框架:潜在结果模型和结构因果模型,来分别御述网个分析框架所涉及的关键理 论和应用方法。其中,潜在结果模型使用数学和可计算的语言对因果理论进行阐述、是一种将假设、命题和结论清晰 化表达的计算模型,其在原因和结果变量已知的前提下定量分析原因变量对结果变量的因果效应,并对缺失的潜在 结果进行补齐,使观察性研究的效果接近试验性研究。结构因果模型则是一种基于图论的因果推断方法,它将事件 分为观察、干预和反事实三个层级,并通过o运算将干预和反事著层级的因果关系都降维成可以通过统计学手段解 决的问题。最后,本文探讨了现今多领域内因果推断的应用场景 并总结了三种分析框架的异同点。 关键词因果效应:因果推断:反事实:潜在结果模型:结构医 分类号TG142.71 Three Analytical l Frameworksòf Causal Inference and Their Applications MA Zhong-gui,XU Xiao-han回,LIU Xue-er School of Computer and Communication Engineering. University of Science and Technology Beijing,Beijing 100083,P.R. China Corresponding author, 0163.com ABSTRACT Causality is a generic relationship between an effect and the cause that produces it,the causal relationship among things is a problem we have been thinking about,but the complexity of causality is sometimes far beyond our imagination.Even if some causality problems seem easy to analyze,it may not be easy to get an exact answer.However, through the continuous innovation and development of empirical research methods in recent decades,we have had several clear analytical frameworks and effective methods for how to define causality and determine the degree of causality. Exploring the causal effects among things is a promising research topic in many fields such as statistics,computer science, econometrics,etc.With Joshua D.Angrist and Guido W.Imbens winning the Nobel Prize in economics for their methodological contributions to the analysis of causality in 2021,causal inference will shine in these fields.This article briefly introduces the basic concepts involved in causal inference,and its three analytical frameworks:Counterfactual Framework(CF),Potential Outcomes Framework(POF)and Structural Causal Model(SCM).Firstly,we introduce the origin of causal effects according to CF.Secondly,based on the counterfactual theory,there are two analysis frameworks,called POF and SCM,and we introduce the key theories and methods respectively.The SCM explains the causal theory through 败离日期:2021-07-04 演自中央高校基本科研业务费专项资金资助项目RE-DF-20-12,ERF-GF-18-0ZB) 地址:北京市海淀区学院路30号 邮政编码:100083 电话:010-62333436 E-mail:xuebaozr@ustb.edu.cn http://cje.ustb.edu.cn
《工程科学学报》编辑部 因果推断三种分析框架及其应用综述1 马忠贵,徐晓晗,刘雪儿 北京科技大学计算机与通信工程学院,北京 100083 通信作者,E-mail: g_runeko@163.com 摘 要 探寻事物之间的因果效应在统计学、计算机科学、计量经济学等许多领域都是一个颇具潜力的研究课题。伴 随着 2021 年约书亚·安格里斯特(Joshua D. Angrist)和圭多·因本斯(Guido W.Imbens)因“对因果关系分析的 方法学贡献”而获得诺贝尔经济学奖,因果推断必将在这些领域大放异彩。本文简要介绍因果推断所涉及的基本概 念及其三种分析框架:反事实框架、潜在结果模型和结构因果模型。首先,从反事实框架介绍因果效应的发端;然后, 从基于反事实的两个因果推断分析框架:潜在结果模型和结构因果模型,来分别阐述两个分析框架所涉及的关键理 论和应用方法。其中,潜在结果模型使用数学和可计算的语言对因果理论进行阐述,是一种将假设、命题和结论清晰 化表达的计算模型,其在原因和结果变量已知的前提下定量分析原因变量对结果变量的因果效应,并对缺失的潜在 结果进行补齐,使观察性研究的效果接近试验性研究。结构因果模型则是一种基于图论的因果推断方法,它将事件 分为观察、干预和反事实三个层级,并通过 do 运算将干预和反事实层级的因果关系都降维成可以通过统计学手段解 决的问题。最后,本文探讨了现今多领域内因果推断的应用场景,并总结了三种分析框架的异同点。 关键词 因果效应;因果推断;反事实;潜在结果模型;结构因果模型 分类号 TG142.71 Three Analytical Frameworks of Causal Inference and Their Applications MA Zhong-gui, XU Xiao-han , LIU Xue-er School of Computer and Communication Engineering, University of Science and Technology Beijing, Beijing 100083, P. R. China Corresponding author, E-mail: g_runeko@163.com ABSTRACT Causality is a generic relationship between an effect and the cause that produces it, the causal relationship among things is a problem we have been thinking about, but the complexity of causality is sometimes far beyond our imagination. Even if some causality problems seem easy to analyze, it may not be easy to get an exact answer. However, through the continuous innovation and development of empirical research methods in recent decades, we have had several clear analytical frameworks and effective methods for how to define causality and determine the degree of causality. Exploring the causal effects among things is a promising research topic in many fields such as statistics, computer science, econometrics, etc. With Joshua D. Angrist and Guido W. Imbens winning the Nobel Prize in economics for their methodological contributions to the analysis of causality in 2021, causal inference will shine in these fields. This article briefly introduces the basic concepts involved in causal inference, and its three analytical frameworks: Counterfactual Framework(CF), Potential Outcomes Framework(POF) and Structural Causal Model(SCM). Firstly, we introduce the origin of causal effects according to CF. Secondly, based on the counterfactual theory, there are two analysis frameworks, called POF and SCM, and we introduce the key theories and methods respectively. The SCM explains the causal theory through 1收稿日期:2021-07-04 基金项目: 中央高校基本科研业务费专项资金资助项目(FRF-DF-20-12, FRF-GF-18-017B) 地址:北京市海淀区学院路 30 号 邮政编码:100083 电话:01062333436 E-mail: xuebaozr@ustb.edu.cn http://cje.ustb.edu.cn 《工程科学学报》录用稿,https://doi.org/10.13374/j.issn2095-9389.2021.07.04.002 ©北京科技大学 2020 录用稿件,非最终出版稿
mathematics and computable language,and it is a calculation model that clearly expresses hypotheses,propositions and conclusions.It quantitatively analyzes the pair of cause variables under the premise that the cause variables and effect variables are known.The potential outcome framework makes up for the missing potential results,so that the effect of observational research is close to experimental research.The SCM is a causal inference method based on graph theory.It divides events into three levels:observation,intervention,and counterfactual.Through the do-operation,the causal relationship at the intervention and counterfactual levels could be reduced to low-dimensional problems which can be solved by statistical methods.Finally,the application scenarios of causal inference in many fields today has been discussed in this paper and the three analysis frameworks are compared KEY WORDS Causal Effect:Causal Inference;Counterfactual;Potential Outcome Model:Structural Causality Model 1引言 为什么需要研究因果关系?有三件事需要在厘清原因的情况下才能更好地做到,那就是:解释 预测和干预。合理的解释可以为探索世界提供支撑,准确的预测可以可靠地描述事件结果。有时我们 可能需要用一些理由去解释事件发生的原因,不仅想知道为什么发生,更希望可以利用其中某些信 息来促进或者避免某些结果的产生,也就是对原本的事件施加氏预(可以是一项行动、措施或政 策)去得到特定的结果。 无论是哲学、自然科学还是社会科学领域,研究因果关系一直是人类持之以恒探索的终极目标。 从亚里士多德山在“四因说”中对因果概念的论述:事物的出现所必需的条件都被称为原因:到约 翰·穆勒John Muller)关于确定现象因果联系提出的“穆勒五法”,再到大卫·休谟(David Hume) 提出的从“是”能否推出“应该”,也即“事实贪@能否推导出“价值”命题。哲学先贤们都 对因果关系相关概念做出了透彻论述,因果关系的哲学德想发展史纵贯两千余年,因果推断的统计 方法至今依然在社会学、计量经济学、流行病学等诸多科学领域发挥余韵,并展现出了巨大的潜力。 弗朗西斯·培根(Francis Bacon)曾提出“真正的知识是根据因果关系得到的知识”,如何找到一种 科学普适的方法探寻事物间的因果关系,随着人类认知的发展不断精深,依旧是一项不小的挑战。 因果推断一直以来都是一个充满挑战性的课题,目前因果推断的方法主要可以分为基于实证的 方法和基于数据观察的方法。其中(实证方法是进行因果关系推断的黄金标准,其干预决策是随机 的,公认最有效的是随机对照试验Random Controlled Trials,RCT),也称为AB测试(AB Tst)。随机对照试验将雾者随机分配到对照组或实验组,并将在试验中对照组和实验组唯一的 预期差异视为实验的结果父然命随机对照试验虽然是分析因果关系的绝佳环境,但其受到伦理问 题、个体不依从等因索影响,往往具有不可操作性,其试验范围也不可能遍及所有真实场景,因此 在很大程度上限制了因果推断的应用。基于数据观察的观察性研究(Observational Study)也是一种 常用方法。研究人员在没有任何干扰的情况下观察受试者并得出数据,从观测数据中得到他们的行 动及其结果,不能得到他们采取特定行动的动机。其核心问题就是如何基于已有的观测数据得到 反事实结果,√这是颇具挑战性的一项工作,主要原因如下:(1)根据获取到的观测数据只能得到事 实结果,无从得知其反事实结果:(2)在无干预的观测环境中,试验往往不是随机分配的,这可能 会因观察对象群体分布不同有较大偏差。为了合理地从数据中推断因果关系,研究者们构建出了基 于潜在结果模型和结构因果模型两种主流方法的分析框架,我们将针对不同的分析框架分别进行介 绍。 本文第2节介绍因果关系和因果推断过程中所涉及到的基本概念,以辅助对后文因果推断的理 解:在第3、4、5节我们将分别阐述现阶段因果推断中三种主流分析框架:反事实框架、潜在结果模 型和结构因果模型:第6节介绍因果推断在各个学科领域的研究应用:第7节总结三种分析框架的 主要特点,并提出因果推断未来的应用前景及其巨大潜力
mathematics and computable language, and it is a calculation model that clearly expresses hypotheses, propositions and conclusions. It quantitatively analyzes the pair of cause variables under the premise that the cause variables and effect variables are known. The potential outcome framework makes up for the missing potential results, so that the effect of observational research is close to experimental research. The SCM is a causal inference method based on graph theory. It divides events into three levels: observation, intervention, and counterfactual. Through the do-operation, the causal relationship at the intervention and counterfactual levels could be reduced to low-dimensional problems which can be solved by statistical methods. Finally, the application scenarios of causal inference in many fields today has been discussed in this paper and the three analysis frameworks are compared. KEY WORDS Causal Effect; Causal Inference; Counterfactual; Potential Outcome Model; Structural Causality Model 1 引言 为什么需要研究因果关系?有三件事需要在厘清原因的情况下才能更好地做到,那就是:解释 预测和干预。合理的解释可以为探索世界提供支撑,准确的预测可以可靠地描述事件结果。有时我们 可能需要用一些理由去解释事件发生的原因,不仅想知道为什么发生,更希望可以利用其中某些信 息来促进或者避免某些结果的产生,也就是对原本的事件施加干预(可以是一项行动、措施或政 策)去得到特定的结果。 无论是哲学、自然科学还是社会科学领域,研究因果关系一直是人类持之以恒探索的终极目标。 从亚里士多德[1]在“四因说”中对因果概念的论述:事物的出现所必需的条件都被称为原因;到约 翰·穆勒(John Muller) [2]关于确定现象因果联系提出的“穆勒五法”,再到大卫·休谟(David Hume) [3]提出的从“是”能否推出“应该”,也即“事实”命题能否推导出“价值”命题。哲学先贤们都 对因果关系相关概念做出了透彻论述,因果关系的哲学思想发展史纵贯两千余年,因果推断的统计 方法至今依然在社会学、计量经济学、流行病学等诸多科学领域发挥余韵,并展现出了巨大的潜力。 弗朗西斯·培根(Francis Bacon)曾提出“真正的知识是根据因果关系得到的知识”,如何找到一种 科学普适的方法探寻事物间的因果关系,随着人类认知的发展不断精深,依旧是一项不小的挑战。 因果推断一直以来都是一个充满挑战性的课题,目前因果推断的方法主要可以分为基于实证的 方法和基于数据观察的方法。其中,实证方法是进行因果关系推断的黄金标准,其干预决策是随机 的,公认最有效的是随机对照试验(Random Controlled Trials,RCT),也称为 A/B 测试(A/B Test)。随机对照试验将参与者随机分配到对照组或实验组,并将在试验中对照组和实验组唯一的 预期差异视为实验的结果。然而,随机对照试验虽然是分析因果关系的绝佳环境,但其受到伦理问 题、个体不依从等因素影响,往往具有不可操作性,其试验范围也不可能遍及所有真实场景,因此 在很大程度上限制了因果推断的应用。基于数据观察的观察性研究(Observational Study)也是一种 常用方法。研究人员在没有任何干扰的情况下观察受试者并得出数据,从观测数据中得到他们的行 动及其结果,但不能得到他们采取特定行动的动机。其核心问题就是如何基于已有的观测数据得到 反事实结果,这是颇具挑战性的一项工作,主要原因如下:(1)根据获取到的观测数据只能得到事 实结果,无从得知其反事实结果;(2)在无干预的观测环境中,试验往往不是随机分配的,这可能 会因观察对象群体分布不同有较大偏差。为了合理地从数据中推断因果关系,研究者们构建出了基 于潜在结果模型和结构因果模型两种主流方法的分析框架,我们将针对不同的分析框架分别进行介 绍。 本文第 2 节介绍因果关系和因果推断过程中所涉及到的基本概念,以辅助对后文因果推断的理 解;在第 3、4、5 节我们将分别阐述现阶段因果推断中三种主流分析框架:反事实框架、潜在结果模 型和结构因果模型;第 6 节介绍因果推断在各个学科领域的研究应用;第 7 节总结三种分析框架的 主要特点,并提出因果推断未来的应用前景及其巨大潜力。 录用稿件,非最终出版稿
2因果推断的相关概念 2.1相关不是因果 事物间的因果关系常常是我们经常要面对和分析的问题,研究因果的意义在于:在许多领域, 我们需要理解数据并据此做出进一步的行动和决策。比如对于我们而言,常常会想要知道“学历越 高就会找到越好的工作吗?”政府可能想知道“增设离婚冷静期会对离婚率有影响吗?”医生可能 想知道“某种药剂的使用会增加患者康复的几率吗?”这些问题的核心就是因果效应,即:X的 变化会对Y造成影响吗?如果会,Y受影响的程度要如何度量?在研究因果关系的基础上,还要进 一步挖掘因果关系产生的原因及其造成的影响。 从时间序列的角度,经济学家克莱夫·格兰杰(Clive Granger)给出了因果关系的文字描述: 如果利用X可以更好地预测Y,那么就可以说X是Y的原因。经过后来的研究不难发现,这段描 述中存在着一些谬误:严格来说,这句话描述的是相关关系,而非因果关系那么相关关系和因果 关系究竞有何不同?其实,相关关系和因果关系是完全不同的两个概念,因果关系阐述了一些关于 世界本身的信息,而实证的统计学方法却不能。相关表示一种一般关系,/即:当两个变量同时呈现 出增加或减少的趋势时,它们就是相关的:而因果关系中原因会导致绮果、结果部分取决于原因。 两个变量之间即便没有相关关系也可能具有因果关系,反之有相关关系也过能没有因果关系。例如, 一项研究表明,通常吃早饭的人比不吃早饭的人体重轻,因此得出结论:不吃早饭有利于减肥。但 事实上,不吃早饭和体重轻之间可能只是相关,而并非因果关系。从事实的角度出发为这个现象寻 求一种解释,可能只是因为每天吃早饭的人习惯于保持一种健康的性活方式,定期运动、睡眠规律、 饮食健康,最终才拥有了更加理想的体重。在这类情况中拥有更健康的生活方式是吃早饭和轻体 重的共同原因,因此也可以将其视为吃早饭和轻体这间因果关系的混淆因素。 因此,相关不是因果。虽然相关关系在统计学得子一系列成果,但因果关系可以拓展传统 统计学解决新问题所需的必要内容,并可延伸到其他学科, 因此更具研究价值。 2.2因果推断的基本概念 在因果推断中有一些基本概念,某种程度在几类分析框架中是通用的,也是理解因果推断的 基础,以下将分别进行介绍。 (1)同一个研究对象(Uit):即在施加于预以研究因果关系时选定的研究对象,可以是一个物理 对象也可以是一个对象的集合: 在潜在结果模型中,不同时间点下的研究样本是不同的研究对象。 (2)千预(Treatment)):干预指对个释本采取的行为,用We{0,l,2,,N}表示干预,目前大多数因 果推断采用二元干预,即采角了干预(W=1)的样本划为干预组:未进行干预(W=0)划为对照组。 (3)潜在结果(Potential Outcom和事实结果(Observed Outcome):在现实世界中,对于每一个研究 对象,其在每一种预灭都存在一个可能的结果,即潜在结果:而在真实观测数据中出现的结果称 为事实结果。(④)效应):效应即评判干预与否所导致结果差别的指标,通过对各个研究对象 干预与否的潜在结果的比较得出。(5)分配机制(Assignment Mechanism):哪些结果可以被观察到主 要取决于干预的分配机制,即哪些研究对象对应采取了哪些干预。对于一个二值干预,X=1代表干 预组,X=0代表对照组,在接受干预分配X=x后结果变量表示为Y,,表示接受相应干预后的潜 在结果。 2.3因果推断的分析框架 近几十年来,因果推断一直是许多领域的关键性研究课题,在各个领域都涌现出了令人瞩目的 研究成果。2008年,诺贝尔经济学奖获得者詹姆斯·海克曼(James.J Heckman)提出了政策评价中 出现的三个基于因果推断且极具挑战性的难题: (1)评价历史上出现的干预对结果的影响: (2)预测在一个环境中曾经经历过的干预在其他环境中的影响: (3)预测历史上从没有经历过的干预在各种环境中的影响
2 因果推断的相关概念 2.1 相关不是因果 事物间的因果关系常常是我们经常要面对和分析的问题,研究因果的意义在于:在许多领域, 我们需要理解数据并据此做出进一步的行动和决策。比如对于我们而言,常常会想要知道“学历越 高就会找到越好的工作吗?”政府可能想知道“增设离婚冷静期会对离婚率有影响吗?”医生可能 想知道“某种药剂的使用会增加患者康复的几率吗?”这些问题的核心就是因果效应,即: X 的 变化会对Y 造成影响吗?如果会,Y 受影响的程度要如何度量?在研究因果关系的基础上,还要进 一步挖掘因果关系产生的原因及其造成的影响。 从时间序列的角度,经济学家克莱夫·格兰杰(Clive Granger)[4] 给出了因果关系的文字描述: 如果利用 X 可以更好地预测Y ,那么就可以说 X 是Y 的原因。经过后来的研究不难发现,这段描 述中存在着一些谬误;严格来说,这句话描述的是相关关系,而非因果关系。那么相关 关系和因果 关系究竟有何不同?其实,相关关系和因果关系是完全不同的两个概念,因果关系阐述了一些关于 世界本身的信息,而实证的统计学方法却不能。相关表示一种一般关系,即:当两个变量同时呈现 出增加或减少的趋势时,它们就是相关的;而因果关系中原因会导致结果,结果部分取决于原因。 两个变量之间即便没有相关关系也可能具有因果关系,反之有相关关系也可能没有因果关系。例如 , 一项研究表明,通常吃早饭的人比不吃早饭的人体重轻,因此得出结论:不吃早饭有利于减肥。但 事实上,不吃早饭和体重轻之间可能只是相关,而并非因果关系。从事实的角度出发为这个现象寻 求一种解释,可能只是因为每天吃早饭的人习惯于保持一种健康的生活方式,定期运动、睡眠规律、 饮食健康,最终才拥有了更加理想的体重。在这类情况中,拥有更健康的生活方式是吃早饭和轻体 重的共同原因,因此也可以将其视为吃早饭和轻体重之间因果关系的混淆因素。 因此,相关不是因果。虽然相关关系在统计学中取得了一系列成果,但因果关系可以拓展传统 统计学解决新问题所需的必要内容,并可延伸到其他学科,因此更具研究价值。 2.2 因果推断的基本概念 在因果推断中有一些基本概念,某种程度上在几类分析框架中是通用的,也是理解因果推断的 基础,以下将分别进行介绍。 (1)同一个研究对象(Unit):即在施加干预以研究因果关系时选定的研究对象,可以是一个物理 对象也可以是一个对象的集合;在潜在结果模型中,不同时间点下的研究样本是不同的 研究对象。 (2)干预(Treatment):干预指对一个样本采取的行为,用 {0,1, 2,..., } W N w 表示干预,目前大多数因 果推断采用二元干预,即采用了干预(W 1)的样本划为干预组;未进行干预(W 0 )划为对照组。 (3)潜在结果(Potential Outcome)和事实结果(Observed Outcome):在现实世界中,对于每一个研究 对象,其在每一种干预下都存在一个可能的结果,即潜在结果;而在真实观测数据中出现的结果称 为事实结果。(4)效应(Effect):效应即评判干预与否所导致结果差别的指标,通过对各个研究对象 干预与否的潜在结果的比较得出。(5)分配机制(Assignment Mechanism):哪些结果可以被观察到主 要取决于干预的分配机制,即哪些研究对象对应采取了哪些干预。对于一个二值干预, X 1代表干 预组, X 0 代表对照组,在接受干预分配 X x 后结果变量表示为Yx ,表示接受相应干预后的潜 在结果。 2.3 因果推断的分析框架 近几十年来,因果推断一直是许多领域的关键性研究课题,在各个领域都涌现出了令人瞩目的 研究成果。2008 年,诺贝尔经济学奖获得者詹姆斯·海克曼(James. J Heckman) [5]提出了政策评价中 出现的三个基于因果推断且极具挑战性的难题: (1)评价历史上出现的干预对结果的影响; (2)预测在一个环境中曾经经历过的干预在其他环境中的影响; (3)预测历史上从没有经历过的干预在各种环境中的影响。 录用稿件,非最终出版稿
通常认为,哲学和统计学是得益于定量化数据记录对各个学科的普适性,以及统计学以数据为 分析对象的特点,先后提出了三种分析框架,即反事实框架、潜在结果模型和结构因果模型。反事实 框架介绍因果效应的起源,潜在结果模型和结构因果模型是在反事实理论的基础上进一步发展,并 成为了发现因果关系和评价因果效应时理论最成熟、应用最广泛的两种因果推断分析框架。随着实证 研究方法的不断创新发展,对于如何界定因果关系以及推断事物间的因果关系已经有了比较成熟的 理论,以下将详细阐述。 3反事实框架 在因果关系的研究中,对于因果关系的界定几个世纪以来哲学家们都没有给出一个明确的定义 这主要是因为因果关系中原因和结果的定义在某种程度上都是以彼此为阐述条件,即需要结果来定 义原因,也需要原因来判定结果,使得二者的关系纷繁复杂、扑朔迷离。 在很长一段时间内,哲学中关于因果推理的主要范式是遵循“连续性或相象烘的规律”,将因 果推断看成是一个挖掘事物规律的过程。无论是威廉姆·沙迪什(William Shadish的@提出的判定因果 关系的三项原则,还是保罗·拉扎斯菲尔德(Paul Lazarsfeld)提出的因果判定方法,都强调因果关 系中“规律性”的影响:随后,越来越多的学者认识到通过连续性或相关性的规律并不一定能得出 真正的因果关系,使得哲学中开始出现通过反事实框架(Counterfactual Framework)来探究因果关 系的方法。休谟]于18世纪最早提出基于反事实框架讨论因果关系年给出了反事实的文字化阐述, 大卫·刘易斯(David Lewis)在休谟的研究基础上给出了反事实框架的符号化表达,结合可能世界 语义学和反事实来刻画因果依赖性,并形成了“界定可比较相@性一用相似性来说明反事实一用反 事实来定义反事实依赖性→用反事实依赖性来阐述因果依獭性一用因果依赖性来解释因果性”的逻 辑链条。刘易斯提出的因果依赖命题是对休漠因果关的正式概括一一“若事件A没有发生,则事 件B也不会发生”,一旦这一反事实命题成立,则何得出“若事件A发生,则事件B发生”的命 题自然成立。至此,刘易斯完成了从因果依赖性向因果性的跨越,他指出:“如果A和B是两个现 实事件且满足若A不发生则B不发生,则可以确定事件A是事件B的原因”,这一结论给出了因 果关系中对于原因和结果比较明晰的界定方法,为因果关系的理论思考提供了一种明确的道路。 4潜在结果模型 在因果推断的理论体系中气潜在结果模型(Potential Outcomes Framework)是其中最重要的理 论模型之一。潜在结果模型由哈佛太学知名统计学者唐纳德·鲁宾(Donald B.Rubin)提出,因此该 模型又称鲁宾因果模型。潜在果模型的核心是对同一个研究对象,比较其接受干预和不接受干预 的效应。对于接受干预的研宽对象而言,其不接受干预是一种“反事实”状态,而对于不接受干预 的研究对象而言,共接受干预就是一种“反事实”状态。对于“反事实”框架的概念,鲁宾却并不 认同,他认为对于之不研究对象,其结果出现与否主要取决于分配机制(Assignment Mechanism), 事实上我们只能看到一种结果,但并不意味着另一种结果不存在,这并不是一个非黑即白的概念, 因此用潜在结果表描述事件是一种更加恰当的方式。 4.1基本概念 潜在结果模型跳脱出因果推理的正统思想,转而着重哲学中反事实框架的影响,通过借鉴统计 学中随机对照试验和潜在结果的概念,构建了因果推断的新分析框架。潜在结果模型的核心假设是 “没有假设就没有因果”,以下将分别介绍潜在结果模型中涉及到的一些必要概念,以更好地理解 这种分析框架。 潜在结果框架分析中,通常说因果将干预和研究对象联系在一起,干预就是原因,干预所导致 的结果就是效应。鲁宾在文献[10]中提出潜在结果的含义,即:给定一个研究对象和一系列干预, 将每一对“干预-结果”界定为一个潜在结果。在潜在结果模型中,文献[11]将因果效应定义为同一 个研究对象潜在结果之差,研究对象i的因果效应(Individual Causal Effect,ICE)定义为
通常认为,哲学和统计学是得益于定量化数据记录对各个学科的普适性,以及统计学以数据为 分析对象的特点,先后提出了三种分析框架,即反事实框架、潜在结果模型和结构因果模型。反事实 框架介绍因果效应的起源,潜在结果模型和结构因果模型是在反事实理论的基础上进一步发展,并 成为了发现因果关系和评价因果效应时理论最成熟、应用最广泛的两种因果推断分析框架。随着实证 研究方法的不断创新发展,对于如何界定因果关系以及推断事物间的因果关系已经有了比较成熟的 理论,以下将详细阐述。 3 反事实框架 在因果关系的研究中,对于因果关系的界定几个世纪以来哲学家们都没有给出一个明确的定义 这主要是因为因果关系中原因和结果的定义在某种程度上都是以彼此为阐述条件,即需要结果来定 义原因,也需要原因来判定结果,使得二者的关系纷繁复杂、扑朔迷离。 在很长一段时间内,哲学中关于因果推理的主要范式是遵循“连续性或相关性的规律”,将因 果推断看成是一个挖掘事物规律的过程。无论是威廉姆·沙迪什(William Shadish)[6] 提出的判定因果 关系的三项原则,还是保罗·拉扎斯菲尔德(Paul Lazarsfeld)[7]提出的因果判定方法,都强调因果关 系中“规律性”的影响;随后,越来越多的学者认识到通过连续性或相关性的规律并不一定能得出 真正的因果关系,使得哲学中开始出现通过反事实框架(Counterfactual Framework)来探究因果关 系的方法。休谟[8]于 18 世纪最早提出基于反事实框架讨论因果关系并给出了反事实的文字化阐述, 大卫·刘易斯(David Lewis)[9]在休谟的研究基础上给出了反事实框架的符号化表达,结合可能世界 语义学和反事实来刻画因果依赖性,并形成了“界定可比较相似性→用相似性来说明反事实→用反 事实来定义反事实依赖性→用反事实依赖性来阐述因果依赖性→用因果依赖性来解释因果性”的逻 辑链条。刘易斯提出的因果依赖命题是对休谟因果关系的正式概括——“若事件 A 没有发生,则事 件 B 也不会发生”,一旦这一反事实命题成立,则可得出“若事件 A 发生,则事件 B 发生”的命 题自然成立。至此,刘易斯完成了从因果依赖性向因果性的跨越,他指出:“如果 A 和 B 是两个现 实事件且满足若 A 不发生则 B 不发生,则可以确定事件 A 是事件 B 的原因”,这一结论给出了因 果关系中对于原因和结果比较明晰的界定方法,为因果关系的理论思考提供了一种明确的道路。 4 潜在结果模型 在因果推断的理论体系中,潜在结果模型(Potential Outcomes Framework)是其中最重要的理 论模型之一。潜在结果模型由哈佛大学知名统计学者唐纳德·鲁宾(Donald B. Rubin)提出,因此该 模型又称鲁宾因果模型。潜在结果模型的核心是对同一个研究对象,比较其接受干预和不接受干预 的效应。对于接受干预的研究对象而言,其不接受干预是一种“反事实”状态,而对于不接受干预 的研究对象而言,其接受干预就是一种“反事实”状态。对于“反事实”框架的概念,鲁宾却并不 认同,他认为对于一个研究对象,其结果出现与否主要取决于分配机制(Assignment Mechanism), 事实上我们只能看到一种结果,但并不意味着另一种结果不存在,这并不是一个非黑即白的概念, 因此用潜在结果去描述事件是一种更加恰当的方式。 4.1 基本概念 潜在结果模型跳脱出因果推理的正统思想,转而着重哲学中反事实框架的影响,通过借鉴统计 学中随机对照试验和潜在结果的概念,构建了因果推断的新分析框架。潜在结果模型的核心假设是 “没有假设就没有因果”,以下将分别介绍潜在结果模型中涉及到的一些必要概念,以更好地理解 这种分析框架。 潜在结果框架分析中,通常说因果将干预和研究对象联系在一起,干预就是原因,干预所导致 的结果就是效应。鲁宾在文献[10]中提出潜在结果的含义,即:给定一个研究对象和一系列干预, 将每一对“干预-结果”界定为一个潜在结果。在潜在结果模型中,文献[11]将因果效应定义为同一 个研究对象潜在结果之差,研究对象 i 的因果效应(Individual Causal Effect,ICE)定义为 录用稿件,非最终出版稿
IC)=Y()-Y,)。尽管鲁宾等学者清楚地定义了一个研究对象的因果效应,但是通常对于同一个 研究对象,不可能既接受干预又接受对照,自然也不能够同时观测到两种结果。统计学中往往关注 总体的统计特征,利用潜在结果还可以得到总体的平均因果效应(Average Causal Effect,ACE)。 假设所有研究对象都接受干预X=1的平均结果为E(Y),所有研究对象都接受对照X=0的平均结 果为E(O),则平均因果效应可定义为两个平均结果之差:ACE)=E(ICE)=E(化-Y)=E(Y)-(Y)。 统计学家罗纳德·艾尔默·费舍尔(Ronald Aylmer Fisher)给出了识别平均因果效应的方法一一 随机对照试验,即将干预X随机分配给研究对象ⅰ。例如,通过抛硬币决定研究对象ⅰ是否接受干预, 这个随机决定的过程与潜在结果无关,可以保证潜在结果(化,。)与干预分配机制完全独立,进而得 到E(Y)=EY|X=x)平均因果效应可以通过在干预组与对照组中观测到的结果变量期望之差 ACE=E(YIX=1)-E(YIX=O)得到,计算式中不再含有潜在结果变量Y和Y。,可以通过传统的统 计方法,分别估计EY)=E(Y|X=1)和E(Y)=E(Y|X=O)来推断平均因果效应。 在实际研究中,随机对照试验往往需要比较理想的试验条件。例如,研究孕归服用某种药物对 婴儿致畸率的影响,不能随机分配一位孕妇服药或者不服药,随机对照试验道往往会受到伦理问题、 个体不依从等问题的限制。一旦随机对照试验条件不成立,这种通过计算禾预组与对照组之间差值 来得到平均因果关系的方法就面临着内生选择性偏差2]、差别化干预效应偏差等问题的困扰。内生 选择偏差意味着分配机制本身对干预组和对照组的差异性,差别化干预偏差意味着干预组和对照组 对于干预本身的反应效应不一,导致干预组和对照组并非在统一理想实验条件下接受比对参考。文 献13]定义了观察性研究的概念,其不再满足随机分配的条件,在此种情形下如果忽略协变量的作 用,仅通过随机对照试验方法估计因果效应就会产生偏差 乃至造成统计学悖论,如辛普森悖论。 4.2关键假设 在哲学和统计学领域,许多优秀的学者为潜在结果模型的研究发展做出了卓越贡献,休谟和 穆勒作为哲学家的典型代表最早从反事实框架的视角过论因果关系:泽西·奈曼(Jerzy Neyman)6 和费舍尔则从统计学家的立场出发,分别提出从潜在结果和随机的视角来讨论因果关系。费希尔提 出了“随机对照试验”的概念,而奈曼提出了潜在结果”并将其应用于随机对照试验,鲁宾在文 献[17]中进一步结合了“潜在结果”和“随机对照试验”这两个概念,系统性地提出了潜在结果模 型的理论假设、核心内容和推理方法。奈曼利用数学语言描述了潜在结果框架下的因果效应,鲁宾刀 将这一数学定义推广到观察性研究中,潜在结果模型作为一种因果推断的重要分析框架,其本身需 要建立在一些基本假设和前提之上)如果现实情况不能满足其基本假设,潜在结果的结论就不成立, 本节我们将重点讨论潜在结果模型的三个基本假设。 4.2.1研究对象干预值稳定性假设 研究对象干预值稳定性假设(Stable Unit Treatment Value Assumption,SUTVA)是一个先验假 设,从广义上看,研究对象干预值稳定性假设强调两个要点:(1)研究对象之间不存在相互影响, 互相独立;(2)每种开预的单一性,即不同层次的干预在SUTVA下不能归因为同一种干预。 鲁宾在986年指出无论分配干预X到研究对象i的分配机制是什么,也无所谓其他研究对 象接受干预入研究对象1受到干预X影响而得到的结果总是不变的。这一假设中既明确了其他 研究对象的决策对参考研究对象接受干预与否没有影响,也包含了分配机制对潜在结果没有影响的 假设。对于每个研究对象,实际观察的结果变量可以用潜在结果(化,Y)表示为Y=Y,+(1-X)Y。。 STUVA假设意味着每个研究对象所做出的决策并不受其他研究对象影响,然而在现实中这往 往是不现实的,比如同学A计划接种新冠疫苗后,同学B也许也会受其邀约一起接种:STUVA假 设是针对潜在结果模型的不完全假设,完全忽略了研究对象之间相互影响的间接效应。针对STUVA 的局限性,辛克莱2o]等提出了部分千扰假设(Partial Interference Assumption)的方法,即对干预分 配机制进行两阶段随机对照设计,第一阶段给研究对象随机分层到不同干预分配策略,第二阶段将 同层级内的研究对象进行随机干预或对照。实验表明,当群体在空间、事件或社会性上充分分离的情 况下,部分干扰假设可能是合理的
1 0 ICE i Y i Y i ( ) ( ) ( ) 。尽管鲁宾等学者清楚地定义了一个研究对象的因果效应,但是通常对于同一个 研究对象,不可能既接受干预又接受对照,自然也不能够同时观测到两种结果。统计学中往往关注 总体的统计特征,利用潜在结果还可以得到总体的平均因果效应(Average Causal Effect,ACE)。 假设所有研究对象都接受干预 X 1的平均结果为 1 E Y( ) ,所有研究对象都接受对照 X 0 的平均结 果为 0 E Y( ) ,则平均因果效应可定义为两个平均结果之差: 1 0 1 0 ACE i E ICE E Y Y E Y Y ( ) ( ) ( ) ( ) ( ) 。 统计学家罗纳德·艾尔默·费舍尔(Ronald Aylmer Fisher)给出了识别平均因果效应的方法—— 随机对照试验,即将干预 X 随机分配给研究对象i 。例如,通过抛硬币决定研究对象i 是否接受干预, 这个随机决定的过程与潜在结果无关,可以保证潜在结果 1 0 ( , ) Y Y 与干预分配机制完全独立,进而得 到 ( ) ( | ) E Y E Y X x x 平均因果效应可以通过在干预组与对照组中观测到的结果变量期望之差 ACE E Y X E Y X ( | 1) ( | 0) 得到,计算式中不再含有潜在结果变量 Y1和Y0 ,可以通过传统的统 计方法,分别估计 E Y E Y X ( ) ( | 1) 和 E Y E Y X ( ) ( | 0) 来推断平均因果效应。 在实际研究中,随机对照试验往往需要比较理想的试验条件。例如,研究孕妇服用某种药物对 婴儿致畸率的影响,不能随机分配一位孕妇服药或者不服药,随机对照试验也往往会受到伦理问题 、 个体不依从等问题的限制。一旦随机对照试验条件不成立,这种通过计算干预组与对照组之间差值 来得到平均因果关系的方法就面临着内生选择性偏差[12]、差别化干预效应偏差等问题的困扰。内生 选择偏差意味着分配机制本身对干预组和对照组的差异性,差别化干预偏差意味着干预组和对照组 对于干预本身的反应效应不一,导致干预组和对照组并非在统一理想实验条件下接受比对参考。文 献[13]定义了观察性研究的概念,其不再满足随机分配的条件,在此种情形下如果忽略协变量的作 用,仅通过随机对照试验方法估计因果效应就会产生偏差,乃至造成统计学悖论,如辛普森悖论。 4.2 关键假设 在哲学和统计学领域,许多优秀的学者为潜在结果模型的研究发展做出了卓越贡献,休谟[14]和 穆勒[15]作为哲学家的典型代表最早从反事实框架的视角讨论因果关系;泽西·奈曼(Jerzy Neyman)[16] 和费舍尔则从统计学家的立场出发,分别提出从潜在结果和随机的视角来讨论因果关系。费希尔提 出了“随机对照试验”的概念,而奈曼提出了“潜在结果”并将其应用于随机对照试验,鲁宾在文 献[17]中进一步结合了“潜在结果”和“随机对照试验”这两个概念,系统性地提出了潜在结果模 型的理论假设、核心内容和推理方法。奈曼利用数学语言描述了潜在结果框架下的因果效应,鲁宾[17] 将这一数学定义推广到观察性研究中,潜在结果模型作为一种因果推断的重要分析框架,其本身需 要建立在一些基本假设和前提之上,如果现实情况不能满足其基本假设,潜在结果的结论就不成立 , 本节我们将重点讨论潜在结果模型的三个基本假设。 4.2.1 研究对象干预值稳定性假设 研究对象干预值稳定性假设(Stable Unit Treatment Value Assumption,SUTVA)是一个先验假 设,从广义上看,研究对象干预值稳定性假设强调两个要点:(1)研究对象之间不存在相互影响, 互相独立;(2)每种干预的单一性,即不同层次的干预在 SUTVA 下不能归因为同一种干预。 鲁宾[19]在 1986 年指出无论分配干预 X 到研究对象 i 的分配机制是什么,也无所谓其他研究对 象接受干预与否,研究对象i 受到干预 X 影响而得到的结果总是不变的。这一假设中既明确了其他 研究对象的决策对参考研究对象接受干预与否没有影响,也包含了分配机制对潜在结果没有影响的 假设。对于每个研究对象,实际观察的结果变量可以用潜在结果 1 0 ( , ) Y Y 表示为 1 0 Y XY X Y (1 ) 。 STUVA 假设意味着每个研究对象所做出的决策并不受其他研究对象影响,然而在现实中这往 往是不现实的,比如同学 A 计划接种新冠疫苗后,同学 B 也许也会受其邀约一起接种;STUVA 假 设是针对潜在结果模型的不完全假设,完全忽略了研究对象之间相互影响的间接效应。针对 STUVA 的局限性,辛克莱[20]等提出了部分干扰假设(Partial Interference Assumption)的方法,即对干预分 配机制进行两阶段随机对照设计,第一阶段给研究对象随机分层到不同干预分配策略,第二阶段将 同层级内的研究对象进行随机干预或对照。实验表明,当群体在空间、事件或社会性上充分分离的情 况下,部分干扰假设可能是合理的。 录用稿件,非最终出版稿
4.2.2可忽略性假设 观察性研究仅对观测数据进行观察,以推断变量间的因果效应,但这种方法不能由研究者决定 是否针对某些研究对象采取干预或对照操作,因此观察性研究不再满足随机对照试验的条件。 在可忽略性假设(Ignorability of Treatment Assignment Mechanism)中阐述了干预分配机制的可 忽略性:即,在给定协变量V的条件下,干预X的分配独立于潜在结果(化,Y)独立于XIV。可忽略 性假设表明了两点:(1)如果给定两个研究对象共同的协变量V,不管他们的分配机制如何,二 者的潜在结果应该是相同的:(2)如果给定两个研究对象共同的协变量V,无论他们潜在结果的 值是什么,它们的干预分配机制应该是相同的。因此,可忽略性假设又被称为无混杂假设,它意味 着在具有相同协变量的研究对象之间,无论进行干预还是进行对照都不会影响潜在结果,也就是分 配机制不会因为研究对象接受干预或者不接受干预的结果产生任何影响。 4.2.3正值假设 如果在给定某些协变量的情况下,其干预分配机制是固定不变的,那么途类依据协变量所做 的分层中,至少有一种潜在结果是无法观察到的,在这种情况下,是无法通过潜在结果之间的差别 来推断因果关系的。例如,假设有两种药物A和B,想要评估药物A对孕妇的影响,孕中期的孕妇 总是被分配服用药物A,那么在孕中期孕妇这个分组中研究药物B对影响是役有意义的。正值假 设可用数学符号表达为:0<px=1<1,表明在基于协变量的分层中莓个研究对象接受干预或 对照的概率都是正值。正值假设表明了分配机制的可变性,这对仿对干预效果有着不可忽视的重要 意义。 在文献[Io]中,可忽略性假设和正值假设一起被称为强可忽略性分配假设(Strongly Ignorable Treatment Assignment)。二者条件相合就能得到总/体的可识别平均因果效应: E(化-Y)=E(化-YIV)】=EE(Y1X=1,)-E(YIO】。句忽略性假设表明了随机对照试验和观 察性研究的区别,当协变量的分布在干预组和对照组不大致时,就会产生一些偏差,我们将在下一 部分进行讨论。 4.3潜在结果的因果推理方法 观察性研究中如果忽略了协变量的作用,仅使用随机对照试险进行因果关系推断就会产生偏差 我们就将这种影响因果关系估计的变量称为混杂因素,判定混杂因素是因果推断中最基本和最关键 的问题。文献[20]基于相关关系的度量定必混杂因素为:如果两个变量之间相关关系的度量受到第 三个变量的影响,那么称第三个变量为混杂因素。文献22]则从潜在结果出发定义了混杂因素: p(化IX=1)=p(化|X=0)且Y。X=1)=pY。|X=0),即如果干预总体的潜在结果Y。和Y的分布与 对照总体的潜在结果的分布糊夙那么可以说在干预组和对照组之间无因混在因素而产生的混杂偏 差。 本节将在4.2并斑分绍的潜在结果模型的三个基本假设基础上,对潜在结果模型中现有的因果 推理方法进行延展,义根据其控制混杂因素的方式,我们重点介绍其中三种:匹配法、逆概率加权和 分层方法。 4.3.1匹配法 在可忽略性假设中,协变量在干预组和对照组之间的差别往往对因果推断的准确性起着举足轻 重的作用,为了消除协变量分布在两组研究对象之间的差异,匹配法(Matching Methods)常用于 观察性研究中,其目的就是对每一个研究对象匹配一个具有相同或相近协变量取值的研究对象集合, 使得通过匹配得到的数据在干预组和对照组之间有着相同的协变量分布,然后再根据匹配数据进行 因果推断。鲁宾等人在1973年提出用一个或多个协变量构建协变量集合,但在一些因果关系中, 所涉及到的协变量较多,难以判定根据哪些协变量构造的集合做匹配才能得到最准确的结果。因此, 文献[24]中提出了倾向值匹配(Propensity Score Matching),即将协变量的倾向值作为参考值来构 造匹配集合,并逐渐成为了观察性研究中最常用的匹配方法。 文献[24中同时定义了倾向值为给定协变量时干预的条件概率:π(W=p(X=1川),并提出如果
4.2.2 可忽略性假设 观察性研究仅对观测数据进行观察,以推断变量间的因果效应,但这种方法不能由研究者决定 是否针对某些研究对象采取干预或对照操作,因此观察性研究不再满足随机对照试验的条件。 在可忽略性假设(Ignorability of Treatment Assignment Mechanism)中阐述了干预分配机制的可 忽略性;即,在给定协变量V 的条件下,干预 X 的分配独立于潜在结果 1 0 ( , ) Y Y 独立于 X V| 。可忽略 性假设表明了两点:(1)如果给定两个研究对象共同的协变量V ,不管他们的分配机制如何,二 者的潜在结果应该是相同的;(2)如果给定两个研究对象共同的协变量V ,无论他们潜在结果的 值是什么,它们的干预分配机制应该是相同的。因此,可忽略性假设又被称为无混杂假设,它意味 着在具有相同协变量的研究对象之间,无论进行干预还是进行对照都不会影响潜在结果,也就是分 配机制不会因为研究对象接受干预或者不接受干预的结果产生任何影响。 4.2.3 正值假设 如果在给定某些协变量的情况下,其干预分配机制是固定不变的,那么在这些依据协变量所做 的分层中,至少有一种潜在结果是无法观察到的,在这种情况下,是无法通过潜在结果之间的差别 来推断因果关系的。例如,假设有两种药物 A 和 B,想要评估药物 A 对孕妇的影响,孕中期的孕妇 总是被分配服用药物 A,那么在孕中期孕妇这个分组中研究药物 B 对其影响是没有意义的。正值假 设可用数学符号表达为: 0 ( 1| ) 1 p X V ,表明在基于协变量的分层中,每个研究对象接受干预或 对照的概率都是正值。正值假设表明了分配机制的可变性,这对估计干预效果有着不可忽视的重要 意义。 在文献[10]中,可忽略性假设和正值假设一起被称为强可忽略性分配假设(Strongly Ignorable Treatment Assignment ) 。 二 者 条 件 相 合 就 能 得 到 总 体 的 可 识 别 平 均 因 果 效 应 : 1 0 1 0 E Y Y E E Y Y V E E Y X V E Y X V ( ) [ ( | )] [ ( | 1, ) ( | 0, )] 。可忽略性假设表明了随机对照试验和观 察性研究的区别,当协变量的分布在干预组和对照组不一致时,就会产生一些偏差,我们将在下一 部分进行讨论。 4.3 潜在结果的因果推理方法 观察性研究中如果忽略了协变量的作用,仅使用随机对照试验进行因果关系推断就会产生偏差 我们就将这种影响因果关系估计的变量称为混杂因素,判定混杂因素是因果推断中最基本 和最关键 的问题。文献[20]基于相关关系的度量定义混杂因素为:如果两个变量之间相关关系的度量受到第 三个变量的影响,那么称第三个变量为混杂因素。文献[22]则从潜在结果出发定义了混杂因素: 1 1 p Y X p Y X ( | 1) ( | 0) 且 0 0 p Y X p Y X ( | 1) ( | 0) ,即如果干预总体的潜在结果Y0 和Y1的分布与 对照总体的潜在结果的分布相同,那么可以说在干预组和对照组之间无因混在因素而产生的混杂 偏 差。 本节将在 4.2 节所介绍的潜在结果模型的三个基本假设基础上,对潜在结果模型中现有的因果 推理方法进行延展,根据其控制混杂因素的方式,我们重点介绍其中三种:匹配法、逆概率加权和 分层方法。 4.3.1 匹配法 在可忽略性假设中,协变量在干预组和对照组之间的差别往往对因果推断的准确性起着举足轻 重的作用,为了消除协变量分布在两组研究对象之间的差异,匹配法(Matching Methods)常用于 观察性研究中,其目的就是对每一个研究对象匹配一个具有相同或相近协变量取值的研究对象集合 , 使得通过匹配得到的数据在干预组和对照组之间有着相同的协变量分布,然后再根据匹配数据进行 因果推断。鲁宾[23]等人在 1973 年提出用一个或多个协变量构建协变量集合,但在一些因果关系中, 所涉及到的协变量较多,难以判定根据哪些协变量构造的集合做匹配才能得到最准确的结果 。因此, 文献[24]中提出了倾向值匹配(Propensity Score Matching),即将协变量的倾向值作为参考值来构 造匹配集合,并逐渐成为了观察性研究中最常用的匹配方法。 文献[24]中同时定义了倾向值为给定协变量时干预的条件概率: ( ) ( 1| ) V p X V ,并提出如果 录用稿件,非最终出版稿
在给定协变量V的情况下可忽略性假设成立,那么在给定倾向值时可忽略性假设也成立,因此可 以用倾向值替代协变量在因果推断中进行分层或匹配,从而避免了从众多协变量中遴选最适组合的 困难。文献[25]中给定研究对象集合i∈L,2,,,将研究对象i根据倾向值得到的匹配集合定义为: J)={U=1,2,,n:X,=1-X;∑6lπ(V)-π(W)π(W)-π(W)B≤M0。 &X=I-X 其中6}是示性函数,当括号中的条件满足时取值1,否则取值0。M为整数,代表每一研究 对象的匹配数,例如,M=1时得到1:1匹配。这个定义允许在构造匹配集合过程中放回已被使用的 个体,并用在其他个体的匹配集合中,平均因果效应的匹配估计为:匹片产--立)° 如果在实际运算中无从得知真实的倾向值,那么可以首先根据观察数据进行预先估计,然后再 用估计所得的倾向值做匹配,常用的基于倾向值匹配的方法包括回归[2]和决策树27等。 4.3.2逆概率加权 除匹配法之外,逆概率加权估计方法[2也是一种基于倾向值的方法 由汗混因素的存在,干 预组和对照组的协变量分布不同,会导致内生选择性偏差。也就是说, 预分配机制与观测数据中 的协变量有关,逆概率加权就是消除内生选择性偏差最有效的方法 通过给观测数据中的每个 研究对象分配适当的权重,可以创建一个干预组与对照组具有相份布的伪总体。样本重加权方法 涉及到的关键概念一一均衡得分(Balancing Score),经均衡得分处理后的协变量与干预分配机制 相独立,倾向值就是均衡得分中的一种。 逆概率加权(Inverse Propensity Weighting,PW 将权重P分配给每个研究对象: w=X/π(x)+(1-X)/(1-π(x).其中,X表示分配机制, t)表示倾向值。文献[29]在重加权后,可 以将平均因果效应的逆概率加权估计为:ATE V)-∑1-X)y,1[1-π(W】。 文献[30]表明,经不同规模的估计总体研究表明倾向值机制足以消除因可观测到的协变量而产 生的偏差;然而在实际估计中,逆概率加权的确性高度依赖倾向值的正确性,一旦倾向值计算出 现偏差就会严重影响逆概率加权的准确性:为了消除这种影响,罗宾斯等人在文章中提出了双稳健 估计,将逆概率加权与结果回归相结合,为因果关系估计提供双保险。 4.3.2分层方法 分层方法(Stratification)又被称为子分类o,,是调整混杂因素的代表性方法之一。这种方法通 过将整个总体划分为同质的子分层(bo©k)来调整因干预组和对照组之间差别造成的偏差,理想 状况下每个子层中干预组利对照组在协变量前提下的特定观测值是相似的,因此,同个子层中的研 究对象可以看作遵循随机府照试验的分配机制,也可以依据随机对照试验中的计算方法计算各子层 内的平均因果效应 ATE stra ∑g正0-)。其中,假设总体中划分了n个子层,q①)=N)1N为 第,个子层中的例究对像个数在总体中所占的比重, 和和,0分别表示第,个子层中干预结果和 对照结果的平均值。 与直接计算干预组和对照组结果差值的估计方法相比,分层方法显著降低了平 均因果估计的偏差,但如何确定分层方式又是另一个研究要点。 等概率(Equal-frequency)方法P4通过倾向值对总体进行分层,使得协变量在每一个子层中具 有相等的倾向值,总体的平均因果效应则通过每个子层中平均因果效应的加权平均进行估计。然而 这种方法会在某些权重过高或过低的子层中导致较大的方差,针对这类问题,文献[31]提出了一种 对倾向值分层得到的子层进行逆概率加权的估计方法,降低了等概率方法中出现的高方差问题。 5结构因果模型 除潜在结果模型外,因果推断中使用最多的一类模型就是结构因果模型(Structure Causal
在给定协变量V 的情况下可忽略性假设成立,那么在给定倾向值时可忽略性假设也成立,因此可 以用倾向值替代协变量在因果推断中进行分层或匹配,从而避免了从众多协变量中遴选最适组合的 困难。文献[25]中给定研究对象集合i n {1, 2,..., },将研究对象i 根据倾向值得到的匹配集合定义为: : 1 ( ) { 1, 2,..., : 1 ; {| ( ) ( ) | | ( ) ( ) |} } k j j i i k i j k X X J i j n X X V V V V M 。 其中{ } 是示性函数,当括号中的条件满足时取值 1,否则取值 0。 M 为整数,代表每一研究 对象的匹配数,例如, M 1 时得到1:1匹配。这个定义允许在构造匹配集合过程中放回已被使用的 个体,并用在其他个体的匹配集合中,平均因果效应的匹配估计为: 1 ( ) 1 1 (2 1)( ) n psm i i j i j J i ATE X Y Y n M 。 如果在实际运算中无从得知真实的倾向值,那么可以首先根据观察数据进行预先估计,然后再 用估计所得的倾向值做匹配,常用的基于倾向值匹配的方法包括回归[26]和决策树[27]等。 4.3.2 逆概率加权 除匹配法之外,逆概率加权估计方法[28]也是一种基于倾向值的方法。由于混杂因素的存在,干 预组和对照组的协变量分布不同,会导致内生选择性偏差。也就是说,干预分配机制与观测数据中 的协变量有关,逆概率加权就是消除内生选择性偏差最有效的方法之一。通过给观测数据中的每个 研究对象分配适当的权重,可以创建一个干预组与对照组具有相似分布的伪总体。样本重加权方法 涉及到的关键概念——均衡得分(Balancing Score),经均衡得分处理后的协变量与干预分配机制 相独立,倾向值就是均衡得分中的一种。 逆 概 率 加 权 ( Inverse Propensity Weighting, IPW ) 将 权 重 w 分 配 给 每 个 研 究 对 象 : w X x X x / ( ) (1 ) / (1 ( )) .其中, X 表示分配机制, ( ) x 表示倾向值。文献[29]在重加权后,可 以将平均因果效应的逆概率加权估计为: 1 1 / ( ) (1 ) / [1 ( )] n n ipw i i i i i i i i ATE X Y V X Y V 。 文献[30]表明,经不同规模的估计总体研究表明倾向值机制足以消除因可观测到的协变量而产 生的偏差;然而在实际估计中,逆概率加权的正确性高度依赖倾向值的正确性,一旦倾向值计算出 现偏差就会严重影响逆概率加权的准确性;为了消除这种影响,罗宾斯等人在文章中提出了双稳健 估计,将逆概率加权与结果回归相结合,为因果关系估计提供双保险。 4.3.2 分层方法 分层方法(Stratification)又被称为子分类[10] ,是调整混杂因素的代表性方法之一。这种方法通 过将整个总体划分为同质的子分层(block)来调整因干预组和对照组之间差别造成的偏差,理想 状况下每个子层中干预组和对照组在协变量前提下的特定观测值是相似的,因此,同个子层中的研 究对象可以看作遵循随机对照试验的分配机制,也可以依据随机对照试验中的计算方法计算各子层 内的平均因果效应: 1 0 1 ( )[ ( ) ( )] n strat i ATE q i Y i Y i 。其中,假设总体中划分了 n 个子层, q i N i N ( ) ( ) / 为 第i 个子层中的研究对象个数在总体中所占的比重, 1Y i( ) 和 0 Y i( ) 分别表示第i 个子层中干预结果和 对照结果的平均值。与直接计算干预组和对照组结果差值的估计方法相比,分层方法显著降低了平 均因果估计的偏差,但如何确定分层方式又是另一个研究要点。 等概率(Equal-frequency)方法[24]通过倾向值对总体进行分层,使得协变量在每一个子层中具 有相等的倾向值,总体的平均因果效应则通过每个子层中平均因果效应的加权平均进行估计。然而 这种方法会在某些权重过高或过低的子层中导致较大的方差,针对这类问题,文献[31]提出了一种 对倾向值分层得到的子层进行逆概率加权的估计方法,降低了等概率方法中出现的高方差问题。 5 结构因果模型 除潜在结果模型外,因果推断中使用最多的一类模型就是结构因果模型(Structure Causal 录用稿件,非最终出版稿
Model,SCM),朱迪亚·珀尔(Judea Pearl)阐述了这两类模型的等价性。相比之下,潜在结果 模型更加精确,而结构因果模型更加直观。结构因果模型可以描述多个变量之间的因果关系,珀尔 基于贝叶斯网络提出了外部干预的概念,并基于外部干预对因果关系形成了一种形式化表达方法, 开创了从数据中发掘因果关系和数据产生机制的方法。 5.1有向无环图 图论作为一种用途广泛的数学语言,可以直观地描述事物之间相互影响的关系,也能够经过简 单运算解决因果问题。在数学中,图是一个形式化定义的对象。数学中的图是由节点和边组成的集合, 图中的节点之间可以由边连接(也可以不连接);如果两个节点之间有边连接则称这两个节点为相 邻节点,若图中每一对节点都有边连接,则称之为完全图,图中的边可以是有向的也可以是无向的。 无向边没有指向的差别,仅起到连接两个节点的作用:而有向边3指定了输入端和输出端,从一个 节点指向另一个节点,并用箭头指示方向。有向边的起始节点称为其指向节点的父节点,反之指向 节点是起始节点的子节点,所有边都有方向的图称为有向图。有向图中节点和X之间的路径是指 从X开始到y结束的一系列由边首尾相接的节点,路径上的第一个节点称为该照径上所有节点的 祖先节点,其他节点俱为祖先节点的后代节点3。路径上不存在两条边同时指向同一个节点的情况, 也不存在从同一个节点出发的两条边。如果两个节点之间的路径能够沿省箭头方向追踪,那么这条 路径就称为有向路径。当一个节点存在回到自身的有向路径时,这个路径称为环,这个图称为有环 图,不存在环的有向图就是有向无环图(Directed Acyclic Graph,pAGs)B。 从因果推断经典问题辛普森悖论可知,某些决策无法仅从数据本身获得有效信息,而是要细 究数据背后的原因。为了能够严格地处理这些因果关系问题,寸 珀尔寻找出了一种能够借助图论这种 数学工具形式化表述数据背后因果假设的方法,卿结构因果模型(Structural Causal Modl,SCM)。其可用于描述现实世界关联特征及缃互作用,具体而言,结构因果模型描述了 如何为感兴趣的变量赋值。 从形式上看,结构因果模型由一组函数:({6:,→XIX∈,和两个变量集U和V构成, 其中U中的变量称为外生变量,位于模型外部无需考虑它们变化的原因:V中的变量称为内生 变量,位于模型的内部,模型中的每一个内生变量都至少是一个外生变量的后代:外生变量在图中 表现为一个根节点,它没有祖先节点,特别不能是内生变量的后代。如果知道每个外生变量的值, 那么利用函数:就可以完全确定每个内生变量的值。 每一个结构因果模型都与图形化的因果模型相关联,称为“图模型”或简称“图”。图模型中 的节点表示U和V中的两类变量,图模型中的边表示∫中的函数。假设结构因果模型M的图模型 为G,M中的每个变量都表家为>个节点,对于变量XV,如果X依赖于Y值变化,那么在图 模型G中会有一条由X指询不的有向边。我们主要讨论基于有向无环图的结构因果模型,因此可以 给出因果关系的图形化定义:在图模型中,如果变量X是变量Y的子节点,那么Y是X的直接原 因:如果变量X是变量X的后代节点,那么Y是X的潜在原因(非传递性的特殊情况此处不予讨 论)。 目前因果推断护我们仅考虑使用有向无环图描述因果关系,这也就意味着有向无环图不能描述存在 互为因果(Simultaneous Causation)和反馈循环(Feedback Loops)等类型的因果关系,虽然可以 通过比较复杂的有向无环图描述以上情形,但是在真正研究中,大多数问题都可以通过有向无环图 来描述,文献[36]中延伸了图模型在因果统计推断中的应用。 5.2因果关系的三个层级 因果关系已经成为了现代社会最重要的认知工具之一,基于人类认知的发展,珀尔将因果关 系划分为三个层级:第一个层级是关联(Association),它涉及到由数据定义的统计相关性,观察 性研究也正是依托于这一层级而实现的统计学方法;第二个层级是干预(Intervention),它不仅表 明了通过观测数据能直观地看到规律,更想知道如果对观察对象做出干预行为会导致什么结果:第 三个层级是反事实(Counterfactual),这一层级是对过去所发生的行为的溯因和思考,比如“如果某
Model,SCM),朱迪亚·珀尔(Judea Pearl)阐述了这两类模型的等价性[32]。相比之下,潜在结果 模型更加精确,而结构因果模型更加直观。结构因果模型可以描述多个变量之间的因果关系,珀尔 基于贝叶斯网络提出了外部干预的概念,并基于外部干预对因果关系形成了一种形式化表达方法, 开创了从数据中发掘因果关系和数据产生机制的方法。 5.1 有向无环图 图论作为一种用途广泛的数学语言,可以直观地描述事物之间相互影响的关系,也能够经过简 单运算解决因果问题。在数学中,图是一个形式化定义的对象。数学中的图是由节点和边组成的集合, 图中的节点之间可以由边连接(也可以不连接);如果两个节点之间有边连接则称这两个节点为相 邻节点,若图中每一对节点都有边连接,则称之为完全图,图中的边可以是有向的也可以是无向的 。 无向边没有指向的差别,仅起到连接两个节点的作用;而有向边[33]指定了输入端和输出端,从一个 节点指向另一个节点,并用箭头指示方向。有向边的起始节点称为其指向节点的父节点,反之指向 节点是起始节点的子节点,所有边都有方向的图称为有向图。有向图中节点 X 和Y 之间的路径是指 从 X 开始到Y 结束的一系列由边首尾相接的节点,路径上的第一个节点称为该路径上所有节点的 祖先节点,其他节点俱为祖先节点的后代节点[34]。路径上不存在两条边同时指向同一个节点的情况, 也不存在从同一个节点出发的两条边。如果两个节点之间的路径能够沿着箭头方向追踪,那么这条 路径就称为有向路径。当一个节点存在回到自身的有向路径时,这个路径称为环,这个图称为有环 图,不存在环的有向图就是有向无环图(Directed Acyclic Graph,DAGs)[32]。 从因果推断经典问题辛普森悖论[35]可知,某些决策无法仅从数据本身获得有效信息,而是要细 究数据背后的原因。为了能够严格地处理这些因果关系问题,珀尔寻找出了一种能够借助图论这种 数 学 工 具 形 式 化 表 述 数 据 背 后 因 果 假 设 的 方 法 , 即 结 构 因 果 模 型 ( Structural Causal Model,SCM)。其可用于描述现实世界关联特征及其相互作用,具体而言,结构因果模型描述了 如何为感兴趣的变量赋值。 从形式上看,结构因果模型由一组函数: { : | } x x f f W X X V ,和两个变量集U 和V 构成, 其中U 中的变量称为外生变量,位于模型外部,无需考虑它们变化的原因;V 中的变量称为内生 变量,位于模型的内部,模型中的每一个内生变量都至少是一个外生变量的后代;外生变量在图中 表现为一个根节点,它没有祖先节点,特别不能是内生变量的后代。如果知道每个外生变量的值, 那么利用函数 x f 就可以完全确定每个内生变量的值。 每一个结构因果模型都与图形化的因果模型相关联,称为“图模型”或简称“图”。图模型中 的节点表示U 和V 中的两类变量,图模型中的边表示 f 中的函数。假设结构因果模型 M 的图模型 为 G,M 中的每个变量都表示为一个节点,对于变量 X V ,如果 X 依赖于Y 值变化,那么在图 模型 G 中会有一条由Y 指向 X 的有向边。我们主要讨论基于有向无环图的结构因果模型,因此可以 给出因果关系的图形化定义:在图模型中,如果变量 X 是变量Y 的子节点,那么Y 是 X 的直接原 因;如果变量 X 是变量Y 的后代节点,那么Y 是 X 的潜在原因(非传递性的特殊情况此处不予讨 论)。 目前因果推断中我们仅考虑使用有向无环图描述因果关系,这也就意味着有向无环图不能描述存在 互为因果(Simultaneous Causation)和反馈循环(Feedback Loops)等类型的因果关系,虽然可以 通过比较复杂的有向无环图描述以上情形,但是在真正研究中,大多数问题都可以通过有向无环图 来描述,文献[36]中延伸了图模型在因果统计推断中的应用。 5.2 因果关系的三个层级 因果关系已经成为了现代社会最重要的认知工具之一,基于人类认知的发展,珀尔[32]将因果关 系划分为三个层级:第一个层级是关联(Association),它涉及到由数据定义的统计相关性,观察 性研究也正是依托于这一层级而实现的统计学方法;第二个层级是干预(Intervention),它不仅表 明了通过观测数据能直观地看到规律,更想知道如果对观察对象做出干预行为会导致什么结果;第 三个层级是反事实(Counterfactual),这一层级是对过去所发生的行为的溯因和思考,比如“如果某 录用稿件,非最终出版稿
个研究对象没有采取A操作,而是采取B操作,与现在得到的结果会有何不同?”三个层级对应的 是三种认识能力,即观察能力(Seeing)、行动能力(Doing)和想象能力maging),人类要想改变世界和 创构世界,就要迈上因果之梯的更高层级。 5.2.1三种基本路径结构和三种偏差 在结构因果模型的理论体系中,因果关系的推断依托于有向无环图的三种基本路径结构,即链 状结构、叉状结构和对撞结构,三种结构具有不同的信息流转方式,所有因果图都可以拆解为这三 类结构的组合,因此路径结构在结构因果模型的学习中占据着举足轻重的地位。 (1)链状结构(chain):顾名思义,链状结构就像一条链子一样,让信息从一端流转到另一 端。如果在链状结构中,变量X和Z之间只有一条单向路径且Y是截断这条路径的任何一组变量, 那么在y的条件下,X和Z是独立的。以上规则成立的条件是,X,Y,Z各自的误差项(外生变量) U,U,U相互独立,如果U,是U.的原因,那么以Y为条件不一定能够保证X和Z相互独立,因为 Z的变化仍然可能通过误差项与X关联。 (2)叉状结构(foks):具有三个节点,且信息可以从中间节点分发到两端节点的结构就是 叉状结构:叉状结构的中间变量是其他两个变量及其后代的共同原因。在及状结构中,如果变量X 和Z都是变量y的后代节点,并且X和Z之间只有一条路径,那么当给定变量Y时,X和Z条件 独立。 (3)对撞结构(collider):如果一个节点可以同时接收来自岛外两个父节点的信息,那么就 称这个结构为对撞结构,称两个父节点共同的子节点为对撞节点。如栗变量y是变量X和Z之间的 对撞节点,且X和Z只有一条路径,对撞节点Y的取值依赖士父节点X和Z,当以对撞节点Y为 条件时,Y取值固定,X的任何变化必须通过Z相应的变化来进行补偿:也就是说正常情况下X 和Z是无条件独立的,但在给定y或y的后代节点时是相互依赖的。 在结构因果模型中不管多么复杂的结构都可以拆分为以上三种结构的组合,三种结构也可能导 致不同的偏差。例如一个人的受教育程度可以直接影响他的收入,而一个人的受教育程度和收入高 低又同时受到智商和竞争意识两个变量的影响入即该因果模型中存在着三条路径:教育→收入、教 育←一智商→收入、教育←竞争意识→收入。如果要估计受教育程度对个人收入的影响,就要考虑智商 对受教育程度和个人收入共同的影响,智商就是这个因果关系中的混淆变量,如在研究中不能剔除 混淆变量的影响,教育和收入之间就会包含“教育一智商一收入”这条混淆路径产生的相关性,因 此产生混淆偏差。如果要估计竞争意识对收入的影响,除了直接影响还需要估计“竞争意识→教育 →收入”的间接影响,如果控制受教育程度这个变量,就截断了其中一条因果路径,也就是截断了 竞争意识的间接影响,这种制方式会在一定程度上低估中间变量的作用,造成过度控制偏差。在 智商和受教育程度之间,会生一条新的衍生路径:智商→收入一教育:这个对撞结构则会使原本 只存在直接因果关系的智商和受教育程度两个变量之间的相关性发生改变,造成内生选择性偏差。 总而言之,结构因果模型中的三种基本结构可能会造成不同的偏差,链状结构会导致过度控制偏差, 叉状结构会导致混淆偏差,对撞结构会导致内生选择性偏差:在复杂因果模型的拆解分析中需要考 虑全部因果路径, 才能推断出准确的因果关系。 5.2.1关联 图模型不仅能提供对因果关系的直观表述,还能有效表达联合分布。利用结构因果模型可以有 效表示n个变量的联合分布:通过确定表述变量之间关系的个函数,以及误差项的概率分析,就 可以得到联合分布概率以及各个边缘概率之间的关联。但是当我们无法得知变量之间具体的函数关 系,或无法获取误差项的分布时,就可以应用下述计算法则解决以上问题。 (1)乘积分解法则:对于任何有向无环图,模型中变量的联合分布可以通过计算条件概率分 布P(子节点父节点的乘积得出,其形式化表达为:P,西,)=几Pm),pa表示子节点,的 所有父节点。例如,如果在一个由三个变量构成的简单链状结构X→Y→Z中,选择用表达式
个研究对象没有采取 A 操作,而是采取 B 操作,与现在得到的结果会有何不同?”三个层级对应的 是三种认识能力,即观察能力(Seeing)、行动能力(Doing)和想象能力(Imaging),人类要想改变世界和 创构世界,就要迈上因果之梯的更高层级。 5.2.1 三种基本路径结构和三种偏差 在结构因果模型的理论体系中,因果关系的推断依托于有向无环图的三种基本路径结构,即链 状结构、叉状结构和对撞结构,三种结构具有不同的信息流转方式,所有因果图都可以拆解为这三 类结构的组合,因此路径结构在结构因果模型的学习中占据着举足轻重的地位。 (1)链状结构(chain):顾名思义,链状结构就像一条链子一样,让信息从一端流转到另一 端。如果在链状结构中,变量 X 和 Z 之间只有一条单向路径且Y 是截断这条路径的任何一组变量, 那么在Y 的条件下, X 和 Z 是独立的。以上规则成立的条件是, X Y Z , , 各自的误差项(外生变量) , , U U U x y z 相互独立,如果Ux 是Uz 的原因,那么以Y 为条件不一定能够保证 X 和 Z 相互独立,因为 Z 的变化仍然可能通过误差项与 X 关联。 (2)叉状结构(forks):具有三个节点,且信息可以从中间节点分发到两端节点的结构就是 叉状结构;叉状结构的中间变量是其他两个变量及其后代的共同原因。在叉状结构中,如果变量 X 和 Z 都是变量Y 的后代节点,并且 X 和 Z 之间只有一条路径,那么当给定变量 Y 时, X 和 Z 条件 独立。 (3)对撞结构(collider):如果一个节点可以同时接收来自另外两个父节点的信息,那么就 称这个结构为对撞结构,称两个父节点共同的子节点为对撞节点。如果变量Y 是变量 X 和 Z 之间的 对撞节点,且 X 和 Z 只有一条路径,对撞节点Y 的取值依赖于父节点 X 和 Z ,当以对撞节点Y 为 条件时,Y 取值固定, X 的任何变化必须通过 Z 相应的变化来进行补偿;也就是说正常情况下 X 和 Z 是无条件独立的,但在给定Y 或Y 的后代节点时是相互依赖的。 在结构因果模型中不管多么复杂的结构都可以拆分为以上三种结构的组合,三种结构也可能导 致不同的偏差。例如一个人的受教育程度可以直接影响他的收入,而一个人的受教育程度和收入高 低又同时受到智商和竞争意识两个变量的影响,即该因果模型中存在着三条路径:教育→收入、教 育←智商→收入、教育←竞争意识→收入。如果要估计受教育程度对个人收入的影响,就要考虑智商 对受教育程度和个人收入共同的影响,智商就是这个因果关系中的混淆变量,如在研究中不能剔除 混淆变量的影响,教育和收入之间就会包含“教育←智商→收入”这条混淆路径产生的相关性,因 此产生混淆偏差。如果要估计竞争意识对收入的影响,除了直接影响还需要估计“竞争意识→教育 →收入”的间接影响,如果控制受教育程度这个变量,就截断了其中一条因果路径,也就是截断了 竞争意识的间接影响,这种控制方式会在一定程度上低估中间变量的作用,造成过度控制偏差。在 智商和受教育程度之间,会产生一条新的衍生路径:智商→收入←教育;这个对撞结构则会使原本 只存在直接因果关系的智商和受教育程度两个变量之间的相关性发生改变,造成内生选择性偏差。 总而言之,结构因果模型中的三种基本结构可能会造成不同的偏差,链状结构会导致过度控制偏差 , 叉状结构会导致混淆偏差,对撞结构会导致内生选择性偏差;在复杂因果模型的拆解分析中需要考 虑全部因果路径,才能推断出准确的因果关系。 5.2.1 关联 图模型不仅能提供对因果关系的直观表述,还能有效表达联合分布。利用结构因果模型可以有 效表示 n 个变量的联合分布:通过确定表述变量之间关系的 n 个函数,以及误差项的概率分析,就 可以得到联合分布概率以及各个边缘概率之间的关联。但是当我们无法得知变量之间具体的函数关 系,或无法获取误差项的分布时,就可以应用下述计算法则解决以上问题。 (1)乘积分解法则:对于任何有向无环图,模型中变量的联合分布可以通过计算条件概率分 布 P( | ) 子节点 父节点 的乘积得出,其形式化表达为: 1 2 ( , ,..., ) ( | ) n i i i P x x x P x pa , pai 表示子节点 i 的 所有父节点。例如,如果在一个由三个变量构成的简单链状结构 X Y Z 中,选择用表达式 录用稿件,非最终出版稿
P(X=x,Y=y,Z=)=P(X=x)P(Y=y川X=x)P(Z=|Y=y)表示其联合分布,它不再需要创建一个 概率表,在海量模型数据运算中节约了大量的时间:因此,图的深层意义就是将一个高维分布估计 问题降维成一个低维分布估计问题。 (2)d分离:实际中基于图模型的因果关系表达往往更加复杂,变量之间可能有多条路径连 接,且每个路径耦合多个基础路径结构:因此,应用贝叶斯网络中的d分离方法对一个复杂的因果 图模型做解构。d-分离的判断方法是一对节点之间是否存在一条连通路径,如果存在即为d连通: 如果不存在则为d-分离,也就是这两个变量相互独立。d-分离主要分为两类:①不以特定节点为条 件,只有对撞节点可以阻断一条路径:②以特定节点为条件,包含链状和叉状结构的中间节点以及 对撞结构除对撞节点外的其他节点。在实际应用中,往往使用d分离工具研究复杂图模型并确定其 中的独立变量和依赖变量,以解析复杂关系下变量之间的因果关系。其优势在于d-分离是非参数的, 仅需要依托图模型进行运算,而不需要参考变量之间的函数关系,并且d分离仅能实施局部性的检 验模型,而非进行全局性的检验,这使得它可以识别假设模型中有缺陷的特定区域并对其进行修复 完善,从而得到一个全新的模型。 5.2.2千预 5.2.2.1干预有关的概念 关联是以观测数据为研究对象进行统计分析,其并未改变数据的分布。例如,我们之前提到的 例子,即通过对数据进行观察发现轻体重和吃早饭之间具有相关性,这就是关联。而要进行干预, 我们就需要改变现有的数据分布,让吃早饭的人停止吃早饭或者让不吃早饭的人开始吃早饭。随 机对照试验是统计学中的黄金准则,在理想情况下,随机对照试验中除了输入变量,所有影响输出 变量的因素,要么是固定的,要么是随机变化的,也就是说输出变量的变化必然是由于输入变量而 引起的。在随机对照试验不可行的情况下,研究者们采佣观察性研究,但这种方法很难将因果关系 从相关关系中识别出来,因此,在实际应用中研究通过天预方法预测干预措施的效果显得尤为重要。 干预一个变量与以该变量为条件有着本质的区别,当干预一个模型中的变量时,相应的我们也 会固定这个变量的值,其他变量的值也会随省固定变量的变化而产生相应的变化。而以某个变量为 条件只是将该变量范围缩减到问题所关心的子集,并不会改变模型中的其他变量。总而言之,干预 改变了世界本身,而以变量为条件改变了我们观察世界的角度。在一定程度上,采取干预措施并固 定其变量取值会削弱该变量响应其他变量变化的自然趋势。用图形语言来说,就是去除了指向该变 量的所有有向边,从而完全消除了它的父节点对它的影响。与以变量为条件不同的是,对一个变量 采取干预措施会导致一种完金不同的相关关系,从而导致图模型结构的变化,而以变量为条件仅对 观测数据进行分类,并下兮对数据建模产生影响。 在符号表达中,珀尔提出了用o运算表达干预。比如P(Y=y川X=x)表示在X=x的条件下 Y=y的概率分布,它反映了在X取值都是x的个体上Y的总体分布。而P(Y=y川do(X=x)表示通 过干预使X=x时y的概率分布,它反映了将群体中所有个体的X取值都固定为x时Y=y的总 体分布。 因果推断中识别性和传统统计中的识别性定义是一致的。统计学中,如果两个不同的模型参 数对应不同的观测数据的分布,那么我们称模型的参数可以识别。这里,如果因果效应可以用观测 数据的分布唯一地表示,那么我们称因果效应是可以识别的,因果关系可以通过o表达式和图模 型从相关关系中识别出来。 5.2.2.2千预工具 (1)校正公式 在因果估计中,通过计算平均因果效应以估计接受干预do(X=I)和do(X=O)之间的差别,但 是在没有因果关联的情况下,无从直接通过观测数据本身估计因果效应。因此需要通过借助图模型, 以对图进行处理的方式模拟干预,即对哪个变量进行干预就把指向它的箭头去掉。在校正公式中使 用P表示修改后的图模型的概率,因此也被称为操纵概率。假设X是Y的原因,且Z是X,Y的共因
P X x Y y Z z P X x P Y y X x P Z z Y y ( , , ) ( ) ( | ) ( | ) 表示其联合分布,它不再需要创建一个 概率表,在海量模型数据运算中节约了大量的时间;因此,图的深层意义就是将一个高维分布估计 问题降维成一个低维分布估计问题。 (2)d-分离:实际中基于图模型的因果关系表达往往更加复杂,变量之间可能有多条路径连 接,且每个路径耦合多个基础路径结构;因此,应用贝叶斯网络中的 d-分离方法对一个复杂的因果 图模型做解构。d-分离的判断方法是一对节点之间是否存在一条连通路径,如果存在即为 d-连通; 如果不存在则为 d-分离,也就是这两个变量相互独立。d-分离主要分为两类:①不以特定节点为条 件,只有对撞节点可以阻断一条路径;②以特定节点为条件,包含链状和叉状结构的中间节点以及 对撞结构除对撞节点外的其他节点。在实际应用中,往往使用 d-分离工具研究复杂图模型并确定其 中的独立变量和依赖变量,以解析复杂关系下变量之间的因果关系。其优势在于 d-分离是非参数的, 仅需要依托图模型进行运算,而不需要参考变量之间的函数关系,并且 d-分离仅能实施局部性的检 验模型,而非进行全局性的检验,这使得它可以识别假设模型中有缺陷的特定区域并对其进行修复 完善,从而得到一个全新的模型。 5.2.2 干预 5.2.2.1 干预有关的概念 关联是以观测数据为研究对象进行统计分析,其并未改变数据的分布。例如,我们之前提到的 例子,即通过对数据进行观察发现轻体重和吃早饭之间具有相关性,这就是关联。而要进行干预, 我们就需要改变现有的数据分布,让吃早饭的人停止吃早饭,或者让不吃早饭的人开始吃早饭。随 机对照试验是统计学中的黄金准则,在理想情况下,随机对照试验中除了输入变量,所有影响输出 变量的因素,要么是固定的,要么是随机变化的,也就是说输出变量的变化必然是由于输入变量而 引起的。在随机对照试验不可行的情况下,研究者们采用观察性研究,但这种方法很难将因果关系 从相关关系中识别出来,因此,在实际应用中研究通过干预方法预测干预措施的效果显得尤为重要。 干预一个变量与以该变量为条件有着本质的区别,当干预一个模型中的变量时,相应的我们也 会固定这个变量的值,其他变量的值也会随着固定变量的变化而产生相应的变化。而以某个变量为 条件只是将该变量范围缩减到问题所关心的子集,并不会改变模型中的其他变量。总而言之,干预 改变了世界本身,而以变量为条件改变了我们观察世界的角度。在一定程度上,采取干预措施并固 定其变量取值会削弱该变量响应其他变量变化的自然趋势。用图形语言来说,就是去除了指向该变 量的所有有向边,从而完全消除了它的父节点对它的影响。与以变量为条件不同的是,对一个变量 采取干预措施会导致一种完全不同的相关关系,从而导致图模型结构的变化,而以变量为条件仅对 观测数据进行分类,并不会对数据建模产生影响。 在符号表达中,珀尔[37]提出了用 do 运算表达干预。比如 P Y y X x ( | ) 表示在 X x 的条件下 Y y 的概率分布,它反映了在 X 取值都是 x 的个体上Y 的总体分布。而 P Y y do X x ( | ( )) 表示通 过干预使 X x 时Y y 的概率分布,它反映了将群体中所有个体的 X 取值都固定为 x 时Y y 的总 体分布。 因果推断中的识别性和传统统计中的识别性定义是一致的。统计学中,如果两个不同的模型参 数对应不同的观测数据的分布,那么我们称模型的参数可以识别。这里,如果因果效应可以用观测 数据的分布唯一地表示,那么我们称因果效应是可以识别的,因果关系可以通过 do 表达式和图模 型从相关关系中识别出来。 5.2.2.2 干预工具 (1)校正公式 在因果估计中,通过计算平均因果效应以估计接受干预 do X( 1) 和 do X( 0) 之间的差别,但 是在没有因果关联的情况下,无从直接通过观测数据本身估计因果效应。因此需要通过借助图模型 , 以对图进行处理的方式模拟干预,即对哪个变量进行干预就把指向它的箭头去掉。在校正公式中使 用 Pm 表示修改后的图模型的概率,因此也被称为操纵概率。假设 X 是Y 的原因,且 Z 是 X Y, 的共因, 录用稿件,非最终出版稿