4.2.2 可忽略性假设观察性研究仅对观测数据进行观察，以推断变量间的因

正在加载图片...

4.2.2可忽略性假设观察性研究仅对观测数据进行观察，以推断变量间的因果效应，但这种方法不能由研究者决定是否针对某些研究对象采取干预或对照操作，因此观察性研究不再满足随机对照试验的条件。在可忽略性假设(Ignorability of Treatment Assignment Mechanism)中阐述了干预分配机制的可忽略性：即，在给定协变量V的条件下，干预X的分配独立于潜在结果（化，Y)独立于XIV。可忽略性假设表明了两点：(1)如果给定两个研究对象共同的协变量V,不管他们的分配机制如何，二者的潜在结果应该是相同的：(2)如果给定两个研究对象共同的协变量V,无论他们潜在结果的值是什么，它们的干预分配机制应该是相同的。因此，可忽略性假设又被称为无混杂假设，它意味着在具有相同协变量的研究对象之间，无论进行干预还是进行对照都不会影响潜在结果，也就是分配机制不会因为研究对象接受干预或者不接受干预的结果产生任何影响。 4.2.3正值假设如果在给定某些协变量的情况下，其干预分配机制是固定不变的，那么途类依据协变量所做的分层中，至少有一种潜在结果是无法观察到的，在这种情况下，是无法通过潜在结果之间的差别来推断因果关系的。例如，假设有两种药物A和B,想要评估药物A对孕妇的影响，孕中期的孕妇总是被分配服用药物A,那么在孕中期孕妇这个分组中研究药物B对影响是役有意义的。正值假设可用数学符号表达为：0<px=1<1,表明在基于协变量的分层中莓个研究对象接受干预或对照的概率都是正值。正值假设表明了分配机制的可变性，这对仿对干预效果有着不可忽视的重要意义。在文献[Io]中，可忽略性假设和正值假设一起被称为强可忽略性分配假设(Strongly Ignorable Treatment Assignment)。二者条件相合就能得到总/体的可识别平均因果效应： E(化-Y)=E(化-YIV)】=EE(Y1X=1,)-E(YIO】。句忽略性假设表明了随机对照试验和观察性研究的区别，当协变量的分布在干预组和对照组不大致时，就会产生一些偏差，我们将在下一部分进行讨论。 4.3潜在结果的因果推理方法观察性研究中如果忽略了协变量的作用，仅使用随机对照试险进行因果关系推断就会产生偏差我们就将这种影响因果关系估计的变量称为混杂因素，判定混杂因素是因果推断中最基本和最关键的问题。文献[20]基于相关关系的度量定必混杂因素为：如果两个变量之间相关关系的度量受到第三个变量的影响，那么称第三个变量为混杂因素。文献22]则从潜在结果出发定义了混杂因素： p(化IX=1)=p(化|X=0)且Y。X=1)=pY。|X=0),即如果干预总体的潜在结果Y。和Y的分布与对照总体的潜在结果的分布糊夙那么可以说在干预组和对照组之间无因混在因素而产生的混杂偏差。本节将在4.2并斑分绍的潜在结果模型的三个基本假设基础上，对潜在结果模型中现有的因果推理方法进行延展，义根据其控制混杂因素的方式，我们重点介绍其中三种：匹配法、逆概率加权和分层方法。 4.3.1匹配法在可忽略性假设中，协变量在干预组和对照组之间的差别往往对因果推断的准确性起着举足轻重的作用，为了消除协变量分布在两组研究对象之间的差异，匹配法(Matching Methods)常用于观察性研究中，其目的就是对每一个研究对象匹配一个具有相同或相近协变量取值的研究对象集合，使得通过匹配得到的数据在干预组和对照组之间有着相同的协变量分布，然后再根据匹配数据进行因果推断。鲁宾等人在1973年提出用一个或多个协变量构建协变量集合，但在一些因果关系中，所涉及到的协变量较多，难以判定根据哪些协变量构造的集合做匹配才能得到最准确的结果。因此，文献[24]中提出了倾向值匹配(Propensity Score Matching),即将协变量的倾向值作为参考值来构造匹配集合，并逐渐成为了观察性研究中最常用的匹配方法。文献[24中同时定义了倾向值为给定协变量时干预的条件概率：π(W=p(X=1川)，并提出如果4.2.2 可忽略性假设观察性研究仅对观测数据进行观察，以推断变量间的因果效应，但这种方法不能由研究者决定是否针对某些研究对象采取干预或对照操作，因此观察性研究不再满足随机对照试验的条件。在可忽略性假设（Ignorability of Treatment Assignment Mechanism）中阐述了干预分配机制的可忽略性；即，在给定协变量V 的条件下，干预 X 的分配独立于潜在结果 1 0 ( , ) Y Y 独立于 X V| 。可忽略性假设表明了两点：（1）如果给定两个研究对象共同的协变量V ，不管他们的分配机制如何，二者的潜在结果应该是相同的；（2）如果给定两个研究对象共同的协变量V ，无论他们潜在结果的值是什么，它们的干预分配机制应该是相同的。因此，可忽略性假设又被称为无混杂假设，它意味着在具有相同协变量的研究对象之间，无论进行干预还是进行对照都不会影响潜在结果，也就是分配机制不会因为研究对象接受干预或者不接受干预的结果产生任何影响。 4.2.3 正值假设如果在给定某些协变量的情况下，其干预分配机制是固定不变的，那么在这些依据协变量所做的分层中，至少有一种潜在结果是无法观察到的，在这种情况下，是无法通过潜在结果之间的差别来推断因果关系的。例如，假设有两种药物 A 和 B，想要评估药物 A 对孕妇的影响，孕中期的孕妇总是被分配服用药物 A，那么在孕中期孕妇这个分组中研究药物 B 对其影响是没有意义的。正值假设可用数学符号表达为： 0 ( 1| ) 1    p X V ，表明在基于协变量的分层中，每个研究对象接受干预或对照的概率都是正值。正值假设表明了分配机制的可变性，这对估计干预效果有着不可忽视的重要意义。在文献[10]中，可忽略性假设和正值假设一起被称为强可忽略性分配假设（Strongly Ignorable Treatment Assignment ）。二者条件相合就能得到总体的可识别平均因果效应： 1 0 1 0 E Y Y E E Y Y V E E Y X V E Y X V ( ) [ ( | )] [ ( | 1, ) ( | 0, )]        。可忽略性假设表明了随机对照试验和观察性研究的区别，当协变量的分布在干预组和对照组不一致时，就会产生一些偏差，我们将在下一部分进行讨论。 4.3 潜在结果的因果推理方法观察性研究中如果忽略了协变量的作用，仅使用随机对照试验进行因果关系推断就会产生偏差我们就将这种影响因果关系估计的变量称为混杂因素，判定混杂因素是因果推断中最基本和最关键的问题。文献[20]基于相关关系的度量定义混杂因素为：如果两个变量之间相关关系的度量受到第三个变量的影响，那么称第三个变量为混杂因素。文献[22]则从潜在结果出发定义了混杂因素： 1 1 p Y X p Y X ( | 1) ( | 0)    且 0 0 p Y X p Y X ( | 1) ( | 0)    ，即如果干预总体的潜在结果Y0 和Y1的分布与对照总体的潜在结果的分布相同，那么可以说在干预组和对照组之间无因混在因素而产生的混杂偏差。本节将在 4.2 节所介绍的潜在结果模型的三个基本假设基础上，对潜在结果模型中现有的因果推理方法进行延展，根据其控制混杂因素的方式，我们重点介绍其中三种：匹配法、逆概率加权和分层方法。 4.3.1 匹配法在可忽略性假设中，协变量在干预组和对照组之间的差别往往对因果推断的准确性起着举足轻重的作用，为了消除协变量分布在两组研究对象之间的差异，匹配法（Matching Methods）常用于观察性研究中，其目的就是对每一个研究对象匹配一个具有相同或相近协变量取值的研究对象集合，使得通过匹配得到的数据在干预组和对照组之间有着相同的协变量分布，然后再根据匹配数据进行因果推断。鲁宾[23]等人在 1973 年提出用一个或多个协变量构建协变量集合，但在一些因果关系中，所涉及到的协变量较多，难以判定根据哪些协变量构造的集合做匹配才能得到最准确的结果。因此，文献[24]中提出了倾向值匹配（Propensity Score Matching），即将协变量的倾向值作为参考值来构造匹配集合，并逐渐成为了观察性研究中最常用的匹配方法。文献[24]中同时定义了倾向值为给定协变量时干预的条件概率：  ( ) ( 1| ) V p X V   ，并提出如果录用稿件，非最终出版稿

<<向上翻页向下翻页>>

点击下载：《工程科学学报》：因果推断三种分析框架及其应用理论体系综述