正在加载图片...
个研究对象没有采取A操作,而是采取B操作,与现在得到的结果会有何不同?”三个层级对应的 是三种认识能力,即观察能力(Seeing)、行动能力(Doing)和想象能力maging),人类要想改变世界和 创构世界,就要迈上因果之梯的更高层级。 5.2.1三种基本路径结构和三种偏差 在结构因果模型的理论体系中,因果关系的推断依托于有向无环图的三种基本路径结构,即链 状结构、叉状结构和对撞结构,三种结构具有不同的信息流转方式,所有因果图都可以拆解为这三 类结构的组合,因此路径结构在结构因果模型的学习中占据着举足轻重的地位。 (1)链状结构(chain):顾名思义,链状结构就像一条链子一样,让信息从一端流转到另一 端。如果在链状结构中,变量X和Z之间只有一条单向路径且Y是截断这条路径的任何一组变量, 那么在y的条件下,X和Z是独立的。以上规则成立的条件是,X,Y,Z各自的误差项(外生变量) U,U,U相互独立,如果U,是U.的原因,那么以Y为条件不一定能够保证X和Z相互独立,因为 Z的变化仍然可能通过误差项与X关联。 (2)叉状结构(foks):具有三个节点,且信息可以从中间节点分发到两端节点的结构就是 叉状结构:叉状结构的中间变量是其他两个变量及其后代的共同原因。在及状结构中,如果变量X 和Z都是变量y的后代节点,并且X和Z之间只有一条路径,那么当给定变量Y时,X和Z条件 独立。 (3)对撞结构(collider):如果一个节点可以同时接收来自岛外两个父节点的信息,那么就 称这个结构为对撞结构,称两个父节点共同的子节点为对撞节点。如栗变量y是变量X和Z之间的 对撞节点,且X和Z只有一条路径,对撞节点Y的取值依赖士父节点X和Z,当以对撞节点Y为 条件时,Y取值固定,X的任何变化必须通过Z相应的变化来进行补偿:也就是说正常情况下X 和Z是无条件独立的,但在给定y或y的后代节点时是相互依赖的。 在结构因果模型中不管多么复杂的结构都可以拆分为以上三种结构的组合,三种结构也可能导 致不同的偏差。例如一个人的受教育程度可以直接影响他的收入,而一个人的受教育程度和收入高 低又同时受到智商和竞争意识两个变量的影响入即该因果模型中存在着三条路径:教育→收入、教 育←一智商→收入、教育←竞争意识→收入。如果要估计受教育程度对个人收入的影响,就要考虑智商 对受教育程度和个人收入共同的影响,智商就是这个因果关系中的混淆变量,如在研究中不能剔除 混淆变量的影响,教育和收入之间就会包含“教育一智商一收入”这条混淆路径产生的相关性,因 此产生混淆偏差。如果要估计竞争意识对收入的影响,除了直接影响还需要估计“竞争意识→教育 →收入”的间接影响,如果控制受教育程度这个变量,就截断了其中一条因果路径,也就是截断了 竞争意识的间接影响,这种制方式会在一定程度上低估中间变量的作用,造成过度控制偏差。在 智商和受教育程度之间,会生一条新的衍生路径:智商→收入一教育:这个对撞结构则会使原本 只存在直接因果关系的智商和受教育程度两个变量之间的相关性发生改变,造成内生选择性偏差。 总而言之,结构因果模型中的三种基本结构可能会造成不同的偏差,链状结构会导致过度控制偏差, 叉状结构会导致混淆偏差,对撞结构会导致内生选择性偏差:在复杂因果模型的拆解分析中需要考 虑全部因果路径, 才能推断出准确的因果关系。 5.2.1关联 图模型不仅能提供对因果关系的直观表述,还能有效表达联合分布。利用结构因果模型可以有 效表示n个变量的联合分布:通过确定表述变量之间关系的个函数,以及误差项的概率分析,就 可以得到联合分布概率以及各个边缘概率之间的关联。但是当我们无法得知变量之间具体的函数关 系,或无法获取误差项的分布时,就可以应用下述计算法则解决以上问题。 (1)乘积分解法则:对于任何有向无环图,模型中变量的联合分布可以通过计算条件概率分 布P(子节点父节点的乘积得出,其形式化表达为:P,西,)=几Pm),pa表示子节点,的 所有父节点。例如,如果在一个由三个变量构成的简单链状结构X→Y→Z中,选择用表达式个研究对象没有采取 A 操作,而是采取 B 操作,与现在得到的结果会有何不同?”三个层级对应的 是三种认识能力,即观察能力(Seeing)、行动能力(Doing)和想象能力(Imaging),人类要想改变世界和 创构世界,就要迈上因果之梯的更高层级。 5.2.1 三种基本路径结构和三种偏差 在结构因果模型的理论体系中,因果关系的推断依托于有向无环图的三种基本路径结构,即链 状结构、叉状结构和对撞结构,三种结构具有不同的信息流转方式,所有因果图都可以拆解为这三 类结构的组合,因此路径结构在结构因果模型的学习中占据着举足轻重的地位。 (1)链状结构(chain):顾名思义,链状结构就像一条链子一样,让信息从一端流转到另一 端。如果在链状结构中,变量 X 和 Z 之间只有一条单向路径且Y 是截断这条路径的任何一组变量, 那么在Y 的条件下, X 和 Z 是独立的。以上规则成立的条件是, X Y Z , , 各自的误差项(外生变量) , , U U U x y z 相互独立,如果Ux 是Uz 的原因,那么以Y 为条件不一定能够保证 X 和 Z 相互独立,因为 Z 的变化仍然可能通过误差项与 X 关联。 (2)叉状结构(forks):具有三个节点,且信息可以从中间节点分发到两端节点的结构就是 叉状结构;叉状结构的中间变量是其他两个变量及其后代的共同原因。在叉状结构中,如果变量 X 和 Z 都是变量Y 的后代节点,并且 X 和 Z 之间只有一条路径,那么当给定变量 Y 时, X 和 Z 条件 独立。 (3)对撞结构(collider):如果一个节点可以同时接收来自另外两个父节点的信息,那么就 称这个结构为对撞结构,称两个父节点共同的子节点为对撞节点。如果变量Y 是变量 X 和 Z 之间的 对撞节点,且 X 和 Z 只有一条路径,对撞节点Y 的取值依赖于父节点 X 和 Z ,当以对撞节点Y 为 条件时,Y 取值固定, X 的任何变化必须通过 Z 相应的变化来进行补偿;也就是说正常情况下 X 和 Z 是无条件独立的,但在给定Y 或Y 的后代节点时是相互依赖的。 在结构因果模型中不管多么复杂的结构都可以拆分为以上三种结构的组合,三种结构也可能导 致不同的偏差。例如一个人的受教育程度可以直接影响他的收入,而一个人的受教育程度和收入高 低又同时受到智商和竞争意识两个变量的影响,即该因果模型中存在着三条路径:教育→收入、教 育←智商→收入、教育←竞争意识→收入。如果要估计受教育程度对个人收入的影响,就要考虑智商 对受教育程度和个人收入共同的影响,智商就是这个因果关系中的混淆变量,如在研究中不能剔除 混淆变量的影响,教育和收入之间就会包含“教育←智商→收入”这条混淆路径产生的相关性,因 此产生混淆偏差。如果要估计竞争意识对收入的影响,除了直接影响还需要估计“竞争意识→教育 →收入”的间接影响,如果控制受教育程度这个变量,就截断了其中一条因果路径,也就是截断了 竞争意识的间接影响,这种控制方式会在一定程度上低估中间变量的作用,造成过度控制偏差。在 智商和受教育程度之间,会产生一条新的衍生路径:智商→收入←教育;这个对撞结构则会使原本 只存在直接因果关系的智商和受教育程度两个变量之间的相关性发生改变,造成内生选择性偏差。 总而言之,结构因果模型中的三种基本结构可能会造成不同的偏差,链状结构会导致过度控制偏差 , 叉状结构会导致混淆偏差,对撞结构会导致内生选择性偏差;在复杂因果模型的拆解分析中需要考 虑全部因果路径,才能推断出准确的因果关系。 5.2.1 关联 图模型不仅能提供对因果关系的直观表述,还能有效表达联合分布。利用结构因果模型可以有 效表示 n 个变量的联合分布:通过确定表述变量之间关系的 n 个函数,以及误差项的概率分析,就 可以得到联合分布概率以及各个边缘概率之间的关联。但是当我们无法得知变量之间具体的函数关 系,或无法获取误差项的分布时,就可以应用下述计算法则解决以上问题。 (1)乘积分解法则:对于任何有向无环图,模型中变量的联合分布可以通过计算条件概率分 布 P( | ) 子节点 父节点 的乘积得出,其形式化表达为: 1 2 ( , ,..., ) ( | ) n i i i P x x x P x pa  , pai 表示子节点 i 的 所有父节点。例如,如果在一个由三个变量构成的简单链状结构 X Y Z   中,选择用表达式 录用稿件,非最终出版稿
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有