正在加载图片...
·156 智能系统学报 第7卷 的配偶节点.例如图3中节点T的父子节点PC(T)为 变量和与因变量相关性弱的次要变量.以目标变量 {B,D},候选马尔可夫毯CMB={A,B,C,D}.由图3 T为因变量,MMMB算法中的候选马尔可夫毯CMB 易知Ind(A;TI{B}),路径A→C+D:T中的碰撞节 为自变量集合,进行回归分析,可以从CMB中去掉 点D包含在集合{DU{B}中,所以Dep(A;TI{DU 与目标变量相关性不强的变量. {B}),A被添加到马尔可夫毯中,但是实际上A并不 3.2.1候选马尔可夫毯的逻辑回归分析模型 在节点T的马尔可夫毯MB(T)中. 一般贝叶斯网络中的数据为离散值,所以对目 标变量和候选马尔可夫毯采用逻辑回归分析山.当 目标变量T为0-1型(取值为2个)因变量,CMB为 自变量集合时,二元逻辑回归模型为 hbp=A+BX+B++x 式中:P=P(T=1),X1,X2,…,X∈CMB,Bo,B,…, B,为未知参数,称为回归系数.采用极大似然估计 方法得到回归系数的估计值B。,B,…,B。,当因变量 取值为多个(大于2个)时,采用多元逻辑回归.当 目标变量T的取值有a、b、c3种,CMB为自变量集 合时,多元逻辑回归的模型为: 图3MMMB算法引入T的错误的配偶节点A Fig.3 Incorrect spouse node A included in MMMB n2T=b=月,+BnX+Bnx2+…+BX, P(T =a) MMPC算法添加的错误节点会包含在最终的 马尔可夫毯MB(T)中,而且这些节点会引入T的错 In p(T=c) P(T=a) =B2 +B2X+B22X2++BzXx. 误的配偶节点.即使MMPC算法返回的是正确的 回归分析通过假设检验判断回归系数是否为零 PC(T),MMMB本身也会引入错误的配偶节点.所 来决定是否去掉候选马尔可夫毯中的变量.假设 以,为了提高学习马尔可夫毯算法的精度和效率,需 Ho:B=0,i=1,2,…,k,逻辑回归中回归系数的检 要去掉这些错误的变量,而这些变量与目标变量的 验统计量采用Wald统计量,即 相关性不强, Wald;= 3RA-MMMB算法 式中:Sa,为回归系数的标准误差.Wald统计量服从 3.1根据相关性将节点分类 自由度为1的X2分布.原假设是正确的却拒绝了该 根据贝叶斯网络中各节点与目标节点T的相 假设,犯这类错误的概率记为卫.当概率值p小于给 关性关系,把MMMB算法中候选马尔可夫毯CMD= 定的显著性水平α(一般取α=0.05)时,则拒绝原 PC(T)Ucec(MMPC(C){T中的节点分为4类: 假设,认定该回归系数不为零;反之,认定该回归系 1)T的父节点和T的子节点:这类节点与T有 数为零,则将该变量从方程中去掉.概率p值越小, 很强的相关性; 表明对应的变量对目标变量T的影响就越显著。 2)T的父节点的父节点和T的子节点的子节 3.2.2候选马尔可夫毯的逻辑回归分析过程 点:由于贝叶斯网络已存在T的父节点和T的子节 采用逐步后向回归依次去掉候选马尔可夫毯 点,故这类节点与T的相关性较弱; CMB中与目标变量T相关性弱的变量.如果逻辑回 3)T的兄弟节点(与T共同有一个父节点)和T 归方程中自变量集合存在回归系数为零的概率值卫 的配偶节点:这类节点和T有共同的原因或结果, 大于显著性水平的变量,则将回归方程中卫值最大 当给定T的父节点或T的子节点时,与T的相关性 的变量从CMB中去掉,然后建立CMB中剩余的变 较强; 量与目标变量的逻辑回归方程,继续进行回归分析, 4)MP℃算法引入的错误节点的父子节点中上述 再将方程中概率值p最大的变量从CMB去掉,继续 3类以外的节点,这类节点与T的相关性最弱. 回归分析直至回归方程中不再含有P值大于显著性 3.2候选马尔可夫毯的逻辑回归分析 水平的变量. 回归分析2]可以从自变量集合中选入与因变 由于CMB中的第4)类节点与T的相关性最 量相关性强的自变量,并去掉那些与因变量无关的 弱,所以会在逐步后向回归中最先被去掉:因为回归
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有