正在加载图片...
·154 智能系统学报 第7卷 导致候选的马尔可夫毯中引入了较多的错误节点, 的变量,是指G中每个节点X在给定它的父节点P 降低了后面的条件独立测试的有效性和可靠性. (X)下的条件概率分布P(XIP,(X)).贝叶斯网络 Tsamardinos等对GS进行了改进,提出了IAMB(in 的联合概率分布可表示如下: cremental association Markov blanket)算法[2】,每入选 p()=Πxep(XIP.(X)). 一个变量,就对该变量进行条件独立测试,减少了错 定义1碰撞节点.如果路径P中的节点W含 误变量的引入:但该算法的条件独立测试是在给定 有2条指向它的边,那么节点W在P中是碰撞节 整个马尔可夫毯下进行的,条件独立测试要求的数 点.在给定W时,它的2个父节点条件依赖. 据量较大3].Tsamardinos等提出的MMMB(max-min 定义2d分离.如果下列任意一条成立:1)路 Markov blanket)算法[4]首先利用MMPC(mar-min 径P上存在一个包含于集合Z的非碰撞节点;2)路 parents and children)算法I4]寻找目标节点的父节点 径P上的碰撞节点和它的子孙节点均不包含在Z 和子节点,然后找到它的配偶节点,但该方法会引入 中,那么称节点X到节点Y的一条路径P被节点集 错误的父子节点和配偶节点).与此相似的算法还 合Z阻塞.当且仅当从X到Y的每条路径均被Z阻 有Hiton-MB(Hiton-Markov blanket)算法[6].Tsamar- 塞,称节点X和Y被Z集合d分离.当有向无环图G dinos等在贝叶斯网络结构学习算法MMHC(max- 和联合概率分布满足忠实性条件时,d分离与条件 min Hill-climbing)[)中调用MMPC算法时,利用父 独立等价.本文中Ind(X;TIZ)表示变量T和X在 节点与子节点对称的性质,去除MMP℃算法引入的 给定变量集Z时条件独立;Dep(X;TIZ)表示变量T 错误父子节点.而PCMB(parents-children Markov 和X在给定Z时条件依赖。 blanket)算法[)利用完整的条件独立测试去除错误 定义3马尔可夫毯一个变量T的马尔可夫毯 节点,但存在时间复杂度较大的问题 MB(T)是在给定该集合时,变量集V中所有其他的节 针对上述算法存在引人错误节点和时间复杂度 点与T条件独立的最小集合.即对HX∈V\ 较大的问题,为了提高学习马尔可夫毯的精度和效 (MB(T)UT),nd(X;TIMBUT).有向无环图G中的 率,在马尔可夫毯学习算法中引入回归分析8].回 每个节点T,它的马尔可夫毯MB(T)包括T的父节点、 归分析可以在发现与目标变量相关性很强的变量的 子节点和配偶节点(与T共同有一个子节点), 同时,去掉与目标变量相关性弱或无关的变量.回归 图1中节点T的马尔可夫毯包括父节点{B, 分析广泛应用于机器学习中的特征选择,从变量集 E}、子节点{C,D}和配偶节点F. 合中选取最优的特征子集9].根据变量数据取值是 否连续,将回归分析分为线性回归分析和逻辑回归 分析o1(logistic regression analysis)2类.逻辑回归 分析可以有效处理贝叶斯网络中的离散数据.因此, 如何让学习到的马尔可夫毯更加精确,学习过程效 率更高,是马尔可夫毯学习算法的核心问题.提出一 种基于逻辑回归分析对MMMB算法改进的RA- MMMB(regression analysis-max min Markov blanket) 算法.该算法对MMMB算法过程中的候选马尔可夫 毯与目标变量进行逻辑回归分析,去掉相关性弱的 变量,然后进行条件独立测试,去掉候选马尔可夫毯 图1T的马尔可夫毯(阴影节点) 存在的兄弟节点,得到最终的马尔可夫毯.本文采用 Fig.1 The Markov blanket of node T(shadow nodes) 文献[11]中的G测试来判断2个变量在给定变量 集时是否条件独立,实验证明,该方法能有效地去掉 2 MMMB算法 MMMB算法包含的错误变量,并减少了条件独立测 2.1MMMB算法描述 试的次数 MMMB算法采用分治法发现目标变量T的马尔 1 贝叶斯网络及相关定义 可夫毯MB(T),首先调用MMPC算法找到T的父子 节点集PC(T),然后找到T的配偶节点.T的父子节 设V代表一组离散随机变量,用〈G,〉来表示 点集PC(T)和配偶节点组成了T的马尔可夫毯 贝叶斯网络,其中有向无环图G中的节点对应V中 MB(T).MMPC算法首先利用启发式搜索策略使与T
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有