正在加载图片...
第3期 胡小康,等:基于相容模糊概念的规则提取方法 ·357· 已经得出不完备形式背景下(表3)的相似模糊概 3.0r×10 念,然后在此基础上根据算法3构建出相似模糊概 2.7 念格,通过设置相容参数(α=0.6,B=0.8)来获得所 2.4 2.1 需要的可靠的相容模糊概念(K): 1.8 1){0.6/(o1),(a,c,d,ef)}; 15 2){0.5/(o2),(a,b,c,ef}; 0.9 0.6 3){0.57/(o1,02,03),(c,ef}; 0.3 4){0.55/(o1,oa),(a,d,e)}; 50 100150 200 5){0.6/(o2,04),(a,d,e)}; 对象数量/个 6){0.667/(o1,02,04),(a,e)}: 图3对象与概念个数关系 7){0.083/(01,02,03,04),(c)}。 Fig.3 Relationship between object and concept 根据算法4可以得出阈值τ为0.9,置信度阈值 为0.5的关联规则: 1.0,*10 0.9 1){a,d,e}→{c,f升置信度为0.5。 0.8 解释:如果头疼、食欲不振、咳嗽则恶心、乏力。 ←0.7 蠡0.6 2){a,e}→{b}置信度为0.67。 0.5 0.4 解释:如果头疼、咳嗽则血压会高。 0.3 0.2 实验结果与分析 0.1 20406080100120140160180200 本文基于相容模糊概念的关联规则提取可分为 对象数量/个 在不完备模糊形式背景中相容模糊概念的构造过程 图4对象与关联规则个数关系 和根据相容模糊概念的偏序关系进行提取规则的过 Fig.4 Relationship between object and association rule 程。本文算法在Win7环境下用MATLAB来实现, 并在UCI数据库的water数据集(526个对象,38个 6 结束语 属性)进行实验。实验主要对2个指标进行测量: 目前在不完备模糊形式背景下的研究越来越 第1个是在不完备模糊形式背景下相似模糊概念数 多。本文结合在传统的不完备形式背景下获取概念 目与对象数目以及相容模糊概念与对象数目之间的 的方法,提出了在不完备模糊形式背景中提取出相 关系:第2个是提取的关联规则数目与对象数目之 容模糊概念,并根据相似模糊概念格提取出相容规 间的关系。在本实验中针对不完备模糊形式背景, 则的方法。实验表明,该方法可以有效的降低形式 背景中因数据缺失和数据的模糊性对获取知识准确 设定相容模糊参数为(α=0.8,B=0.9),关联规则的 性带来的的影响。未来的工作还需要改进和细化文 置信度阈值为0.8。在不完备形式背景下相似模糊 中的一些算法,例如如何在知识库分类能力保持不 概念与相容模糊概念的数量关系可由图3体现,图 变的情况下删除不相关的冗余属性:如何把模糊概 4则体现了对象数目与关联规则数量之间的关系。 念格与粗糙集理论有效结合以解决不确定规则提取 图3与图4都在相容模糊参数与属性数量都不变的 中的规则冗余性等问题。 情况下,取water数据集中的前200个对象进行测 量。图3与图4中横坐标都表示对象的数量,初始 参考文献: 为0,分别一次递增50与10进行测试。图3纵坐标 [1]WILLE R.Restructuring lattice theory:an approach based 表示由不完备形式背景形成概念的数量,图4纵坐 on hierarchies of concepts[M]//RIVAL I.Ordered sets. 标表示由相容模糊概念获得的关联规则的数量。通 Netherlands:Springer,1982:445-470. [2]POELMANS J,IGNATOV D I,KUZNETSOV S O,et al. 过图3、4的实验结果可以观察到,在不完备模糊形 Formal concept analysis in knowledge processing:a survey 式背景中随着对象数目的增多,通过本算法获得知 on applications [J].Expert systems with applications, 识准确性与传统的方法相比具有一定的优势。已经得出不完备形式背景下(表 3) 的相似模糊概 念,然后在此基础上根据算法 3 构建出相似模糊概 念格,通过设置相容参数(α = 0.6,β = 0.8)来获得所 需要的可靠的相容模糊概念 w 0.6 0.8(Kc): 1){0.6 / (o1 ),(a,c,d,e,f)}; 2){0.5 / (o2 ),(a,b,c,e,f)}; 3){0.57 / (o1 ,o2 ,o3 ),(c,e,f)}; 4){0.55 / (o1 ,o4 ),(a,d,e)}; 5){0.6 / (o2 ,o4 ),(a,d,e)}; 6){0.667 / (o1 ,o2 ,o4 ),(a,e)}; 7){0.083 / (o1 ,o2 ,o3 ,o4 ),(c)}。 根据算法 4 可以得出阈值 τ 为 0.9,置信度阈值 为 0.5 的关联规则: 1){a,d,e}⇒{c,f}置信度为 0.5。 解释:如果头疼、食欲不振、咳嗽则恶心、乏力。 2){a,e}⇒{b}置信度为 0.67。 解释:如果头疼、咳嗽则血压会高。 5 实验结果与分析 本文基于相容模糊概念的关联规则提取可分为 在不完备模糊形式背景中相容模糊概念的构造过程 和根据相容模糊概念的偏序关系进行提取规则的过 程。 本文算法在 Win7 环境下用 MATLAB 来实现, 并在 UCI 数据库的 water 数据集(526 个对象,38 个 属性)进行实验。 实验主要对 2 个指标进行测量: 第 1 个是在不完备模糊形式背景下相似模糊概念数 目与对象数目以及相容模糊概念与对象数目之间的 关系;第 2 个是提取的关联规则数目与对象数目之 间的关系。 在本实验中针对不完备模糊形式背景, 设定相容模糊参数为(α = 0.8,β = 0.9),关联规则的 置信度阈值为 0.8。 在不完备形式背景下相似模糊 概念与相容模糊概念的数量关系可由图 3 体现,图 4 则体现了对象数目与关联规则数量之间的关系。 图 3 与图 4 都在相容模糊参数与属性数量都不变的 情况下,取 water 数据集中的前 200 个对象进行测 量。 图 3 与图 4 中横坐标都表示对象的数量,初始 为 0,分别一次递增 50 与 10 进行测试。 图 3 纵坐标 表示由不完备形式背景形成概念的数量,图 4 纵坐 标表示由相容模糊概念获得的关联规则的数量。 通 过图 3、4 的实验结果可以观察到,在不完备模糊形 式背景中随着对象数目的增多,通过本算法获得知 识准确性与传统的方法相比具有一定的优势。 图 3 对象与概念个数关系 Fig.3 Relationship between object and concept 图 4 对象与关联规则个数关系 Fig.4 Relationship between object and association rule 6 结束语 目前在不完备模糊形式背景下的研究越来越 多。 本文结合在传统的不完备形式背景下获取概念 的方法,提出了在不完备模糊形式背景中提取出相 容模糊概念,并根据相似模糊概念格提取出相容规 则的方法。 实验表明,该方法可以有效的降低形式 背景中因数据缺失和数据的模糊性对获取知识准确 性带来的的影响。 未来的工作还需要改进和细化文 中的一些算法,例如如何在知识库分类能力保持不 变的情况下删除不相关的冗余属性;如何把模糊概 念格与粗糙集理论有效结合以解决不确定规则提取 中的规则冗余性等问题。 参考文献: [1]WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts [ M] / / RIVAL I. Ordered sets. Netherlands: Springer, 1982: 445⁃470. [2] POELMANS J, IGNATOV D I, KUZNETSOV S O, et al. Formal concept analysis in knowledge processing: a survey on applications [ J ]. Expert systems with applications, 第 3 期 胡小康,等:基于相容模糊概念的规则提取方法 ·357·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有