正在加载图片...
第3期 胡小康,等:基于相容模糊概念的规则提取方法 ·353· 实生活中由于人的认知能力以及机器的局限性,人 G(B)={g∈GI glm,Hm∈B},BCM(2) 们经常不能准确地判断对象和属性之间的关系,使 形式背景能用一个二维表表示,如表1,其中对 得获取的形式背景经常存在数据缺失,从而得到形 象集G={x1,x2,x3,x4},属性集M={a,b,c,d。表 式背景是不完备的模糊形式背景,这对于知识获取 中1表示某对象拥有某属性,0表示某对象不拥有 产生了很大障碍。因此不完备模糊形式背景的研究 某属性,例如x,有a属性,没有b属性。 获得了广泛的关注。 表1形式背景 粗糙集理论中的信息系统就是形式概念分析中 Table 1 A formal context 的形式背景,对于不完备信息系统[】,粗糙集已通 G a b C 过相容关系、非对称相似关系等进行了一些研究。 X 1 0 在形式概念分析中LuJ等在文献[9]中将多值形 X2 0 式背景转变为单值形式背景后,通过把不完备属性 1 0 在不同对象上的不同取值进行扩展,从而得到了完 X3 1 0 0 备的形式背景来进行概念的提取。Dubois D等在文 Xa 0 0 1 0 献[10]提出了利用概率论来解决不完备形式背景 定义2山形式背景K=(G,M,)中一对二元 的方法。Krupka M等在文献[I1]中定义了不完备 组(A,B)称为形式概念,当且仅当F(A)=B与G 的模糊形式背景,然后提出了在不完备模糊形式背 (B)=A同时成立(ACG,BCM),其中A叫做形式 景下构建概念格的方法。Djouadi Y等在文献[12] 概念的外延,B叫做形式概念的内涵。 中将不完备模糊形式背景中的隶属度值均采用区间 假定(41,B)与(A2,B2)是形式背景(G,M,I) 值来表示,将不完备模糊形式背景转化为区间值模 下的两个概念,这两个概念间可以建立起偏序关系 糊形式背景(interval-valued fuzzy formal concept, (A1,B)≤(A2,B2)台A1CA2(曰B2CB1)。领先次 VFF),在此基础上提出了基于区间值形式背景的 概念格构建方法。iJH等在文献[13]中提出了在 序意味着(41,B,)是(42,B,)的子概念。根据概念 间的偏序关系生成格的Hasse图见图1。下面是在 不完备形式背景下构建相似概念格的方法,此外基 形式背景K下生成的概念: 于相似概念格还研究了在不完备的决策形式背景下 1){☑,(a,b,c,d)}; 获取规则的方法。上述研究中,无论是将不完备形 2){(x),(a,d)}: 式背景转化为区间值形式背景,还是对不完备属性 3){(x3),(a,c)}; 进行扩展来构造概念格的方法,仅仅适用于形式背 4){(x2),(b,c)}; 景中数据量缺失较少的情况。当形式背景中数据缺 失量较大时,所构造的概念格中包含有大量不确定 5){(x1,x3),(a)}: 6){(x2,x3,x4),(c)}: 的信息,这对知识获取造成了很大影响。 7)1(x1,x2,x3,x),☑1。 本文为了减少形式背景中数据缺失量对知识获 取的影响,提出并定义了相似模糊概念和相容模糊 7 概念并给出了相容模糊概念的构建方法,建立了相 容模糊概念之间的偏序关系,进而设计面向模糊不 完备信息的关联规则挖掘算法。 1基本概念 1.1形式概念分析 定义1山一个形式背景K=(G,M,I)是一个 三元组,其中G是对象集合,M是属性集合,I是G 与M之间的一个二元关系gm或(g,m)∈I,表示 图1表1对应概念格的Hasse图 对象g具有属性m。在形式背景中定义式(1)和式 Fig.1 Hasse diagram of table 1 (2): F(A)={m∈MI glm,Hg∈A},ACG(1)实生活中由于人的认知能力以及机器的局限性,人 们经常不能准确地判断对象和属性之间的关系,使 得获取的形式背景经常存在数据缺失,从而得到形 式背景是不完备的模糊形式背景,这对于知识获取 产生了很大障碍。 因此不完备模糊形式背景的研究 获得了广泛的关注。 粗糙集理论中的信息系统就是形式概念分析中 的形式背景,对于不完备信息系统[8] ,粗糙集已通 过相容关系、非对称相似关系等进行了一些研究。 在形式概念分析中 Liu J 等在文献[9]中将多值形 式背景转变为单值形式背景后,通过把不完备属性 在不同对象上的不同取值进行扩展,从而得到了完 备的形式背景来进行概念的提取。 Dubois D 等在文 献[10]提出了利用概率论来解决不完备形式背景 的方法。 Krupka M 等在文献[11]中定义了不完备 的模糊形式背景,然后提出了在不完备模糊形式背 景下构建概念格的方法。 Djouadi Y 等在文献[12] 中将不完备模糊形式背景中的隶属度值均采用区间 值来表示,将不完备模糊形式背景转化为区间值模 糊形 式 背 景 ( interval⁃valued fuzzy formal concept, IVFF),在此基础上提出了基于区间值形式背景的 概念格构建方法。 Li J H 等在文献[13]中提出了在 不完备形式背景下构建相似概念格的方法,此外基 于相似概念格还研究了在不完备的决策形式背景下 获取规则的方法。 上述研究中,无论是将不完备形 式背景转化为区间值形式背景,还是对不完备属性 进行扩展来构造概念格的方法,仅仅适用于形式背 景中数据量缺失较少的情况。 当形式背景中数据缺 失量较大时,所构造的概念格中包含有大量不确定 的信息,这对知识获取造成了很大影响。 本文为了减少形式背景中数据缺失量对知识获 取的影响,提出并定义了相似模糊概念和相容模糊 概念并给出了相容模糊概念的构建方法,建立了相 容模糊概念之间的偏序关系,进而设计面向模糊不 完备信息的关联规则挖掘算法。 1 基本概念 1.1 形式概念分析 定义 1 [1] 一个形式背景 K = (G,M,I)是一个 三元组 ,其中 G 是对象集合,M 是属性集合, I 是 G 与 M 之间的一个二元关系 gIm 或( g,m) ∈I,表示 对象 g 具有属性 m。 在形式背景中定义式(1)和式 (2): F(A) = {m ∈ M | gIm,∀g ∈ A},A ⊆ G (1) G(B) = {g ∈ G | gIm,∀m ∈ B},B ⊆ M (2) 形式背景能用一个二维表表示,如表 1,其中对 象集 G = x1 ,x2 ,x3 ,x4 { } ,属性集 M = {a,b,c,d} 。 表 中 1 表示某对象拥有某属性,0 表示某对象不拥有 某属性,例如 x1 有 a 属性,没有 b 属性。 表 1 形式背景 Table 1 A formal context G a b c d X1 1 0 0 1 X2 0 1 1 0 X3 1 0 1 0 X4 0 0 1 0 定义 2 [1] 形式背景 K = (G,M,I) 中一对二元 组( A,B) 称为形式概念,当且仅当 F (A) = B 与 G (B) = A 同时成立(A⊆G,B⊆M),其中 A 叫做形式 概念的外延,B 叫做形式概念的内涵。 假定 A1 ,B1 ( ) 与 A2 ,B2 ( ) 是形式背景(G,M,I) 下的两个概念,这两个概念间可以建立起偏序关系 A1 ,B1 ( ) ≤ A2 ,B2 ( ) ⇔A1⊆A2(⇔B2⊆B1 ) 。 领先次 序意味着 A1 ,B1 ( ) 是 A2 ,B2 ( ) 的子概念。 根据概念 间的偏序关系生成格的 Hasse 图见图 1。 下面是在 形式背景 K 下生成的概念: 1){∅,(a,b,c,d)}; 2){(x1 ),(a,d)}; 3){(x3 ),(a,c)}; 4){(x2 ),(b,c)}; 5){(x1 ,x3 ),(a)}; 6){(x2 ,x3 ,x4 ),(c)}; 7){(x1 ,x2 ,x3 ,x4 ),∅}。 图 1 表 1 对应概念格的 Hasse 图 Fig.1 Hasse diagram of table 1 第 3 期 胡小康,等:基于相容模糊概念的规则提取方法 ·353·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有