第11卷第3期 智能系统学报 Vol.11 No.3 2016年6月 CAAI Transactions on Intelligent Systems Jun.2016 D0I:10.11992/is.201603055 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20160513.0920.018.html 一种基于概念格的集值信息系统中的知识获取方法 康向平12,苗夺谦12 (1.同济大学计算机科学与技术系,上海201804:2.同济大学嵌入式系统与服务计算教育部重点实验室,上海 201804) 摘要:以集值信息系统为研究背景,以概念格为理论基础,提出了一种基于概念格的集值信息系统中的知识获取 方法。该模型首先将复杂的集值信息系统转化为形式上更加简单的单值背景,然后借助概念格理论,重点探讨了基 于相容关系的粒化模型和集值系统中的格代数结构,该代数结构可以将论域中的所有覆盖以格的形式有机结织起 来。此外,探讨了集值信息系统中的约简、核等问题。本文有助于拓展概念格的应用范围,同时也为集值信息系统 的分析和处理提供了一种有益思路。 关键词:粗糙集:概念格:集值信息系统:相容关系:代数结构 中图分类号:TP18文献标志码:A文章编号:1673-4785(2016)03-0287-07 中文引用格式:康向平,苗夺谦.一种基于概念格的集值信息系统中的知识获取方法[J】.智能系统学报,2016,11(3):287-293. 英文引用格式:KANG Xiangping,MIAO Duoqian..A knowledge acquisition method based on concept lattice in set-valued informa- tion systems [J].CAAI transactions on intelligent systems,2016,11(3):287-293. A knowledge acquisition method based on concept lattice in set-valued information systems KANG Xiangping'2,MIAO Duoqian'2 (1.Department of Computer Science and Technology,Tongji University,Shanghai 201804,China;2.Key Laboratory of Embedded System and Service Computing.Ministry of Education,Tongji University,Shanghai 201804,China) Abstract:The paper takes set-valued information systems as research background,proposes a knowledge acquisition method on the basis of concept lattice.The model can transforms a complicated set-valued information system into a simpler one-valued context,and then by means of concept lattice,emphasizes the granularity model based on toler- ance relation and the algebra structure in the set-valued information system,where the algebraic structure can or- ganize all covers in the form of lattice structure,and it can be considered an important algebraic structure in the set- valued information system.Meanwhile,the paper also offers some simple solutions to common problems,such as re- duction,core.In short,this paper not only helps to explore the application range of concept lattice,but also offers a useful idea for the analysis and processing of set-valued information systems. Keywords:rough set;concept lattice;set-valued information systems;tolerance relations;algebraic structure 针对模糊、不确定等问题,波兰学者Pawlak基 效获取知识,相对来讲会更加客观和易用。近年来, 于粒化和近似思想于1982年提出了粗糙集),该理 粗糙集正快速从单一理论向多理论融合方向发展、 论于20世纪90年代逐步走向成熟并随后引起了国 从简单应用向复杂数据建模方向延伸,其相关研究 内外学者的广泛关注)。与其他类似理论相比较, 成果已被广泛应用于数据挖掘、机器学习等领 其不需要借助复杂的先验知识便可以在数据集中有 域[3]。 概念格是与粗糙集同时代产生的一种数据分析 收稿日期:2016-03-28.网络出版日期:2016-05-13. 基金项目:国家自然科学基金项目(61273304,61202170):国家博士后 工具),其最早是由德国学者Wille基于人脑的概 科学基金项目(2014M560352);高等学校博士学科点专项科 念思维提出来的。在概念格构筑的理论体系中,概 研基金项目(20130072130004). 通信作者:康向平.E-mail:tongji_kangxp@sina.com 念、格代数结构,伽罗瓦(Galois)连接等是核心要
第 11 卷第 3 期 智 能 系 统 学 报 Vol.11 №.3 2016 年 6 月 CAAI Transactions on Intelligent Systems Jun. 2016 DOI:10.11992 / tis.201603055 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20160513.0920.018.html 一种基于概念格的集值信息系统中的知识获取方法 康向平1,2 , 苗夺谦1,2 (1.同济大学 计算机科学与技术系,上海 201804; 2. 同济大学 嵌入式系统与服务计算教育部重点实验室,上海 201804) 摘 要:以集值信息系统为研究背景,以概念格为理论基础,提出了一种基于概念格的集值信息系统中的知识获取 方法。 该模型首先将复杂的集值信息系统转化为形式上更加简单的单值背景,然后借助概念格理论,重点探讨了基 于相容关系的粒化模型和集值系统中的格代数结构,该代数结构可以将论域中的所有覆盖以格的形式有机结织起 来。 此外,探讨了集值信息系统中的约简、核等问题。 本文有助于拓展概念格的应用范围,同时也为集值信息系统 的分析和处理提供了一种有益思路。 关键词:粗糙集;概念格;集值信息系统;相容关系;代数结构 中图分类号:TP18 文献标志码:A 文章编号:1673⁃4785(2016)03⁃0287⁃07 中文引用格式:康向平, 苗夺谦.一种基于概念格的集值信息系统中的知识获取方法[J]. 智能系统学报, 2016, 11(3): 287⁃293. 英文引用格式:KANG Xiangping, MIAO Duoqian. A knowledge acquisition method based on concept lattice in set⁃valued informa⁃ tion systems [J]. CAAI transactions on intelligent systems, 2016,11(3): 287⁃293. A knowledge acquisition method based on concept lattice in set⁃valued information systems KANG Xiangping 1,2 , MIAO Duoqian 1,2 (1. Department of Computer Science and Technology, Tongji University, Shanghai 201804, China; 2. Key Laboratory of Embedded System and Service Computing, Ministry of Education, Tongji University, Shanghai 201804, China) Abstract:The paper takes set⁃valued information systems as research background, proposes a knowledge acquisition method on the basis of concept lattice. The model can transforms a complicated set⁃valued information system into a simpler one⁃valued context, and then by means of concept lattice, emphasizes the granularity model based on toler⁃ ance relation and the algebra structure in the set⁃valued information system, where the algebraic structure can or⁃ ganize all covers in the form of lattice structure, and it can be considered an important algebraic structure in the set⁃ valued information system. Meanwhile, the paper also offers some simple solutions to common problems, such as re⁃ duction, core. In short, this paper not only helps to explore the application range of concept lattice, but also offers a useful idea for the analysis and processing of set⁃valued information systems. Keywords:rough set; concept lattice; set⁃valued information systems; tolerance relations; algebraic structure 收稿日期:2016⁃03⁃28. 网络出版日期:2016⁃05⁃13. 基金项目:国家自然科学基金项目( 61273304, 61202170);国家博士后 科学基金项目(2014M560352);高等学校博士学科点专项科 研基金项目(20130072130004). 通信作者:康向平. E⁃mail:tongji_kangxp@ sina.com. 针对模糊、不确定等问题,波兰学者 Pawlak 基 于粒化和近似思想于 1982 年提出了粗糙集[1] ,该理 论于 20 世纪 90 年代逐步走向成熟并随后引起了国 内外学者的广泛关注[2] 。 与其他类似理论相比较, 其不需要借助复杂的先验知识便可以在数据集中有 效获取知识,相对来讲会更加客观和易用。 近年来, 粗糙集正快速从单一理论向多理论融合方向发展、 从简单应用向复杂数据建模方向延伸,其相关研究 成果已 被 广 泛 应 用 于 数 据 挖 掘、 机 器 学 习 等 领 域[3⁃5] 。 概念格是与粗糙集同时代产生的一种数据分析 工具[6] ,其最早是由德国学者 Wille 基于人脑的概 念思维提出来的。 在概念格构筑的理论体系中,概 念、格代数结构,伽罗瓦(Galois) 连接等是核心要
·288· 智能系统学报 第11卷 素。其中,概念可以分别从内涵和外延两个不同角 差信息,存在一定的局限性。针对上述情况,许多学 度进行刻画,具有丰富的语义,有助于深化人们对现 者尝试发展直接面向集值信息系统的知识获取方 实生活中概念的概要认识和准确理解:代数格结构 法[3],诸如基于相容关系、优势关系等的粗糙集 作为一种基于序关系建立起来的概念层次模型,客 模型。直接处理方法不经过数据预处理,能直接对 观上反映了概念之间的泛化/特化关系:伽罗瓦连接 原始数据进行处理,可以有效避免由于数据预处理 则为生成概念和代数结构的核心理论基础。近年 不当所导致的偏差逐层传导扩大。 来,关于概念格的基础理论研究和应用拓展已经取 针对上述不确定性问题,同时考虑到概念格在 得了一系列重要成果[.1o] 二元关系分析中的良好数学基础,本文引入了概念 虽然上述理论方法上存在一定差异,但集合论 格,并重点探讨了基于相容关系的粒化模型和集值 和二元关系都是它们的建模基础,同时它们均面向 系统中的格代数结构,该代数结构可以将论域中的 相类似的数据集,这就意味着它们之间可能存在着 所有覆盖以格的形式有机结织起来。此外,本文还 某种紧密的关联。在充分挖掘它们各自理论优势的 重点探讨了集值信息系统中的约简、核等问题。总 基础上,探讨二者之间的融合理论必将有助于粗糙 的来讲,本文结论一方面有助于拓展概念格的应用 集和概念格的进一步拓展。近年来,许多学者探讨 范围,另一方面也为集值信息系统的分析和处理提 了它们之间的融合理论。一些学者把概念格中 供了一种有益思路。 的概念思维、格代数结构、伽罗瓦连接等要素引入到 1概念格 粗糙集中,探讨了信息系统中的格代数结构、约简、 规则获取等2):一些学者把形式背景视为一类特 定义1一个形式背景通常由一个三元组 殊的信息系统,然后借助粗糙集中的近似算子和区 (G,M,I)来表示,其中G和M分别是非空有限的对 分矩阵,提出了概念格中的粗糙概念分析、属性约 象集和属性集,I二GxM。一个典型的形式背景如表 简,以及上近似格和下近似格等[46;一些学者从 1所示,其中websitel,website2,…,website6分别 不同角度对比了两种理论,揭示了它们之间的紧密 表示一些网站的编号;Finance,Culture,…,Shop 联系[20],这样做不仅有助于人们从不同角度深化 ping则表示上述网站可能涉及的一些主题:若某个 对单一理论的认识和理解,同时也有助于两种理论 网站含有某种主题,用“×”进行标记。 之间的深度融合。 表1一个典型的形式背景 在关于经典信息系统的描述中,对象在属性下 Table 1 A typical formal context 的取值是唯一的。然而,在一些复杂的信息系统,对 Finance Culture Military History Shopping 象在属性下的取值有时可能不是一个值,而是由若 website 1 + 干个元素组成的一个非空集合,即取值不是一个值 website 2 + 而是一个集合。当取值是一个集合时,若其代表一 website 3 个取值范围,那么此时取值就存在一定的不确定性。 website 4 × 例如,在地震预测中,不同专家可能得出不一样的预 测结果,也许这些预测结果都是合理的,但却只有一 website 5 种预测是正确的。据此,人们将经典信息系统进一 website 6 步泛化为集值信息系统。本质上,信息的不完备性 定义2定义1在形式背景(G,M,)中,对于 也可以理解为上述不确定性的一种特殊情况2122]。 任意X∈P(G),定义 例如,在不完备信息系统中,针对取值缺失的情况, X°={m∈Ml(x,m)∈I,Hx∈X} 人们通常会用一个集合替代某个缺失值,即依据先 相应地,对于任意B∈P(M),定义 验知识或算法将缺失值限定在某个范围,并将该范 B·={x∈Gl(x,m)∈I,Hm∈B} 围视为缺失值。在此意义下,不完备信息系统本质 其中P(G)和P(M)分别是G和M的幂集。如 上是一种特殊的集值信息系统。针对上述不确定 果X·=B且B·=X,则称(X,B)是一个形式概念,其 性,以往人们更多采用的是一些间接的知识获取方 中X和B分别是外延和内涵。若将任意概念 法,即数据建模是建立在对数据预处理的基础之上。 (X1,B)和(X2,B2)之间的序关系“≤”定义为 此类方法虽然简单易用,但数据预处理可能会丢失 (X1,B)≤(X2,B2)台X1SX2台B12B2 大量的有用信息或由于人为因素增加一些额外的偏 在此意义下,偏序集(B(G,M,I),≤)本质上是
素。 其中,概念可以分别从内涵和外延两个不同角 度进行刻画,具有丰富的语义,有助于深化人们对现 实生活中概念的概要认识和准确理解;代数格结构 作为一种基于序关系建立起来的概念层次模型,客 观上反映了概念之间的泛化/ 特化关系;伽罗瓦连接 则为生成概念和代数结构的核心理论基础。 近年 来,关于概念格的基础理论研究和应用拓展已经取 得了一系列重要成果[7⁃10] 。 虽然上述理论方法上存在一定差异,但集合论 和二元关系都是它们的建模基础,同时它们均面向 相类似的数据集,这就意味着它们之间可能存在着 某种紧密的关联。 在充分挖掘它们各自理论优势的 基础上,探讨二者之间的融合理论必将有助于粗糙 集和概念格的进一步拓展。 近年来,许多学者探讨 了它们之间的融合理论[11] 。 一些学者把概念格中 的概念思维、格代数结构、伽罗瓦连接等要素引入到 粗糙集中,探讨了信息系统中的格代数结构、约简、 规则获取等[12⁃13] ;一些学者把形式背景视为一类特 殊的信息系统,然后借助粗糙集中的近似算子和区 分矩阵,提出了概念格中的粗糙概念分析、属性约 简,以及上近似格和下近似格等[14⁃16] ;一些学者从 不同角度对比了两种理论,揭示了它们之间的紧密 联系[17⁃20] ,这样做不仅有助于人们从不同角度深化 对单一理论的认识和理解,同时也有助于两种理论 之间的深度融合。 在关于经典信息系统的描述中,对象在属性下 的取值是唯一的。 然而,在一些复杂的信息系统,对 象在属性下的取值有时可能不是一个值,而是由若 干个元素组成的一个非空集合,即取值不是一个值 而是一个集合。 当取值是一个集合时,若其代表一 个取值范围,那么此时取值就存在一定的不确定性。 例如,在地震预测中,不同专家可能得出不一样的预 测结果,也许这些预测结果都是合理的,但却只有一 种预测是正确的。 据此,人们将经典信息系统进一 步泛化为集值信息系统。 本质上,信息的不完备性 也可以理解为上述不确定性的一种特殊情况[21⁃22] 。 例如,在不完备信息系统中,针对取值缺失的情况, 人们通常会用一个集合替代某个缺失值,即依据先 验知识或算法将缺失值限定在某个范围,并将该范 围视为缺失值。 在此意义下,不完备信息系统本质 上是一种特殊的集值信息系统。 针对上述不确定 性,以往人们更多采用的是一些间接的知识获取方 法,即数据建模是建立在对数据预处理的基础之上。 此类方法虽然简单易用,但数据预处理可能会丢失 大量的有用信息或由于人为因素增加一些额外的偏 差信息,存在一定的局限性。 针对上述情况,许多学 者尝试发展直接面向集值信息系统的知识获取方 法[23⁃28] ,诸如基于相容关系、优势关系等的粗糙集 模型。 直接处理方法不经过数据预处理,能直接对 原始数据进行处理,可以有效避免由于数据预处理 不当所导致的偏差逐层传导扩大。 针对上述不确定性问题,同时考虑到概念格在 二元关系分析中的良好数学基础,本文引入了概念 格,并重点探讨了基于相容关系的粒化模型和集值 系统中的格代数结构,该代数结构可以将论域中的 所有覆盖以格的形式有机结织起来。 此外,本文还 重点探讨了集值信息系统中的约简、核等问题。 总 的来讲,本文结论一方面有助于拓展概念格的应用 范围,另一方面也为集值信息系统的分析和处理提 供了一种有益思路。 1 概念格 定义 1 一个形式背景通常由一个三元组 (G,M,I) 来表示,其中 G 和 M 分别是非空有限的对 象集和属性集,I⊆G×M。 一个典型的形式背景如表 1 所示,其中 website1, website2, …, website6 分别 表示一些网站的编号;Finance, Culture, …, Shop⁃ ping 则表示上述网站可能涉及的一些主题;若某个 网站含有某种主题,用“×”进行标记。 表 1 一个典型的形式背景 Table 1 A typical formal context Finance Culture Military History Shopping website 1 × × × website 2 × × × × website 3 × × × × website 4 × × × × website 5 × × × × website 6 × × × 定义 2 定义 1 在形式背景(G,M,I) 中,对于 任意 X∈P(G) ,定义 X ∗ = {m ∈ M | (x,m) ∈ I,∀x ∈ X} 相应地,对于任意 B∈P(M) ,定义 B ∗ = {x ∈ G | (x,m) ∈ I,∀m ∈ B} 其中 P(G) 和 P(M) 分别是 G 和 M 的幂集。 如 果 X ∗ =B 且 B ∗ =X,则称(X,B) 是一个形式概念,其 中 X 和 B 分 别 是 外 延 和 内 涵。 若 将 任 意 概 念 X1 ,B1 ( ) 和 X2 ,B2 ( ) 之间的序关系“≤”定义为 X1 ,B1 ( ) ≤ X2 ,B2 ( ) ⇔X1 ⊆ X2⇔B1 ⊇ B2 在此意义下,偏序集(B(G,M,I) ,≤) 本质上是 ·288· 智 能 系 统 学 报 第 11 卷
第3期 康向平,等:一种基于概念格的集值信息系统中的知识获取方法 .289. 一个完备格,其中B(G,M,)是所有概念组的集合。 单值背景中的经典算子往往并不适用于多值的 引理1在形式背景(G,M,)中,对于任意BC 信息系统。即若采用定义1中的算子,必须将信息 M,有 系统转化为单值形式背景。由此,针对集值信息系 B··=n{L∈Int(G,M,I)IBCL} 统,本文采用了如下转化策略。 式中Int(G,M,)表示所有概念内涵组成的集合。 定义3设(U,AT,V,F)是一个集值信息系统, 定义3在表1所示的背景中,若a1=Finance、 称(UxU,AT,)是(U,AT,V,F)的衍生形式背景,其 a2=Culture、a3=Military、a4=History、as=Shopping, 中J被描述为:对于任意(x,y)∈U,m∈AT,有 且将websitel,website2.,…,website(6简记为l,2, (x,y),m)eJs+f(x,m)∩fy,m)≠☑ …,6,则表1中的概念格如图1所示,图1可以直 由于衍生背景不再保留原信息系统中属性值自 观反映信息在不同层次上的聚类。例如,概念 身的信息,仅体现相同属性下不同对象之间的关系, (456,a3auas)揭示website4、website5和website6等 因而在形式上较原信息系统更加简单明了。一个由 网站均含有主题Military、History和Shopping。 表2所示集值信息系统衍生的形式背景如表3。 (123456.a,) 表3一个衍生形式背景 Table 3 A derivative formal context (12345.a,a) (23456.,a,a,) 6 (u1,u1) 123,,a,a) 2345,a,a,a) (1,2) (456,a,0 (u1,u3) + (23,a,a,,a (45.a,04a (41,44) (d,aaaaa) (u1,45) 图1从表1导出的概念格结构 (u1,46) Fig.1 The concept lattice derived from table 1 定义4关于概念格的详细介绍请参阅文献 (ug,u3)】 [29]。 (g,44) 2集值信息系统和单值形式背景 (g,u) (ug,u6) 一个集值信息系统一般由四元组 (ug,4,) (U,AT,V,F)进行表示。其中U是一个非空对象 (us,us) 集,称为论域;AT是一个非空属性集;V=UnEAT'm, 其中Vm是属性m的值域;F={fm:m∈AT},其中 3 集值信息系统中的代数结构和粒 fm:U→P(Vn)。一个典型的集值信息系统如表2。 化模型 表2一个典型的集值信息系统 概念格是一类重要的格代数结构,其在形式概 Table 2 A typical set-valued information system 念分析理论中扮演了重要的角色。据此,本文尝试 b 基于形式概念分析理论重点探讨集值信息系统中的 1,3 格代数结构、信息粒化等问题。其中,本文提到的粒 D1,3 化模型是基于定义3中的相容关系构造的。 "1,D2 2 定义42】设(U,AT,V,F)是一个集值信息系 U1,D2 3 V2 统,对于任意B二AT,论域U中的相容关系定义为 D1, Re={(x,y)∈U1Hm∈B,fx,m)∩fy,m)≠) 定理1设(UxU,AT,J)是(U,AT,V,F)的衍生 D1, 背景,对于任意BCAT,有B·=RB。 4 U1,D2 证明由定义1、定义2和定义3即得,证毕。 Us U1,D3 定义5设R是论域U中的一个相容关系
一个完备格,其中 B(G,M,I) 是所有概念组的集合。 引理 1 在形式背景(G,M,I) 中,对于任意 B⊆ M,有 B ∗∗ =∩ {L ∈ Int(G,M,I) | B ⊆ L} 式中 Int(G,M,I) 表示所有概念内涵组成的集合。 定义 3 在表 1 所示的背景中,若 a1 = Finance、 a2 =Culture、a3 = Military、a4 = History、a5 = Shopping, 且将 website1, website2, …, website6 简记为 1, 2, …, 6,则表 1 中的概念格如图 1 所示,图 1 可以直 观反 映 信 息 在 不 同 层 次 上 的 聚 类。 例 如, 概 念 456,a3 a4 a5 ( ) 揭示 website4、website5 和 website6 等 网站均含有主题 Military、History 和 Shopping。 图 1 从表 1 导出的概念格结构 Fig.1 The concept lattice derived from table 1 定义 4 关于概念格的详细介绍请参阅文献 [29]。 2 集值信息系统和单值形式背景 一 个 集 值 信 息 系 统 一 般 由 四 元 组 (U,AT,V,F) 进行表示。 其中 U 是一个非空对象 集,称为论域;AT 是一个非空属性集;V = ∪m∈AT Vm , 其中 Vm 是属性 m 的值域;F = f { m :m∈AT} ,其中 fm :U→P Vm ( ) 。 一个典型的集值信息系统如表 2。 表 2 一个典型的集值信息系统 Table 2 A typical set⁃valued information system a b c d e u1 v1 v1 v1 v1 v1 , v3 u2 v1 v1 v1 v1 v1 , v3 u3 v1 , v2 v1 v1 , v2 v2 v2 u4 v1 , v2 v1 v1 , v2 v2 v2 u5 v2 , v3 v1 , v2 v2 v1 v1 , v2 u6 v2 , v3 v1 , v2 v2 v1 v1 , v2 u7 v3 v2 v2 v1 , v2 v3 u8 v3 v2 v2 v1 , v2 v3 单值背景中的经典算子往往并不适用于多值的 信息系统。 即若采用定义 1 中的算子,必须将信息 系统转化为单值形式背景。 由此,针对集值信息系 统,本文采用了如下转化策略。 定义 3 设(U,AT,V,F) 是一个集值信息系统, 称(U×U,AT,J) 是(U,AT,V,F) 的衍生形式背景,其 中 J 被描述为:对于任意(x,y) ∈U 2 ,m∈AT,有 ( (x,y) ,m) ∈ JS⇔f(x,m) ∩ f(y,m) ≠ ⌀ 由于衍生背景不再保留原信息系统中属性值自 身的信息,仅体现相同属性下不同对象之间的关系, 因而在形式上较原信息系统更加简单明了。 一个由 表 2 所示集值信息系统衍生的形式背景如表 3。 表 3 一个衍生形式背景 Table 3 A derivative formal context a b c d e (u1 , u1 ) × × × × × (u1 , u2 ) × × × × × (u1 , u3 ) × × × (u1 ,u4 ) × × × (u1 ,u5 ) × × × (u1 , u6 ) × × × ︙ ︙ ︙ ︙ ︙ ︙ (u8 , u3 ) × × (u8 , u4 ) × × (u8 , u5 ) × × × × (u8 , u6 ) × × × × (u8 , u7 ) × × × × × (u8 , u8 ) × × × × × 3 集值信息系统中的代数结构和粒 化模型 概念格是一类重要的格代数结构,其在形式概 念分析理论中扮演了重要的角色。 据此,本文尝试 基于形式概念分析理论重点探讨集值信息系统中的 格代数结构、信息粒化等问题。 其中,本文提到的粒 化模型是基于定义 3 中的相容关系构造的。 定义 4 [23] 设(U,AT,V,F) 是一个集值信息系 统,对于任意 B⊆AT,论域 U 中的相容关系定义为 RB = (x,y) ∈U 2 { | ∀m ∈B, f(x,m) ∩f(y,m) ≠⌀} 定理 1 设(U×U,AT,J) 是(U,AT,V,F) 的衍生 背景,对于任意 B⊆AT,有 B ∗ =RB 。 证明 由定义 1、定义 2 和定义 3 即得,证毕。 定义 5 设 R 是论域 U 中的一个相容关系, 第 3 期 康向平,等:一种基于概念格的集值信息系统中的知识获取方法 ·289·
.290 智能系统学报 第11卷 HCU。若HXHCR,且不存在N×NCR满足HxHC (123456.a,) NxN,称H是一个极大相容类。U中所有极大相容 类组成的集合记为U/R。设R,和R,是U中的相 12345,a,a) .(23456.a,a, 容关系,对于任意X∈U/R,若存在Y∈U/R2且满 足XCY,则称U/R2相对于U/R,是一种更粗的粒 123a,a,a) (2345.a,4,a,) 化结果,记为U/R,CU/R2。 (456.a,a4) 引理2在定义4中,有下述结论成立: (23.a,aa,0, (45.a,a,aa) 1)若R,和R,是论域U中的相容关系,则R,C R,+U/R CU/R,; (d,aaaaa 2)在(U,AT,V,F)中,设B,DCAT,则BCD曰 图2从表4导出的概念格结构 RpERBo Fig.2 A concept lattice derived from table 4 定义6若R是论域U中的一个相容关系,则 生背景,映射+:v(L)→P(AT)被描述为 称(U,U,R)是由R决定的中间背景。 C=(B(C))°={m∈AT1((x,y),m)∈J, 定理2在上述背景(U,U,R)中,有下述结论 H(x,y)∈B(C)} 成立: 映射+:P(AT)→w(L)被描述为 R=U{X×XIX∈U/R} B*=a(B)={XI(X,X)∈B(U,U,B·)} X∈U/R台(X,X)∈B(U,U,R) 式中BCAT,C∈v(L)。若C=B且B=C,则称 证明由定义1和定义4即得,证毕。 (C,B)是(U,AT,V,F)中的相容概念。对于任意相 在表2中,表4是由R决定的中间背景,相应 容概念(C,B,)和(C2,B2),它们之间的偏序关系 的概念格如图2所示。显然,依据定理2,可以判定 “≤”定义为 {山1,42,山5,u6}、u1,2,山1,4g}、{u3,u4}均是U/RB (C1,B1)≤(C2,B2)台C1≤C2台B2CB1 中的极大相容类。在图2中,“u,”简化表示为“”。 偏序集(B(U,AT,V,F),≤)是一个完备格,其 表4一个中间背景 中B(U,AT,V,F)是由所有相容概念构成的集合。 Table 4 A intermediate context 该结论与经典概念格中的相关结论类似,具体证明 4344u364, g 详见文献[29],在此不再详述。事实上,依据上述 定义,对于任意覆盖U/R,有 (U/R)+=R·={m∈ATI(x,y),m)∈J, H(x,y)∈R} 43 对于任意属性子集BCAT,有 B*=a(Rg)={XI (X,X)E B(U,U,Rg))=U/Rg us 定理3设(C,B)是一个相容概念,则C=U/Rs。 证明由于(C,B)是一个相容概念,所以由定 4 义7即得B*=C。又由于B*=U/Rg,故C=U/RB成 立,证毕。 依据定理2,本文在集值信息系统中进一步定 定理4在上述定义中,设R,R,和R2是论域 义如下α和B映射。 U中的相容关系,B,DSAT。有下述结论成立: 定义7设v(R)和v(L)分别是由论域U中所 1)U/R CU/R,=(U/R2)C(U/R)* 有相容关系和覆盖组成的集合。映射a:v(R)→v 2)BCD→D+CB (L)定义为 3)U/RC(U/R):BCB a(R)=(XI (X,X)E B(U,U,R)) 4)(U/R)+=(U/R)+:B*=B+ 映射B:v(L)→w(R)定义为 B(C)=U{X×XIX∈C} 证明1)当U/R,CU/R2时,有B(U/R,)CB 式中R∈v(R)和C∈v(L)。 (U/R2),进而由定义7即得结论成立。 定义8设(U×U,AT,J)是(U,AT,V,F)的衍 2)由于BCD→R,CRB→U/R,EU/RB→D*E
H⊆U。 若 H×H⊆R,且不存在 N×N⊆R满足 H×H⊂ N×N,称 H 是一个极大相容类。 U 中所有极大相容 类组成的集合记为 U/ R。 设 R1 和 R2 是 U 中的相 容关系,对于任意 X∈U/ R1 ,若存在 Y∈U/ R2 且满 足 X⊆Y,则称 U/ R2 相对于 U/ R1 是一种更粗的粒 化结果,记为 U/ R1⊆U/ R2 。 引理 2 在定义 4 中,有下述结论成立: 1)若 R1 和 R2 是论域 U 中的相容关系,则 R1⊆ R2⇔U/ R1⊆U/ R2 ; 2)在(U,AT,V,F) 中,设 B,D⊆AT,则 B⊆D⇒ RD⊆RB 。 定义 6 若 R 是论域 U 中的一个相容关系,则 称(U,U,R) 是由 R 决定的中间背景。 定理 2 在上述背景 (U,U,R) 中,有下述结论 成立: R =∪ {X × X | X ∈ U/ R} X ∈ U/ R⇔(X,X) ∈ B(U,U,R) 证明 由定义 1 和定义 4 即得,证毕。 在表 2 中,表 4 是由 R{d,e} 决定的中间背景,相应 的概念格如图 2 所示。 显然,依据定理 2,可以判定 {u1, u2, u5, u6}、{u1, u2, u7, u8}、{u3, u4}均是 U/ RB 中的极大相容类。 在图 2 中,“ui”简化表示为“i”。 表 4 一个中间背景 Table 4 A intermediate context u1 u2 u3 u4 u5 u6 u7 u8 u1 × × × × × × u2 × × × × × × u3 × × u4 × × u5 × × × × u6 × × × × u7 × × × × u8 × × × × 依据定理 2,本文在集值信息系统中进一步定 义如下 α 和 β 映射。 定义 7 设 ν(R) 和 ν (L) 分别是由论域 U 中所 有相容关系和覆盖组成的集合。 映射 α:ν (R) →ν (L) 定义为 α(R) = {X | (X,X) ∈ B(U,U,R) } 映射 β:ν(L) →ν(R) 定义为 β(C) =∪ {X × X | X ∈ C} 式中 R∈ν(R) 和 C∈ν(L) 。 定义 8 设(U×U,AT,J) 是(U,AT,V,F) 的衍 图 2 从表 4 导出的概念格结构 Fig. 2 A concept lattice derived from table 4 生背景,映射+:ν(L)→P(AT)被描述为 C + = (β(C)) ∗ = {m ∈ AT | ((x,y)),m) ∈ J, ∀(x,y) ∈ β(C)} 映射+:P(AT)→ν(L)被描述为 B + = α B ∗ ( ) = X | (X,X) ∈ B U,U,B ∗ { ( ) } 式中 B⊆AT,C∈ν( L)。 若 C + = B 且 B + = C,则称 (C,B)是(U,AT,V,F)中的相容概念。 对于任意相 容概念 C1 ,B1 ( ) 和 C2 ,B2 ( ) ,它们之间的偏序关系 “≤”定义为 C1 ,B1 ( ) ≤ C2 ,B2 ( ) ⇔C1 ⊆C2⇔B2 ⊆ B1 偏序集 (B(U,AT,V,F) ,≤) 是一个完备格,其 中 B (U,AT,V,F) 是由所有相容概念构成的集合。 该结论与经典概念格中的相关结论类似,具体证明 详见文献[29],在此不再详述。 事实上,依据上述 定义,对于任意覆盖 U/ R,有 (U/ R) + = R ∗ = {m ∈ AT | ((x,y),m) ∈ J, ∀(x,y) ∈ R} 对于任意属性子集 B⊆AT,有 B + = α RB ( ) = X | (X,X) ∈ B U,U,RB { ( ) } = U/ RB 定理 3 设(C,B)是一个相容概念,则 C=U/ RB。 证明 由于(C,B) 是一个相容概念,所以由定 义 7 即得 B + =C。 又由于 B + =U/ RB ,故 C = U/ RB 成 立,证毕。 定理 4 在上述定义中,设 R,R1 和 R2 是论域 U 中的相容关系,B,D⊆AT。 有下述结论成立: 1)U/ R1⊆U/ R2⇒ U/ R2 ( ) +⊆ U/ R1 ( ) + 2)B⊆D⇒D +⊆B + 3)U/ R⊆(U/ R) ++ ;B⊆B ++ 4) (U/ R) + = (U/ R) +++ ;B + =B +++ 证明 1) 当 U/ R1 ⊆U/ R2 时,有 β U/ R1 ( ) ⊆β U/ R2 ( ) ,进而由定义 7 即得结论成立。 2)由于 B⊆D⇒RD⊆RB⇒U/ RD⊆U/ RB⇒D +⊆ ·290· 智 能 系 统 学 报 第 11 卷
第3期 康向平,等:一种基于概念格的集值信息系统中的知识获取方法 ·291· B,故BCD曰DCB成立。 4 集值信息系统中的约简、核、依赖等 3)当(U/R)+=B时,有(U/R)=B*=U/RB成 知识的获取 立。又(U/R)+=B={m∈ATIRC{m}},故 m∈B台RC{m}·台RCRm,从而有RCRg。显然, 定理1约简、核、依赖等作为粗糙集研究的重 要组成部分,也是本文研究的重点。针对集值信息 此时由RCRB即得U/RCU/RB,进而U/RC 系统中的相关问题,本文给出一种基于定理6的求 (U/R)成立。由于 解方法。此节内容是通过借鉴文献[12]得到的。 B=(U/Rg)=BUm E (AT-B)I Rg Cm) 在S=(U,AT,V,F)中,设m∈BCAT,若RB≠ 故结论BCB成立。 Ra-m,称m是B中的必要属性;B中所有必要属性的 4)由上述结论可知U/RC(U/R)艹→ 集合称为B的核,记为Core(B);设CCBCAT,若C (U/R)艹(U/R),此外,又由结论3)即得 是满足Rg=Rc的最小属性子集,称C是B的一个 (U/R)+C(U/R))+=(U/R)艹,故(U/R)+= 约简;设B,DCAT,若R&RD,称B→D是一个 (U/R)艹成立;同理可证B*=B艹,证毕。 依赖。 定理5对于任意BCAT,(B*,B)是一个相 定理7设m∈BCAT,若满足下述条件: 容概念,且U/Rg是(B*,B+)的外延。 {L E Int(S)I(B-m)CL}≠{L∈Int(S)IBSL 证明由B+=B即得(B,B“)是一个相容概 定理4则m∈Core(B)成立。 念,进而由B*=U/Rg可知U/Rg是相容概念 证明假设m生Core(B)成立。有如下结论: (B*,B)的外延。证毕。 Rg-m=Ra→U/Ra-m=U/Rg台(B-m)+=B+ 进而由(B-m)艹=B艹即得 由上述定理可知,(B(U,AT,V,F),≤)可以将 所有覆盖的集合{U/ReIB二AT}以格的形式有机地 {L∈Int(S)I(B-m)*≤L}= 组织起来,由此,本文将其视为集值信息系统 {L∈Int(S)IB+CL} (U,AT,V,F)中的重要代数结构。 又(B-m)CL台(B-m)艹CL且BCL台B艹CL,故 定理6设nt(S)是S=(U,AT,V,F)中所有相 {L∈nt(S)I(B-m)CL={L∈Int(S)IBCL} 容概念内涵的集合,则对于任意B二AT,有 与条件相矛盾!所以m∈Core(B)成立,证毕。 B**=L C Int(S)I B CL 定理8设CCBCAT,若C是满足下述条件的 证明与参考文献[29]中有关结论的证明过 最小属性子集: 程相类似,在此不再详述。证毕。 {L∈Int(S)IBCL}={L∈Int(S)ICCL} 例如,基于定义7中的算子,可以从表3导出一 则C是B的一个约简。 个如图3的格结构,该结构即为表2所示集值信息 证明基于定理6,由上述条件即得B*=C+, 系统中的相容概念格。图3中的X,/X2/…/X,表示 进而有 覆盖{X1,X2,…,X},任意“u:”表简化表示为“”。 B+=C+台B*=C台U/RB=U/Rc台RB=Rc 又由于C是满足上述条件的B的最小属性子集,故 (12345678.d) C是B的一个约简,证毕。 (123456/5678,b) (1256783478,d 在表2中所示的集值信息系统中,当B={a,b, 1234/34578.c9(d356/34567 c,d}时,依据上述定理,并参照表5中的包含关系, (1234/3456/5678.g6c) (56456&6 (1256/1278/34.de) 我们不难发现{a,d}和{b,c,d}是B的约简, 45678.be (1234785678e0 Core(B)={d;而当B={a,b,c}时,{a}和{b,c}是 (12/3456/78.abce)234/5678,4bcd B的约简,Core(B)=☑。为便于表示,表5中的任 125634/78.be) 意属性子集{m1,m2,…,mn}简化为m1m2…mno (12/34/56/78.abcde) 定理9设B,DCAT,若满足条件: {L∈Int(S)IBSL}S{L∈Int(S)lDCL} 图3一个相容概念格 则B→D是一个依赖。 Fig.3 A tolerance concept lattice 证明由条件可知: n{L∈Int(S)IDCL}Cn{L∈nt(S)IBCL 进而由定理6即得DSB+。由于
B + ,故 B⊆D⇒D +⊆B +成立。 3)当(U/ R) + = B 时,有(U/ R) ++ = B + = U/ RB 成 立。 又 (U/ R) + = B = m ∈ AT | R ⊆ {m} ∗ { } , 故 m∈B⇔R⊆{m} ∗ ⇔R⊆Rm ,从而有 R⊆RB 。 显然, 此时 由 R ⊆ RB 即 得 U/ R ⊆ U/ RB , 进 而 U/ R ⊆ (U/ R) ++成立。 由于 B ++ = U/ RB ( ) + = B ∪ m ∈ (AT - B) | RB ⊆{m} ∗ { } 故结论 B⊆B ++成立。 4) 由 上 述 结 论 可 知 U/ R ⊆ (U/ R) ++ ⇒ (U/ R) +++⊆ (U/ R) + , 此 外, 又 由 结 论 3 ) 即 得 (U/ R) + ⊆ (U/ R) + ( ) ++ = (U/ R) +++ , 故 (U/ R) + = (U/ R) +++成立;同理可证 B + =B +++ ,证毕。 定理 5 对于任意 B⊆AT, B + ,B ++ ( ) 是一个相 容概念,且 U/ RB 是 B + ,B ++ ( ) 的外延。 证明 由 B +++ =B +即得 B + ,B ++ ( ) 是一个相容概 念,进 而 由 B + = U/ RB 可 知 U/ RB 是 相 容 概 念 B + ,B ++ ( ) 的外延。 证毕。 由上述定理可知, (B(U,AT,V,F) ,≤) 可以将 所有覆盖的集合{U/ RB | B⊆AT}以格的形式有机地 组织 起 来, 由 此, 本 文 将 其 视 为 集 值 信 息 系 统 (U,AT,V,F) 中的重要代数结构。 定理 6 设 Int(S) 是 S = (U,AT,V,F) 中所有相 容概念内涵的集合,则对于任意 B⊆AT,有 B + + = {L ⊆ Int(S) | B ⊆ L} 证明 与参考文献[29]中有关结论的证明过 程相类似,在此不再详述。 证毕。 例如,基于定义 7 中的算子,可以从表 3 导出一 个如图 3 的格结构,该结构即为表 2 所示集值信息 系统中的相容概念格。 图 3 中的 X1 / X2 / …/ Xl 表示 覆盖{X1 ,X2 ,…,Xl},任意“ui”表简化表示为“i”。 图 3 一个相容概念格 Fig.3 A tolerance concept lattice 4 集值信息系统中的约简、核、依赖等 知识的获取 定理 1 约简、核、依赖等作为粗糙集研究的重 要组成部分,也是本文研究的重点。 针对集值信息 系统中的相关问题,本文给出一种基于定理 6 的求 解方法。 此节内容是通过借鉴文献[12]得到的。 在 S = (U,AT,V,F) 中,设 m∈B⊆AT,若 RB ≠ RB-m ,称 m 是 B 中的必要属性;B 中所有必要属性的 集合称为 B 的核,记为 Core (B) ;设 C⊆B⊆AT,若 C 是满足 RB = RC 的最小属性子集,称 C 是 B 的一个 约简;设 B,D⊆AT,若 RB ⊆RD,称 B→D 是一个 依赖。 定理 7 设 m∈B⊆AT,若满足下述条件: {L ∈ Int(S) | (B - m) ⊆ L} ≠ {L ∈ Int(S) | B ⊆ L} 定理 4 则 m∈Core (B) 成立。 证明 假设 m∉Core (B) 成立。 有如下结论: RB-m = RB⇔U/ RB-m = U/ RB⇔ (B - m) + + = B + + 进而由(B-m) ++ =B ++即得 L ∈ Int(S) | (B - m) { + + ⊆ L} = L ∈ Int(S) | B { + + ⊆ L} 又(B-m) ⊆L⇔(B-m) ++⊆L 且 B⊆L⇔B ++⊆L,故 {L ∈Int(S) | (B - m) ⊆L} = {L ∈Int(S) | B ⊆L} 与条件相矛盾! 所以 m∈Core(B)成立,证毕。 定理 8 设 C⊆B⊆AT,若 C 是满足下述条件的 最小属性子集: {L ∈ Int(S) | B ⊆ L} = {L ∈ Int(S) | C ⊆ L} 则 C 是 B 的一个约简。 证明 基于定理 6,由上述条件即得 B ++ = C ++ , 进而有 B + + = C + +⇔B + = C + ⇔U/ RB = U/ RC⇔RB = RC 又由于 C 是满足上述条件的 B 的最小属性子集,故 C 是 B 的一个约简,证毕。 在表 2 中所示的集值信息系统中,当 B = {a,b, c,d}时,依据上述定理,并参照表 5 中的包含关系, 我们不 难 发 现 { a, d } 和 { b, c, d } 是 B 的 约 简, Core(B)= {d};而当 B = {a,b,c}时,{ a}和{ b,c}是 B 的约简,Core(B) = ⌀。 为便于表示,表 5 中的任 意属性子集{m1 ,m2 ,…, mn }简化为 m1m2… mn 。 定理 9 设 B,D⊆AT,若满足条件: {L ∈ Int(S) | B ⊆ L} ⊆ {L ∈ Int(S) | D ⊆ L} 则 B→D 是一个依赖。 证明 由条件可知: ∩ {L ∈ Int(S) | D ⊆ L} ⊆∩ {L ∈ Int(S) | B ⊆ L} 进而由定理 6 即得 D ++⊆B ++ 。 由于 第 3 期 康向平,等:一种基于概念格的集值信息系统中的知识获取方法 ·291·
.292. 智能系统学报 第11卷 D+≤B*+台B*CD*曰U/RBCU/Ro台RE C RD D2CD1时,由B,→D1可以推导出B2→D2,即B2→D2 故B→D是一个依赖。证毕。 是相对冗余的。在表2中,去掉上述冗余依赖后,一 一个信息系统中往往包含着大量的冗余依赖,例 个规模较小的依赖集如表6。在表6中,m1m2…m。 如,当D二B时,B→D是绝对冗余的:当B,CB2且 表示集合{m1,m2,…,mn}。 表5一些属性子集与内涵之间的包含关系 Table 5 Inclusion relation between some attributes sets and intents 相容概念内涵 属性子集 0 b d bd be cd de abe bde abed abce abcde abed S S a C b C C c d C C ac C C ad be bd ed abe abd acd bed S S 0 ( CC 表6一个依赖集 Table 6 A dependency set 参考文献: a-abe ad-abed bed-abcd ae→abce [1]PAWLAK Z.Rough sets[J].International journal of com- puter information sciences,1982,11(5):341-356. ade→abcde cde→abcde ce→abce bc-*abc [2]PAWLAK Z.Rough sets:theoretical aspects of reasoning a- bout data[M].Dordrecht:Kluwer Academic Publishers, 5 结束语 1991. [3]王国胤,张清华,胡军.粒计算研究综述[J].智能系统 我们知道,二元关系是粗糙集的核心要素,而概 学报,2007,2(6):8-26 念格本质上又是一种以二元关系为研究对象的数学 WANG Guoyin,ZHANG Qinghua,HU Jun.An overview of 工具,因此将概念格融入到粗糙集研究中,必将有助 granular computing[J].CAAI transactions on intelligent sys- 于拓展粗糙集的分析能力。本文尝试将概念格中的 tems,2007,2(6):8-26. 概念思维、格代数结构、伽罗瓦连接等引入到集值信 [4]王国胤,姚一豫,于洪.粗糙集理论及应用研究综述[J刀 息系统中,重点探讨了基于相容关系的粒化模型和 计算机学报,2009,32(7):1229-1246. WANG Guoyin,YAO Yiyu,YU Hong.A survey on rough 集值系统中的格代数结构,该代数结构可以将论域 set theory and applications[J].Chinese journal of comput- 中的所有覆盖以格的形式有机结织起来。此外,本 es,2009,32(7):1229-1246. 文还探讨了集值信息系统中的约简、核等问题。理[5]伞治,叶玉玲.粗糙集理论及其在智能系统中的应用 论推理和实例验证揭示了本文结论的合理性和有效 [J].智能系统学报,2007,4(2):40-47. 性。本文从概念格视角提出了集值信息系统中的知 SAN Ye,YE Yuling.Rough set theory and its application in the intelligent systems[J].CAAI transactions on intelligent 识获取方法,有助于人们深入理解粗糙集理论,也有 systems,.2007,4(2):40-47. 助于揭示两种理论之间的紧密联系。相关研究内容 [6]WILLE R.Restructuring lattice theory:an approach based 仍将是我们下一阶段的研究重点。 on hierarchies of concepts[M]//RIVAL I.Ordered Sets
D + + ⊆ B + +⇔B +⊆ - D + ⇔U/ RB ⊆ - U/ RD⇔RB ⊆ RD 故 B→D 是一个依赖。 证毕。 一个信息系统中往往包含着大量的冗余依赖,例 如,当 D⊆B 时,B→D 是绝对冗余的;当B1⊆B2 且 D2⊆D1 时,由 B1→D1 可以推导出B2→D2 ,即B2→D2 是相对冗余的。 在表 2 中,去掉上述冗余依赖后,一 个规模较小的依赖集如表 6。 在表 6 中,m1m2…mn 表示集合{m1 ,m2 ,…,mn }。 表 5 一些属性子集与内涵之间的包含关系 Table 5 Inclusion relation between some attributes sets and intents 属性子集 相容概念内涵 ⌀ b c d e bd be cd de abc bde abcd abce abcde abcd ⊆ ⊆ a ⊆ ⊆ ⊆ ⊆ b ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ c ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ d ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ab ⊆ ⊆ ⊆ ⊆ ac ⊆ ⊆ ⊆ ⊆ ad ⊆ ⊆ bc ⊆ ⊆ ⊆ ⊆ bd ⊆ ⊆ ⊆ ⊆ cd ⊆ ⊆ ⊆ abc ⊆ ⊆ ⊆ ⊆ abd ⊆ ⊆ acd ⊆ ⊆ bcd ⊆ ⊆ ⌀ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ ⊆ 表 6 一个依赖集 Table 6 A dependency set a→abc ad→abcd bcd→abcd ae→abce ade→abcde cde→abcde ce→abce bc→abc 5 结束语 我们知道,二元关系是粗糙集的核心要素,而概 念格本质上又是一种以二元关系为研究对象的数学 工具,因此将概念格融入到粗糙集研究中,必将有助 于拓展粗糙集的分析能力。 本文尝试将概念格中的 概念思维、格代数结构、伽罗瓦连接等引入到集值信 息系统中,重点探讨了基于相容关系的粒化模型和 集值系统中的格代数结构,该代数结构可以将论域 中的所有覆盖以格的形式有机结织起来。 此外,本 文还探讨了集值信息系统中的约简、核等问题。 理 论推理和实例验证揭示了本文结论的合理性和有效 性。 本文从概念格视角提出了集值信息系统中的知 识获取方法,有助于人们深入理解粗糙集理论,也有 助于揭示两种理论之间的紧密联系。 相关研究内容 仍将是我们下一阶段的研究重点。 参考文献: [1]PAWLAK Z. Rough sets[ J]. International journal of com⁃ puter & information sciences, 1982, 11(5): 341⁃356. [2]PAWLAK Z. Rough sets: theoretical aspects of reasoning a⁃ bout data [ M]. Dordrecht: Kluwer Academic Publishers, 1991. [3]王国胤, 张清华, 胡军. 粒计算研究综述[ J]. 智能系统 学报, 2007, 2(6): 8⁃26. WANG Guoyin, ZHANG Qinghua, HU Jun. An overview of granular computing[J]. CAAI transactions on intelligent sys⁃ tems, 2007, 2(6): 8⁃26. [4]王国胤, 姚一豫, 于洪. 粗糙集理论及应用研究综述[J]. 计算机学报, 2009, 32(7): 1229⁃1246. WANG Guoyin, YAO Yiyu, YU Hong. A survey on rough set theory and applications[ J]. Chinese journal of comput⁃ ers, 2009, 32(7): 1229⁃1246. [5]伞冶, 叶玉玲. 粗糙集理论及其在智能系统中的应用 [J]. 智能系统学报, 2007, 4(2): 40⁃47. SAN Ye, YE Yuling. Rough set theory and its application in the intelligent systems[ J]. CAAI transactions on intelligent systems, 2007, 4(2): 40⁃47. [6] WILLE R. Restructuring lattice theory: an approach based on hierarchies of concepts [ M] / / RIVAL I. Ordered Sets. ·292· 智 能 系 统 学 报 第 11 卷
第3期 康向平,等:一种基于概念格的集值信息系统中的知识获取方法 ·293· Netherlands:Springer,1982:445-470. [21]KRYSZKIEWICZ M.Rough set approach to incomplete in- [7]LI Jinhai,MEI Changlin,WANG Lidong,et al.On infer- formation systemsJ.Information sciences,1998,112(1/ ence rules in decision formal contexts[J].International jour- 2/3/4):39-49. nal of computational intelligence systems,2015,8(1): [22]KRYSZKIEWICZ M.Rules in incomplete information sys- 175-186. tems[J].Information sciences,1999,113(3/4):271- [8]LI Jinhai,MEI Changlin,WANG Junhong,et al.Rule-pre- 292. served object compression in formal decision contexts using [23]王国胤.Rough集理论在不完备信息系统中的扩充[J] concept lattices[J].Knowledge-based systems,2014,71: 计算机研究与发展.2002.39(10):1238-1243. 435-445. WANG Guoyin.Extension of rough set under incomplete in- [9]QI Jianjun,QIAN Ting,WEI Ling.The connections be- formation systems[].Joumal of computer research and de- tween three-way and classical concept lattices[J].Knowl- velopment,.2002,39(10):1238-1243. edge-based systems,2016,91:143-151. [24]LEUNG Y,LI Deyu.Maximal consistent block technique [10]ZHAI Yanhui,LI Deyu,QU Kaishe.Decision implication for rule acquisition in incomplete information systems[J]. canonical basis:a logical perspective[].Journal of com- Information sciences,2003,153:85-106. puter and system sciences,2015,81(1):208-218. [25]ZHANG Wenxiu,MI Jusheng.Incomplete information sys- [11]张文修,姚一豫,梁怡.粗糙集与概念格[M].西安:西 tem and its optimal selections[J].Computers mathemat- 安交通大学出版社,2006. ics with applications,2004,48(5/6):691-698. [12]KANG Xianping,LI Deyu,WANG Suge,et al.Rough set [26]GUAN Yanyong,WANG Hongkai.Set-valued information model based on formal concept analysis[].Information systems[J].Information sciences,2006,176(17):2507- sciences,2013,222:611-625. 2525. [13]曲开社,翟岩慧,梁吉业,等.形式概念分析对粗糙集 [27]QIAN Yuhua,DANG Chuangyin,LIANG Jiye,et al.Set- 理论的表示及扩展[J].软件学报,2007,18(9):2174- valued ordered information systems[J].Information sci- 2182. ences,2009,179(16):2809-2832. QU Kaishe,ZHAI Yanhui,LIANG Jiye,et al.Representa- [28]QIAN Y H,LIANG J Y,SONG P,et al.On dominance tion and extension of rough set theory based on formal con- relations in disjunctive set-valued ordered information sys- cept analysis[J].Journal of software,2007,18(9):2174- tems[J].International journal of information technology 2182. decision making,2010,9(1):9-33. [14]仇国芳,张志霞,张炜.基于粗糙集方法的概念格理论 29 GANTER B,WILLE R.Formal concept analysis:mathe- 研究综述[J].模糊系统与数学,2014,28(1):168- matical foundations[M].Berlin Heidelberg:Springer-Ver- 177. lag,1999. QIU Guofang,ZHANG Zhixia,ZHANG Wei.A survey for 作者简介: study on concept lattice theory via rough set[J].Fuzzy sys- 康向平,男,1982年生,博土 tems and mathematics,2014,28(1):168-177. 后,主要研究方向为概念格、粗糙 [15]WAN Qing,WEI Ling.Approximate concepts acquisition 集、粒计算。 based on formal contexts[J].Knowledge-based systems, 2015,75:78-86. [16]KENT R E.Rough concept analysis:a synthesis of rough sets and formal concept analysis[J].Fundamenta informati- cae,1996,27(2-3):169-181. 苗夺谦,男,1964年生,教授,博 [17]CHEN Jinkun,LI Jinjin,LIN Yaojin,et al.Relations of 士生导师,中国人工智能学会理事、中 reduction between covering generalized rough sets and con- 国计算机学会杰出会员、中国自动化学 cept lattices[J].Information sciences,2015,304:16-27. 会智能自动化专委会委员、上海市计算 [18 ]LI Jinhai,REN Yue,MEI Changlin,et al.A comparative 机学会理事、上海市人工智能学会理 study of multigranulation rough sets and concept lattices via 事,主要研究方向为粗糙集、粒计算、 rule acquisition[J].Knowledge-based systems,2016,91: Wb智能、,数据挖掘和机器学习。主持完成国家级、省部级 152-164. 自然科学基金与科技攻关项目多项,参与完成973计划项 [19]SHAO Mingwen,LEUNG Y.Relations between granular 目、863计划项目、国家自然科学基金重大研究计划项目、上 reduct and dominance reduct in formal contexts [J]. 海市科委重大科技攻关项目等多项。作为项目组成员,曾 Knowledge-based systems,2014,65:1-11. 获国家教委科技进步三等奖、教育部科技进步一等奖、上海 [20]TAN Anhui,LI Jinjin,LIN Guoping.Connections between 市技术发明一等奖、重庆市自然科学一等奖等。发表学术论 covering-based rough sets and concept lattices[].Interna- 文260余篇,其中被SCI或EI检索150余篇.编著教材及著 tional journal of approximate reasoning,2015,56:43-58. 作12部,获得专利授权9项
Netherlands: Springer, 1982: 445⁃470. [7] LI Jinhai, MEI Changlin, WANG Lidong, et al. On infer⁃ ence rules in decision formal contexts[J]. International jour⁃ nal of computational intelligence systems, 2015, 8 ( 1 ): 175⁃186. [8]LI Jinhai, MEI Changlin, WANG Junhong, et al. Rule⁃pre⁃ served object compression in formal decision contexts using concept lattices[ J]. Knowledge⁃based systems, 2014, 71: 435⁃445. [9] QI Jianjun, QIAN Ting, WEI Ling. The connections be⁃ tween three⁃way and classical concept lattices [ J]. Knowl⁃ edge⁃based systems, 2016, 91: 143⁃151. [10]ZHAI Yanhui, LI Deyu, QU Kaishe. Decision implication canonical basis: a logical perspective[ J]. Journal of com⁃ puter and system sciences, 2015, 81(1): 208⁃218. [11]张文修, 姚一豫, 梁怡. 粗糙集与概念格[M]. 西安: 西 安交通大学出版社, 2006. [12]KANG Xianping, LI Deyu, WANG Suge, et al. Rough set model based on formal concept analysis [ J]. Information sciences, 2013, 222: 611⁃625. [13]曲开社, 翟岩慧, 梁吉业, 等. 形式概念分析对粗糙集 理论的表示及扩展[J]. 软件学报, 2007, 18(9): 2174⁃ 2182. QU Kaishe, ZHAI Yanhui, LIANG Jiye, et al. Representa⁃ tion and extension of rough set theory based on formal con⁃ cept analysis[J]. Journal of software, 2007, 18(9): 2174⁃ 2182. [14]仇国芳, 张志霞, 张炜. 基于粗糙集方法的概念格理论 研究综述[ J]. 模糊系统与数学, 2014, 28 ( 1): 168⁃ 177. QIU Guofang, ZHANG Zhixia, ZHANG Wei. A survey for study on concept lattice theory via rough set[J]. Fuzzy sys⁃ tems and mathematics, 2014, 28(1): 168⁃177. [15] WAN Qing, WEI Ling. Approximate concepts acquisition based on formal contexts [ J]. Knowledge⁃based systems, 2015, 75: 78⁃86. [16]KENT R E. Rough concept analysis: a synthesis of rough sets and formal concept analysis[J]. Fundamenta informati⁃ cae, 1996, 27(2⁃3): 169⁃181. [17] CHEN Jinkun, LI Jinjin, LIN Yaojin, et al. Relations of reduction between covering generalized rough sets and con⁃ cept lattices[J]. Information sciences, 2015, 304: 16⁃27. [18]LI Jinhai, REN Yue, MEI Changlin, et al. A comparative study of multigranulation rough sets and concept lattices via rule acquisition[J]. Knowledge⁃based systems, 2016, 91: 152⁃164. [19] SHAO Mingwen, LEUNG Y. Relations between granular reduct and dominance reduct in formal contexts [ J ]. Knowledge⁃based systems, 2014, 65: 1⁃11. [20]TAN Anhui, LI Jinjin, LIN Guoping. Connections between covering⁃based rough sets and concept lattices[J]. Interna⁃ tional journal of approximate reasoning, 2015, 56: 43⁃58. [21]KRYSZKIEWICZ M. Rough set approach to incomplete in⁃ formation systems[J]. Information sciences, 1998, 112(1 / 2 / 3 / 4): 39⁃49. [22]KRYSZKIEWICZ M. Rules in incomplete information sys⁃ tems[ J]. Information sciences, 1999, 113 ( 3 / 4): 271⁃ 292. [23]王国胤. Rough 集理论在不完备信息系统中的扩充[ J]. 计算机研究与发展, 2002, 39(10): 1238⁃1243. WANG Guoyin. Extension of rough set under incomplete in⁃ formation systems[J]. Journal of computer research and de⁃ velopment, 2002, 39(10): 1238⁃1243. [24] LEUNG Y, LI Deyu. Maximal consistent block technique for rule acquisition in incomplete information systems[ J]. Information sciences, 2003, 153: 85⁃106. [25]ZHANG Wenxiu, MI Jusheng. Incomplete information sys⁃ tem and its optimal selections[J]. Computers & mathemat⁃ ics with applications, 2004, 48(5 / 6): 691⁃698. [26] GUAN Yanyong, WANG Hongkai. Set⁃valued information systems[J]. Information sciences, 2006, 176(17): 2507⁃ 2525. [27]QIAN Yuhua, DANG Chuangyin, LIANG Jiye, et al. Set⁃ valued ordered information systems [ J]. Information sci⁃ ences, 2009, 179(16): 2809⁃2832. [28]QIAN Y H, LIANG J Y, SONG P, et al. On dominance relations in disjunctive set⁃valued ordered information sys⁃ tems[J]. International journal of information technology & decision making, 2010, 9(1): 9⁃33. [29]GANTER B, WILLE R. Formal concept analysis: mathe⁃ matical foundations[M]. Berlin Heidelberg: Springer⁃Ver⁃ lag, 1999. 作者简介: 康向 平, 男, 1982 年 生, 博 士 后, 主 要 研 究 方 向 为 概 念 格、 粗 糙 集、粒计算。 苗夺谦, 男, 1964 年生, 教授, 博 士生导师,中国人工智能学会理事、中 国计算机学会杰出会员、中国自动化学 会智能自动化专委会委员、上海市计算 机学会理事、上海市人工智能学会理 事,主要研究方向为粗糙集、粒计算、 Web 智能、数据挖掘和机器学习。 主持完成国家级、省部级 自然科学基金与科技攻关项目多项, 参与完成 973 计划项 目、863 计划项目、国家自然科学基金重大研究计划项目、上 海市科委重大科技攻关项目等多项。 作为项目组成员, 曾 获国家教委科技进步三等奖、教育部科技进步一等奖、上海 市技术发明一等奖、重庆市自然科学一等奖等。 发表学术论 文 260 余篇, 其中被 SCI 或 EI 检索 150 余篇. 编著教材及著 作 12 部, 获得专利授权 9 项。 第 3 期 康向平,等:一种基于概念格的集值信息系统中的知识获取方法 ·293·