正在加载图片...
第6期 王国胤,等:粒计算研究综述 ·15 的相互转化 分,即知识的分解,二是泛化,即知识的综合.对于确 3.43基于容差关系的粒计算模型 定的知识,没有必要进行泛化和细化,但对于不确定 粗糙集能有效地分析和处理不精确、不一致和 性知识,利用外延内涵算子和内涵外延算子可以将 不完整等各种不完备信息,并能从中揭示潜在的规 知识进行泛化和例化.结合包含度理论在不同的泛 律,近年来在机器学习、数据挖掘等多个领域得到了 化和例化知识系统上发现知识,这种方法与粒计算 广泛应用.在对粗糙集理论的研究中,对不完备信息 的思路完全一致.因此,知识系统的泛化和例化是粒 系统的传统处理方法是先进行补齐,然后再用粗糙 计算的一种特殊形式,它与Yao)提出的基于划分 集的方法来进行处理,由于补齐的过程导致了原始 的粒计算模型(即采用逻辑决策语言(DL~语言)来 系统信息的变化,所得到的结果不一定反映原始系 描述集合的粒(用满足公式中元素的集合来定义等 统的真实情况.因而有必要扩充不完备信息系统的 价类m(,构建粒世界的逻辑框架,并应用于构建 理论与方法,直接从不完备信息系统中获取知识.王 粒网络和分析了相关规则、例外规则和特殊规则)非 国胤等人38·以容差关系为基础,提出了不完备信 常相似.曲开社等人51在概念信息粒格上建立了 息系统的粒计算方法.使用属性值上的容差关系给出 3个偏序集:G偏序集、M偏序集和GM偏序集,并 不完备信息系统的粒表示、粒运算规则和粒分解算法, 将包含度的概念引入到这3个偏序集上,证实了概 同时结合粗糙集中的属性约简问题,提出了不完备信 念信息系统中的内涵、外延和蕴涵规则均可归结为 息系统在粒表示下属性必要性的判定条件.郑 偏序集上的序表示及包含度表示.近几年来,人们进 征6.7列等人根据人类具有依据具体的任务特性把相 一步对概念知识粒和概念信息粒的转化进行了研 关数据和知识泛化或者例化成不同程度、不同大小的 究2.1o),加快了概念格粒计算模型的发展 粒的能力,以及进一步依据这些粒和粒之间的关系进 随着粒计算研究工作的飞速发展,粒计算模型 行问题求解的能力提出了相容粒度空间模型 的种类层出不穷,如基于神经网络的粒计算模 3.44基于概念格的粒计算模型 型490!基于进化计算的粒计算模型o6等等.限于 概念格,也称形式概念分析,最早由Wlle于 篇幅,不再一一列举 1982年提出o1,它几乎与粗糙集理论一起被提出, 4 并都为数据分析提供了有效的研究方法.它是根据 粒计算模型之间的关系 二元关系提出的一种概念层次结构.从数据集中生 基于模糊集合论的词计算模型、基于粗糙集理 成概念格的过程,实际上是一种概念聚类的过程,它 论的粒计算模型和基于商空间理论的粒计算模型都 的每个节点被称为一个概念,概念的外延表示为属 是描述人类能按不同粒度处理事物的能力的模型. 于这个概念的所有对象的集合,而内涵则表示为所 商空间理论模型和粗糙集理论模型认为概念粒子可 有对象所共有的属性的集合,概念格在本质上描述 以用子集来表示,不同粒度下的粒子用不同大小的 了对象和属性之间的联系,表明了概念之间的泛化 子集来描述,所有的粒子都通过等价关系获得划分 和例化关系,它的Hasse图则实现了对数据的可视 产生.而词计算模型认为表示知识的粒子用一个 化,作为数据分析和知识处理的形式化工具.概念格 “词”(即模糊子集)来表示,不同程度的知识可以通 理论已被广泛地应用于软件工程、知识工程、数据挖 过不同的程度词进行刻画.从研究对象上看,3种模 掘、信息检索等领域.仇国芳2.]等人在概念 型都是在有限的集合论域上研究,只是各自的侧重 格的基础上,提出概念知识格,以及概念信息粒格, 点不同 讨论了概念信息粒之间的蕴含关系,以及由概念信 粗糙集理论的研究对象是由一个多值属性集合 息粒生成的不确定规则的方法,扩充了概念格的研 描述的一个对象集合对于每个对象及其属性都有 究内容 一个值作为其描述符号.对象、属性和描述符是表述 张文修等人1]认为:知识是人类认知的成果 决策问题的3个基本要素.关于对象可得到的信息 和结晶,包括经验知识和理论知识.经验知识可以理 不一定足以划分其成员类型,这种不精确性导致了 解为从大量现象中归纳的共同特征,数据库知识发 对象的不可分辨性.给定对象间的一个等价关系,即 现即是这种思维方式的程序化;而理论知识是对事 导致由等价类构成的近似空间的不分明关系,粗糙 务因果的探索,是对经验知识的理性概括.但任何知 集就用不分明对象类形成的上近似和下近似来描 识都不是孤立存在的,都存在于相互关联的知识系 述.它能够解决重要的分类问题,所有冗余对象和属 统中,对于知识的深层次认识有2种方法:一是细 性的约简包含属性的最小子集,能够很好地近似分 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net的相互转化. 31413 基于容差关系的粒计算模型 粗糙集能有效地分析和处理不精确、不一致和 不完整等各种不完备信息 ,并能从中揭示潜在的规 律 ,近年来在机器学习、数据挖掘等多个领域得到了 广泛应用. 在对粗糙集理论的研究中 ,对不完备信息 系统的传统处理方法是先进行补齐 ,然后再用粗糙 集的方法来进行处理 ,由于补齐的过程导致了原始 系统信息的变化 ,所得到的结果不一定反映原始系 统的真实情况. 因而有必要扩充不完备信息系统的 理论与方法 ,直接从不完备信息系统中获取知识. 王 国胤等人[38 - 39 ]以容差关系为基础 ,提出了不完备信 息系统的粒计算方法 ,使用属性值上的容差关系给出 不完备信息系统的粒表示、粒运算规则和粒分解算法 , 同时结合粗糙集中的属性约简问题 ,提出了不完备信 息系统在粒表示下属性必要性的判定条件. 郑 征[46 - 47 ,59]等人根据人类具有依据具体的任务特性把相 关数据和知识泛化或者例化成不同程度、不同大小的 粒的能力 ,以及进一步依据这些粒和粒之间的关系进 行问题求解的能力提出了相容粒度空间模型. 31414 基于概念格的粒计算模型 概念格 ,也称形式概念分析 ,最早由 Wille 于 1982 年提出[100 ] ,它几乎与粗糙集理论一起被提出 , 并都为数据分析提供了有效的研究方法. 它是根据 二元关系提出的一种概念层次结构. 从数据集中生 成概念格的过程 ,实际上是一种概念聚类的过程 ,它 的每个节点被称为一个概念 ,概念的外延表示为属 于这个概念的所有对象的集合 ,而内涵则表示为所 有对象所共有的属性的集合. 概念格在本质上描述 了对象和属性之间的联系 ,表明了概念之间的泛化 和例化关系 ,它的 Hasse 图则实现了对数据的可视 化 ,作为数据分析和知识处理的形式化工具. 概念格 理论已被广泛地应用于软件工程、知识工程、数据挖 掘、信息检索等领域[101 ] . 仇国芳[102 - 103 ] 等人在概念 格的基础上 ,提出概念知识格 ,以及概念信息粒格 , 讨论了概念信息粒之间的蕴含关系 ,以及由概念信 息粒生成的不确定规则的方法 ,扩充了概念格的研 究内容. 张文修等人[104 ] 认为 :知识是人类认知的成果 和结晶 ,包括经验知识和理论知识. 经验知识可以理 解为从大量现象中归纳的共同特征 ,数据库知识发 现即是这种思维方式的程序化 ;而理论知识是对事 务因果的探索 ,是对经验知识的理性概括. 但任何知 识都不是孤立存在的 ,都存在于相互关联的知识系 统中. 对于知识的深层次认识有 2 种方法 :一是细 分 ,即知识的分解 ;二是泛化 ,即知识的综合. 对于确 定的知识 ,没有必要进行泛化和细化 ,但对于不确定 性知识 ,利用外延内涵算子和内涵外延算子可以将 知识进行泛化和例化. 结合包含度理论在不同的泛 化和例化知识系统上发现知识 ,这种方法与粒计算 的思路完全一致. 因此 ,知识系统的泛化和例化是粒 计算的一种特殊形式 ,它与 Yao [17 ] 提出的基于划分 的粒计算模型 (即采用逻辑决策语言 (DL2语言) 来 描述集合的粒(用满足公式φ元素的集合来定义等 价类 m (φ) ,构建粒世界的逻辑框架 ,并应用于构建 粒网络和分析了相关规则、例外规则和特殊规则) 非 常相似. 曲开社等人[105 ] 在概念信息粒格上建立了 3 个偏序集 : G偏序集、M 偏序集和 GM 偏序集 ,并 将包含度的概念引入到这 3 个偏序集上 ,证实了概 念信息系统中的内涵、外延和蕴涵规则均可归结为 偏序集上的序表示及包含度表示. 近几年来 ,人们进 一步对概念知识粒和概念信息粒的转化进行了研 究[102 - 103 ] ,加快了概念格粒计算模型的发展. 随着粒计算研究工作的飞速发展 ,粒计算模型 的种类层出不穷 , 如基于神经网络的粒计算模 型[49 - 50 ] 、基于进化计算的粒计算模型[106 ]等等. 限于 篇幅 ,不再一一列举. 4 粒计算模型之间的关系 基于模糊集合论的词计算模型、基于粗糙集理 论的粒计算模型和基于商空间理论的粒计算模型都 是描述人类能按不同粒度处理事物的能力的模型. 商空间理论模型和粗糙集理论模型认为概念粒子可 以用子集来表示 ,不同粒度下的粒子用不同大小的 子集来描述 ,所有的粒子都通过等价关系获得划分 产生. 而词计算模型认为表示知识的粒子用一个 “词”(即模糊子集) 来表示 ,不同程度的知识可以通 过不同的程度词进行刻画. 从研究对象上看 ,3 种模 型都是在有限的集合论域上研究 ,只是各自的侧重 点不同. 粗糙集理论的研究对象是由一个多值属性集合 描述的一个对象集合 ,对于每个对象及其属性都有 一个值作为其描述符号. 对象、属性和描述符是表述 决策问题的 3 个基本要素. 关于对象可得到的信息 不一定足以划分其成员类型 ,这种不精确性导致了 对象的不可分辨性. 给定对象间的一个等价关系 ,即 导致由等价类构成的近似空间的不分明关系 ,粗糙 集就用不分明对象类形成的上近似和下近似来描 述. 它能够解决重要的分类问题 ,所有冗余对象和属 性的约简包含属性的最小子集 ,能够很好地近似分 第 6 期 王国胤 ,等 :粒计算研究综述 · 51 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有