第6期 王因胤,等:粒计算研究综述 ·17 势,将形成更加有效的粒计算方法和理论.目前,模 解模糊关系方程最大解的快速方法,减少了图像重 糊粗糙集,粗糙模糊集和模糊商空间对于处理复杂 构的运算量.修保新等人181)给出了基于模糊信 问题都表现出比单一模型更好的优势,得到较好的 息粒化思想的图像边缘检测方法,并在基于图像模 发展.但如何将粗糙集与商空间有效地结合起来,还 糊粒化思想进行图像插值的基础上,提出了具体的 没有进一步的研究成果 基于图像模糊粒化结构的插值方法.刘仁金等 基于划分的粒计算模型是粗糙集理论模型的一 人31,14,2o1通过对粒度概念及粗糙集、模糊集等粒 种特例.它将概念知识分为内涵和外延,在外延上利 计算理论的比较研究以及对图像分割概念分析及对 用集合论上的交并等运算来合成粒子或分解粒子, 现有的图像分割方法系统分析,提出了图像分割中 在内涵上采用属性的多少来控制粒子的大小.基于 的商空间粒度原理和基于粒度合成技术原理的纹理 覆盖的粒计算模型是比基于划分粒计算模型更广的 图像分割算法,成功设计出纹理图像的分割算法 一种粒计算模型,是广义粗糙集理论模型的一种特 5.2海量数据挖掘 例.这2个模型都是通过某种二元关系(等价关系或 随着计算机及网络的日益普及,丰富的数据与 非等价关系)产生邻域,再通过Zooming-in和Zoo~ 贫乏的知识问题日见突出.不同领域的人们都期待 ming out2个算子(或其他类似的算子)来实现不同 着从这些数据中得到自己的答案,将信息变为知识, 粒层上粒子之间的相互转化.基于容差关系的粒计 数据挖掘就是从大型数据库或数据仓库中储存的大 算模型和基于相容关系的粒计算模型实质是同一个 量的、不完整的、有噪声的数据中发现潜在的、有价 模型,都是基于自反和对称的二元关系,只是各自的 值的、有趣知识的过程.面对海量数据处理,人们提 侧重点不同.基于概念格的粒计算模型是一种层次 出了各式各样的挖掘方法.粒计算方法凭借自身的 结构模型,它的粒子之间通过包含关系形成偏序关 优势在数据挖掘中显示出较大的优势 系,构成一个完备格.在知识系统中,概念信息粒和 基于模糊集的词计算模型是较早提出的粒计算 概念知识粒之间的相互转化为概念的形成奠定了基 模型,在数据挖掘中有非常成功的应用.模糊集在数 础,也为概念知识的获取提供了方法.而结合神经网 据挖掘中应用最多的是聚类分析.聚类分析是通过 络形成的神经网络粒计算模型在知识获取方面表现 相似性将用户或数据记录进行分组,从而获得相应 出较大的优势9.0] 的规则.与分类不同,聚类是一种无导师的学习,它 将论域中的所有对象划分为簇,同一簇中的对象具 5 粒计算的应用研究 有很高的相似性,不同簇中的对象则很不相似,即差 粒计算方法的应用越来越广泛,己经渗透到自 异很大4].将模糊集引入聚类分析的思想,是首先 然科学和社会科学的很多领域.这里作一个简单的 由Bellman、Kalaba和Zadeh等人于1966年提出 介绍 的,后来有许多研究者对模糊聚类进行了研究,提出 5.1图形图像处理 了基于摄动的模糊聚类方法等新的模糊聚类算法 图像分割是图像分析和处理技术的重要手段, 近年来聚类方法层出不穷,文献[48]从信息粒度的 是模式识别、图像处理、计算机视觉等领域的一个基 角度剖析了聚类和分类技术,试图使用信息粒度原 础环节.一个图像分析系统是否成功,很大程度上依 理的框架来统一聚类和分类.从信息粒度的观点来 赖于分割的质量31,1.随着数学理论特别是应用数 看,聚类是在一个统一的粒度下进行计算,而分类却 学理论的发展,人们借助新的数学理论,对图像分割 是在不同的粒度下进行计算 问题进行研究,并提出了图像分割的许多方法.基于 粗糙集理论是一种研究不完整、不确定知识和 粗糙集的粒计算方法在适当降低精确度为代价的条 数据的表达、学习、归纳的理论方法.由于它是建立 件下可以解决这一问题.Zadeh提出了模糊信息粒 在分类机制基础之上的方法,因而它在数据挖掘分 理论研究的一般框架后,Pedrycz等人s1深入研究 类问题中的应用很多.粗糙集理论在分类问题中的 了信息粒间的结合问题,并结合数字化图像可粒化 应用大致可以分为2类2):一是利用粗糙集理论的 的特点,讨论了利用图像的内容信息和空间信息进 属性约简、值约简及核属性,直接从数据表中获取分 行粒化的问题.后来,Hirota和Pedrycz6]用模糊 类规则:二是将粗糙集理论与其他方法结合起来进 关系来描述一幅静态灰度图像,提出了基于模糊关 行分类22.124 系计算的图像压缩方法,将模糊信息粒化思想运用 商空间理论是研究不同粒度世界的数学工具, 到图像压缩领域.Nobuhara等人I提出了一种求 在面对数据仓库中海量数据挖掘时,可以针对要处 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.htp://www.cnki.net势 ,将形成更加有效的粒计算方法和理论. 目前 ,模 糊粗糙集 ,粗糙模糊集和模糊商空间对于处理复杂 问题都表现出比单一模型更好的优势 ,得到较好的 发展. 但如何将粗糙集与商空间有效地结合起来 ,还 没有进一步的研究成果. 基于划分的粒计算模型是粗糙集理论模型的一 种特例. 它将概念知识分为内涵和外延 ,在外延上利 用集合论上的交并等运算来合成粒子或分解粒子 , 在内涵上采用属性的多少来控制粒子的大小. 基于 覆盖的粒计算模型是比基于划分粒计算模型更广的 一种粒计算模型 ,是广义粗糙集理论模型的一种特 例. 这 2 个模型都是通过某种二元关系(等价关系或 非等价关系) 产生邻域 ,再通过 Zooming2in 和 Zoo2 ming2out 2 个算子(或其他类似的算子) 来实现不同 粒层上粒子之间的相互转化. 基于容差关系的粒计 算模型和基于相容关系的粒计算模型实质是同一个 模型 ,都是基于自反和对称的二元关系 ,只是各自的 侧重点不同. 基于概念格的粒计算模型是一种层次 结构模型 ,它的粒子之间通过包含关系形成偏序关 系 ,构成一个完备格. 在知识系统中 ,概念信息粒和 概念知识粒之间的相互转化为概念的形成奠定了基 础 ,也为概念知识的获取提供了方法. 而结合神经网 络形成的神经网络粒计算模型在知识获取方面表现 出较大的优势[49 - 50 ] . 5 粒计算的应用研究 粒计算方法的应用越来越广泛 ,已经渗透到自 然科学和社会科学的很多领域. 这里作一个简单的 介绍. 511 图形图像处理 图像分割是图像分析和处理技术的重要手段 , 是模式识别、图像处理、计算机视觉等领域的一个基 础环节. 一个图像分析系统是否成功 ,很大程度上依 赖于分割的质量[ 31 ,114 ] . 随着数学理论特别是应用数 学理论的发展 ,人们借助新的数学理论 ,对图像分割 问题进行研究 ,并提出了图像分割的许多方法. 基于 粗糙集的粒计算方法在适当降低精确度为代价的条 件下可以解决这一问题. Zadeh 提出了模糊信息粒 理论研究的一般框架后 ,Pedrycz 等人[115 ] 深入研究 了信息粒间的结合问题 ,并结合数字化图像可粒化 的特点 ,讨论了利用图像的内容信息和空间信息进 行粒化的问题. 后来 , Hirota 和 Pedrycz [116 ] 用模糊 关系来描述一幅静态灰度图像 ,提出了基于模糊关 系计算的图像压缩方法 ,将模糊信息粒化思想运用 到图像压缩领域. Nobuhara 等人[ 117 ] 提出了一种求 解模糊关系方程最大解的快速方法 ,减少了图像重 构的运算量. 修保新等人[118 - 119 ] 给出了基于模糊信 息粒化思想的图像边缘检测方法 ,并在基于图像模 糊粒化思想进行图像插值的基础上 ,提出了具体的 基于图像模糊粒化结构的插值方法. 刘仁金等 人[31 ,114 ,120 ]通过对粒度概念及粗糙集、模糊集等粒 计算理论的比较研究以及对图像分割概念分析及对 现有的图像分割方法系统分析 ,提出了图像分割中 的商空间粒度原理和基于粒度合成技术原理的纹理 图像分割算法 ,成功设计出纹理图像的分割算法. 512 海量数据挖掘 随着计算机及网络的日益普及 ,丰富的数据与 贫乏的知识问题日见突出. 不同领域的人们都期待 着从这些数据中得到自己的答案 ,将信息变为知识. 数据挖掘就是从大型数据库或数据仓库中储存的大 量的、不完整的、有噪声的数据中发现潜在的、有价 值的、有趣知识的过程. 面对海量数据处理 ,人们提 出了各式各样的挖掘方法. 粒计算方法凭借自身的 优势在数据挖掘中显示出较大的优势. 基于模糊集的词计算模型是较早提出的粒计算 模型 ,在数据挖掘中有非常成功的应用. 模糊集在数 据挖掘中应用最多的是聚类分析. 聚类分析是通过 相似性将用户或数据记录进行分组 ,从而获得相应 的规则. 与分类不同 ,聚类是一种无导师的学习 ,它 将论域中的所有对象划分为簇 ,同一簇中的对象具 有很高的相似性 ,不同簇中的对象则很不相似 ,即差 异很大[ 48 ] . 将模糊集引入聚类分析的思想 ,是首先 由 Bellman、Kalaba 和 Zadeh 等人于 1966 年提出 的 ,后来有许多研究者对模糊聚类进行了研究 ,提出 了基于摄动的模糊聚类方法等新的模糊聚类算法. 近年来聚类方法层出不穷 ,文献[ 48 ]从信息粒度的 角度剖析了聚类和分类技术 ,试图使用信息粒度原 理的框架来统一聚类和分类. 从信息粒度的观点来 看 ,聚类是在一个统一的粒度下进行计算 ,而分类却 是在不同的粒度下进行计算. 粗糙集理论是一种研究不完整、不确定知识和 数据的表达、学习、归纳的理论方法. 由于它是建立 在分类机制基础之上的方法 ,因而它在数据挖掘分 类问题中的应用很多. 粗糙集理论在分类问题中的 应用大致可以分为 2 类[121 ] :一是利用粗糙集理论的 属性约简、值约简及核属性 ,直接从数据表中获取分 类规则 ;二是将粗糙集理论与其他方法结合起来进 行分类[ 122 - 124 ] . 商空间理论是研究不同粒度世界的数学工具. 在面对数据仓库中海量数据挖掘时 ,可以针对要处 第 6 期 王国胤 ,等 :粒计算研究综述 · 71 · © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net