正在加载图片...
·890· 智能系统学报 第12卷 践的是粗糙集。其领军人物Polkowski和Skowron 仍然是人工智能的瓶颈,特征要靠专家的经验来提 在1989发表的《粗糙集与知识发现》一文引领了 取,这就必须限定识别空间的维数。在高维度数据 第十届国际人工智能大会上所提出的KDD(数据库 面前,如何降低维度是最大的关键。于是,粗糙集 知识发现)的新潮流。粗糙集用属性所构建的信息 的属性约简方法被人们视为新的希望。出现了大量 系统来描写事物,用各种细化的熵指标来实现信息 应用属性约简来提取特征的研究。尤其是支持 的标度,为数据知识挖掘提供了理论基础。相比之 向量机与属性约简相结合,更使人注目。遗憾的 下,Wlle的形式概念分析就没有那么明确的实际背 是,这个时期不太长久,属性约简目前已经减弱 景。他的理论是在被埋没了12年之后,才被人们发 了。因为属性约简要用到一个概念工具,叫做区分 现的。他的《形式概念分析》一书围绕概念格提取 矩阵(或差异矩阵)。正是由于这个概念的奇特性 这一主题而展开,数学严谨。集合论向世人强调了 影响了事态发展。为了说明这件事情,需要回顾一 任何概念的外延都是一个集合。但若反过来问:任 下有关定义。 何集合都一定是概念的外延吗?就不好回答了。 Wille明确地回答:No!他第一次明确地从数学上提 1粗糙集信息系统 出了内涵与外延之间的对合性条件,只有满足对合 在粗糙集中,一个信息系统(或称知识表达系 性的集合和属性对才能形成概念。这是他的重要贡 统)被描述成一个四元组S=-(U,A,V,,其中U是对 献。在这一点上粗糙集的用词就显得太粗糙了。它 象的非空集合,A是属性名的集合,V是属性值的集 把由任一映射所形成的划分都叫做知识,那么,任 合,∫是从对象x就着属性A向∥所作的映射。为 一集合都可以由其特征函数形成一个划分。由此可 了便于理解,我们对以下所引用的定义符号都略有 推得:任一集合必是某概念的外延,这就与Wille的 改变。 理论产生了矛盾。人工智能要运用概念进行识别与 定义1)矩阵D={a(x,y(x,y∈U叫做S上 搜索,内涵是我们识别事物的依据,外延是我们实 的一个区分矩阵(discernibility matrix),其中 现搜寻的结果,如果内涵与外延不相一致,那么人 a(x,y)={a∈Alf(x,a≠fy,a) (1) 工智能就不具备实践的前提。这不能不说是粗糙集 这个定义的奇特之处在于矩阵中的元素 在用词上的一个疏忽。 (x,y)不是实数,不是区间,不是向量,而是属性名 在对属性的称呼上也存在着矛盾。例如,颜色 的集合。由D还派生出另外一个概念,叫做区分函 有红、黄、蓝…之分,是把颜色叫做一个属性,还 数。对每一个属性名α指定一个布尔变量,仍记作 是把红、黄、蓝等都叫做属性?属性的英文是At a,若存在属性名将对象x与y分开,则对a(y)指定 tribute。Wille曾以科教片《生物与水》为例来区 一个布尔变量,用Va(x,y)=V{a∈Alfx,a)≠fGy,a)川 分说:鱼和水草都是“在水中生活”而狗和豆却是“在 来表示,记作∑a(x,y),若不存在将对象x与y分开 陆地上生活”。他把“在水中生活”与“在陆地上生 的属性名,则对α(x,y)指定布尔变量“1”(对A与Π的 活”这两个词视为两个不同的attribute。可见,At 叙述亦类似)。 tribute是指属性的状态,而不是指生物栖性”这一 定义2四区分函数△的定义为 属性名称。但是,粗糙集则把汽车按颜色、车长、车 重、马力、里程等属性来分类,在那里,Attribute指 a=几lwn(Lax) (2) 的是颜色、车长、车重,它们都是属性的名称而不是 在这里设A仁{a1,a2,,am},这里便设置了m个 属性值。这两种不同的用法一直被国人懵懂地引 布尔变量。于是a(x,y)={a:∈Af(x,a)≠fGy,a)} 用着。细心的学者把Wile的Attribute译成属性值 便被指定成括号中所包含的布尔变量的析取,设那 而把粗糙集中的Attribute译成属性名,这是十分明 几个变量是a,a2,·,aw,所指定的这个布尔变量 智的。 便具有布尔表达式auVa2…Vaw=V{au,a2,…,ae, 以上矛盾并没有影响粗糙集与形式概念的融 记作∑a(x,y)=V{au,a2,…,a}。由于这个布尔表 合,二者求同存异,彼此互补,都得到了良好的发 达式中只含析取运算,叫做析取式。而在式(2)中, 展s-6。Wile的形式背景表以属性值来分列,而粗 由于△是由布尔变量先组成析取式而后再进行合 糙集的信息系统表以属性名来分列,前者的应用效 取,这种表达形式叫做合取范式。布尔代数中有方 率是比不上后者的。所以,粗糙集在应用邻域一直 法把△从合取范式改写为析取范式,意思是把析取 先行。在跨世纪的年代里,粗糙集在属性约简方面 与合取的运算次序颠倒一下。△=∑Πetx(a(x,》 度在机器学习的应用邻域走红,当时,特征提取 就叫做析取范式。再把析取的这些析取式一一甄践的是粗糙集。其领军人物 Polkowski 和 Skowron[4] 在 1989 发表的《粗糙集与知识发现》一文引领了 第十届国际人工智能大会上所提出的 KDD(数据库 知识发现) 的新潮流。粗糙集用属性所构建的信息 系统来描写事物,用各种细化的熵指标来实现信息 的标度,为数据知识挖掘提供了理论基础。相比之 下,Wille 的形式概念分析就没有那么明确的实际背 景。他的理论是在被埋没了 12 年之后,才被人们发 现的。他的《形式概念分析》一书围绕概念格提取 这一主题而展开,数学严谨。集合论向世人强调了 任何概念的外延都是一个集合。但若反过来问:任 何集合都一定是概念的外延吗?就不好回答了。 Wille 明确地回答:No!他第一次明确地从数学上提 出了内涵与外延之间的对合性条件,只有满足对合 性的集合和属性对才能形成概念。这是他的重要贡 献。在这一点上粗糙集的用词就显得太粗糙了。它 把由任一映射所形成的划分都叫做知识,那么,任 一集合都可以由其特征函数形成一个划分。由此可 推得:任一集合必是某概念的外延,这就与 Wille 的 理论产生了矛盾。人工智能要运用概念进行识别与 搜索,内涵是我们识别事物的依据,外延是我们实 现搜寻的结果,如果内涵与外延不相一致,那么人 工智能就不具备实践的前提。这不能不说是粗糙集 在用词上的一个疏忽。 ······ 在对属性的称呼上也存在着矛盾。例如,颜色 有红、黄、蓝 之分,是把颜色叫做一个属性,还 是把红、黄、蓝等都叫做属性?属性的英文是 At￾tribute。Wille 曾以科教片《生物与水》为例来区 分说:鱼和水草都是“在水中生活”而狗和豆却是“在 陆地上生活”。他把“在水中生活”与“在陆地上生 活”这两个词视为两个不同的 attribute[16]。可见,At￾tribute 是指属性的状态,而不是指“生物栖性”这一 属性名称。但是,粗糙集则把汽车按颜色、车长、车 重、马力、里程等属性来分类,在那里,Attribute 指 的是颜色、车长、车重,它们都是属性的名称而不是 属性值[15]。这两种不同的用法一直被国人懵懂地引 用着。细心的学者把 Wille 的 Attribute 译成属性值 而把粗糙集中的 Attribute 译成属性名,这是十分明 智的。 以上矛盾并没有影响粗糙集与形式概念的融 合,二者求同存异,彼此互补,都得到了良好的发 展 [5-6]。Wille 的形式背景表以属性值来分列,而粗 糙集的信息系统表以属性名来分列,前者的应用效 率是比不上后者的。所以,粗糙集在应用邻域一直 先行。在跨世纪的年代里,粗糙集在属性约简方面 一度在机器学习的应用邻域走红,当时,特征提取 仍然是人工智能的瓶颈,特征要靠专家的经验来提 取,这就必须限定识别空间的维数。在高维度数据 面前,如何降低维度是最大的关键。于是,粗糙集 的属性约简方法被人们视为新的希望。出现了大量 应用属性约简来提取特征的研究[7-9]。尤其是支持 向量机与属性约简相结合[10] ,更使人注目。遗憾的 是,这个时期不太长久,属性约简目前已经减弱 了。因为属性约简要用到一个概念工具,叫做区分 矩阵(或差异矩阵)。正是由于这个概念的奇特性 影响了事态发展。为了说明这件事情,需要回顾一 下有关定义。 1 粗糙集信息系统 在粗糙集中,一个信息系统(或称知识表达系 统)被描述成一个四元组 S=(U, A, V, f),其中 U 是对 象的非空集合,A 是属性名的集合,V 是属性值的集 合,f 是从对象 x 就着属性 A 向 V 所作的映射。为 了便于理解,我们对以下所引用的定义符号都略有 改变。 定义 1 D = {α(x, y)}(x, y ∈ U) [11] 矩阵 叫做 S 上 的一个区分矩阵(discernibility matrix),其中 α(x, y) = {a ∈ A| f(x,a) , f(y,a)} (1) α(x, y) α(x, y) ∨α(x, y) = ∨{a ∈ A| f(x,a) , f(y,a)} ∑ α(x, y) α(x, y) 这个定义的奇特之处在于矩阵中的元素 不是实数,不是区间,不是向量,而是属性名 的集合。由 D 还派生出另外一个概念,叫做区分函 数。对每一个属性名 a 指定一个布尔变量,仍记作 a,若存在属性名将对象 x 与 y 分开,则对 指定 一个布尔变量,用 来表示,记作 ,若不存在将对象 x 与 y 分开 的属性名,则对 指定布尔变量“1”(对∧与∏的 叙述亦类似) [12]。 定义 2 [11] 区分函数∆的定义为 ∆ =∏ (x,y∈U×U) (∑ α(x, y) ) (2) ··· α(x, y) = {ai ∈ A| f(x,ai) , f(y,ai)} a(1) ,a(2) ,··· ,a(k) a(1) ∨a(2) ··· ∨a(k) = ∨ { a(1) ,a(2) ,··· ,a(k) } ∑ α(x, y) = ∨ { a(1) ,a(2) ,··· ,a(k) } ∆ = ∑∏ (x,y∈U×U) (α(x, y)) 在这里设 A={a1 , a2 , , am},这里便设置了 m 个 布尔变量。于是 便被指定成括号中所包含的布尔变量的析取,设那 几个变量是 , 所指定的这个布尔变量 便具有布尔表达式 , 记作 。由于这个布尔表 达式中只含析取运算,叫做析取式。而在式(2)中, 由于∆是由布尔变量先组成析取式而后再进行合 取,这种表达形式叫做合取范式。布尔代数中有方 法把∆从合取范式改写为析取范式,意思是把析取 与合取的运算次序颠倒一下。 就叫做析取范式。再把析取的这些析取式一一甄 ·890· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有