践的是粗糙集。其领军人物 Polkowski 和 Skowron[4] 在

正在加载图片...

·890· 智能系统学报第12卷践的是粗糙集。其领军人物Polkowski和Skowron 仍然是人工智能的瓶颈，特征要靠专家的经验来提在1989发表的《粗糙集与知识发现》一文引领了取，这就必须限定识别空间的维数。在高维度数据第十届国际人工智能大会上所提出的KDD(数据库面前，如何降低维度是最大的关键。于是，粗糙集知识发现)的新潮流。粗糙集用属性所构建的信息的属性约简方法被人们视为新的希望。出现了大量系统来描写事物，用各种细化的熵指标来实现信息应用属性约简来提取特征的研究。尤其是支持的标度，为数据知识挖掘提供了理论基础。相比之向量机与属性约简相结合，更使人注目。遗憾的下，Wlle的形式概念分析就没有那么明确的实际背是，这个时期不太长久，属性约简目前已经减弱景。他的理论是在被埋没了12年之后，才被人们发了。因为属性约简要用到一个概念工具，叫做区分现的。他的《形式概念分析》一书围绕概念格提取矩阵（或差异矩阵）。正是由于这个概念的奇特性这一主题而展开，数学严谨。集合论向世人强调了影响了事态发展。为了说明这件事情，需要回顾一任何概念的外延都是一个集合。但若反过来问：任下有关定义。何集合都一定是概念的外延吗？就不好回答了。 Wille明确地回答：No!他第一次明确地从数学上提 1粗糙集信息系统出了内涵与外延之间的对合性条件，只有满足对合在粗糙集中，一个信息系统（或称知识表达系性的集合和属性对才能形成概念。这是他的重要贡统)被描述成一个四元组S=-(U,A,V,,其中U是对献。在这一点上粗糙集的用词就显得太粗糙了。它象的非空集合，A是属性名的集合，V是属性值的集把由任一映射所形成的划分都叫做知识，那么，任合，∫是从对象x就着属性A向∥所作的映射。为一集合都可以由其特征函数形成一个划分。由此可了便于理解，我们对以下所引用的定义符号都略有推得：任一集合必是某概念的外延，这就与Wille的改变。理论产生了矛盾。人工智能要运用概念进行识别与定义1)矩阵D={a(x,y(x,y∈U叫做S上搜索，内涵是我们识别事物的依据，外延是我们实的一个区分矩阵(discernibility matrix),其中现搜寻的结果，如果内涵与外延不相一致，那么人 a(x,y)={a∈Alf(x,a≠fy,a) (1) 工智能就不具备实践的前提。这不能不说是粗糙集这个定义的奇特之处在于矩阵中的元素在用词上的一个疏忽。 (x,y)不是实数，不是区间，不是向量，而是属性名在对属性的称呼上也存在着矛盾。例如，颜色的集合。由D还派生出另外一个概念，叫做区分函有红、黄、蓝…之分，是把颜色叫做一个属性，还数。对每一个属性名α指定一个布尔变量，仍记作是把红、黄、蓝等都叫做属性？属性的英文是At a,若存在属性名将对象x与y分开，则对a(y)指定 tribute。Wille曾以科教片《生物与水》为例来区一个布尔变量，用Va(x,y)=V{a∈Alfx,a)≠fGy,a)川分说：鱼和水草都是“在水中生活”而狗和豆却是“在来表示，记作∑a(x,y),若不存在将对象x与y分开陆地上生活”。他把“在水中生活”与“在陆地上生的属性名，则对α(x,y)指定布尔变量“1”（对A与Π的活”这两个词视为两个不同的attribute。可见，At 叙述亦类似)。 tribute是指属性的状态，而不是指生物栖性”这一定义2四区分函数△的定义为属性名称。但是，粗糙集则把汽车按颜色、车长、车重、马力、里程等属性来分类，在那里，Attribute指 a=几lwn(Lax) (2) 的是颜色、车长、车重，它们都是属性的名称而不是在这里设A仁{a1,a2,,am},这里便设置了m个属性值。这两种不同的用法一直被国人懵懂地引布尔变量。于是a(x,y)={a:∈Af(x,a)≠fGy,a)} 用着。细心的学者把Wile的Attribute译成属性值便被指定成括号中所包含的布尔变量的析取，设那而把粗糙集中的Attribute译成属性名，这是十分明几个变量是a,a2,·,aw,所指定的这个布尔变量智的。便具有布尔表达式auVa2…Vaw=V{au,a2,…,ae, 以上矛盾并没有影响粗糙集与形式概念的融记作∑a(x,y)=V{au,a2,…,a}。由于这个布尔表合，二者求同存异，彼此互补，都得到了良好的发达式中只含析取运算，叫做析取式。而在式(2)中，展s-6。Wile的形式背景表以属性值来分列，而粗由于△是由布尔变量先组成析取式而后再进行合糙集的信息系统表以属性名来分列，前者的应用效取，这种表达形式叫做合取范式。布尔代数中有方率是比不上后者的。所以，粗糙集在应用邻域一直法把△从合取范式改写为析取范式，意思是把析取先行。在跨世纪的年代里，粗糙集在属性约简方面与合取的运算次序颠倒一下。△=∑Πetx(a(x,》度在机器学习的应用邻域走红，当时，特征提取就叫做析取范式。再把析取的这些析取式一一甄践的是粗糙集。其领军人物 Polkowski 和 Skowron[4] 在 1989 发表的《粗糙集与知识发现》一文引领了第十届国际人工智能大会上所提出的 KDD(数据库知识发现) 的新潮流。粗糙集用属性所构建的信息系统来描写事物，用各种细化的熵指标来实现信息的标度，为数据知识挖掘提供了理论基础。相比之下，Wille 的形式概念分析就没有那么明确的实际背景。他的理论是在被埋没了 12 年之后，才被人们发现的。他的《形式概念分析》一书围绕概念格提取这一主题而展开，数学严谨。集合论向世人强调了任何概念的外延都是一个集合。但若反过来问：任何集合都一定是概念的外延吗？就不好回答了。 Wille 明确地回答：No！他第一次明确地从数学上提出了内涵与外延之间的对合性条件，只有满足对合性的集合和属性对才能形成概念。这是他的重要贡献。在这一点上粗糙集的用词就显得太粗糙了。它把由任一映射所形成的划分都叫做知识，那么，任一集合都可以由其特征函数形成一个划分。由此可推得：任一集合必是某概念的外延，这就与 Wille 的理论产生了矛盾。人工智能要运用概念进行识别与搜索，内涵是我们识别事物的依据，外延是我们实现搜寻的结果，如果内涵与外延不相一致，那么人工智能就不具备实践的前提。这不能不说是粗糙集在用词上的一个疏忽。 ······ 在对属性的称呼上也存在着矛盾。例如，颜色有红、黄、蓝之分，是把颜色叫做一个属性，还是把红、黄、蓝等都叫做属性？属性的英文是 Attribute。Wille 曾以科教片《生物与水》为例来区分说：鱼和水草都是“在水中生活”而狗和豆却是“在陆地上生活”。他把“在水中生活”与“在陆地上生活”这两个词视为两个不同的 attribute[16]。可见，Attribute 是指属性的状态，而不是指“生物栖性”这一属性名称。但是，粗糙集则把汽车按颜色、车长、车重、马力、里程等属性来分类，在那里，Attribute 指的是颜色、车长、车重，它们都是属性的名称而不是属性值[15]。这两种不同的用法一直被国人懵懂地引用着。细心的学者把 Wille 的 Attribute 译成属性值而把粗糙集中的 Attribute 译成属性名，这是十分明智的。以上矛盾并没有影响粗糙集与形式概念的融合，二者求同存异，彼此互补，都得到了良好的发展 [5-6]。Wille 的形式背景表以属性值来分列，而粗糙集的信息系统表以属性名来分列，前者的应用效率是比不上后者的。所以，粗糙集在应用邻域一直先行。在跨世纪的年代里，粗糙集在属性约简方面一度在机器学习的应用邻域走红，当时，特征提取仍然是人工智能的瓶颈，特征要靠专家的经验来提取，这就必须限定识别空间的维数。在高维度数据面前，如何降低维度是最大的关键。于是，粗糙集的属性约简方法被人们视为新的希望。出现了大量应用属性约简来提取特征的研究[7-9]。尤其是支持向量机与属性约简相结合[10] ，更使人注目。遗憾的是，这个时期不太长久，属性约简目前已经减弱了。因为属性约简要用到一个概念工具，叫做区分矩阵（或差异矩阵）。正是由于这个概念的奇特性影响了事态发展。为了说明这件事情，需要回顾一下有关定义。 1 粗糙集信息系统在粗糙集中，一个信息系统（或称知识表达系统）被描述成一个四元组 S=(U, A, V, f)，其中 U 是对象的非空集合，A 是属性名的集合，V 是属性值的集合，f 是从对象 x 就着属性 A 向 V 所作的映射。为了便于理解，我们对以下所引用的定义符号都略有改变。定义 1 D = {α(x, y)}(x, y ∈ U) [11] 矩阵叫做 S 上的一个区分矩阵（discernibility matrix），其中 α(x, y) = {a ∈ A| f(x,a) , f(y,a)} (1) α(x, y) α(x, y) ∨α(x, y) = ∨{a ∈ A| f(x,a) , f(y,a)} ∑ α(x, y) α(x, y) 这个定义的奇特之处在于矩阵中的元素不是实数，不是区间，不是向量，而是属性名的集合。由 D 还派生出另外一个概念，叫做区分函数。对每一个属性名 a 指定一个布尔变量，仍记作 a，若存在属性名将对象 x 与 y 分开，则对指定一个布尔变量，用来表示，记作，若不存在将对象 x 与 y 分开的属性名，则对指定布尔变量“1”(对∧与∏的叙述亦类似) [12]。定义 2 [11] 区分函数∆的定义为 ∆ =∏ (x,y∈U×U) (∑ α(x, y) ) (2) ··· α(x, y) = {ai ∈ A| f(x,ai) , f(y,ai)} a(1) ,a(2) ,··· ,a(k) a(1) ∨a(2) ··· ∨a(k) = ∨ { a(1) ,a(2) ,··· ,a(k) } ∑ α(x, y) = ∨ { a(1) ,a(2) ,··· ,a(k) } ∆ = ∑∏ (x,y∈U×U) (α(x, y)) 在这里设 A={a1 , a2 , , am}，这里便设置了 m 个布尔变量。于是便被指定成括号中所包含的布尔变量的析取，设那几个变量是 , 所指定的这个布尔变量便具有布尔表达式，记作。由于这个布尔表达式中只含析取运算，叫做析取式。而在式（2）中，由于∆是由布尔变量先组成析取式而后再进行合取，这种表达形式叫做合取范式。布尔代数中有方法把∆从合取范式改写为析取范式，意思是把析取与合取的运算次序颠倒一下。就叫做析取范式。再把析取的这些析取式一一甄 ·890· 智能系统学报第 12 卷

<<向上翻页向下翻页>>

点击下载：【人工智能基础】因素空间中属性约简的区分函数