第10卷第2期 智能系统学报 Vol.10 No.2 2015年4月 CAAI Transactions on Intelligent Systems Apr.2015 D0:10.3969/j.issn.1673-4785.201312008 网络出版地址:http://www.enki..net/kcms/detail/23.1538.TP.20150317.1025.003.html 采用粒计算的属性权重确定方法 周丹晨 (中国工程物理研究院机械制造工艺研究所,四川绵阳621900) 摘要:针对属性值为连续值且无单一决策属性的多属性决策问题,通过宏观和微观的粒计算理论模型的对比分 析,提出了一种融合模糊商空间理论和粗糙集理论的属性权重确定方法。首先通过应用模糊商空间理论构建具有 分层递阶结构的商空间族,将一系列粒度商空间的样本聚类结果作为相应粒度空间下单一决策属性的分类,然后采 用粗糙集理论计算得出所有商空间下各个属性的重要度,综合不同粗细粒度商空间下的属性重要度大小确定了各 属性的客观权重。应用实例验证了该方法的合理性、有效性和实用性。 关键词:属性权重:粒计算:模糊商空间:粗糙集;多属性决策 中图分类号:TP18文献标志码:A文章编号:1673-4785(2015)02-023-08 中文引用格式:周丹晨.采用粒计算的属性权重确定方法[J].智能系统学报,2015,10(2):273-280. 英文引用格式:ZHOU Danchen.A method for ascertaining the weight of attributes based on granular computing[J].CAAI Trans- actions on Intelligent Systems,2015,10(2):273-280. A method for ascertaining the weight of attributes based on granular computing ZHOU Danchen (Institute of Machinery Manufacturing Technology,China Academy of Engineering Physics,Mianyang 621900,China) Abstract:Aiming at multi-attribute decision making problem without single decision attribute in which the attribute values are in the forms of continuous numbers,a method for ascertaining attributes weight based on fusion of fuzzy quotient spaces theory and rough sets theory is put forward through comparison and analysis of the macrocosmic and microcosmic theoretical models of granular computing.Firstly,the quotient space family with hierarchical structure was established by applying fuzzy quotient spaces theory.The sample clustering resulted in a series of granular quo- tient spaces were used as classification of single decision attribute in corresponding granular space.Furthermore, the significances of every attribute in all quotient spaces were calculated by applying rough sets theory.Finally,ob- jective attributes weight was ascertained by integrating the significances of every attribute in different granular quo- tient spaces.The application case showed that the proposed method is reasonable,effective and practical. Keywords:attributes weight;granular computing;fuzzy quotient space;rough set;multi-attribute decision making 科学合理地确定属性权重关系是多属性决策领 评价目的和决策者对不同属性的重视程度,能较好 域研究的核心问题,关系到决策结果的可靠性与正 地遵循重要性原则。 确性)。属性权重应能从宏观上体现决策目标,有 确定属性权重的方法有主观赋权法、客观赋权 效地反映各属性对目标的影响程度,体现决策者的 法和主客观相结合的赋权方法。客观赋权法基于决 策矩阵信息,从问题数据人手,通过建立一定的数学 收稿日期:2013-12-09.网络出版日期:2015-03-17. 模型计算出权重系数,从而减少了决策者的主观因 基金项目:中国工程物理研究院科学技术发展基金资助项目 (2013B0203031). 素,具有较强的科学性。针对采用连续值、区间数、 通信作者:周丹晨.E-mail:zc69@163.com 模糊数、序数等数值形式定量表达的属性值,或者用
第 10 卷第 2 期 智 能 系 统 学 报 Vol.10 №.2 2015 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2015 DOI:10.3969 / j.issn.1673⁃4785.201312008 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20150317.1025.003.html 采用粒计算的属性权重确定方法 周丹晨 (中国工程物理研究院 机械制造工艺研究所, 四川 绵阳 621900) 摘 要:针对属性值为连续值且无单一决策属性的多属性决策问题,通过宏观和微观的粒计算理论模型的对比分 析,提出了一种融合模糊商空间理论和粗糙集理论的属性权重确定方法。 首先通过应用模糊商空间理论构建具有 分层递阶结构的商空间族,将一系列粒度商空间的样本聚类结果作为相应粒度空间下单一决策属性的分类,然后采 用粗糙集理论计算得出所有商空间下各个属性的重要度,综合不同粗细粒度商空间下的属性重要度大小确定了各 属性的客观权重。 应用实例验证了该方法的合理性、有效性和实用性。 关键词:属性权重;粒计算;模糊商空间;粗糙集;多属性决策 中图分类号:TP18 文献标志码:A 文章编号:1673⁃4785(2015)02⁃023⁃08 中文引用格式:周丹晨. 采用粒计算的属性权重确定方法[J]. 智能系统学报, 2015, 10(2): 273⁃280. 英文引用格式:ZHOU Danchen. A method for ascertaining the weight of attributes based on granular computing[J]. CAAI Trans⁃ actions on Intelligent Systems, 2015, 10(2): 273⁃280. A method for ascertaining the weight of attributes based on granular computing ZHOU Danchen (Institute of Machinery Manufacturing Technology, China Academy of Engineering Physics, Mianyang 621900, China) Abstract:Aiming at multi⁃attribute decision making problem without single decision attribute in which the attribute values are in the forms of continuous numbers, a method for ascertaining attributes weight based on fusion of fuzzy quotient spaces theory and rough sets theory is put forward through comparison and analysis of the macrocosmic and microcosmic theoretical models of granular computing. Firstly, the quotient space family with hierarchical structure was established by applying fuzzy quotient spaces theory. The sample clustering resulted in a series of granular quo⁃ tient spaces were used as classification of single decision attribute in corresponding granular space. Furthermore, the significances of every attribute in all quotient spaces were calculated by applying rough sets theory. Finally, ob⁃ jective attributes weight was ascertained by integrating the significances of every attribute in different granular quo⁃ tient spaces. The application case showed that the proposed method is reasonable, effective and practical. Keywords:attributes weight; granular computing; fuzzy quotient space; rough set; multi⁃attribute decision making 收稿日期:2013⁃12⁃09. 网络出版日期:2015⁃03⁃17. 基金项 目: 中 国 工 程 物 理 研 究 院 科 学 技 术 发 展 基 金 资 助 项 目 (2013B0203031). 通信作者:周丹晨. E⁃mail: zdc69@ 163.com. 科学合理地确定属性权重关系是多属性决策领 域研究的核心问题,关系到决策结果的可靠性与正 确性[1] 。 属性权重应能从宏观上体现决策目标,有 效地反映各属性对目标的影响程度,体现决策者的 评价目的和决策者对不同属性的重视程度,能较好 地遵循重要性原则。 确定属性权重的方法有主观赋权法、客观赋权 法和主客观相结合的赋权方法。 客观赋权法基于决 策矩阵信息,从问题数据入手,通过建立一定的数学 模型计算出权重系数,从而减少了决策者的主观因 素,具有较强的科学性。 针对采用连续值、区间数、 模糊数、序数等数值形式定量表达的属性值,或者用
·274. 智能系统学报 第10卷 语言形式定性描述的属性值,目前主要有主成分分 体构成一个完备半序格,从而为粒计算提供了一种 析法[]、离差最大化方法[34」、均方差法[s]、多目标 有力的数学模型和工具190]。模糊商空间理论能 规划法[6]、信息嫡法[8】、聚类分析法[】、粗糙集方 够更好地反映人类处理不确定问题的若干特点,即 法[o】、灰色关联分析方法[门等客观赋权法。 信息的确定与不确定、概念的清晰与模糊都是相对 对于没有任何先验信息,属性值为连续值且无 的,都与问题的粒度粗细有关。 单一决策属性的多属性决策问题,一些文献提出了 定义119】设X是论域,X上的一个模糊集A 基于模糊聚类和粗糙集的客观赋权法[5)。其核 是指Hx∈X,有一个指定的数u4∈[0,1],称为x 心是根据样本集的属性进行模糊聚类,以没有删除 对A的隶属程度,映射:u4:X一[0,1],x→u(x) 任何属性的分类为基准,把没有删除任何一个属性 称为A的隶属函数。令T(X)表示X上一切模糊子 视为一种知识分类,将删除各个属性后视为另一种 集的集合,则T(X)实际上是由u:X→[0,1]这个 知识分类,计算删除各属性后的分类相对于总的属 函数组成的函数空间。 性分类的正域,从而求得各个属性的重要程度,最后 定义2[19]设R∈T(X×X),若满足 利用归一化方法来确定各属性的权重。该方法没有 1)x∈X,R(x,x)=1, 客观信息的损失,具有一定的普遍性,但该方法存在 2)Vx,y E X,R(x,y)=R(y,x), 以下不足:即如果样本集有m个属性,则需要进行 3)Hx,y,z∈X,R(x,z)≥sup,(min(R(x,y), m+1次模糊聚类计算(其中包括计算量很大的模糊 R(y,z)), 相似度计算以及求出模糊等价矩阵的传递闭包计 则称R是X上的一个模糊等价关系。 算),因此当属性数量和样本数量较多时,该方法的 命题11]设R是X上的一个模糊等价关系, 计算过程比较繁琐,一定程度上影响了其实用性。 令R={(x,y)IR(x,y)≥入},0≤入≤1,则R,是 粒计算理论是目前人工智能研究领域的新热 X上的一个普通等价关系,称R,为R的截关系。令 点,其理论模型主要分为2类:1)以处理不确定性 等价关系R对应的商空间为X(入),可得到如下性 为主要目标,如以模糊集(也称词计算)理论和粗糙 质:若0≤入2≤A1≤1台R,>R,台X(A2)是 集理论为基础的模型:2)以多粒度计算为目标,如 X(入,)的商集。于是,商空间族{X(入)I0≤入≤ 商空间理论1618]。这2类模型的侧重点有所不 1}按照商集的包含关系构成一个有序链,称 同,前者侧重于计算对象的不确定性处理,因此重点 {X(入)10≤入≤1}为X上的一个分层递阶结构。 关注于含糊、不清晰概念的表达和近似推理:而后者 命题21】给定X上的一个模糊等价关系,则 的核心思想来源于人类问题求解的基本特征之一, 对应一个X上的分层递阶结构。 即从极不相同的粒度空间上观察和分析同一问题, 1.2 粗糙集理论 并很容易地从一个抽象的粒度空间转换到其他的粒 粗糙集理论是一种处理模糊性和不精确性问题 度空间,也就是分层次地处理问题的能力,因此更关 的数学工具212]。其本质思想是利用等价关系 注于如何从不同粗细粒度的问题空间,即从不同的 (不可分辨关系)建立论域的一个划分,得到不可区 层次得到对问题不同角度的理解,并最终综合成对 分的等价类,从而构建一个近似空间。在此近似空 问题总的理解。 间上,用精确的上近似集和下近似集来逼近一个边 本文基于2类粒计算理论模型的思想,同样针 界模糊的集合。 对属性值为连续值且无单一决策属性的多属性决策 定义32】给定一个信息系统S=(U,A,V, 问题,提出了一种融合模糊商空间理论和粗糙集理 力,其中U为研究对象的非空有限集合,称为论域: 论的客观赋权法,以期在现有研究的基础上,在保证 A为属性的非空有限集合,A=CUD,其中C为条 权重确定过程合理性的前提下,降低计算复杂度,进 件属性集,D为决策属性集:V是属性值的集合,V= 一步提高计算结果的准确性和方法的实用性。 UV。,'。是属性a的值域:f为信息函数,f:U×A→ V,它为每个对象的每个属性赋予信息值。对于每 1 粒计算理论基础 个子集XSU和一个等价关系R∈ind(S),称 1.1模糊商空间理论 R(X)=U{Y:∈U/RI YCX为X的R下近似集。 模糊商空间理论是将模糊集合论引入经典商空 定义421】条件属性集C与决策属性集D之 间理论,利用模糊等价关系将精确粒度下的商空间 间的依赖程度y(C,D)定义为 理论推广到模糊粒度计算中,且所有模糊商空间全 y(C,D)=POS(D)/U (1)
语言形式定性描述的属性值,目前主要有主成分分 析法[2] 、离差最大化方法[ 3 ⁃4 ] 、均方差法[ 5 ] 、多目标 规划法[ 6 ] 、信息熵法[ 7⁃8 ] 、聚类分析法[ 9 ] 、粗糙集方 法[ 10 ] 、灰色关联分析方法[ 11 ]等客观赋权法。 对于没有任何先验信息,属性值为连续值且无 单一决策属性的多属性决策问题,一些文献提出了 基于模糊聚类和粗糙集的客观赋权法[ 12 ⁃ 15 ] 。 其核 心是根据样本集的属性进行模糊聚类,以没有删除 任何属性的分类为基准,把没有删除任何一个属性 视为一种知识分类,将删除各个属性后视为另一种 知识分类,计算删除各属性后的分类相对于总的属 性分类的正域,从而求得各个属性的重要程度,最后 利用归一化方法来确定各属性的权重。 该方法没有 客观信息的损失,具有一定的普遍性,但该方法存在 以下不足:即如果样本集有 m 个属性,则需要进行 m+1 次模糊聚类计算(其中包括计算量很大的模糊 相似度计算以及求出模糊等价矩阵的传递闭包计 算),因此当属性数量和样本数量较多时,该方法的 计算过程比较繁琐,一定程度上影响了其实用性。 粒计算理论是目前人工智能研究领域的新热 点,其理论模型主要分为 2 类:1) 以处理不确定性 为主要目标,如以模糊集(也称词计算)理论和粗糙 集理论为基础的模型;2) 以多粒度计算为目标,如 商空间理论[ 1 6 ⁃ 1 8 ] 。 这 2 类模型的侧重点有所不 同,前者侧重于计算对象的不确定性处理,因此重点 关注于含糊、不清晰概念的表达和近似推理;而后者 的核心思想来源于人类问题求解的基本特征之一, 即从极不相同的粒度空间上观察和分析同一问题, 并很容易地从一个抽象的粒度空间转换到其他的粒 度空间,也就是分层次地处理问题的能力,因此更关 注于如何从不同粗细粒度的问题空间,即从不同的 层次得到对问题不同角度的理解,并最终综合成对 问题总的理解。 本文基于 2 类粒计算理论模型的思想,同样针 对属性值为连续值且无单一决策属性的多属性决策 问题,提出了一种融合模糊商空间理论和粗糙集理 论的客观赋权法,以期在现有研究的基础上,在保证 权重确定过程合理性的前提下,降低计算复杂度,进 一步提高计算结果的准确性和方法的实用性。 1 粒计算理论基础 1.1 模糊商空间理论 模糊商空间理论是将模糊集合论引入经典商空 间理论,利用模糊等价关系将精确粒度下的商空间 理论推广到模糊粒度计算中,且所有模糊商空间全 体构成一个完备半序格,从而为粒计算提供了一种 有力的数学模型和工具[ 1 9 ⁃ 20 ] 。 模糊商空间理论能 够更好地反映人类处理不确定问题的若干特点,即 信息的确定与不确定、概念的清晰与模糊都是相对 的,都与问题的粒度粗细有关。 定义 1 [ 1 9 ] 设 X 是论域,X 上的一个模糊集 A 是指 ∀x ∈ X, 有一个指定的数 μA ∈ [0,1], 称为 x 对 A 的隶属程度,映射: μA :X → [0,1],x → μA(x) 称为 A 的隶属函数。 令 T(X) 表示 X 上一切模糊子 集的集合,则 T(X) 实际上是由 μ:X → [0,1] 这个 函数组成的函数空间。 定义 2 [ 1 9 ] 设 R ∈ T(X × X), 若满足 1) ∀x ∈ X,R(x,x) = 1, 2) ∀x,y ∈ X,R(x,y) = R(y,x), 3) ∀x,y,z ∈ X, R(x,z) ≥ supy(min(R(x,y), R(y,z)), 则称 R 是 X 上的一个模糊等价关系。 命题 1 [ 1 9 ] 设 R 是 X 上的一个模糊等价关系, 令 Rλ = {(x,y) | R(x,y) ≥ λ},0 ≤ λ ≤1, 则 Rλ 是 X 上的一个普通等价关系,称 Rλ 为 R 的截关系。 令 等价关系 Rλ 对应的商空间为 X(λ), 可得到如下性 质:若 0 ≤ λ2 ≤ λ1 ≤ 1⇔Rλ1 > Rλ2⇔X(λ2 ) 是 X(λ1 ) 的商集。 于是,商空间族 {X(λ) | 0 ≤ λ ≤ 1} 按 照 商 集 的 包 含 关 系 构 成 一 个 有 序 链, 称 {X(λ) | 0 ≤ λ ≤ 1} 为 X 上的一个分层递阶结构。 命题 2 [ 1 9 ] 给定 X 上的一个模糊等价关系,则 对应一个 X 上的分层递阶结构。 1.2 粗糙集理论 粗糙集理论是一种处理模糊性和不精确性问题 的数学工具[ 21 ⁃ 22 ] 。 其本质思想是利用等价关系 (不可分辨关系)建立论域的一个划分,得到不可区 分的等价类,从而构建一个近似空间。 在此近似空 间上,用精确的上近似集和下近似集来逼近一个边 界模糊的集合。 定义 3 [ 21 ] 给定一个信息系统 S = 〈U,A,V, f〉, 其中 U 为研究对象的非空有限集合,称为论域; A 为属性的非空有限集合, A = C ∪ D, 其中 C 为条 件属性集,D 为决策属性集;V 是属性值的集合, V = ∪a∈A Va , Va 是属性 a 的值域;f 为信息函数, f:U × A→ V, 它为每个对象的每个属性赋予信息值。 对于每 个子集 X ⊆ U 和一个等价关系 R ∈ ind(S), 称 R_ (X) = ∪{Yi ∈U/ R | Yi ⊆X} 为 X 的 R 下近似集。 定义 4 [ 21 ] 条件属性集 C 与决策属性集 D 之 间的依赖程度 γ(C,D) 定义为 γ(C,D) = POSC(D) / U (1) ·274· 智 能 系 统 学 报 第 10 卷
第2期 周丹晨:采用粒计算的属性权重确定方法 ·275. 式中:POS(D)为C相对于D的正域: 统一起来,从多粒度、多层次所得到的属性重要度融 POSc(D)=,C(),其表示根据条件属性集C 合信息,使属性权重的确定过程更为全面客观,计算 能够被准确地分入由决策属性D所确定的分类元 结果也相对更为准确。 素的集合。|U川表示整个集合对象的个数。 2.2流程步骤 定义521)】设4,为条件属性集C中的一个条件 该方法的流程如图1所示。 属性(即ak∈C),属性a,关于D的重要度定义为 构建样本初始属性表 sig(ag,C,D)=y(C,D)-y(C-ag,D)(2) 属性规范化处理 式中:y(C-{a4},D)表示在C中缺少属性a后, 条件属性集对决策属性集的依赖程度。 建立样本集模糊相似矩阵 属性值离散化处理 2 融合模糊商空间和粗糙集理论的属 创建分层递阶的商空间族分析删除各属性后的等价类 性权重确定方法 计算不同粒度商空间下的属性重要度 2.1学术思想 可以看出,模糊商空间理论和粗糙集理论的共 综合得出各属性的最终重要度 同点是都认为概念粒子可以用子集来表示,不同粒 归一化方法求解各属性的权重 度下的粒子用不同大小的子集来描述,所有的粒子 都通过等价关系获得划分产生1)。但它们之间的 图1融合模糊商空间和粗糙集理论的属性权重确定流程 区别主要在于:粗糙集理论的研究对象是由一个多 Fig.1 Flow chart of ascertaining attributes weight 值属性集合描述的对象集合,但其论域是点集,各个 其计算步骤如下: 对象之间没有结构关系或拓扑关系:而模糊商空间 1)根据需要处理的样本对象属性(指标)项目, 理论是把商集作为描述不同粒度世界的数学模型, 设有待处理的n个样本的组成集合 其本质是分层递阶结构,是一种由粗到细、由表及里 来描述样本集的方法,因此利用模糊商空间理论可 X={x1,x2,…,x,…,xn},每个样本用m个指 以从大量的样本数据中建立一系列具有粒度层次结 标特征值向量表示:x={yay2,…,yk,…ym},这 样就可以构建一个样本初始属性表,如表1所示。 构的商空间(即对论域进行不同的划分),然后在各 表1样本初始属性表 商空间中获取相应的知识,从而实现从模糊信息粒 Table 1 Initial attributes of samples 结构到分层递阶结构再到具有粒度结构的知识的相 互转化。从这个意义上来说,模糊商空间理论可以 条件属性集 样本 看成是一种宏观的粒计算模型,而粗糙集理论可以 a 看成是一种微观的粒计算模型,即不同粒度均在同 yu y12 yuk yim 一个给定的商空间中进行划分,是无拓扑结构情况 X2 y21 y2 s■ y2 y2m 的商空间特例小 基于以上分析,本文所提出的融合模糊商空间 yu 2 yim 理论和粗糙集理论的属性权重确定方法的主要思想 是:首先根据样本集的属性值,通过应用模糊商空间 理论得到具有分层递阶结构的商空间族 2)由于样本初始属性表中各属性的量纲不同、 {X(入)10≤入≤1},并把一系列粒度商空间的样 取值范围不同和极性不同,因此必须首先采用线性 本聚类结果作为相应粒度空间下单一决策属性的分 比例变换法、极差变换法、比重变换法、向量标准化 类:然后在各个粒度商空间X(入)下,通过采用粗 法等方法,消除属性量纲和数量级的影响,并进行极 糙集理论的属性重要度计算方法得出该商空间下各 性转换,将属性值统一规范到固定的区间上,使得多 个属性的重要度值,即从不同粗细粒度的商空间来 个属性能够进行比较。 观察分析各个属性的重要程度,从而综合得出各属 3)并行的计算步骤,即一方面基于模糊商空间 性总的重要度:最终采用归一化方法来求解各属性 理论,为创建具有分层递阶结构的商空间族,需采用 的权重。这样通过将宏观和微观的粒计算理论模型 数量积法、相关系数法、夹角余弦法、最大最小法、算
式 中: POSC(D) 为 C 相 对 于 D 的 正 域: POSC(D) = ∪Y∈U/ D C_ (Y), 其表示根据条件属性集 C 能够被准确地分入由决策属性 D 所确定的分类元 素的集合。 U 表示整个集合对象的个数。 定义 5 [ 21 ] 设 ak为条件属性集 C 中的一个条件 属性(即 ak ∈ C ) ,属性 ak关于 D 的重要度定义为 sig(ak,C,D) = γ(C,D) - γ(C - {ak},D) (2) 式中: γ(C - {ak},D) 表示在 C 中缺少属性 ak后, 条件属性集对决策属性集的依赖程度。 2 融合模糊商空间和粗糙集理论的属 性权重确定方法 2.1 学术思想 可以看出,模糊商空间理论和粗糙集理论的共 同点是都认为概念粒子可以用子集来表示,不同粒 度下的粒子用不同大小的子集来描述,所有的粒子 都通过等价关系获得划分产生[ 1 7 ] 。 但它们之间的 区别主要在于:粗糙集理论的研究对象是由一个多 值属性集合描述的对象集合,但其论域是点集,各个 对象之间没有结构关系或拓扑关系;而模糊商空间 理论是把商集作为描述不同粒度世界的数学模型, 其本质是分层递阶结构,是一种由粗到细、由表及里 来描述样本集的方法,因此利用模糊商空间理论可 以从大量的样本数据中建立一系列具有粒度层次结 构的商空间(即对论域进行不同的划分),然后在各 商空间中获取相应的知识,从而实现从模糊信息粒 结构到分层递阶结构再到具有粒度结构的知识的相 互转化。 从这个意义上来说,模糊商空间理论可以 看成是一种宏观的粒计算模型,而粗糙集理论可以 看成是一种微观的粒计算模型,即不同粒度均在同 一个给定的商空间中进行划分,是无拓扑结构情况 的商空间特例[1 7 ] 。 基于以上分析,本文所提出的融合模糊商空间 理论和粗糙集理论的属性权重确定方法的主要思想 是:首先根据样本集的属性值,通过应用模糊商空间 理 论 得 到 具 有 分 层 递 阶 结 构 的 商 空 间 族 {X(λ) | 0 ≤λ ≤ 1}, 并把一系列粒度商空间的样 本聚类结果作为相应粒度空间下单一决策属性的分 类; 然后在各个粒度商空间 X(λ) 下,通过采用粗 糙集理论的属性重要度计算方法得出该商空间下各 个属性的重要度值,即从不同粗细粒度的商空间来 观察分析各个属性的重要程度,从而综合得出各属 性总的重要度;最终采用归一化方法来求解各属性 的权重。 这样通过将宏观和微观的粒计算理论模型 统一起来,从多粒度、多层次所得到的属性重要度融 合信息,使属性权重的确定过程更为全面客观,计算 结果也相对更为准确。 2.2 流程步骤 该方法的流程如图 1 所示。 图 1 融合模糊商空间和粗糙集理论的属性权重确定流程 Fig.1 Flow chart of ascertaining attributes weight 其计算步骤如下: 1)根据需要处理的样本对象属性(指标)项目, 设有待处理的 n 个样本的组成集合 X = {x1 ,x2 ,…,xi,…,xn }, 每个样本用 m 个指 标特征值向量表示: xi = {yi1 ,yi2 ,…,yik,…,yim }, 这 样就可以构建一个样本初始属性表,如表 1 所示。 表 1 样本初始属性表 Table 1 Initial attributes of samples 样本 条件属性集 a1 a2 … ak … am x1 y11 y12 … y1 k … y1 m x2 y21 y22 … y2 k … y2 m ︙ ︙ ︙ … ︙ … ︙ xi yi 1 yi 2 … yik … yim ︙ ︙ ︙ … ︙ … ︙ xn yn 1 yn 2 … ynk … ynm 2)由于样本初始属性表中各属性的量纲不同、 取值范围不同和极性不同,因此必须首先采用线性 比例变换法、极差变换法、比重变换法、向量标准化 法等方法,消除属性量纲和数量级的影响,并进行极 性转换,将属性值统一规范到固定的区间上,使得多 个属性能够进行比较。 3)并行的计算步骤,即一方面基于模糊商空间 理论,为创建具有分层递阶结构的商空间族,需采用 数量积法、相关系数法、夹角余弦法、最大最小法、算 第 2 期 周丹晨:采用粒计算的属性权重确定方法 ·275·
·276· 智能系统学报 第10卷 术平均最小法等方法根据规范化处理后的属性值计 化方法确定各属性的权重,如式(5)所示。 算样本x:与x之间的相似关系R(x:,x)= sig(ag,C,D) 0= 0≤,<1,i≠构建所有样本的模糊相似矩阵 1,i=j ∑sig(a4,C,D) =1 R=[r],由于g=T,所以R既是自反矩阵也是 3 应用算例 对称矩阵,如式(3)所示。 1 将上述提出的属性权重确定方法应用于某多品 种小批量制造企业加工中心操作工2012年工作绩 效综合评价,共选取15个操作人员样本,评价指标 ra 及其属性值如表2所示,其中除加班时间为成本型 R=[rg]nxn= 属性外,其余属性均为效益型属性。 Ta 表2某企业加工中心操作工工作绩效综合评价指标 Table 2 The performance evaluation index of machining ··T center operators in an enterprise (3) 生产产品按期 加工 加班 同时,由于粗糙集理论只能分析离散型属性值, 操作工总工时 工时率合格率完成率难度时间 因此需要对连续量属性值进行离散化处理。 编号 a2/9%a3/% a4/% as as 4)该步骤同样为并行的计算步骤,即一方面需 3681.0 99.6 100 98.70 高 294.5 根据得到的样本集模糊相似矩阵创建具有分层递阶 3135.6 96.5 99.65 100 较高 509.0 结构的商空间族,另一方面需根据离散化后的样本 1916.5 97.0 99.39 97.01 一般 277.1 属性表分析删除各个属性后的等价类U/ind(C- 4 4098.0 98.7 99.05 96.23 高 601.8 {a})o 传统的模糊聚类方法在建立模糊相似矩阵R 5 2076.9 98.1 99.96 97.92 较高 532.2 后,需要采用平方法求出R的传递闭包:R→R→ 3937.6 99.0 95.67 95.58 462.6 4194.3 98.92 711.9 (R2)2→…→R2=R,将R改造成模糊等价矩阵R 后才能得到聚类结果[3]。文献[24]证明了一个模 3456.4 98.4 99.78 98.31 346.7 9 4515.1 99.2 100 100 较 543.8 糊相似矩阵R和其模糊等价矩阵R所分别对应的 2365.6 100 97.53 100 132.2 分层递阶结构是相同的,从而省去了比较繁琐的传 2654.3 96.9 99.74 87.00 一般 259.7 递闭包计算,同时给出了基于模糊相似矩阵的分层 递阶结构聚类算法,由此就可以得到一个具有商集 X12 2975.2 87.0 100 99.61 高 387.3 包含关系的样本商空间族{X(入)10≤入≤1}。 3777.2 99.0 100 99.87 较高 474.2 不同的入取值将分别对应一个不同粒度的商空间, 14 4354.799.5 99.91 94.02 636.5 且入值越大,商空间的粒度就越细,样本聚类数也 x151306.995.3 99.9198.44 一般 375.7 就越多。 1)由于“加工难度”属性为定性指标,直接按照 5)以商空间族{X(入)10≤入≤1}所形成的 “高=100,较高=50,一般=0”的规则进行处理。对于 一系列粒度商空间的样本聚类结果作为相应粒度空 其余连续型属性值,采用式(6)所示的极差变换法进行 间下单一决策属性的分类,按照式(2)分别计算各 属性规范化处理,将每一个属性值统一于同一数值范 粒度商空间下各个属性的重要度。 围[0,100],规范化后的属性数据表如表3所示。 6)根据式(4)计算得出各属性最终重要度: sig(a.C.D)=sig(a.C.D) y法-min(y张) (4) 1=1 ×100,a4为效益型属性 gp=1 n 式中:9为商空间族{X(入)10≤入≤1}的个 maa)-min(a 数,sig((a4,C,D)为商空间X(入,)下属性a max(y法)-y i=1 的重要度。 y'= 一×100,a4为成本型属性 7)根据各个属性最终重要度的大小,采用归一 max(yt)-min(yt) 1= 4=
术平均最小法等方法根据规范化处理后的属性值计 算样 本 xi 与 xj 之 间 的 相 似 关 系 R(xi,xj) = 1,i = j 0 ≤ r { ij < 1,i ≠ j , 构建所有样本的模糊相似矩阵 R = [rij]n×n , 由于 rij = rji, 所以 R 既是自反矩阵也是 对称矩阵,如式(3)所示。 R = [rij]n×n = 1 ︙ ⋱ ri1 … 1 ︙ ︙ ⋱ rj1 … rji … 1 ︙ ︙ ︙ ⋱ rn1 … rni … rnj … 1 é ë ê ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú ú (3) 同时,由于粗糙集理论只能分析离散型属性值, 因此需要对连续量属性值进行离散化处理。 4)该步骤同样为并行的计算步骤,即一方面需 根据得到的样本集模糊相似矩阵创建具有分层递阶 结构的商空间族,另一方面需根据离散化后的样本 属性表分析删除各个属性后的等价类 U/ ind(C - {ak}) 。 传统的模糊聚类方法在建立模糊相似矩阵 R 后,需要采用平方法求出 R 的传递闭包:R→R 2 → (R 2 ) 2→…→R 2K = R ^ ,将 R 改造成模糊等价矩阵 R ^ 后才能得到聚类结果[ 23 ] 。 文献[24]证明了一个模 糊相似矩阵 R 和其模糊等价矩阵 R ^ 所分别对应的 分层递阶结构是相同的,从而省去了比较繁琐的传 递闭包计算,同时给出了基于模糊相似矩阵的分层 递阶结构聚类算法,由此就可以得到一个具有商集 包含关系的样本商空间族 {X(λ) | 0 ≤ λ ≤ 1} 。 不同的 λ 取值将分别对应一个不同粒度的商空间, 且 λ 值越大,商空间的粒度就越细,样本聚类数也 就越多。 5)以商空间族 {X(λ) | 0 ≤ λ ≤ 1} 所形成的 一系列粒度商空间的样本聚类结果作为相应粒度空 间下单一决策属性的分类,按照式(2)分别计算各 粒度商空间下各个属性的重要度。 6)根据式(4)计算得出各属性最终重要度: sig(ak,C,D) = 1 q ∑ q p = 1 sig X(λp ) (ak,C,D) (4) 式中:q 为商空间族 { X( λ) | 0 ≤ λ ≤ 1} 的个 数, sig X( λp ) ( ak,C,D) 为商空间 X( λp) 下属性 ak 的重要度。 7)根据各个属性最终重要度的大小,采用归一 化方法确定各属性的权重,如式(5)所示。 wak = sig(ak,C,D) ∑ m k = 1 sig(ak,C,D) (5) 3 应用算例 将上述提出的属性权重确定方法应用于某多品 种小批量制造企业加工中心操作工 2012 年工作绩 效综合评价,共选取 15 个操作人员样本,评价指标 及其属性值如表 2 所示,其中除加班时间为成本型 属性外,其余属性均为效益型属性。 表 2 某企业加工中心操作工工作绩效综合评价指标 Table 2 The performance evaluation index of machining center operators in an enterprise 操作工 编号 总工时 a1 生产 工时率 a2 / % 产品 合格率 a3 / % 按期 完成率 a4 / % 加工 难度 a5 加班 时间 a6 x1 3 681.0 99.6 100 98.70 高 294.5 x2 3 135.6 96.5 99.65 100 较高 509.0 x3 1 916.5 97.0 99.39 97.01 一般 277.1 x4 4 098.0 98.7 99.05 96.23 高 601.8 x5 2 076.9 98.1 99.96 97.92 较高 532.2 x6 3 937.6 99.0 95.67 95.58 高 462.6 x7 4 194.3 98.3 98.92 94.67 较高 711.9 x8 3 456.4 98.4 99.78 98.31 较高 346.7 x9 4 515.1 99.2 100 100 较高 543.8 x10 2 365.6 100 97.53 100 一般 132.2 x11 2 654.3 96.9 99.74 87.00 一般 259.7 x12 2 975.2 87.0 100 99.61 高 387.3 x13 3 777.2 99.0 100 99.87 较高 474.2 x14 4 354.7 99.5 99.91 94.02 高 636.5 x15 1 306.9 95.3 99.91 98.44 一般 375.7 1) 由于“加工难度”属性为定性指标,直接按照 “高=100,较高= 50,一般= 0”的规则进行处理。 对于 其余连续型属性值,采用式(6)所示的极差变换法进行 属性规范化处理,将每一个属性值统一于同一数值范 围 [0,100] , 规范化后的属性数据表如表 3 所示。 y′ik = yik - min( n i = 1 yik) max( n i = 1 yik) - min( n i = 1 yik) × 100,ak 为效益型属性 y′ik = max( n i = 1 yik) - yik max( n i = 1 yik) - min( n i = 1 yik) × 100,ak 为成本型属性 ì î í ï ï ï ï ï ï ï ï (6) ·276· 智 能 系 统 学 报 第 10 卷
第2期 周丹晨:采用粒计算的属性权重确定方法 .277. 表3规范化处理后的属性表 2)采用夹角余弦法计算每一个样本之间的相 Table 3 Attributes after normalization 似关系,其计算公式如式(7)所示,从而建立所有样 样本 d d4 d5 ds 本的模糊相似矩阵,如式(8)所示。 74 97 100 90100 72 92 100 50 35 19 86 77 0 5 k=1 87 0 78 1 100 19 rij=cos(xi,x)= X5 24 85 99 50 31 (yt)2×】 6 82 92 0 66 100 43 90 87 75 59 50 0 67 8 (7) 95 50 63 100 94 100 100 50 29 3)根据文献[24]给出的基于模糊相似矩阵的 33 100 8 100 0 100 分层递阶结构聚类算法,得到一个有序的样本商空 42 94 0 0 78 52 0 100 100 56 间族{X(入)10≤入≤1},不同粒度的商空间分别 13 100 99 50 41 对应不同的样本聚类结果,如表4所示。图2所示 x14 95 96 98 54 100 13 为与表4相对应的根据分层递阶结构绘制的样本聚 x15 0 64 98 88 0 58 类结构图。 R=[rg]15xis 1 0.962 0.8550.895 1 0.9630.9310.724 1 0.9430.975 0.9120.898 1 0.8750.7880.6020.9050.729 1 0.9080.924 0.7390.9640.882 0.830 1 0.9790.9830.9260.9260.9600.8120.917 1 (8) 0.9450.9790.8460.9500.9320.8160.9750.972 1 0.8190.8370.9440.6920.8230.7090.6940.8830.802 1 0.7750.7350.8650.6680.7640.5190.7050.8290.7470.766 1 0.8880.8750.7130.8370.8270.6940.7390.8490.8180.6260.567 1 0.9650.9940.8950.9420.9640.8090.9510.9900.9930.8450.7770.840 1 0.9450.9100.7080.9910.8870.8580.9710.9110.9410.6440.7100.808 0.929 1 0.8130.8870.9780.6840.9210.5080.6960.8870.8130.8820.7880.7300.8680.667 表4具有分层递阶结构的样本商空间族 Table 4 The family of quotient spaces with hierarchical structure 商空间族 样本聚类结果 聚类数 X(1) {x1},x2},{x3},x4,{x3},{x6{,{x},{xg},{xg},}xo},{xu},}x2},{x1s},{x4},{x5}} 15 X(0.994) {x},{x2,xe,{x3},x4},{x3},x6},{},{xg},{xg},{xo},{xu},{x2},{x4},{xsf 14 X(0.993) {x},{x2,xg,xe,{x3},{x4},{5},ix6,{x},{xg},{xo},}x1},x2},{x4},xs} 13 X(0.991) x1B.ix2.xxxxx5.ix.1x5.ix1,1xo1,ixn1,1x11,1x1515 12 X(0.990) {{x1},{x2,g,xg,xs},x3},{x4,x4,{x5},{x6},x},{xio},x1},1x2},{x5}} 11 X(0.979) {x1,x2,xg,xg,x3},{x3},{x4,x4},{x3},{x6},{x},{xo},x11},{x2},{x5}} 10 X(0.978) {x1,x2,xgxg,xg,x3,x5},x4,4},{x,x6},x7},xo},{},x2}月 9 X(0.975) {{x1,x2,5,x,xg,xg,xe},{x3,15},{x4,x4},{x6},{x1of,{x},x12} 7 X(0.971) 1{1,x2,x4,x5,x7,xg,xg,xgx4},{x3,x5},{x6},{xo},{x},{x2} 6 X(0.944) {x1,x2,x4,5,x7,xg,xg,x3,x14},{x3,x10,x15},{x6},{x1},x2} 5 X(0.926) {x1,x2,3,x4,x5,x,xg,xg,x10,x1B,x14,x5f,{x6},{x},{x2}f 4 X(0.905) {x1,2,33,x4,,x6,x7,xg,g,x0,13,x14,xs},{1},{x2} 3 X(0.888) {x1,2,x3,x4,x5,x6,x7,x8,xg,x10,x2,x3,x14,x15,{x11} 2 X(0.865) {1,x2,x3,x45,x6,7,xg,gx101,x2,14,x15} 1
表 3 规范化处理后的属性表 Table 3 Attributes after normalization 样本 a1 a2 a3 a4 a5 a6 x1 74 97 100 90 100 72 x2 57 73 92 100 50 35 x3 19 77 86 77 0 75 x4 87 90 78 71 100 19 x5 24 85 99 84 50 31 x6 82 92 0 66 100 43 x7 90 87 75 59 50 0 x8 67 88 95 87 50 63 x9 100 94 100 100 50 29 x10 33 100 43 100 0 100 x11 42 76 94 0 0 78 x12 52 0 100 97 100 56 x13 77 92 100 99 50 41 x14 95 96 98 54 100 13 x15 0 64 98 88 0 58 2) 采用夹角余弦法计算每一个样本之间的相 似关系,其计算公式如式(7)所示,从而建立所有样 本的模糊相似矩阵,如式(8)所示。 rij = cos(xi,xj) = ∑ m k = 1 y′ik × y′jk ∑ m k = 1 (y′ik) 2 × ∑ m k = 1 (y′jk) 2 (7) 3) 根据文献[24]给出的基于模糊相似矩阵的 分层递阶结构聚类算法,得到一个有序的样本商空 间族 {X(λ) | 0 ≤ λ ≤ 1}, 不同粒度的商空间分别 对应不同的样本聚类结果,如表 4 所示。 图 2 所示 为与表 4 相对应的根据分层递阶结构绘制的样本聚 类结构图。 R = [rij]15×15 = 1 0.962 1 0.855 0.895 1 0.963 0.931 0.724 1 0.943 0.975 0.912 0.898 1 0.875 0.788 0.602 0.905 0.729 1 0.908 0.924 0.739 0.964 0.882 0.830 1 0.979 0.983 0.926 0.926 0.960 0.812 0.917 1 0.945 0.979 0.846 0.950 0.932 0.816 0.975 0.972 1 0.819 0.837 0.944 0.692 0.823 0.709 0.694 0.883 0.802 1 0.775 0.735 0.865 0.668 0.764 0.519 0.705 0.829 0.747 0.766 1 0.888 0.875 0.713 0.837 0.827 0.694 0.739 0.849 0.818 0.626 0.567 1 0.965 0.994 0.895 0.942 0.964 0.809 0.951 0.990 0.993 0.845 0.777 0.840 1 0.945 0.910 0.708 0.991 0.887 0.858 0.971 0.911 0.941 0.644 0.710 0.808 0.929 1 0.813 0.887 0.978 0.684 0.921 0.508 0.696 0.887 0.813 0.882 0.788 0.730 0.868 0.667 1 é ë ê ê ê ê ê ê ê ê ê ê ê ê ê ê ê ê ê ê êê ù û ú ú ú ú ú ú ú ú ú ú ú ú ú ú ú ú ú ú úú (8) 表 4 具有分层递阶结构的样本商空间族 Table 4 The family of quotient spaces with hierarchical structure 商空间族 样本聚类结果 聚类数 X(1) {{x1 },{x2 },{x3 },{x4 },{x5 },{x6 },{x7 },{x8 },{x9 },{x10 },{x11 },{x12 },{x13 },{x14 },{x15 }} 15 X(0.994) {{x1 },{x2 ,x13 },{x3 },{x4 },{x5 },{x6 },{x7 },{x8 },{x9 },{x10 },{x11 },{x12 },{x14 },{x15 }} 14 X(0.993) {{x1 },{x2 ,x9 ,x13 },{x3 },{x4 },{x5 },{x6 },{x7 },{x8 },{x10 },{x11 },{x12 },{x14 },{x15 }} 13 X(0.991) {{x1 },{x2 ,x9 ,x13 },{x3 },{x4 ,x14 },{x5 },{x6 },{x7 },{x8 },{x10 },{x11 },{x12 },{x15 }} 12 X(0.990) {{x1 },{x2 ,x8 ,x9 ,x13 },{x3 },{x4 ,x14 },{x5 },{x6 },{x7 },{x10 },{x11 },{x12 },{x15 }} 11 X(0.979) {{x1 ,x2 ,x8 ,x9 ,x13 },{x3 },{x4 ,x14 },{x5 },{x6 },{x7 },{x10 },{x11 },{x12 },{x15 }} 10 X(0.978) {{x1 ,x2 ,x8 ,x9 ,x13 },{x3 ,x15 },{x4 ,x14 },{x5 },{x6 },{x7 },{x10 },{x11 },{x12 }} 9 X(0.975) {{x1 ,x2 ,x5 ,x7 ,x8 ,x9 ,x13 },{x3 ,x15 },{x4 ,x14 },{x6 },{x10 },{x11 },{x12 }} 7 X(0.971) {{x1 ,x2 ,x4 ,x5 ,x7 ,x8 ,x9 ,x13 ,x14 },{x3 ,x15 },{x6 },{x10 },{x11 },{x12 }} 6 X(0.944) {{x1 ,x2 ,x4 ,x5 ,x7 ,x8 ,x9 ,x13 ,x14 },{x3 ,x10 ,x15 },{x6 },{x11 },{x12 }} 5 X(0.926) {{x1 ,x2 ,x3 ,x4 ,x5 ,x7 ,x8 ,x9 ,x10 ,x13 ,x14 ,x15 },{x6 },{x11 },{x12 }} 4 X(0.905) {{x1 ,x2 ,x3 ,x4 ,x5 ,x6 ,x7 ,x8 ,x9 ,x10 ,x13 ,x14 ,x15 },{x11 },{x12 }} 3 X(0.888) {{x1 ,x2 ,x3 ,x4 ,x5 ,x6 ,x7 ,x8 ,x9 ,x10 ,x12 ,x13 ,x14 ,x15 },{x11 }} 2 X(0.865) {{x1 ,x2 ,x3 ,x4 ,x5 ,x6 ,x7 ,x8 ,x9 ,x10 ,x11 ,x12 ,x13 ,x14 ,x15 }} 1 第 2 期 周丹晨:采用粒计算的属性权重确定方法 ·277·
.278. 智能系统学报 第10卷 1=0.865 1=0.888 U/ind(C-{a3})={x1},{x2},{x3},{x4,x6,xa}, 1=0.905 {xs},{x},{xg},{xg},{xo},{x},{x2,{xs},{xs}} 1=0.926 U/ind(C-{a4})={{x,},{x2},{x3xu,xs},{xa} 1=0.944 {x5},x6},{x7},{xg},{xg},{xo},{x12},{xs},{xa} 1=0.971 U/ind(C-{a5})={{x},{x2},{x3},{x4,x,},{x5} 2=0.975 =0.978 {x6},{xg},{xg},{xo},{x1},{x2},{xB},{xa},{xs} 1=0.979 U/ind(C-{a6})={x1},{x2},{x3},{x4},{x5},{x6}, 1=0.990 =0.991 {x7},{xg,x3},{xg},{xo},{xi},{x2},{xa},{xs} 1=0.993 1=0.994r- 5)以表4中商空间族所形成的14个不同粒度 =1 X2 XiX Xs XX,X,Xa XiXs Xis Xio X.Xi:Xu 商空间的样本聚类结果作为相应粒度空间下单一决 图2样本聚类结构图 策属性的分类,按照式(2)分别计算各粒度空间下 Fig.2 The structural clustering graph 各个属性的重要度,再根据式(4)综合计算得出各 4)按照表5中的离散区间对表3中的属性值 属性的最终重要度,计算结果如表7所示。 进行离散化处理,得到具有离散化属性值的属性表, 表7属性重要度的计算结果 如表6所示。根据表6,可以分析计算删除各个属性 Table 7 Computing result of attributes significance 后的等价类。 属性重要度 表5连续属性值的离散区间 序号商空间族 a d Table 5 as a6 Discrete interval of continuous attribute values 1 X(1) 3/154/153/153/152/152/15 ya [0,50) [50,80] (80,100] 2 X(0.994)3/152/153/153/152/152/15 离散值 1 2 3 3 含义 低 中等 高 X(0.993)3/152/153/153/152/152/15 4 X(0.991)3/152/153/153/152/152/15 表6 离散化处理后的属性表 0 Table 6 Attributes after discretization 5 X(0.990)3/152/153/153/152/15 6 X(0.979)3/152/15 3/153/152/15 0 a a 2 3 3 3 3 2 7 X(0.978)3/152/153/153/152/15 0 2 2 3 2 1 8 X(0.975) 3/153/152/15 0 2 2 2 9 X(0.971) 0 2/15 3/15 3/15 0 0 3 1 10X(0.944) 0 2/153/153/15 0 0 1 11X(0.926) 0 2/153/153/15 0 0 X6 3 1 2 1 12 X(0.905) 02/15 03/15 0 0 2 13X(0.888) 0 0 0 3/15 0 0 2 1 14X(0.865)0 0 0 0 0 0 x10 1 综合值 0.10.1240.1570.1860.0760.038 1 1 2 x12 3 3 2 6)按照式(5)确定各属性的权重:0,=0.147 2 3 、3 3 2 1 02=0.182,0=0.230,0a4=0.273,0=0.112, 3 3 3 2 3 1 0。=0.056。由计算结果可以看出,各属性的权重 15 1 2 3 3 1 2 由大到小的排列顺序为:按期完成率>产品合格率> 生产工时率>总工时>加工难度>加班时间,这与该 U/ind(C)={{x1},{x2},{x3},{xa},{x5},{x6},{x}, 企业管理者正从以前单纯强调工作量和加班时间, {xg},{xg},{xo},{x1},{x2},{xB},xa},{xs} 逐步转变为更加重视任务进度的控制、产品质量的 U/ind(C-{a})={x},{x2},{x},x},{x5yxB}, 稳定、工作效率的提高这一技能人员工作绩效考核 x,xx,xl,xn,ix,xu,xs1 评价新思路是完全吻合的,实现了基于数据驱动的 U/ind(C-{a2})={x1xe},{x2xs},{x},{x},{x}, 客观权重计算与决策者主观偏好的有机统一,由此 x6l,ix1,ixst,ixol,ixl,ixnl,ixul,ixis1 初步验证了本文所提出方法的合理性和有效性
图 2 样本聚类结构图 Fig.2 The structural clustering graph 4) 按照表 5 中的离散区间对表 3 中的属性值 进行离散化处理,得到具有离散化属性值的属性表, 如表 6 所示。 根据表 6,可以分析计算删除各个属性 后的等价类。 表 5 连续属性值的离散区间 Table 5 Discrete interval of continuous attribute values y′ik [0,50) [50,80] (80,100] 离散值 1 2 3 含义 低 中等 高 表 6 离散化处理后的属性表 Table 6 Attributes after discretization U a1 a2 a3 a4 a5 a6 x1 2 3 3 3 3 2 x2 2 2 3 3 2 1 x3 1 2 3 2 1 2 x4 3 3 2 2 3 1 x5 1 3 3 3 2 1 x6 3 3 1 2 3 1 x7 3 3 2 2 2 1 x8 2 3 3 3 2 2 x9 3 3 3 3 2 1 x10 1 3 1 3 1 3 x11 1 2 3 1 1 2 x12 2 1 3 3 3 2 x13 2 3 3 3 2 1 x14 3 3 3 2 3 1 x15 1 2 3 3 1 2 U/ ind(C) = {{x1},{x2},{x3},{x4},{x5},{x6},{x7}, {x8},{x9},{x10},{x11},{x12},{x13},{x14},{x15}} U/ ind(C - {a1}) = {{x1},{x2},{x3},{x4},{x5,x9,x13}, {x6},{x7},{x8},{x10},{x11},{x12},{x14},{x15}} U/ ind(C - {a2}) = {{x1,x12},{x2,x13},{x3},{x4},{x5}, {x6},{x7},{x8},{x9},{x10},{x11},{x14},{x15}} U/ ind(C - {a3}) = {{x1},{x2},{x3},{x4,x6,x14}, {x5},{x7},{x8},{x9},{x10},{x11},{x12},{x13},{x15}} U/ ind(C - {a4}) = {{x1},{x2},{x3,x11,x15},{x4}, {x5},{x6},{x7},{x8},{x9},{x10},{x12},{x13},{x14}} U/ ind(C - {a5}) = {{x1},{x2},{x3},{x4,x7},{x5}, {x6},{x8},{x9},{x10},{x11},{x12},{x13},{x14},{x15}} U/ ind(C - {a6}) = {{x1},{x2},{x3},{x4},{x5},{x6}, {x7},{x8,x13},{x9},{x10},{x11},{x12},{x14},{x15}} 5) 以表 4 中商空间族所形成的 14 个不同粒度 商空间的样本聚类结果作为相应粒度空间下单一决 策属性的分类,按照式(2) 分别计算各粒度空间下 各个属性的重要度,再根据式(4) 综合计算得出各 属性的最终重要度,计算结果如表 7 所示。 表 7 属性重要度的计算结果 Table 7 Computing result of attributes significance 序号 商空间族 属性重要度 a1 a2 a3 a4 a5 a6 1 X (1) 3 / 15 4 / 15 3 / 15 3 / 15 2 / 15 2 / 15 2 X (0.994) 3 / 15 2 / 15 3 / 15 3 / 15 2 / 15 2 / 15 3 X (0.993) 3 / 15 2 / 15 3 / 15 3 / 15 2 / 15 2 / 15 4 X (0.991) 3 / 15 2 / 15 3 / 15 3 / 15 2 / 15 2 / 15 5 X (0.990) 3 / 15 2 / 15 3 / 15 3 / 15 2 / 15 0 6 X (0.979) 3 / 15 2 / 15 3 / 15 3 / 15 2 / 15 0 7 X (0.978) 3 / 15 2 / 15 3 / 15 3 / 15 2 / 15 0 8 X (0.975) 0 2 / 15 3 / 15 3 / 15 2 / 15 0 9 X (0.971) 0 2 / 15 3 / 15 3 / 15 0 0 10 X (0.944) 0 2 / 15 3 / 15 3 / 15 0 0 11 X (0.926) 0 2 / 15 3 / 15 3 / 15 0 0 12 X (0.905) 0 2 / 15 0 3 / 15 0 0 13 X (0.888) 0 0 0 3 / 15 0 0 14 X (0.865) 0 0 0 0 0 0 综合值 0.1 0.124 0.157 0.186 0.076 0.038 6) 按照式(5)确定各属性的权重: wa1 = 0.147, wa2 = 0.182,wa3 = 0.230,wa4 = 0.273,wa5 = 0.112, wa6 =0.056。 由计算结果可以看出,各属性的权重 由大到小的排列顺序为:按期完成率>产品合格率> 生产工时率>总工时>加工难度>加班时间,这与该 企业管理者正从以前单纯强调工作量和加班时间, 逐步转变为更加重视任务进度的控制、产品质量的 稳定、工作效率的提高这一技能人员工作绩效考核 评价新思路是完全吻合的,实现了基于数据驱动的 客观权重计算与决策者主观偏好的有机统一,由此 初步验证了本文所提出方法的合理性和有效性。 ·278· 智 能 系 统 学 报 第 10 卷
第2期 周丹晨:采用粒计算的属性权重确定方法 ·279. 7)为进一步验证该方法的准确性和实用性,采 (1):67-70. 用文献[12-15]所提出方法进行了属性权重计算(由 [3]XU Zeshui,ZHANG Xiaolu.Hesitant fuzzy multi-attribute 于篇幅所限,本文不给出详细的计算过程)。其计算 decision making based on TOPSIS with incomplete weight 结果为:0a=0.141,0,=0.172,0,=0.176,0a4= information[J].Knowledge-Based Systems,2013,52:53- 0.191,0,=0.190,06=0.130,即各属性的权重由 64. [4]黄宗盛,胡培,聂佳佳.基于离差最大化的交叉效率评价 大到小的排列顺序为:按期完成率>加工难度>产品 方法[J].运筹与管理,2012,21(6):177-181 合格率>生产工时率>总工时>加班时间。通过对比 HUANG Zongsheng,HU Pei,NIE Jiajia.Cross efficiency e- 可知,2种方法属性权重计算结果的总体分布是基 valuation method based on maximizing deviations[J].Opera- 本一致的,但本文方法的准确性和实用性主要体现 tions Research and Management Science,2012,21(6): 在:①以往方法的属性权重计算结果相对比较平均, 177-181. 差距不大,其标准差仅为0.023,因此对企业管理者 [5]江文奇.无量纲化方法对属性权重影响的敏感性和方案 新的考核评价思路的体现作用不显著:而本文方法 保序[J].系统工程与电子技术,2012,34(12):2520- 的权重标准差为0.072,为以往方法的3.1倍,相比 2523. JIANG Wengi.Sensibility and alternative COP analysis of 较而言,更能充分发挥管理者所重视指标的导向作 dimensionless methods on effect of attribute weight[J].Sys- 用。②2种方法对于“加工难度”指标权重的计算结 tems Engineering and Electronics,2012,34(12):2520- 果差异较大。考虑到“加工难度”仅仅是个定性指 2523. 标,目前还难以量化,区分度不强,如果权重过大,在 [6]刘勇,JEF℉REYF,刘思峰,等.基于区间直觉模糊的动态 具体实施时将很难操作,因此本文方法相对较低的 多属性灰色关联决策方法[J].控制与决策,2013,28 权重是比较合适的。③本文方法的模糊相似度计算 (9):1303-1308 次数仅为以往方法的1/7,且无需进行以往方法求 LIU Yong,JEFFREY F,LIU Sifeng,et al.Dynamic multi- 出模糊等价矩阵的7×4次传递闭包计算,因此计算 ple attribute grey incidence decision making method based 量要小得多。 on interval valued intuitionisite fuzzy number[J.Control and Decision,2013,28(9):1303-1308. 4结束语 [7]CHEN Yuan,LI Bing.Dynamic multi-attribute decision making model based on triangular intuitionistic fuzzy num- 针对属性值为连续值且无单一决策属性的多属 bers[].Scientia Iranica,2011,18(2):268-274. 性决策问题,提出了一种基于粒计算的属性权重确 [8]陈晓红戴子敬,刘翔.基于熵和关联系数的区间直觉模 定方法。与目前的研究成果相比,该方法通过从不 糊决策方法[J].系统工程与电子技术,2013,35(4): 同粗细粒度的商空间多角度、多层次地综合分析各 791-795. 个属性的重要程度,使属性权重的确定过程更为全 CHEN Xiaohong,DAI Zijing,LIU Xiang.Approach to inter- 面,计算结果更为准确,应用实例也说明了其合理性 val-valued intuitionistic fuzzy decision making based on en- 和有效性。同时,该方法只需进行一次模糊相似度 tropy and correlation coefficient [J].Systems Engineering 计算,无需进行传递闭包计算,计算复杂度大幅降 and Electronics,2013,35(4):791-795. 低,因此也更具实用性。方法的不足之处主要在于 [9]迟国泰,程砚秋,曹勇.基于聚类赋权的科学发展评价模 连续属性值的离散化处理过程会造成一定的客观信 型及实证[J].运筹与管理,2011,20(5):94-102. 息的损失,所以如何应用合适的高效离散化算法来 CHI Guotai,CHENG Yanqiu,CAO Yong.The scientific de- velopment evaluation model based on clustering and its em- 减少这种损失需要做进一步的研究。 pirical studyJ.Operations Research and Management Sci- 参考文献: ence,2011,20(5):94-102. [10]苏永华,刘科伟,张进华.基于粗糙集重心理论的公路隧 [1]张荣.交互式不确定多属性决策研究[M].郑州:河南大 道塌方风险分析[J].湖南大学学报:自然科学版, 学出版社,2011:10-23. 2013,40(1):21-26. [2]杨立才,张朋飞,王德伟.基于主成分分析的代谢综合征 SU Yonghua,LIU Kewei,ZHANG Jinhua.Fuzzy evaluation 模糊综合评价方法[].生物医学工程学杂志,2013,30 of collapse incidents in highway tunnel construction based on (1):67-70. rough set and barycenter theory[J].Journal of Hunan Uni- YANG Licai,ZHANG Pengfei,WANG Dewei.Fuzzy com- versity:Natural Sciences,2013,40(1):21-26. prehensive evaluation method of metabolic syndrome based [11]WEI Guiwu.Gray relational analysis method for intuitionis- on PCA[J].Journal of Biomedical Engineering,2013,30 tic fuzzy multiple attribute decision making[J].Expert Sys-
7) 为进一步验证该方法的准确性和实用性,采 用文献[12⁃15]所提出方法进行了属性权重计算(由 于篇幅所限,本文不给出详细的计算过程)。 其计算 结果为: wa1 = 0.141,wa2 = 0.172,wa3 = 0.176,wa4 = 0.191, wa5 = 0.190,wa6 = 0.130, 即各属性的权重由 大到小的排列顺序为:按期完成率>加工难度>产品 合格率>生产工时率>总工时>加班时间。 通过对比 可知,2 种方法属性权重计算结果的总体分布是基 本一致的,但本文方法的准确性和实用性主要体现 在:①以往方法的属性权重计算结果相对比较平均, 差距不大,其标准差仅为 0.023,因此对企业管理者 新的考核评价思路的体现作用不显著;而本文方法 的权重标准差为 0.072,为以往方法的 3.1 倍,相比 较而言,更能充分发挥管理者所重视指标的导向作 用。 ②2 种方法对于“加工难度”指标权重的计算结 果差异较大。 考虑到“加工难度” 仅仅是个定性指 标,目前还难以量化,区分度不强,如果权重过大,在 具体实施时将很难操作,因此本文方法相对较低的 权重是比较合适的。 ③本文方法的模糊相似度计算 次数仅为以往方法的 1 / 7,且无需进行以往方法求 出模糊等价矩阵的 7×4 次传递闭包计算,因此计算 量要小得多。 4 结束语 针对属性值为连续值且无单一决策属性的多属 性决策问题,提出了一种基于粒计算的属性权重确 定方法。 与目前的研究成果相比,该方法通过从不 同粗细粒度的商空间多角度、多层次地综合分析各 个属性的重要程度,使属性权重的确定过程更为全 面,计算结果更为准确,应用实例也说明了其合理性 和有效性。 同时,该方法只需进行一次模糊相似度 计算,无需进行传递闭包计算,计算复杂度大幅降 低,因此也更具实用性。 方法的不足之处主要在于 连续属性值的离散化处理过程会造成一定的客观信 息的损失,所以如何应用合适的高效离散化算法来 减少这种损失需要做进一步的研究。 参考文献: [1]张荣.交互式不确定多属性决策研究[M]. 郑州: 河南大 学出版社, 2011: 10⁃23. [2]杨立才,张朋飞,王德伟.基于主成分分析的代谢综合征 模糊综合评价方法[J]. 生物医学工程学杂志, 2013, 30 (1): 67⁃70. YANG Licai, ZHANG Pengfei, WANG Dewei. Fuzzy com⁃ prehensive evaluation method of metabolic syndrome based on PCA[ J]. Journal of Biomedical Engineering, 2013, 30 (1): 67⁃70. [3] XU Zeshui, ZHANG Xiaolu. Hesitant fuzzy multi⁃attribute decision making based on TOPSIS with incomplete weight information[J]. Knowledge⁃Based Systems, 2013, 52: 53⁃ 64. [4]黄宗盛,胡培,聂佳佳.基于离差最大化的交叉效率评价 方法[J]. 运筹与管理, 2012, 21(6): 177⁃181. HUANG Zongsheng, HU Pei, NIE Jiajia. Cross efficiency e⁃ valuation method based on maximizing deviations[J]. Opera⁃ tions Research and Management Science, 2012, 21 ( 6): 177⁃181. [5]江文奇.无量纲化方法对属性权重影响的敏感性和方案 保序[J]. 系统工程与电子技术, 2012, 34 ( 12): 2520⁃ 2523. JIANG Wenqi. Sensibility and alternative COP analysis of dimensionless methods on effect of attribute weight[J]. Sys⁃ tems Engineering and Electronics, 2012, 34 ( 12): 2520⁃ 2523. [6]刘勇,JEFFREY F,刘思峰,等.基于区间直觉模糊的动态 多属性灰色关联决策方法[ J]. 控制与决策, 2013, 28 (9): 1303⁃1308. LIU Yong, JEFFREY F, LIU Sifeng, et al. Dynamic multi⁃ ple attribute grey incidence decision making method based on interval valued intuitionisitc fuzzy number [ J]. Control and Decision, 2013, 28(9): 1303⁃1308. [ 7 ] CHEN Yuan, LI Bing. Dynamic multi⁃attribute decision making model based on triangular intuitionistic fuzzy num⁃ bers[J]. Scientia Iranica, 2011, 18(2): 268⁃274. [8]陈晓红,戴子敬,刘翔.基于熵和关联系数的区间直觉模 糊决策方法[ J]. 系统工程与电子技术, 2013, 35( 4): 791⁃795. CHEN Xiaohong, DAI Zijing, LIU Xiang. Approach to inter⁃ val⁃valued intuitionistic fuzzy decision making based on en⁃ tropy and correlation coefficient [ J]. Systems Engineering and Electronics, 2013, 35(4): 791⁃795. [9]迟国泰,程砚秋,曹勇. 基于聚类赋权的科学发展评价模 型及实证[J]. 运筹与管理, 2011, 20 (5): 94⁃102. CHI Guotai, CHENG Yanqiu, CAO Yong. The scientific de⁃ velopment evaluation model based on clustering and its em⁃ pirical study[J]. Operations Research and Management Sci⁃ ence, 2011, 20(5): 94⁃102. [10]苏永华,刘科伟,张进华.基于粗糙集重心理论的公路隧 道塌方风险分析 [ J]. 湖南 大 学 学 报: 自 然 科 学 版, 2013, 40(1): 21⁃26. SU Yonghua, LIU Kewei, ZHANG Jinhua. Fuzzy evaluation of collapse incidents in highway tunnel construction based on rough set and barycenter theory[J]. Journal of Hunan Uni⁃ versity: Natural Sciences, 2013, 40(1): 21⁃26. [11]WEI Guiwu. Gray relational analysis method for intuitionis⁃ tic fuzzy multiple attribute decision making[J]. Expert Sys⁃ 第 2 期 周丹晨:采用粒计算的属性权重确定方法 ·279·
·280· 智能系统学报 第10卷 tems with Applications,2011,38(9):11671-11677. [18]SANKAR K P,SAROJ K M.Natural computing:a problem [12]黄定轩,武振业,宗蕴璋.基于属性重要性的多属性客观 solving paradigm with granular information processing[J]. 权重分配方法[J].系统工程理论方法应用,2004,13 Applied Soft Computing,2013,13(9):3944-3955. (3):203-207. [19]张铃,张钹模糊商空间理论(模糊粒度计算方法)[J] HUANG Dingxuan,WU Zhenye,ZONG Yunzhang.An im- 软件学报,2003,14(4):770-776. personal multi-attribute weight allocation method based on ZHANG Ling,ZHANG Bo.Theory of fuzzy quotient space attribute importance [J].Systems Engineering-Theory (methods of fuzzy granular computing)[].Journal of Soft- Methodology Applications,2004,13(3):203-207. ware,2003,14(4):770-776. [13]柳炳祥,李海林.基于模糊粗糙集的因素权重分配方法 [20]ZHANG Ling,ZHANG Bo.The structure analysis of fuzzy [J].控制与决策,2007,22(12):1437-1440. sets[J].International Journal of Approximate Reasoning, LIU Bingxiang,LI Hailin.Method of factor weights alloca- 2005,40(1/2):92-108. tion based on combination of fuzzy and rough set[].Con- [21]苗夺谦,李道国.粗糙集理论、算法与应用[M].北京: trol and Decision,2007,22(12):1437-1440. 清华大学出版社,2008:24-81. [14]刘文军.连续值域决策表的一种属性权重确定方法[J] MIAO Duoqian,LI Daoguo.Rough sets theory,algorithms 模糊系统与数学,2008,22(3):160-166. and applications[M].Beijing:Tsinghua University Press, LIU Wenjun.An algorithm of obtain weight of continuous 2008.24-81. attributes in continuous domain decision table[J].Fuzzy [22]王国胤,姚一豫,于洪粗糙集理论与应用研究综述[J] Systems and Mathematics,2008,22(3):160-166. 计算机学报,2009,32(7):1229-1246, [15]吴静,吴晓燕,高忠长基于模糊聚类和粗糙集的仿真可 WANG Guoyin,YAO Yiyu,YU Hong.A survey on rough 信性模糊综合评估[J].系统工程与电子技术,2010,32 set theory and applications[J].Chinese Journal of Comput- (4):770-773. er,2009,32(7):1229-1246. WU Jing,WU Xiaoyan,GAO Zhongchang.Fuzzy compre- [23]杨纶标,高英仪.模糊数学原理及应用[M].4版.广州: hensive evaluation of simulation credibility based on fuzzy 华南理工大学出版社,2008:66-77. clustering analysis and rough sets theory[]].Systems Engi- [24]TANG Xuqing,ZHU Ping,CHENG Jiaxing.Cluster analy- neering and Electronics,2010,32(4):770-773. sis based on fuzzy quotient space[J].Journal of Software, [16]张钹,张铃.粒计算未来发展方向探讨[J].重庆邮电大 2008,19(4):861-868. 学学报:自然科学版,2010,22(5):538-540, ZHANG Bo,ZHANG Ling.Discussion on future develop- 作者简介: ment of granular computing[J].Journal of Chongqing Uni- 周丹晨,男,1969年生,高级工程 versity of Posts and Telecommunications:Natural Science 师,博士,主要研究方向为人工智能、数 Edition.2010.22(5):538-540. 字化设计与制造,发表学术论文50余 [17]王国胤,张清华,胡军粒计算研究综述[J].智能系统学 篇,其中被SCI,EI检索20余篇。 报,2007,2(6):8-26. WANG Guoyin,ZHANG Qinghua,HU Jun.An overview of granular computing[J].CAAI Transactions on Intelligent Systems,2007,2(6):8-26
tems with Applications, 2011, 38(9): 11671⁃11677. [12]黄定轩,武振业,宗蕴璋.基于属性重要性的多属性客观 权重分配方法[ J]. 系统工程理论方法应用,2004,13 (3): 203⁃207. HUANG Dingxuan, WU Zhenye, ZONG Yunzhang. An im⁃ personal multi⁃attribute weight allocation method based on attribute importance [ J ]. Systems Engineering - Theory Methodology Applications, 2004, 13(3): 203⁃207. [13]柳炳祥,李海林.基于模糊粗糙集的因素权重分配方法 [J]. 控制与决策, 2007, 22(12): 1437⁃1440. LIU Bingxiang, LI Hailin. Method of factor weights alloca⁃ tion based on combination of fuzzy and rough set[ J]. Con⁃ trol and Decision, 2007, 22(12): 1437⁃1440. [14]刘文军.连续值域决策表的一种属性权重确定方法[ J]. 模糊系统与数学, 2008, 22(3):160⁃166. LIU Wenjun. An algorithm of obtain weight of continuous attributes in continuous domain decision table [ J]. Fuzzy Systems and Mathematics, 2008, 22(3): 160⁃166. [15]吴静,吴晓燕,高忠长.基于模糊聚类和粗糙集的仿真可 信性模糊综合评估[J].系统工程与电子技术, 2010, 32 (4): 770⁃773. WU Jing, WU Xiaoyan, GAO Zhongchang. Fuzzy compre⁃ hensive evaluation of simulation credibility based on fuzzy clustering analysis and rough sets theory[J]. Systems Engi⁃ neering and Electronics, 2010, 32(4): 770⁃773. [16]张钹,张铃.粒计算未来发展方向探讨[ J].重庆邮电大 学学报: 自然科学版, 2010, 22(5): 538⁃540. ZHANG Bo, ZHANG Ling. Discussion on future develop⁃ ment of granular computing[J]. Journal of Chongqing Uni⁃ versity of Posts and Telecommunications: Natural Science Edition, 2010, 22(5): 538⁃540. [17]王国胤,张清华,胡军.粒计算研究综述[ J].智能系统学 报, 2007, 2(6): 8⁃26. WANG Guoyin, ZHANG Qinghua, HU Jun. An overview of granular computing [ J]. CAAI Transactions on Intelligent Systems, 2007, 2(6): 8⁃26. [18]SANKAR K P, SAROJ K M. Natural computing: a problem solving paradigm with granular information processing[ J]. Applied Soft Computing, 2013, 13(9): 3944⁃3955. [19]张铃,张钹.模糊商空间理论(模糊粒度计算方法) [ J]. 软件学报, 2003, 14(4): 770⁃776. ZHANG Ling, ZHANG Bo. Theory of fuzzy quotient space (methods of fuzzy granular computing)[J]. Journal of Soft⁃ ware, 2003, 14(4): 770⁃776. [20]ZHANG Ling, ZHANG Bo. The structure analysis of fuzzy sets[ J]. International Journal of Approximate Reasoning, 2005, 40(1 / 2): 92⁃108. [21]苗夺谦,李道国.粗糙集理论、算法与应用[M]. 北京: 清华大学出版社, 2008: 24⁃81. MIAO Duoqian, LI Daoguo. Rough sets theory, algorithms and applications[M]. Beijing: Tsinghua University Press, 2008: 24⁃81. [22]王国胤,姚一豫,于洪.粗糙集理论与应用研究综述[ J]. 计算机学报, 2009, 32(7): 1229⁃1246. WANG Guoyin, YAO Yiyu, YU Hong. A survey on rough set theory and applications[J]. Chinese Journal of Comput⁃ er, 2009, 32(7): 1229⁃1246. [23]杨纶标,高英仪.模糊数学原理及应用[M].4 版. 广州: 华南理工大学出版社, 2008: 66⁃77. [24]TANG Xuqing, ZHU Ping, CHENG Jiaxing. Cluster analy⁃ sis based on fuzzy quotient space[ J]. Journal of Software, 2008, 19(4): 861⁃868. 作者简介: 周丹晨,男, 1969 年生,高级工程 师,博士,主要研究方向为人工智能、数 字化设计与制造,发表学术论文 50 余 篇,其中被 SCI、EI 检索 20 余篇。 ·280· 智 能 系 统 学 报 第 10 卷