第12卷第2期 智能系统学报 Vol.12 No.2 2017年4月 CAAI Transactions on Intelligent Systems Apr.2017 D0I:10.11992/6is.201603005 网络出版地址:http://www.cmki.net/kcms/detail,/23.1538.tp.20160824.0928.004.html 知识迁移的极大熵聚类算法及其 在纹理图像分割中的应用 程肠,蒋亦樟,钱鹏江,王士同 (江南大学数字媒体学院,江苏无锡214122) 摘要:本文研究了一种新型的基于知识迁移的极大嫡聚类技术。拟解决两大挑战性问题:1)如何从源域中选择合 适的知识对目标域进行迁移学习以最终强化目标域的聚类性能:2)若存在源域聚类数与目标域聚类数不一致的情 况时,该如何进行迁移聚类。为此提出一种全新的迁移聚类机制,即基于聚类中心的中心匹配迁移机制。进一步将 该机制与经典极大嫡聚类算法相融合提出了基于知识迁移的极大熵聚类算法(KT-MEC)。实验表明,在不同迁移场 景下的纹理图像分割应用中,KT-MEC算法较很多现有聚类算法具有更高的精确度和抗噪性。 关键词:迁移学习:中心迁移匹配:极大嫡聚类:纹理图像分割:抗噪性 中图分类号:TP181文献标志码:A文章编号:1673-4785(2017)02-0179-09 中文引用格式:程肠,蒋亦樟,钱鹏江,等.知识迁移的极大熵聚类算法及其在纹理图像分割中的应用[J].智能系统学报,2017,12 (2):179-187. 英文引用格式:CHENG Yang,JIANG Yizhang,QIAN Pengjiang,etal.A maximum entropy clustering algorithm based on knowl- edge transfer and its application to texture image segmentation[J].CAAI transactions on intelligent systems,2017,12(2):178- 187. A maximum entropy clustering algorithm based on knowledge transfer and its application to texture image segmentation CHENG Yang,JIANG Yizhang,QIAN Pengjiang,WANG Shitong School of Digital Media,Jiangnan University,Wuxi 214122,China) Abstract:In this paper,we propose a novel technique for maximum entropy clustering (MEC)based on knowledge transfer.More specifically,we aim to solve the following two challenging questions.First,how can knowledge be appropriately selected from a source domain to enhance clustering performance in the target domain via transfer learning?Second,how best do we conduct transfer clustering if the number of clusters in the source domain and the target domain are inconsistent?To address these questions,we designed a new transfer clustering mechanism called the central matching transfer mechanism,which we based on clustering centers.Further,we developed a knowl- edge-transfer-based maximum entropy clustering (KT-MEC)algorithm by incorporating our mechanism into the classic MEC approach.Our experimental results reveal that our proposed KT-MEC algorithm achieves a higher level of accuracy and better noise immunity than many existing methods when applied to texture image segmentation in different transfer scenarios. Keywords:transfer learning;center transfer matching;maximum entropy clustering;texture image segmentation; robustness 在实际生产中,大部分机器学习方法处理的对 收稿日期:2016-03-04.网络出版日期:2016-08-24 象均为含噪数据集且存在数据量不足的问题。如对 基金项目:国家自然科学基金项目(61572236):江苏省自然科学基金项于图像分割)任务而言,图像数据往往含有很大的 目(BK20160187):江苏省产学研前瞻性联合研究项目 (BY2013015-02). 噪声。图像数据含噪程度越高,使用的机器学习方 通信作者:蒋亦樟.E-mail:jyz0512@163.com 法对其进行分割的性能就变得越弱。一般来说,无
第 12 卷第 2 期 智 能 系 统 学 报 Vol.12 №.2 2017 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2017 DOI:10.11992 / tis.201603005 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20160824.0928.004.html 知识迁移的极大熵聚类算法及其 在纹理图像分割中的应用 程旸,蒋亦樟,钱鹏江,王士同 (江南大学 数字媒体学院,江苏 无锡 214122) 摘 要:本文研究了一种新型的基于知识迁移的极大熵聚类技术。 拟解决两大挑战性问题: 1)如何从源域中选择合 适的知识对目标域进行迁移学习以最终强化目标域的聚类性能;2)若存在源域聚类数与目标域聚类数不一致的情 况时,该如何进行迁移聚类。 为此提出一种全新的迁移聚类机制,即基于聚类中心的中心匹配迁移机制。 进一步将 该机制与经典极大熵聚类算法相融合提出了基于知识迁移的极大熵聚类算法(KT⁃MEC)。 实验表明,在不同迁移场 景下的纹理图像分割应用中,KT⁃MEC 算法较很多现有聚类算法具有更高的精确度和抗噪性。 关键词:迁移学习;中心迁移匹配;极大熵聚类;纹理图像分割;抗噪性 中图分类号: TP181 文献标志码:A 文章编号:1673-4785(2017)02-0179-09 中文引用格式:程旸,蒋亦樟,钱鹏江,等. 知识迁移的极大熵聚类算法及其在纹理图像分割中的应用[ J]. 智能系统学报, 2017, 12 (2): 179-187. 英文引用格式:CHENG Yang, JIANG Yizhang, QIAN Pengjiang, et al. A maximum entropy clustering algorithm based on knowl⁃ edge transfer and its application to texture image segmentation[ J]. CAAI transactions on intelligent systems, 2017, 12(2): 178- 187. A maximum entropy clustering algorithm based on knowledge transfer and its application to texture image segmentation CHENG Yang, JIANG Yizhang, QIAN Pengjiang, WANG Shitong (School of Digital Media, Jiangnan University, Wuxi 214122, China) Abstract:In this paper, we propose a novel technique for maximum entropy clustering (MEC) based on knowledge transfer. More specifically, we aim to solve the following two challenging questions. First, how can knowledge be appropriately selected from a source domain to enhance clustering performance in the target domain via transfer learning? Second, how best do we conduct transfer clustering if the number of clusters in the source domain and the target domain are inconsistent? To address these questions, we designed a new transfer clustering mechanism called the central matching transfer mechanism, which we based on clustering centers. Further, we developed a knowl⁃ edge⁃transfer⁃based maximum entropy clustering (KT⁃MEC) algorithm by incorporating our mechanism into the classic MEC approach. Our experimental results reveal that our proposed KT⁃MEC algorithm achieves a higher level of accuracy and better noise immunity than many existing methods when applied to texture image segmentation in different transfer scenarios. Keywords: transfer learning; center transfer matching; maximum entropy clustering; texture image segmentation; robustness 收稿日期:2016-03-04. 网络出版日期:2016-08-24. 基金项目:国家自然科学基金项目(61572236);江苏省自然科学基金项 目( BK20160187 ); 江 苏 省 产 学 研 前 瞻 性 联 合 研 究 项 目 (BY2013015⁃02). 通信作者:蒋亦樟. E⁃mail:jyz0512@ 163.com. 在实际生产中,大部分机器学习方法处理的对 象均为含噪数据集且存在数据量不足的问题。 如对 于图像分割[1]任务而言,图像数据往往含有很大的 噪声。 图像数据含噪程度越高,使用的机器学习方 法对其进行分割的性能就变得越弱。 一般来说,无
.180 智能系统学报 第12卷 监督的聚类方法通常用来获得图像的分割结 心迁移匹配机制用于处理源域和目标域聚类数不一 果[2-),比较著名的算法有模糊C均值算法 致的情况。无论源域与目标域的聚类数是否相同, (FCM)[4)、可能性聚类算法(PCM)【s)、极大熵聚类 该中心迁移匹配机制均可适用,且能够找到源域与 算法[6等。这些方法虽简单实用,但其对于含噪图 目标域类中心的最佳匹配关系。将上述迁移知识与 像数据的分割效果并不理想。尽管已有学者致力于 中心迁移匹配机制融入到经典的极大嫡聚类算法 解决该问题,但效果并不明显。 中,本文提出了一种全新的基于知识迁移的极大熵 聚类算法,并将该算法成功应用于纹理图像分割中。 1问题描述 实验结果表明,本文所提出的基于知识迁移的极大 迁移学习技术[的提出,为我们提供了一种新 熵聚类算法在不同的迁移场景下对于纹理图像的分 的解决问题的思路。传统的机器学习假设训练数据 割性能均优于其他迁移以及非迁移聚类算法。本文 与测试数据服从相同的数据分布。然而,大量实际 工作的创新主要涵盖以下几点: 情况中并不满足这种同分布假设。从另外一个角度 1)确定了源域中哪种知识能够进行有效迁移, 上看,如果我们已经有了大量的、在不同分布下的训 即从源域数据中获取的聚类中心知识可以用来指导 练数据,完全丢弃这些数据是非常浪费的。如何合 并增强目标域的聚类性能; 理地利用这些数据就是迁移学习要解决的问题。迁 2)给出了一种解决源域与目标域聚类数不同 移学习可以从现有的数据中迁移知识,用来帮助将 时,如何进行有效迁移的途径,即提出了一种通用的 来的学习。迁移学习的目标是将从一个环境中学到 中心迁移匹配机制,不仅能够有效解决源域与目标 的知识用来帮助新环境中的学习任务,其学习过程 域聚类数不相同时的迁移问题,还能指导源域、目标 类似人类的学习和思维方式。我们面临的问题如图 域聚类数相同时,各类中心如何一一对应的问题。 1所示。 3)将上述两个问题的解决策略融入到极大熵 聚类算法后,本文提出了一种新的基于知识迁移的 极大嫡聚类算法,实验表明该算法的聚类性能较其 知识来源 求 他迁移聚类算法以及非迁移聚类算法在处理不同迁 源域优质图像 解 移场景下的纹理分割图像时,具有更加优良的性能。 待分割日标 目标域理想 分割结果 本文所用的符号说明如表1所示。 表1符号说明 目标域含噪图像 Table 1 The explanation of some notations 图1问题描述 符号 描述 Fig.1 The description of the problem 隶属度矩阵,U,代表第i个 源域的数据中往往存在一部分数据为可用数 U=[ug]cxv 数据属于第个聚类中心的可能性 据,如源域优质图像,目标域的数据通常呈现数据不 足或噪声污染严重[8]等情况,如目标域含噪图像。 P [Palexc. 知识迁移隶属度矩阵,P:代表目标域第j 个中心属于源域第k个聚类中心的程度 如何才能得到最接近目标域理想分割的效果图,如 V=[V,… Ve]T 果能够将源域的知识成功迁移到目标域中进行学 聚类中心矩阵V,代表第i个聚类中心 习,是否能够大幅提高图像分割性能呢? V=[va to]T 为了验证本文的设想,实现提高图像分割性能的 2 熵的正则化参数 目标,本文将迁移学习方法融入到经典的极大嫡聚类 迁移平衡参数 算法[o(maximum entropy clustering,MEC)中,以提高 聚类数 极大嫡算法的聚类性能,进而提高该算法对图像分割 总的迭代次数 的性能。在将迁移学习策略融入到极大嫡聚类算法 N 样本总数 的过程中,我们面临的挑战有:1)选择源域的何种知 D 特征总数 识进行迁移学习以增强目标域的聚类性能:2)当源域 如果将s作为一个符号的下标, 和目标域的聚类数不一致时如何迁移。 表示这个符号属于源域 针对挑战1),本文选用聚类中心作为迁移知 识,因源域的聚类中心是各类所包含点的高度浓缩, 如果将1作为一个符号的下标, 表示这个符号属于目标域 亦是各类的代表点,将其作为聚类中的高级知识具 有更强的指导性:针对挑战2),本文提出了一个中
监督 的 聚 类 方 法 通 常 用 来 获 得 图 像 的 分 割 结 果[2-3] , 比 较 著 名 的 算 法 有 模 糊 C 均 值 算 法 (FCM) [4] 、可能性聚类算法( PCM) [5] 、极大熵聚类 算法[6]等。 这些方法虽简单实用,但其对于含噪图 像数据的分割效果并不理想。 尽管已有学者致力于 解决该问题,但效果并不明显。 1 问题描述 迁移学习技术[7]的提出,为我们提供了一种新 的解决问题的思路。 传统的机器学习假设训练数据 与测试数据服从相同的数据分布。 然而,大量实际 情况中并不满足这种同分布假设。 从另外一个角度 上看,如果我们已经有了大量的、在不同分布下的训 练数据,完全丢弃这些数据是非常浪费的。 如何合 理地利用这些数据就是迁移学习要解决的问题。 迁 移学习可以从现有的数据中迁移知识,用来帮助将 来的学习。 迁移学习的目标是将从一个环境中学到 的知识用来帮助新环境中的学习任务,其学习过程 类似人类的学习和思维方式。 我们面临的问题如图 1 所示。 图 1 问题描述 Fig.1 The description of the problem 源域的数据中往往存在一部分数据为可用数 据,如源域优质图像,目标域的数据通常呈现数据不 足或噪声污染严重[8-9]等情况,如目标域含噪图像。 如何才能得到最接近目标域理想分割的效果图,如 果能够将源域的知识成功迁移到目标域中进行学 习,是否能够大幅提高图像分割性能呢? 为了验证本文的设想,实现提高图像分割性能的 目标,本文将迁移学习方法融入到经典的极大熵聚类 算法[10] (maximum entropy clustering,MEC)中,以提高 极大熵算法的聚类性能,进而提高该算法对图像分割 的性能。 在将迁移学习策略融入到极大熵聚类算法 的过程中,我们面临的挑战有:1)选择源域的何种知 识进行迁移学习以增强目标域的聚类性能;2)当源域 和目标域的聚类数不一致时如何迁移。 针对挑战 1),本文选用聚类中心作为迁移知 识,因源域的聚类中心是各类所包含点的高度浓缩, 亦是各类的代表点,将其作为聚类中的高级知识具 有更强的指导性;针对挑战 2),本文提出了一个中 心迁移匹配机制用于处理源域和目标域聚类数不一 致的情况。 无论源域与目标域的聚类数是否相同, 该中心迁移匹配机制均可适用,且能够找到源域与 目标域类中心的最佳匹配关系。 将上述迁移知识与 中心迁移匹配机制融入到经典的极大熵聚类算法 中,本文提出了一种全新的基于知识迁移的极大熵 聚类算法,并将该算法成功应用于纹理图像分割中。 实验结果表明,本文所提出的基于知识迁移的极大 熵聚类算法在不同的迁移场景下对于纹理图像的分 割性能均优于其他迁移以及非迁移聚类算法。 本文 工作的创新主要涵盖以下几点: 1)确定了源域中哪种知识能够进行有效迁移, 即从源域数据中获取的聚类中心知识可以用来指导 并增强目标域的聚类性能; 2)给出了一种解决源域与目标域聚类数不同 时,如何进行有效迁移的途径,即提出了一种通用的 中心迁移匹配机制,不仅能够有效解决源域与目标 域聚类数不相同时的迁移问题,还能指导源域、目标 域聚类数相同时,各类中心如何一一对应的问题。 3)将上述两个问题的解决策略融入到极大熵 聚类算法后,本文提出了一种新的基于知识迁移的 极大熵聚类算法,实验表明该算法的聚类性能较其 他迁移聚类算法以及非迁移聚类算法在处理不同迁 移场景下的纹理分割图像时,具有更加优良的性能。 本文所用的符号说明如表 1 所示。 表 1 符号说明 Table 1 The explanation of some notations 符号 描述 U = [uij] C×N 隶属度矩阵, Uij 代表第 i 个 数据属于第 j 个聚类中心的可能性 P = [pjk] C t ×C s 知识迁移隶属度矩阵, pjk 代表目标域第 j 个中心属于源域第 k 个聚类中心的程度 V = [V1 … VC ] T Vi = [vi1 … viD ] T 聚类中心矩阵 Vi 代表第 i 个聚类中心 γ 熵的正则化参数 λ 迁移平衡参数 C 聚类数 T 总的迭代次数 N 样本总数 D 特征总数 s 如果将 s 作为一个符号的下标, 表示这个符号属于源域 t 如果将 t 作为一个符号的下标, 表示这个符号属于目标域 ·180· 智 能 系 统 学 报 第 12 卷
第2期 程肠,等:知识迁移的极大嫡聚类算法及其在纹理图像分割中的应用 ·181· 2相关工作 受到许多专家学者的关注,本文将研究中较有价值 的文献罗列如下:文献[11]提出了一种自学聚类算 2.1经典MEC算法 法,该算法是第1个基于互信息的迁移聚类算法,但 MEC聚类算法是基于划分的聚类算法中最具 是由于该算法运行的前提是假定源域数据是可用 代表性的算法之一,该算法的数学表达式简单明了、 的,这在实际生产应用中并不切实际,所以该算法具 物理意义明确,是广大学者较常使用的聚类算法,关 有一定的局限性:文献[12]提出了一种基于谱聚类 于MEC算法的变形算法较经典的如文献[10]。特 的迁移聚类算法,该算法主要针对光谱聚类;文献 别是在针对含有噪声的纹理图像的分割中,MC聚 [13]提出了一种极大嫡的迁移聚类算法,该算法提 类算法相比经典的模糊C均值聚类FCM以及可能 出了基于类中心和隶属度的两种知识迁移机制,但 性聚类PCM等聚类算法具有更好的抗噪性,进而能 该算法并未解决当源域目标域聚类数不一致时,如 够获得更好的聚类性,使得分割结果更加逼近理想 何进行迁移的问题。除了直接提出的迁移聚类算 分割结果。综上,本文选用了MEC算法。MEC算 法,还存在如协同聚类]、多任务聚类、联合聚 法的函数表达式为 类[6]、半监督聚类切)等具有相关性的聚类算法。 其中,协同聚类算法的核心思想为结合样本间不同 的协作能力形成拉动效应,共同推动事物的发展,从 而提高样本的整体聚类精度。多任务聚类的核心思 st.0≤ug≤1, 想为多个聚类任务同时进行,各个聚类任务之间相 互协调配合,以提高聚类性能。联合聚类顾名思义 1≤i≤C,1≤j≤N 就是联合多个聚类算法进行一定关系的联合使用, (1) 聚类精度的提高对于具体聚类算法的选择比较敏 式中:x为第j个数据样本,V,为第i个聚类中心,“ 感。半监督聚类算法需要已知一部分数据样本的标 为样本x属于聚类中心V:的隶属度,C为聚类数,N 签,根据这些标签来指导整个样本数据的聚类过程, 为样本总数,y为熵的正则化参数,Ix:-V:‖2代 从而提高聚类性能。 表样本x与聚类中心V:之间的距离。 现有的迁移聚类算法及其相关算法在处理含噪 由拉格朗日乘子法则,求解式(1),解得聚类中 的图像分割数据时,均存在各种问题。如文献[13]提 心V:和隶属度U:的表达式为 出的迁移聚类算法无法解决当源域与目标域的图像 分割数不一致时,如何实现迁移的问题。对于其他相 -,i=1,2,…,C (2) 关算法如联合算法来说,图像本身还有噪声,经过层 层的聚类算法进行处理,误差被层层放大,最终的聚 类性能则被削弱。本文所做研究主要针对纹理图像 exp(-∥5-yI2 分割进行展开,我们将在下一节针对算法的抗噪性、 g= 源域目标域聚类数是否一致等问题进行详细描述。 ep(-5v巴 (3) 3基于知识迁移的MEC聚类算法 k=1 i=1,2,…,C;j=1,2,…,N。 3.1基于聚类中心的知识迁移机制 MEC算法步骤如下: 源域中存在许多知识可用于迁移到目标域中进 1)给定聚类数C,样本总数N,正则化参数Y, 行学习。问题在于在具体选择时,应该选择哪种或哪 聚类精度ε,最大迭代次数T,初始化隶属度矩阵U 几种知识的组合进行迁移。源域中存在可以迁移的 和聚类中心V 知识主要有:聚类中心、隶属度、数据样本以及其他经 2)根据式(2)更新聚类中心矩阵V; 过二次或多次处理后获得的知识。考虑到源域的聚 3)根据式(3)更新隶属度矩阵U: 类中心具有较高的数据集中特征,且该知识作为自然 4)当‖U(t+1)-U(t)‖<e或迭代次数达 聚类知识的核心,本文最终选择了聚类中心作为知识 到最大迭代次数T时,算法运行终止,否则,返回2): 迁移的对象。基于中心迁移的表达式计算的是源域 5)算法收敛后,输出聚类中心V和隶属度矩阵U。 的聚类中心V,与目标域V,之间距离和。 2.2相关迁移聚类算法 4,(V,V,)=a∑IV.-VI2 (4) 近年来,迁移聚类算法及其相关算法的研究已
2 相关工作 2.1 经典 MEC 算法 MEC 聚类算法是基于划分的聚类算法中最具 代表性的算法之一,该算法的数学表达式简单明了、 物理意义明确,是广大学者较常使用的聚类算法,关 于 MEC 算法的变形算法较经典的如文献[10]。 特 别是在针对含有噪声的纹理图像的分割中,MEC 聚 类算法相比经典的模糊 C 均值聚类 FCM 以及可能 性聚类 PCM 等聚类算法具有更好的抗噪性,进而能 够获得更好的聚类性,使得分割结果更加逼近理想 分割结果。 综上,本文选用了 MEC 算法。 MEC 算 法的函数表达式为 min U,V ∑ C i = 1 ∑ N j = 1 μij‖xj - Vi‖2 + γ∑ C i = 1 ∑ N j = 1 μij ( ln μij) s.t. 0 ≤ μij ≤ 1, ∑ C i = 1 μij = 1, 1 ≤ i ≤ C,1 ≤ j ≤ N (1) 式中: xj 为第 j 个数据样本, Vi 为第 i 个聚类中心, uij 为样本 xj 属于聚类中心 Vi 的隶属度,C 为聚类数,N 为样本总数, γ 为熵的正则化参数, ‖xj - Vi‖2 代 表样本 xj 与聚类中心 Vi 之间的距离。 由拉格朗日乘子法则,求解式(1),解得聚类中 心 Vi 和隶属度 Uij 的表达式为 Vi = ∑ N j = 1 μijxj ∑ N j = 1 μij ,i = 1,2,…,C (2) μij = exp( - ‖xj - Vi‖2 γ ) ∑ C k = 1 exp( - ‖xj - Vk‖2 γ ) i = 1,2,…,C; j = 1,2,…,N。 (3) MEC 算法步骤如下: 1)给定聚类数 C,样本总数 N,正则化参数 γ , 聚类精度 ε ,最大迭代次数 T,初始化隶属度矩阵 U 和聚类中心 V; 2)根据式(2)更新聚类中心矩阵 V; 3)根据式(3)更新隶属度矩阵 U; 4)当 ‖U(t + 1) - U(t) ‖ < ε 或迭代次数达 到最大迭代次数 T 时,算法运行终止,否则,返回 2); 5)算法收敛后,输出聚类中心 V 和隶属度矩阵 U。 2.2 相关迁移聚类算法 近年来,迁移聚类算法及其相关算法的研究已 受到许多专家学者的关注,本文将研究中较有价值 的文献罗列如下:文献[11]提出了一种自学聚类算 法,该算法是第 1 个基于互信息的迁移聚类算法,但 是由于该算法运行的前提是假定源域数据是可用 的,这在实际生产应用中并不切实际,所以该算法具 有一定的局限性;文献[12]提出了一种基于谱聚类 的迁移聚类算法,该算法主要针对光谱聚类;文献 [13]提出了一种极大熵的迁移聚类算法,该算法提 出了基于类中心和隶属度的两种知识迁移机制,但 该算法并未解决当源域目标域聚类数不一致时,如 何进行迁移的问题。 除了直接提出的迁移聚类算 法,还存在如协同聚类[14] 、多任务聚类[15] 、联合聚 类[16] 、半监督聚类[17] 等具有相关性的聚类算法。 其中,协同聚类算法的核心思想为结合样本间不同 的协作能力形成拉动效应,共同推动事物的发展,从 而提高样本的整体聚类精度。 多任务聚类的核心思 想为多个聚类任务同时进行,各个聚类任务之间相 互协调配合,以提高聚类性能。 联合聚类顾名思义 就是联合多个聚类算法进行一定关系的联合使用, 聚类精度的提高对于具体聚类算法的选择比较敏 感。 半监督聚类算法需要已知一部分数据样本的标 签,根据这些标签来指导整个样本数据的聚类过程, 从而提高聚类性能。 现有的迁移聚类算法及其相关算法在处理含噪 的图像分割数据时,均存在各种问题。 如文献[13]提 出的迁移聚类算法无法解决当源域与目标域的图像 分割数不一致时,如何实现迁移的问题。 对于其他相 关算法如联合算法来说,图像本身还有噪声,经过层 层的聚类算法进行处理,误差被层层放大,最终的聚 类性能则被削弱。 本文所做研究主要针对纹理图像 分割进行展开,我们将在下一节针对算法的抗噪性、 源域目标域聚类数是否一致等问题进行详细描述。 3 基于知识迁移的 MEC 聚类算法 3.1 基于聚类中心的知识迁移机制 源域中存在许多知识可用于迁移到目标域中进 行学习。 问题在于在具体选择时,应该选择哪种或哪 几种知识的组合进行迁移。 源域中存在可以迁移的 知识主要有:聚类中心、隶属度、数据样本以及其他经 过二次或多次处理后获得的知识。 考虑到源域的聚 类中心具有较高的数据集中特征,且该知识作为自然 聚类知识的核心,本文最终选择了聚类中心作为知识 迁移的对象。 基于中心迁移的表达式计算的是源域 的聚类中心 Vs 与目标域 Vt 之间距离和。 Δ1(Vs,Vt) = λ∑ Ct j = 1 ‖ Vj,t - Vj,s‖2 (4) 第 2 期 程旸,等:知识迁移的极大熵聚类算法及其在纹理图像分割中的应用 ·181·
.182 智能系统学报 第12卷 式中:入为迁移平衡参数,一般大于0,其值越大,表 1)知识提取 示源域知识在目标域中所占分量越大;C,为目标域 利用经典的极大嫡聚类算法对源域的数据集进 聚类数;V为目标域中第j个聚类中心;V为源 行聚类,得到源域的聚类中心V,。知识提取的表达 域中第j个聚类中心。 式为 3.2基于聚类中心的迁移匹配机制 式(4)尽管实现了源域知识向目标域迁移进行 指导学习的目的,但其并未解决源域与目标域的聚 类数不相同时,如何进行迁移和中心间的匹配问题。 st4e[0,1],∑u=1,1≤i≤G,1≤j≤N 本小节,我们将致力于探讨能否确定一个通用的准 = 则,无论源域与目标域的聚类数是否一致均能自适 (6) 应地匹配。为了解决上述问题,本文引入了模糊聚 通过求解式(6),得到源域聚类中心V,。 类理论来解决该问题,从而提出了一种中心迁移匹 2)知识匹配与迁移 配机制。中心迁移匹配机制的表达式为 利用中心迁移匹配机制将阶段1得到的聚类知 识进行自适应匹配,使源域中的聚类中心(知识)能 4,(Dv,y)=AΣP=IV.-V. C 够与目标域中的聚类中心进行完美匹配,以解决源 域和目标域不同类时的迁移问题。同时,将匹配后 stp4e[0,1],∑P4=1,1≤i≤N 的源域知识迁移到目标域中加以利用。结合极大熵 k=1 聚类算法,基于知识迁移的极大嫡聚类算法(KT 1≤广≤C,1≤k≤C MEC),该算法的函数表达式为 (5) 式(5)解决了源域的聚类中心V,与目标域V, JKT-MEC 、5‖xw-,/ 之间的匹配问题。其中,参数P,:为知识迁移隶属 度,P:表示目标域的第j个类中心与源域的第k个 2 g.+A∑ pV-V+ = 类中心进行匹配的隶属度。当P:→1,表示目标域 的第j个类中心完全匹配源域的第k个类中心:当 ∑PlnP (7) P:→0,表示目标域的第j个类中心不匹配源域的第 k个类中心,若出现不匹配的情况,源域中未找到匹 .ue[0,l],∑u=1,p4∈[0,1].∑pt 配聚类中心的那个聚类中心将会从源域的聚类中心 =1 =1 中删除掉。V,为目标域数据样本的大小,C,为目标 1≤j≤N,1≤i≤C,1≤k≤C 域聚类数,C,为源域聚类数。 式中:“为目标域隶属度,为目标域第j个样本 3.3 基于知识迁移的极大熵聚类算法 数据,V,为目标域第i个聚类中心,y为嫡的正则 将上述知识迁移机制与知识匹配机制融入到 化参数,C,为目标域聚类数,N,为目标域样本总数, MEC聚类算法后,本文提出一种基于知识迁移的极 入为知识迁移的平衡系数,P:表示目标域的第i个 大嫡聚类算法。该算法的流程主要分为两个阶段, 类中心迁移到源域的第k个类中心的知识迁移隶属 流程图如图2所示。 度,V为源域的第k个类中心,刀为迁移项的正则 阶段1:知识提取 化参数。通过拉格朗日乘子法最小化式(7),各参 聚类知识 数表达式如下: 源域 MEC算法 数据果 …,'cr 目标域隶属度u,1: 阶段2:知识匹配与迁移 ep(-5-.I3 = 目标域 基于知识的中心迁移匹配 数据集 ∑ep(-a- 2 目标域聚类中心4: 基于知识迁移的极大嫡聚类算法 N: C 最优聚类结果 s11 图2KT-MEC算法流程图 Th +pa Fig.2 The flowchart of KT-MEC algorithm k=
式中: λ 为迁移平衡参数,一般大于 0,其值越大,表 示源域知识在目标域中所占分量越大; Ct 为目标域 聚类数; Vj,t 为目标域中第 j 个聚类中心; Vj,s 为源 域中第 j 个聚类中心。 3.2 基于聚类中心的迁移匹配机制 式(4)尽管实现了源域知识向目标域迁移进行 指导学习的目的,但其并未解决源域与目标域的聚 类数不相同时,如何进行迁移和中心间的匹配问题。 本小节,我们将致力于探讨能否确定一个通用的准 则,无论源域与目标域的聚类数是否一致均能自适 应地匹配。 为了解决上述问题,本文引入了模糊聚 类理论来解决该问题,从而提出了一种中心迁移匹 配机制。 中心迁移匹配机制的表达式为 Δ2 Pt,s,Vt,Vs ( ) = λ∑ Ct j = 1 ∑ Cs k = 1 pjk ‖ Vj,t - Vk,s‖2 s.t. pjk ∈ [0,1],∑ Cs k = 1 pjk = 1,1 ≤ i ≤ Nt 1 ≤ j ≤ Ct,1 ≤ k ≤ Cs (5) 式(5)解决了源域的聚类中心 Vs 与目标域 Vt 之间的匹配问题。 其中,参数 Pt,s 为知识迁移隶属 度, pjk 表示目标域的第 j 个类中心与源域的第 k 个 类中心进行匹配的隶属度。 当 pjk → 1,表示目标域 的第 j 个类中心完全匹配源域的第 k 个类中心;当 pjk → 0,表示目标域的第 j 个类中心不匹配源域的第 k 个类中心,若出现不匹配的情况,源域中未找到匹 配聚类中心的那个聚类中心将会从源域的聚类中心 中删除掉。 Nt 为目标域数据样本的大小, Ct 为目标 域聚类数, Cs 为源域聚类数。 3.3 基于知识迁移的极大熵聚类算法 将上述知识迁移机制与知识匹配机制融入到 MEC 聚类算法后,本文提出一种基于知识迁移的极 大熵聚类算法。 该算法的流程主要分为两个阶段, 流程图如图 2 所示。 图 2 KT⁃MEC 算法流程图 Fig.2 The flowchart of KT⁃MEC algorithm 1)知识提取 利用经典的极大熵聚类算法对源域的数据集进 行聚类,得到源域的聚类中心 Vs 。 知识提取的表达 式为 JMEC = ∑ Cs i = 1 ∑ Ns j = 1 μij,s ‖ xj,t - Vi,s‖2 + γ∑ Cs i = 1 ∑ Ns j = 1 μij,s ln μij,s s.t. μij,s ∈ [0,1],∑ Cs i = 1 μij,s = 1,1 ≤ i ≤ Cs,1 ≤ j ≤ Ns (6) 通过求解式(6),得到源域聚类中心 Vs 。 2)知识匹配与迁移 利用中心迁移匹配机制将阶段 1 得到的聚类知 识进行自适应匹配,使源域中的聚类中心(知识)能 够与目标域中的聚类中心进行完美匹配,以解决源 域和目标域不同类时的迁移问题。 同时,将匹配后 的源域知识迁移到目标域中加以利用。 结合极大熵 聚类算法,基于知识迁移的极大熵聚类算法(KT⁃ MEC),该算法的函数表达式为 JKT-MEC = ∑ Ct i = 1 ∑ Nt j = 1 μij,t ‖ xj,t - Vi,t‖2 + γ∑ Ct i = 1 ∑ Nt j = 1 μij,t ln μij,t + λ∑ Ct i = 1 ∑ Cs k = 1 pik ‖ Vi,t - Vk,s‖2 + η∑ Ct i = 1 ∑ Cs k = 1 pik ln pik (7) s.t.uij,t ∈ [0,1],∑ Ct i = 1 μij,t = 1,pik ∈ [0,1],∑ Cs k = 1 pik = 1 1 ≤ j ≤ Nt,1 ≤ i ≤ Ct,1 ≤ k ≤ Cs 式中: uij,t 为目标域隶属度, xj,t 为目标域第 j 个样本 数据, Vi,t 为目标域第 i 个聚类中心, γ 为熵的正则 化参数, Ct 为目标域聚类数, Nt 为目标域样本总数, λ 为知识迁移的平衡系数, pik 表示目标域的第 i 个 类中心迁移到源域的第 k 个类中心的知识迁移隶属 度, Vk,s 为源域的第 k 个类中心, η 为迁移项的正则 化参数。 通过拉格朗日乘子法最小化式(7),各参 数表达式如下: 目标域隶属度 uij,t : μij,t = exp( - ‖ xj,t - Vi,t‖2 γ ) ∑ Ct l = 1 exp( - ‖ xj,t - Vl,t‖2 γ ) 目标域聚类中心 vi,t : vi,t = ∑ Nt j = 1 μij,t xj,t + λ∑ Cs k = 1 pik Vk,s ∑ Nt j = 1 μij,t + λ∑ Cs k = 1 pik ·182· 智 能 系 统 学 报 第 12 卷
第2期 程肠,等:知识迁移的极大嫡聚类算法及其在纹理图像分割中的应用 ·183 知识迁移隶属度Pk: 为3、4、5、6,σ=0.1。 exp(-Vi) ∑ep(-4 vv巴 通过上述两个阶段的流程,将各源域与目标域 (a源域S b)7 (c)7 (d)7 的相关数据带入到各表达式中,得到最终的聚类结 果。KT-MEC聚类算法的详细步骤如下: 输入源域数据集x,目标域数据集x,源域聚 类数C,目标域聚类数C,嫡的正则化参数y,收敛 ©T, (0T (g)T (h)7 ①T 精度ε,最大迭代次数T: 输出目标域隶属度U,目标域聚类中心V,。 图3源域及不同情况下目标域的纹理图像数据 知识提取阶段: Fig.3 Texture image datasets of one source domain and 1)随机初始化源域的隶属度矩阵U,; some different target domains 2)利用式(2)求得源域的聚类中心V,: 理想分割图可用来为各算法的分割性能优劣作 3)利用式(3)求得源域的隶属度U,: 参考,理想的纹理分割结果如图4所示。 4)满足迭代终止条件则输出源域聚类中心V, 并终止算法,否则返回2)。 知识匹配与迁移阶段: 1)随机初始化目标域的隶属度矩阵U,以及聚 类中心V,; 2)利用式(8)求得目标域的隶属度矩阵U,; (aT、T bT、T (c)7. 3)利用式(9)求得目标域聚类中心矩阵V,: 4)利用式(10)求得目标域的知识迁移隶属度 矩阵Ps; 5)如满足迭代终止条件则输出目标域隶属度 矩阵,聚类中心V,并终止算法,否则返回2)。 (d)Ta (e), (f)T. 4实验与分析 图4不同纹理图像的理想分割结果 为了评估本文所提KT-MEC聚类算法的性能, Fig.4 Ideal segmentation result of different texture images 实验所使用的对比算法有:非迁移MEC聚类算法、 纹理图像分割的过程概括如下。文献[先采 自学聚类算法(STC)m)、迁移谱聚类算法 用Gabor滤波器在6个方向提取纹理图像特征的滤 (TSC)[2]、DRCC协同聚类算法[s)、CombKM多任 波器组。每个纹理图像的数据集包含30维特征,数 务聚类算法u)。本文实验所用数据集为Brodatz纹 据集大小为10000。不同算法得到的类被认为分割 理图像分割数据集。 图像的一个区域。 Brodatz纹理图像由7个基本纹理图像(D3、D。、 4.1实验参数设置 D2DgD3D6、Dg)合成,具体见图3。合成纹理 通常用来衡量聚类算法性能的指标有:NMI、 图像的大小被重新调整为100像素×100像素。为 RL、Entropy、F-measure等,本文主要采用以下两种评 了模拟真实数据集环境,本文将不同标准偏差的高 估指标: 斯噪声添加到各个纹理图像中。实验中,图3(a)为 源域的图像数据,图3(b)~(i)为在不同的目标域 (NogN NMI=- 中的图像数据。为了模拟不同的迁移场景,我们设 计了两种不同迁纹理图像分割任务,目标域图像T, N log N/N· ∑N,log N/N ~T4与源域图像的类别数均为7,σ=0.1,0.2,0.0, Joo +fu 0.1;目标域图像T,~T。与源域图像的类别数分别 RI=N(N-1)/2
知识迁移隶属度 pik : pik = exp( - λ ‖ Vi,t - Vk,s‖2 η ) ∑ Cs l ' = 1 exp( - λ ‖ Vi,t - Vl ',s‖2 η ) 通过上述两个阶段的流程,将各源域与目标域 的相关数据带入到各表达式中,得到最终的聚类结 果。 KT⁃MEC 聚类算法的详细步骤如下: 输入 源域数据集 xs,目标域数据集 xt,源域聚 类数 Cs,目标域聚类数 Ct,熵的正则化参数 γ,收敛 精度 ε,最大迭代次数 T; 输出 目标域隶属度Ut,目标域聚类中心Vt。 知识提取阶段: 1)随机初始化源域的隶属度矩阵Us; 2)利用式(2)求得源域的聚类中心Vs; 3)利用式(3)求得源域的隶属度Us; 4)满足迭代终止条件则输出源域聚类中心Vs 并终止算法,否则返回 2)。 知识匹配与迁移阶段: 1)随机初始化目标域的隶属度矩阵Ut 以及聚 类中心Vt; 2)利用式(8)求得目标域的隶属度矩阵Ut; 3)利用式(9)求得目标域聚类中心矩阵Vt; 4)利用式(10)求得目标域的知识迁移隶属度 矩阵Pts; 5)如满足迭代终止条件则输出目标域隶属度 矩阵Ut,聚类中心Vt,并终止算法,否则返回 2)。 4 实验与分析 为了评估本文所提 KT⁃MEC 聚类算法的性能, 实验所使用的对比算法有:非迁移 MEC 聚类算法、 自 学 聚 类 算 法 ( STC ) [11] 、 迁 移 谱 聚 类 算 法 (TSC) [12] 、DRCC 协同聚类算法[15] 、CombKM 多任 务聚类算法[15] 。 本文实验所用数据集为 Brodatz 纹 理图像分割[17]数据集。 Brodatz 纹理图像由 7 个基本纹理图像(D3 、D6 、 D21 、D49 、D53 、D56 、D93 )合成,具体见图 3。 合成纹理 图像的大小被重新调整为 100 像素×100 像素。 为 了模拟真实数据集环境,本文将不同标准偏差的高 斯噪声添加到各个纹理图像中。 实验中,图 3(a)为 源域的图像数据,图 3( b) ~ ( i)为在不同的目标域 中的图像数据。 为了模拟不同的迁移场景,我们设 计了两种不同迁纹理图像分割任务,目标域图像 T1 ~ T4 与源域图像的类别数均为 7, σ = 0.1,0.2,0.0, 0.1;目标域图像 T5 ~ T8 与源域图像的类别数分别 为 3、4、5、6, σ = 0.1。 图 3 源域及不同情况下目标域的纹理图像数据 Fig.3 Texture image datasets of one source domain and some different target domains 理想分割图可用来为各算法的分割性能优劣作 参考,理想的纹理分割结果如图 4 所示。 图 4 不同纹理图像的理想分割结果 Fig.4 Ideal segmentation result of different texture images 纹理图像分割的过程概括如下。 文献[19] 先采 用 Gabor 滤波器在 6 个方向提取纹理图像特征的滤 波器组。 每个纹理图像的数据集包含 30 维特征,数 据集大小为 10 000。 不同算法得到的类被认为分割 图像的一个区域。 4.1 实验参数设置 通常用来衡量聚类算法性能的指标有:NMI、 RI、Entropy、F⁃measure 等,本文主要采用以下两种评 估指标: NMI = ∑ C i = 1 ∑ C j = 1 (Ni,j log N·Ni,j) / Ni·Nj ∑ C i = 1 Ni log Ni / N·∑ C j = 1 Nj log Nj / N RI = f 00 + f 11 N(N - 1) / 2 第 2 期 程旸,等:知识迁移的极大熵聚类算法及其在纹理图像分割中的应用 ·183·
.184 智能系统学报 第12卷 式中:N,表示第i个聚类与类j的契合程度,N:表 在本文所使用的对比算法中,极大嫡聚类MEC 示第i个聚类所包含的数据样本量,N,表示类j所 的嫡正则化参数y∈{0:0.05:1},协同聚类 包含的数据样本量,而N表示整个数据样本的总量 DRCC的正则化参数A和4取值为 大小。RI表达式中的f。表示数据点具有不同的类 {0.1,1,10,100,500,1000}。 标签并且属于不同类的配对点数目,f,则表示数据 上述所有参数均由网格搜索[18]得到最优值, 点具有相同的类标签并且属于同一类的配对点数 实验结果均为运行算法15次的结果取均值及方 目,而N表示整个数据样本的总量大小。NMI、I 差所得。实验均在MARTLAB8.1.0.604 两种评价指标的取值范围均为[0,1],取值越大表 (R2013a)平台下完成,操作系统为64位Win 明算法的性能越好。 dows7,CPU Intel(R)Core(TM)i3-3240 3.40 在本文所使用的迁移算法中,KT-MEC算法的 GHz,内存为4GB。 嫡正则化参数y∈{0:0.05:1},迁移平衡因子 4.2聚类数相同的纹理图像分割 入∈{0.1,0.5,1,5,10,50,100,500,1000},迁移隶 表2与图5分别为源域与目标域聚类数相同 属度的正则化参数7∈{0:0.05:1}。TSC算法和 时,各算法对纹理图像进行分割时的聚类性能对比 ST℃算法的参数设置详见文献[11]和文献[12]。 与图像分割结果对比。 表2源域与目标域的聚类数相同时的各算法聚类性能对比 Table 2 Performance comparison of algorithms when the number of clusters of source domain and target domain are same 数据集 评价指标 MEC CombKM DRCC STC TSC KT-MEC NMI-mean 0.4151 0.2500 0.2480 0.4986 0.5133 0.6336 NMI-std 0.0052 0.0308 0.0213 0 0.0066 0.0049 T RI-mean 0.8268 0.7532 0.7905 0.8690 0.8772 0.9063 RI-std 0.0087 0.0154 0.0037 0 0.0022 0.0011 NMI-mean 0.3027 0.2311 0.2264 0.3696 0.3470 0.5350 NMI-std 0.0048 0.0481 0.0188 0 0 0.0091 RI-mean 0.7777 0.7063 0.7783 0.7839 0.7708 0.8569 RI-std 0.0052 0.0287 0.0015 0 0 0.0124 NMI-mean 0.6039 0.6092 0.3422 0.6511 0.6104 0.6198 NMI-std 0.0359 0.0240 0.0241 0 5.77×104 0.0032 RI-mean 0.8553 0.8611 0.7849 0.8877 0.8726 0.8644 RI-std 0.0185 0.0268 0.0204 0 2.31×104 0.0008 NMI-mean 0.4557 0.4261 0.2413 0.5497 0.5511 0.6147 NMI-std 0.0197 0.0193 0.0143 0 0 0.0011 T RI-mean 0.8178 0.8082 0.7848 0.8472 0.8496 0.8757 RI-std 0.0044 0.0073 0.0013 0 0 0.0008 (a)6种算法分别在数据集T,上的图像分割结果 (b)6种算法分别在数据集T2上的图像分割结果
式中: Ni,j 表示第 i 个聚类与类 j 的契合程度, Ni 表 示第 i 个聚类所包含的数据样本量, Nj 表示类 j 所 包含的数据样本量,而 N 表示整个数据样本的总量 大小。 RI 表达式中的 f 00 表示数据点具有不同的类 标签并且属于不同类的配对点数目, f 11 则表示数据 点具有相同的类标签并且属于同一类的配对点数 目,而 N 表示整个数据样本的总量大小。 NMI、RI 两种评价指标的取值范围均为[0,1],取值越大表 明算法的性能越好。 在本文所使用的迁移算法中,KT⁃MEC 算法的 熵正则化参数 γ ∈{ 0 ∶ 0. 05 ∶ 1},迁移平衡因子 λ ∈{0.1,0.5,1,5,10,50,100,500,1 000} , 迁移隶 属度的正则化参数 η ∈{0 ∶ 0.05 ∶ 1}。 TSC 算法和 STC 算法的参数设置详见文献[11]和文献[12]。 在本文所使用的对比算法中,极大熵聚类 MEC 的熵正则化参数 γ ∈ { 0 ∶ 0. 05 ∶ 1}, 协同聚类 DRCC 的 正 则 化 参 数 λ 和 μ 取 值 为 {0.1,1,10,100,500,1 000} 。 上述所有参数均由网格搜索[ 18] 得到最优值, 实验结果均为运行算法 15 次的结果取均值及方 差 所 得。 实 验 均 在 MARTLAB 8. 1. 0. 604 (R2013a)平 台 下 完 成, 操 作 系 统 为 64 位 Win⁃ dows7,CPU 为 Intel( R) Core( TM) i3⁃3240 3. 40 GHz,内存为 4 GB。 4.2 聚类数相同的纹理图像分割 表 2 与图 5 分别为源域与目标域聚类数相同 时,各算法对纹理图像进行分割时的聚类性能对比 与图像分割结果对比。 表 2 源域与目标域的聚类数相同时的各算法聚类性能对比 Table 2 Performance comparison of algorithms when the number of clusters of source domain and target domain are same 数据集 评价指标 MEC CombKM DRCC STC TSC KT⁃MEC T1 NMI⁃mean 0.415 1 0.250 0 0.248 0 0.498 6 0.513 3 0.633 6 NMI⁃std 0.005 2 0.030 8 0.021 3 0 0.006 6 0.004 9 RI⁃mean 0.826 8 0.753 2 0.790 5 0.869 0 0.877 2 0.906 3 RI⁃std 0.008 7 0.015 4 0.003 7 0 0.002 2 0.001 1 T2 NMI⁃mean 0.302 7 0.231 1 0.226 4 0.369 6 0.347 0 0.535 0 NMI⁃std 0.004 8 0.048 1 0.018 8 0 0 0.009 1 RI⁃mean 0.777 7 0.706 3 0.778 3 0.783 9 0.770 8 0.856 9 RI⁃std 0.005 2 0.028 7 0.001 5 0 0 0.012 4 T3 NMI⁃mean 0.603 9 0.609 2 0.342 2 0.651 1 0.610 4 0.619 8 NMI⁃std 0.035 9 0.024 0 0.024 1 0 5.77×10 -4 0.003 2 RI⁃mean 0.855 3 0.861 1 0.784 9 0.887 7 0.872 6 0.864 4 RI⁃std 0.018 5 0.026 8 0.020 4 0 2.31×10 -4 0.000 8 T4 NMI⁃mean 0.455 7 0.426 1 0.241 3 0.549 7 0.551 1 0.614 7 NMI⁃std 0.019 7 0.019 3 0.014 3 0 0 0.001 1 RI⁃mean 0.817 8 0.808 2 0.784 8 0.847 2 0.849 6 0.875 7 RI⁃std 0.004 4 0.007 3 0.001 3 0 0 0.000 8 (a) 6 种算法分别在数据集 T1 上的图像分割结果 (b) 6 种算法分别在数据集 T2 上的图像分割结果 ·184· 智 能 系 统 学 报 第 12 卷
第2期 程肠,等:知识迁移的极大嫡聚类算法及其在纹理图像分割中的应用 ·185. 如表2和图5的聚类结果所示,本文提出的KT-MEC 算法与协同算法DRCC以及多任务聚类算法Com bKM相比,本文算法仍然较优,这是因为多任务聚类 与迁移聚类的原理明显不同。协同聚类与多任务聚 类在集中完成多个聚类任务的同时,通过使用每个聚 类任务的独立信息和多个聚类任务间的潜在相关信 息,以获得良好的聚类性能。然而,在迁移聚类场景 中,目标域的数据不能提供正确的聚类信息,这就会 使得协同聚类和多任务聚类算法的聚类性能变弱。 中” 此外,由于本文提出的KT-MEC算法较其他迁 (c)6种算法分别在数据集T,上的图像分割结果 移聚类算法、协同聚类算法、多任务聚类算法具有更 好的聚类性能,这进一步表明先进的集群知识(如聚 类中心)可以被看作是一种有效的迁移知识,以提高 目标域的聚类性能。这也表明本文提出的聚类中心 自适应匹配机制能使源域的类中心与目标域的类中 心进行成功匹配,达到知识迁移的目的。 4.3聚类数不同的纹理图像分割 表3与图6分别为源域与目标域聚类数不同 时,各算法对纹理图像进行分割时的聚类性能对比 与图像分割结果对比。 (d)6种算法分别在数据集T:上的图像分割结果 由于协同聚类算法DRCC、迁移聚类算法STC 图5源域与目标域聚类数相同的含噪纹理图像分割结果 和T$C的聚类机制需要源域与目标域有相同的聚类 Fig.5 Segmentation results of clustering algorithms for 数,所以这3种聚类算法不能在源域与目标域聚类 noisy texture images with the same number of 数不同的迁移场景下运行。 clusters between source domain and target domain 表3和图6的实验结果表明本文提出KT-MEC 从表2和图5的聚类结果可以观察到,迁移聚类 聚类算法在图像分割性能上较经典的非迁移MEC 算法(STC、TSC、KT-MEC)在T,~T,数据集上取得了比 算法以及CombKM算法具有更优的聚类性能。此 传统的非迁移聚类算法更高的聚类精度。表2中NM 外,得益于本文提出的基于知识的中心迁移机制,源 和值以及图5中可视化的分割结果,均表明本文所 域与目标域聚类数不同的迁移场景中的聚类结果表 提出的KT-MEC聚类算法优于经典的MEC算法。以 上结果进一步表明,在含噪的数据环境中,本文KT 明了本文提出的基于知识的中心匹配机制可挖掘出 EC算法具有比MEC更好的鲁棒性,也进一步表明迁 源域和目标域之间完美的聚类中心的配对关系,进 移学习技术是提高算法鲁棒性的有效途径。 而确保知识迁移的质量。 表3源域与目标域的聚类数不同时的各算法聚类性能对比 Table 3 Performance comparison of algorithms when the number of clusters of source domain and target domain are different 数据集 评价指标 MEC CombKM DRCC STC TSC KT-MEC NMI-mean 0.4644 0.5557 一 0.6501 NMI-std 0.0002 0.0201 T 一 一 7.064×105 RI-mean 0.7817 0.7310 一 一 0.8360 RI-std 0.0001 0.0220 5.90x105 NMI-mean 0.2680 0.5087 一 0.7628 NMI-std 0.0050 0.0690 - 1.11×10-16 RI-mean 0.6872 0.6578 0.9168 RI-std 0.0020 0.0888 1.35×10-6
(c) 6 种算法分别在数据集 T3 上的图像分割结果 (d) 6 种算法分别在数据集 T4 上的图像分割结果 图 5 源域与目标域聚类数相同的含噪纹理图像分割结果 Fig.5 Segmentation results of clustering algorithms for noisy texture images with the same number of clusters between source domain and target domain 从表 2 和图 5 的聚类结果可以观察到,迁移聚类 算法(STC、TSC、KT⁃MEC)在 T1 ~T4 数据集上取得了比 传统的非迁移聚类算法更高的聚类精度。 表 2 中 NMI 和 RI 值以及图 5 中可视化的分割结果,均表明本文所 提出的 KT⁃MEC 聚类算法优于经典的 MEC 算法。 以 上结果进一步表明,在含噪的数据环境中,本文 KT⁃ MEC 算法具有比 MEC 更好的鲁棒性,也进一步表明迁 移学习技术是提高算法鲁棒性的有效途径。 如表 2 和图 5 的聚类结果所示,本文提出的 KT⁃MEC 算法与协同算法 DRCC 以及多任务聚类算法 Com⁃ bKM 相比,本文算法仍然较优,这是因为多任务聚类 与迁移聚类的原理明显不同。 协同聚类与多任务聚 类在集中完成多个聚类任务的同时,通过使用每个聚 类任务的独立信息和多个聚类任务间的潜在相关信 息,以获得良好的聚类性能。 然而,在迁移聚类场景 中,目标域的数据不能提供正确的聚类信息,这就会 使得协同聚类和多任务聚类算法的聚类性能变弱。 此外,由于本文提出的 KT⁃MEC 算法较其他迁 移聚类算法、协同聚类算法、多任务聚类算法具有更 好的聚类性能,这进一步表明先进的集群知识(如聚 类中心)可以被看作是一种有效的迁移知识,以提高 目标域的聚类性能。 这也表明本文提出的聚类中心 自适应匹配机制能使源域的类中心与目标域的类中 心进行成功匹配,达到知识迁移的目的。 4.3 聚类数不同的纹理图像分割 表 3 与图 6 分别为源域与目标域聚类数不同 时,各算法对纹理图像进行分割时的聚类性能对比 与图像分割结果对比。 由于协同聚类算法 DRCC、迁移聚类算法 STC 和 TSC 的聚类机制需要源域与目标域有相同的聚类 数,所以这 3 种聚类算法不能在源域与目标域聚类 数不同的迁移场景下运行。 表 3 和图 6 的实验结果表明本文提出 KT⁃MEC 聚类算法在图像分割性能上较经典的非迁移 MEC 算法以及 CombKM 算法具有更优的聚类性能。 此 外,得益于本文提出的基于知识的中心迁移机制,源 域与目标域聚类数不同的迁移场景中的聚类结果表 明了本文提出的基于知识的中心匹配机制可挖掘出 源域和目标域之间完美的聚类中心的配对关系,进 而确保知识迁移的质量。 表 3 源域与目标域的聚类数不同时的各算法聚类性能对比 Table 3 Performance comparison of algorithms when the number of clusters of source domain and target domain are different 数据集 评价指标 MEC CombKM DRCC STC TSC KT⁃MEC T5 NMI⁃mean 0.464 4 0.555 7 — — — 0.650 1 NMI⁃std 0.000 2 0.020 1 — — — 7.064×10 -5 RI⁃mean 0.781 7 0.731 0 — — — 0.836 0 RI⁃std 0.000 1 0.022 0 — — — 5.90×10 -5 T6 NMI⁃mean 0.268 0 0.508 7 — — — 0.762 8 NMI⁃std 0.005 0 0.069 0 — — — 1.11×10 -16 RI⁃mean 0.687 2 0.657 8 — — — 0.916 8 RI⁃std 0.002 0 0.088 8 — — — 1.35×10 -16 第 2 期 程旸,等:知识迁移的极大熵聚类算法及其在纹理图像分割中的应用 ·185·
.186 智能系统学报 第12卷 续表3 数据集 评价指标 MEC CombKM DRCC STC TSC KT-MEC NMI-mean 0.2910 0.5769 0.7278 NMI-std 0.0080 0.0189 T 0 RI-mean 0.7325 0.7347 一 0.9054 RI-std 0.0033 0.0476 一 一 0 NMI-mean 0.2038 0.5728 一 一 0.6914 NMI-std 0.0225 0.0329 一 T 1.11×10-6 RI-mean 0.7399 0.7941 0.9032 RI-std 0.0059 0.0160 0 5结束语 本文研究是基于迁移学习的聚类算法,实验部分 主要针对纹理图像的分割。本文算法对迁移聚类算 法的贡献主要有两方面:1)确定了聚类中心作为迁移 (a)6种算法分别在数据集T,上的图像分割结果 知识,实验证明了将聚类中心作为迁移知识能够更好 地增强目标域的聚类性能:2)找到了一个解决无论源 域与目标域的聚类数是否一致,都能够成功进行迁移 的通用策略。基于上述工作,结合传统的非迁移极大 嫡聚类算法,本文提出了基于知识迁移的极大嫡聚类 算法,并将该算法与其他迁移算法、非迁移算法、协同 (b)6种算法分别在数据集T。上的图像分割结果 聚类算法、多任务聚类算法等一系列相关算法进行了 性能对比,实验表明本文KT-MEC聚类算法的性能在 纹理图像分割上较其他算法具有更加优良的性能。 KT-MEC聚类算法不仅能够提高算法的聚类精度,增 强图像的分割效果,还能适应不同迁移场景下的聚类 任务,具有较强的鲁棒性。 (©)6种算法分别在数据集T上的图像分割结果 虽然本文KT-MEC聚类算法在纹理图像的分割 上具有较好的性能,但该算法的适应性上还需进行 进一步的研究。随着数据的爆炸式增长,数据复杂 性的迅速增加,KT-MEC聚类算法是否能够适用于 高维复杂数据还有待研究。 参考文献: ()6种算法分别在数据集了,上的图像分割结果 图6源域与目标域聚类数不同的含噪纹理图像分割结果 [1]ZHU Lin,CHUNG F L.WANG Shitong.Generalized fuzzy Fig.6 Segmentation results of clustering algorithms for c-means clustering algorithm with improved fuzzy partitions noisy texture images with the different number [J].IEEE transactions on systems,man,and cybernetics, of clusters between source domain and target do- part B (cybernetics),2009,39(3):578-591. main [2]KIM S,YOO C D,NOWOZIN S,et al.Image segmentation 上述实验结果表明本文提出的KT-MEC聚类算 usinghigher-order correlation clustering[J].IEEE transac- 法在不同的迁移场景中的聚类性能均优于现有的相 tions on pattern analysis and machine intelligence,2014,36 (9):1761-1774 关聚类算法。特别是,KT-MEC聚类算法适用于一 [3]JIANG Yizhang,CHUNG F L,WANG Shitong,et al.Col- 般的迁移场景,即无论是源域和目标域的聚类的数 laborative fuzzy clustering from multiple weighted views[J]. 目是相同或不同时,本文KT-MEC算法均能适用且 IEEE transactions on cybernetics,2015,45(4):688-701. 能获得比其他聚类算法更好的聚类结果。 [4]BEZDEK J C.Pattern recognition with fuzzy objective func- tion algorithms M].USA:Springer Science Business
续表 3 数据集 评价指标 MEC CombKM DRCC STC TSC KT⁃MEC T7 NMI⁃mean 0.291 0 0.576 9 — — — 0.7278 NMI⁃std 0.008 0 0.018 9 — — — 0 RI⁃mean 0.732 5 0.734 7 — — — 0.905 4 RI⁃std 0.003 3 0.047 6 — — — 0 T8 NMI⁃mean 0.203 8 0.572 8 — — — 0.691 4 NMI⁃std 0.022 5 0.032 9 — — — 1.11×10 -16 RI⁃mean 0.739 9 0.794 1 — — — 0.903 2 RI⁃std 0.005 9 0.016 0 — — — 0 (a) 6 种算法分别在数据集 T5 上的图像分割结果 (b) 6 种算法分别在数据集 T6 上的图像分割结果 (c) 6 种算法分别在数据集 T7 上的图像分割结果 (d) 6 种算法分别在数据集 T8 上的图像分割结果 图 6 源域与目标域聚类数不同的含噪纹理图像分割结果 Fig.6 Segmentation results of clustering algorithms for noisy texture images with the different number of clusters between source domain and target do⁃ main 上述实验结果表明本文提出的 KT⁃MEC 聚类算 法在不同的迁移场景中的聚类性能均优于现有的相 关聚类算法。 特别是,KT⁃MEC 聚类算法适用于一 般的迁移场景,即无论是源域和目标域的聚类的数 目是相同或不同时,本文 KT⁃MEC 算法均能适用且 能获得比其他聚类算法更好的聚类结果。 5 结束语 本文研究是基于迁移学习的聚类算法,实验部分 主要针对纹理图像的分割。 本文算法对迁移聚类算 法的贡献主要有两方面:1)确定了聚类中心作为迁移 知识,实验证明了将聚类中心作为迁移知识能够更好 地增强目标域的聚类性能;2)找到了一个解决无论源 域与目标域的聚类数是否一致,都能够成功进行迁移 的通用策略。 基于上述工作,结合传统的非迁移极大 熵聚类算法,本文提出了基于知识迁移的极大熵聚类 算法,并将该算法与其他迁移算法、非迁移算法、协同 聚类算法、多任务聚类算法等一系列相关算法进行了 性能对比,实验表明本文 KT⁃MEC 聚类算法的性能在 纹理图像分割上较其他算法具有更加优良的性能。 KT⁃MEC 聚类算法不仅能够提高算法的聚类精度,增 强图像的分割效果,还能适应不同迁移场景下的聚类 任务,具有较强的鲁棒性。 虽然本文 KT⁃MEC 聚类算法在纹理图像的分割 上具有较好的性能,但该算法的适应性上还需进行 进一步的研究。 随着数据的爆炸式增长,数据复杂 性的迅速增加,KT⁃MEC 聚类算法是否能够适用于 高维复杂数据还有待研究。 参考文献: [1]ZHU Lin, CHUNG F L, WANG Shitong. Generalized fuzzy c⁃means clustering algorithm with improved fuzzy partitions [J]. IEEE transactions on systems, man, and cybernetics, part B (cybernetics), 2009, 39(3): 578-591. [2]KIM S, YOO C D, NOWOZIN S, et al. Image segmentation usinghigher⁃order correlation clustering [ J]. IEEE transac⁃ tions on pattern analysis and machine intelligence, 2014, 36 (9): 1761-1774. [3]JIANG Yizhang, CHUNG F L, WANG Shitong, et al. Col⁃ laborative fuzzy clustering from multiple weighted views[ J]. IEEE transactions on cybernetics, 2015, 45(4): 688-701. [4]BEZDEK J C. Pattern recognition with fuzzy objective func⁃ tion algorithms [ M]. USA: Springer Science & Business ·186· 智 能 系 统 学 报 第 12 卷
第2期 程肠,等:知识迁移的极大嫡聚类算法及其在纹理图像分割中的应用 ·187. Media,2013:155-201. [15]GU Quanquan,ZHOU Jie.Learning the shared subspace [5]KRISHNAPURAM R,KELLER J M.A possibilistic ap- for multi-task clustering and transductive transfer classifica- proach to clustering[].IEEE transactions on fuzzy sys- tion [C]//Proceedings of the Ninth IEEE International tems,1993,1(2):98-110. Conference on Data Mining.Miami,USA:IEEE,2009: [6]KARAYIANNIS N B.MECA:maximum entropy clustering 159-168. algorithm[C//Proceedings of the Third IEEE Fuzzy Sys- [16]GU Quanquan,ZHOU Jie.Co-clustering on manifolds tems Conference.Orlando,USA:IEEE,1994:630-635. [C]//Proceedings of the 15th ACM SIGKDD Internation- [7]PAN S J,YANG Qiang.A survey on transfer learning[J]. al Conference on Knowledge Discovery and Data Mining. IEEE transactions on knowledge and data engineering, New York,USA:ACM,2009:359-368. 2010,22(10):1345-1359. [17]RANDEN T.Brodatz texture EB/OL].[2015-12-14]. [8]DENG Zhaohong,CHOI K S,JIANG Yizhang,et al.Gener- http://www.ux.uis.no/~tranden/brodatz.html. alized hidden-mapping ridge regression,knowledge-lever- [18]DENG Zhaohong,CHOI K S,CHUNG F L,et al.En- aged inductive transfer learning for neural networks,fuzzy hanced soft subspace clustering integrating within-cluster systems and kernel methods[J.IEEE transactions on cyber- and between-cluster information[J].Pattern recognition, netics,2014,44(12):2585-2599. 2010,43(3):767-781. [9 DENG Zhaohong,JIANG Yizhang,CHOI K S,et al. [19]KYRKI V,KAMARAINEN J K,KALVIAINEN H.Simple Knowledge-leverage-based TSK fuzzy system modeling[J]. Gabor feature space for invariant object recognition[J]. IEEE transactions on neural networks and learning systems, Pattern recognition letters,2004,25(3):311-318. 2013,24(8):1200-1212. 作者简介: [10]ZHI Xiaobin,FAN Jiulun,ZHAO Feng.Fuzzy linear dis- 程肠,男,1991年生,硕士研究生, criminant analysis-guided maximum entropy fuzzy clustering 主要研究方向为人工智能、模式识别 algorithm[J].Pattern recognition,2013,46(6):1604- 数据挖掘。 1615. [11]DAI Wenyuan,YANG Qiang,XUE Guirong,et al.Self- taught clustering[Cl//Proceedings of the 25th Internation- al Conference on Machine Learning.New York,USA: 蒋亦樟,男,1988年生,博士,讲师, ACM.2008:200-207. [12]JIANG Wenhao,CHUNG F L.Transfer spectral clustering 主要研究方向为人工智能、模式识别、 模糊系统。 [M]//FLACH P A,DE BIE T,CRISTIANINI N.Ma- chine Learning and Knowledge Discovery in Databases. Berlin Heidelberg:Springer,2012:789-803. [13]钱鹏江,孙寿伟,蒋亦樟,等.知识迁移极大嫡聚类算 钱鹏江,男,1979年生,副教授,博 法[J].控制与决策,2015,30(6):1000-1006. 士,主要研究方向为模式识别、医学图 QIAN Pengjiang,SUN Shouwei,JIANG Yizhang,et al. 像处理、大数据。 Knowledge transfer based maximum entropy clustering[J]. Control and decision,2015,30(6):1000-1006. [14]PEDRYCZ W,RAI P.Collaborative clustering with the use of Fuzzy C-Means and its quantification[J].Fuzzy sets and systems,2008,159(18):2399-2427
Media, 2013: 155-201. [5] KRISHNAPURAM R, KELLER J M. A possibilistic ap⁃ proach to clustering [ J]. IEEE transactions on fuzzy sys⁃ tems, 1993, 1(2): 98-110. [6] KARAYIANNIS N B. MECA: maximum entropy clustering algorithm[ C] / / Proceedings of the Third IEEE Fuzzy Sys⁃ tems Conference. Orlando, USA: IEEE, 1994: 630-635. [7]PAN S J, YANG Qiang. A survey on transfer learning[ J]. IEEE transactions on knowledge and data engineering, 2010, 22(10): 1345-1359. [8]DENG Zhaohong, CHOI K S, JIANG Yizhang, et al. Gener⁃ alized hidden⁃mapping ridge regression, knowledge⁃lever⁃ aged inductive transfer learning for neural networks, fuzzy systems and kernel methods[J]. IEEE transactions on cyber⁃ netics, 2014, 44(12): 2585-2599. [ 9 ] DENG Zhaohong, JIANG Yizhang, CHOI K S, et al. Knowledge⁃leverage⁃based TSK fuzzy system modeling[ J]. IEEE transactions on neural networks and learning systems, 2013, 24(8): 1200-1212. [10]ZHI Xiaobin, FAN Jiulun, ZHAO Feng. Fuzzy linear dis⁃ criminant analysis⁃guided maximum entropy fuzzy clustering algorithm[J]. Pattern recognition, 2013, 46( 6): 1604- 1615. [11] DAI Wenyuan, YANG Qiang, XUE Guirong, et al. Self⁃ taught clustering[C] / / Proceedings of the 25th Internation⁃ al Conference on Machine Learning. New York, USA: ACM, 2008: 200-207. [12]JIANG Wenhao, CHUNG F L. Transfer spectral clustering [M] / / FLACH P A, DE BIE T, CRISTIANINI N. Ma⁃ chine Learning and Knowledge Discovery in Databases. Berlin Heidelberg: Springer, 2012: 789-803. [13]钱鹏江, 孙寿伟, 蒋亦樟, 等. 知识迁移极大熵聚类算 法[J]. 控制与决策, 2015, 30(6): 1000-1006. QIAN Pengjiang, SUN Shouwei, JIANG Yizhang, et al. Knowledge transfer based maximum entropy clustering[ J]. Control and decision, 2015, 30(6): 1000-1006. [14]PEDRYCZ W, RAI P. Collaborative clustering with the use of Fuzzy C⁃Means and its quantification[J]. Fuzzy sets and systems, 2008, 159(18): 2399-2427. [15] GU Quanquan, ZHOU Jie. Learning the shared subspace for multi⁃task clustering and transductive transfer classifica⁃ tion [ C] / / Proceedings of the Ninth IEEE International Conference on Data Mining. Miami, USA: IEEE, 2009: 159-168. [16 ] GU Quanquan, ZHOU Jie. Co⁃clustering on manifolds [C] / / Proceedings of the 15th ACM SIGKDD Internation⁃ al Conference on Knowledge Discovery and Data Mining. New York, USA: ACM, 2009: 359-368. [17]RANDEN T. Brodatz texture[EB/ OL]. [2015- 12- 14]. http: / / www.ux.uis.no / ~ tranden / brodatz.html. [18] DENG Zhaohong, CHOI K S, CHUNG F L, et al. En⁃ hanced soft subspace clustering integrating within⁃cluster and between⁃cluster information [ J]. Pattern recognition, 2010, 43(3): 767-781. [19]KYRKI V, KAMARAINEN J K, KǍLVIǍINEN H. Simple Gabor feature space for invariant object recognition [ J]. Pattern recognition letters, 2004, 25(3): 311-318. 作者简介: 程旸,男,1991 年生,硕士研究生, 主要研究方向为人工智能、模式识别、 数据挖掘。 蒋亦樟,男,1988 年生,博士,讲师, 主要研究方向为人工智能、模式识别、 模糊系统。 钱鹏江,男,1979 年生,副教授,博 士,主要研究方向为模式识别、医学图 像处理、大数据。 第 2 期 程旸,等:知识迁移的极大熵聚类算法及其在纹理图像分割中的应用 ·187·