正在加载图片...
·596· 智能系统学报 第13卷 用户可以在高维特征空间中得到数据的显式表示 间中的新表示。但是作为单层映射结构,会因映 方法;2)模糊特征映射基于模糊规则进行构建, 射后的特征维数过高使得数据变得混乱和冗余, 而模糊规则本身具有较强的可解释性;3)输入向 继而影响算法后续的聚类效果。研究表明2s26) 量经模糊特征映射后得到的高维特征向量的维数 将单层映射结构改造为多层映射结构,可以有效 可以由模糊规则数确定,这有利于用户控制高维 地提高算法对复杂非线性数据的学习能力。为 空间中数据的复杂程度。 此,本文引入多层递阶融合的概念来构造新型的 2基于多层递阶融合模糊特征映射 映射,提出基于多层递阶融合的模糊特征映射新 的模糊C均值聚类算法 方法(MLHFFFM)。通过对每层模糊特征映射之 后的高维特征表示进行PCA降维,再进行相应的 2.1 基于多层递阶融合的模糊特征映射新方法 信息补充,形成新的融合层,依次进入下一层的 原数据通过模糊特征映射,得到其在高维空 压缩融合过程,其结构如图1所示。 高维 融合 融合 PCA 压缩模 高维 压缩融 模糊 高组 糊空间 空间 合空间 空间 空间 Xg四 X阳 YSm X恩 模糊 模糊 MLHFFFM第1层 特征 特征 输 高维 高维 映射 输 模糊 映射 MLHFFFM 模构 食 MLHFFFM 空间 第2层融合层 空间 第3层融合层 X四 X 图1 MLHFFFM算法结构图 Fig.1 Structure of MLHFFFM algorithm 基于多层递阶融合的模糊特征映射新方法 2.2 基于多层递阶融合模糊特征映射的模糊 MLHFFFM算法描述如下: C均值聚类算法MLHFFFM-FCM 输入给定一个数据集D={X,乃,设置初始 本节中,将多层递阶融合模糊特征映射与经 模糊规则数K,分层融合层数S。 典模糊聚类算法FCM相结合,提出基于多层递阶 输出经多层递阶融合后的数据矩阵X。 融合模糊特征映射的模糊C均值聚类算法。ML- 1)对原数据进行第一层的模糊特征映射(初 HFFFM-FCM算法描述如下: 始层) 输入给定一个数据集D={X,Y,设置初始 ①通过FCM算法计算出隶属度矩阵u; 模糊规则数K,分层融合层数S。 ②经式(6)和式(7)分别计算出对应的和 1)通过基于多层递阶融合的模糊特征映射, (=1,2,…,d,j户1,2,,n,k=1,2,,K) 将输入数据X转化为X。 ③通过高斯隶属度函数(5)和式(3)的计算 2)对最终压缩融合获得的数据矩阵X,采 得到(X)(=1,2,…,K): 用FCM算法聚类。 ④再经过式(8)~(10)的转化,得到映射后高 输出模糊划分矩阵U。 维空间中的数据矩阵XeR+K。 2)多层递阶融合 3实验研究与分析 ①利用PCA对X进行压缩,得到数据矩阵 为了验证MLHFFFM-FCM算法在复杂非线 记为X爬: 性数据分析上的有效性,本节从3个方面进行对 ②For=2:(S-1): 比分析:1)各FCM演变算法之间聚类效果的对比 ③重复步骤1),对原数据进行模糊特征映 实验;2)单层映射结构与多层递阶融合映射结构 射,得到数据矩阵XO∈RxaK; 的聚类效果对比实验;3)关键参数敏感性的对比 ④x9=X阳X9 实验。 ⑤利用PCA对X进行压缩,得到数据矩阵 3.1算法性能的评价指标 记为X; 为了对各类算法的聚类性能进行对比,本文 ⑥end; 采用NMI(normalized mutual information)和RI(rand用户可以在高维特征空间中得到数据的显式表示 方法;2) 模糊特征映射基于模糊规则进行构建, 而模糊规则本身具有较强的可解释性;3) 输入向 量经模糊特征映射后得到的高维特征向量的维数 可以由模糊规则数确定,这有利于用户控制高维 空间中数据的复杂程度。 2 基于多层递阶融合模糊特征映射 的模糊 C 均值聚类算法 2.1 基于多层递阶融合的模糊特征映射新方法 原数据通过模糊特征映射,得到其在高维空 间中的新表示。但是作为单层映射结构,会因映 射后的特征维数过高使得数据变得混乱和冗余, 继而影响算法后续的聚类效果。研究表明[25-26] , 将单层映射结构改造为多层映射结构,可以有效 地提高算法对复杂非线性数据的学习能力。为 此,本文引入多层递阶融合的概念来构造新型的 映射,提出基于多层递阶融合的模糊特征映射新 方法 (MLHFFFM)。通过对每层模糊特征映射之 后的高维特征表示进行 PCA 降维,再进行相应的 信息补充,形成新的融合层,依次进入下一层的 压缩融合过程,其结构如图 1 所示。 基于多层递阶融合的模糊特征映射新方法 MLHFFFM 算法描述如下: 输入 给定一个数据集 D={X, Y},设置初始 模糊规则数 K,分层融合层数 S。 X (S) 输出 经多层递阶融合后的数据矩阵 pca。 1) 对原数据进行第一层的模糊特征映射 (初 始层) ① 通过 FCM 算法计算出隶属度矩阵 ujk ; c k i δ k i ··· ··· ··· ② 经式 (6) 和式 (7) 分别计算出对应的 和 (i=1, 2, , d,j=1, 2, , n,k=1, 2, , K); µ k (X) ··· ③ 通过高斯隶属度函数 (5) 和式 (3) 的计算 得到 (k=1, 2, , K); X (1) g ∈ R N×(d+1)∗K ④ 再经过式 (8)~(10) 的转化,得到映射后高 维空间中的数据矩阵 。 2) 多层递阶融合 X (1) g X (2) pca ① 利用 PCA 对 进行压缩,得到数据矩阵 记为 ; ② For i=2:(S-1); X (i) g ∈ R N×dK ③ 重复步骤 1),对原数据进行模糊特征映 射,得到数据矩阵 ; X (i) lhffm= [ X (i) pca X (i) g ] ④ ; X (i) lhffm X (i+1) pca ⑤ 利用 PCA 对 进行压缩,得到数据矩阵 记为 ; ⑥ end; 2.2 基于多层递阶融合模糊特征映射的模 糊 C 均值聚类算法 MLHFFFM-FCM 本节中,将多层递阶融合模糊特征映射与经 典模糊聚类算法 FCM 相结合,提出基于多层递阶 融合模糊特征映射的模糊 C 均值聚类算法。ML￾HFFFM-FCM 算法描述如下: 输入 给定一个数据集 D={X, Y},设置初始 模糊规则数 K,分层融合层数 S。 X (S) pca 1) 通过基于多层递阶融合的模糊特征映射, 将输入数据 X 转化为 。 X (S) 2) 对最终压缩融合获得的数据矩阵 pca,采 用 FCM 算法聚类。 输出 模糊划分矩阵 U。 3 实验研究与分析 为了验证 MLHFFFM-FCM 算法在复杂非线 性数据分析上的有效性,本节从 3 个方面进行对 比分析:1) 各 FCM 演变算法之间聚类效果的对比 实验;2) 单层映射结构与多层递阶融合映射结构 的聚类效果对比实验; 3) 关键参数敏感性的对比 实验。 3.1 算法性能的评价指标 为了对各类算法的聚类性能进行对比,本文 采用 NMI(normalized mutual information) 和 RI(rand 输入层 X 输入层 X 高维 模糊 空间 X g (1) 高维 模糊 空间 X g (2) MLHFFFM 第1层 MLHFFFM 第2层融合层 MLHFFFM 第3层融合层 PCA 模糊 特征 映射 压缩模 糊空间 X (2) pca 压缩融 合空间 X (3) pca 融合 高维 空间 X (2) lhffm 融合 高维 空间 X (3) lhffm 输入层 X 高维 模糊 空间 X g (3) … … 模糊 … 特征 映射 图 1 MLHFFFM 算法结构图 Fig. 1 Structure of MLHFFFM algorithm ·596· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有