第11卷第5期 智能系统学报 Vol.11 No.5 2016年10月 CAAI Transactions on Intelligent Systems 0ct.2016 D0I:10.11992/6is.201508015 网络出版地址:http://www.cnki.net/kcms/detail,/23.1538.TP.20160824.0928.002.html 堆叠隐空间模糊C回归算法及其在 发酵数据多模型建模中的应用 刘欢,王骏,邓赵红,王士同 (江南大学数字蝶体学院,江苏无锡214122)》 摘要:切换回归算法FCR的性能容易受到噪声点以及离群点的影响,同时该算法对于复杂数据的处理能力较差。 对此,文中提出一种基于堆叠隐空间的模糊C回归算法。该算法将基于LM特征映射技术,利用主成分分析进行特 征提取,再结合多层前馈神经网络学习结构对隐空间进行多次扩展和压缩。实验结果表明,该算法具有更好的抗噪 性能,对模糊指数的变化不敏感,同时在处理复杂数据以及在多模型建模中更加精确、高效、稳定。 关键词:隐空间映射:极限学习机;主成分分析;模糊C回归算法:多层神经网络:多模型建模 中图分类号:TP181文献标志码:A文章编号:1673-4785(2016)05-0670-10 中文引用格式:刘欢,王骏,邓赵红,等堆叠隐空间模糊C回归算法及其在发酵数据多模型建模中的应用[J].智能系统学报,2016, 11(5):670-679. 英文写引用格式:LIU Huan,WANGJun,DENG Zhaohong,etal.A cascaded hidden space fuz四yC-regression algorithm and its ap- plication in multi-model modeling for the fermentation process [J].CAAI transactions on intelligent systems,2016,11(5):670-679. A cascaded hidden space fuzzy C-regression algorithm and its application in multi-model modeling for the fermentation process LIU Huan,WANG Jun,DENG Zhaohong,WANG Shitong School of Digital Media,JiangNan University,WuXi 214122,China) Abstract:The switching regression algorithm FCR is sensitive to noise data and outliers.The algorithm also has low levels of capability for dealing with complex data.In order to handle these problems,an improved fuzzy C-regres- sion algorithm is proposed based on cascaded hidden space.In our method,principal component analysis is com- bined with extreme machine learning feature mapping and multilayer feedforward neural networks.The experimental results show that our proposed method is more stable as regards noise data and outliers,and thus more suitable for handling complex data and multi-model modeling problems for the fermentation process. Keywords:hidden space feature mapping;extreme learning machine;principal component analysis;fuzzy C-re- gression algorithm;multilayer neural network;multi-model modeling. 切换回归模型在经济、数据挖掘等领域中有着 gression algorithm,FCR)算法,从而实现了对多个模 广泛的应用。近年来,基于模糊聚类分析4]的切 型的切换回归:在此基础上,文献[6]结合牛顿万有 换回归技术得到了广泛的研究。如文献[5]在模糊 引力定律提出了关于切换回归的集成模糊聚类算法 C均值聚类算法(fuzzy C clustering algorithm,FCM) (gravity-based fuzzy clustering algorithm,GFC)算法, 的基础上提出了模糊C均值回归算法(fuzzy C re- 文中实验表明该算法与CR相比具有更快的收敛 速度;文献[7]通过向FCR中引入动态的样本权值, 收稿日期:2015-08-14.网络出版日期:2016-08-24. 提出了离群模糊切换回归模型,从而使模型具有更 基金项目:国家自然科学基金项目(61300151):江苏省自然科学基金强的鲁棒性,并且能通过权值发现数据集中的离群 项目(BK20130155,BK20130160). 通信作者:刘欢.E-mail:771627297@qg.com. 点。虽然这些方法在一定条件下可以较好地解决切
第 11 卷第 5 期 智 能 系 统 学 报 Vol.11 №.5 2016 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2016 DOI:10.11992 / tis.201508015 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20160824.0928.002.html 堆叠隐空间模糊 C 回归算法及其在 发酵数据多模型建模中的应用 刘欢,王骏,邓赵红,王士同 (江南大学 数字媒体学院,江苏 无锡 214122) 摘 要:切换回归算法 FCR 的性能容易受到噪声点以及离群点的影响,同时该算法对于复杂数据的处理能力较差。 对此,文中提出一种基于堆叠隐空间的模糊 C 回归算法。 该算法将基于 ELM 特征映射技术,利用主成分分析进行特 征提取,再结合多层前馈神经网络学习结构对隐空间进行多次扩展和压缩。 实验结果表明,该算法具有更好的抗噪 性能,对模糊指数的变化不敏感,同时在处理复杂数据以及在多模型建模中更加精确、高效、稳定。 关键词:隐空间映射;极限学习机;主成分分析;模糊 C 回归算法;多层神经网络;多模型建模 中图分类号:TP181 文献标志码:A 文章编号:1673⁃4785(2016)05⁃0670⁃10 中文引用格式:刘欢,王骏,邓赵红,等.堆叠隐空间模糊 C 回归算法及其在发酵数据多模型建模中的应用[J]. 智能系统学报, 2016, 11(5): 670⁃679. 英文引用格式:LIU Huan, WANG Jun, DENG Zhaohong, et al. A cascaded hidden space fuzzy C⁃regression algorithm and its ap⁃ plication in multi⁃model modeling for the fermentation process [J]. CAAI transactions on intelligent systems, 2016,11(5): 670⁃679. A cascaded hidden space fuzzy C⁃regression algorithm and its application in multi⁃model modeling for the fermentation process LIU Huan, WANG Jun, DENG Zhaohong, WANG Shitong (School of Digital Media, JiangNan University, WuXi 214122, China) Abstract:The switching regression algorithm FCR is sensitive to noise data and outliers. The algorithm also has low levels of capability for dealing with complex data. In order to handle these problems, an improved fuzzy C⁃regres⁃ sion algorithm is proposed based on cascaded hidden space. In our method, principal component analysis is com⁃ bined with extreme machine learning feature mapping and multilayer feedforward neural networks. The experimental results show that our proposed method is more stable as regards noise data and outliers, and thus more suitable for handling complex data and multi⁃model modeling problems for the fermentation process. Keywords:hidden space feature mapping; extreme learning machine; principal component analysis; fuzzy C⁃re⁃ gression algorithm; multilayer neural network; multi⁃model modeling. 收稿日期:2015⁃08⁃14. 网络出版日期:2016⁃08⁃24. 基金项目:国家自然科学基金项目(61300151); 江苏省自然科学基金 项目(BK20130155,BK20130160). 通信作者:刘欢.E⁃mail:771627297@ qq.com. 切换回归模型在经济、数据挖掘等领域中有着 广泛的应用。 近年来,基于模糊聚类分析[1⁃4] 的切 换回归技术得到了广泛的研究。 如文献[5]在模糊 C 均值聚类算法(fuzzy C clustering algorithm, FCM) 的基础上提出了模糊 C 均值回归算法( fuzzy C re⁃ gression algorithm, FCR)算法,从而实现了对多个模 型的切换回归;在此基础上,文献[6]结合牛顿万有 引力定律提出了关于切换回归的集成模糊聚类算法 (gravity⁃based fuzzy clustering algorithm, GFC)算法, 文中实验表明该算法与 FCR 相比具有更快的收敛 速度;文献[7]通过向 FCR 中引入动态的样本权值, 提出了离群模糊切换回归模型,从而使模型具有更 强的鲁棒性,并且能通过权值发现数据集中的离群 点。 虽然这些方法在一定条件下可以较好地解决切
第5期 刘欢,等:堆叠隐空间模糊C回归算法及其在发酵数据多模型建模中的应用 .671. 换回归模型中的参数学习问题,但是面向现实生活 常用的激励函数有以下几种: 中的复杂数据,仍然有诸多局限性,其学习能力有待 1 Sigmoid: G(x)= (2 进一步提高。 1 exp(-x) 近年来,以极速学习机(extreme learning ma- Sine: G(x)=sin(x) (3 chine,ELM)为代表的单隐层前馈神经网络快速学 名-龙川2 (4) 习理论得到了研究人员的深入研究[81。研究表 Gaussian:G(x;,x)=exp(- 2c2 明,将ELM特征映射技术代替已有核方法中的核映 1.2模糊C回归算法及其问题分析 射,可以有效提高学习器的学习能力,目前该技术已 l993年Richard J.Hathaway)和James C. 被广泛用于分类、回归、聚类等学习任务中。结合已 Bezdek[i提出了FCR算法。该算法能在对观察数 有的研究工作,本文重点研究基于ELM隐空间学习 据进行模糊划分的同时估计出划分数据满足的回归 理论的切换回归模型。首先研究基于主成分分析 模型参数。设数据集D={(x1,少1),(x2,Y),, (principal component analysis,.PCA)[]的压缩隐空 (xnyn)},其中n是数据点个数,x=(x1,x2,, 间构建新方法。在此基础上,结合多层神经网络学 xa)∈R,为∈R表示观察数据模型,d是数据集的 习方法,将单隐层结构改造为多隐层结构)],提出 特征数。FCR算法构建的回归模型为 堆叠隐空间模糊C回归算法(cascaded hidden space y:=Bo0+B1+…+B FCR,CHS-FCR)。该方法通过使用层次化的学习 i=1,2,…,c;j=1,2,…,n (5) 结构对数据对象在不同层次上的表达形式进行抽 式中:c是模型数目,j是样本点个数,B为模型参 象,并通过重组低层概念来重新定义高层概念,从而 数。FCR算法的目标函数为 有效提高了学习系统处理复杂问题的能力。经实验 Jm=∑∑(y-)2 (6) 验证,该算法能有效地弥补经典FCR的若干不足, 在保证学习精度和学习效率的前提下,该方法对噪 式中“,是隶属度,且满足∑4,=1,山∈10,1, 声数据和离群点有很好的鲁棒性。 i=1,2,…,c)=1,2,…,n。m是模糊指数且 m>1。FCR使用式(7)来更新隶属度: 1相关工作 (y-a)-a-) k=1,2,…,C 1.1ELM隐空间 ∑,(6y-)-- 在ELM中,隐节点所形成的特征空间构成隐空 (7) 间)。其映射过程如下:I)随机生成权重矩阵W∈ FCR的目标函数是一个基于模糊划分的多模 Ra和偏移量矩阵B=[b,b2…b]T,其中L是ELM 型最小二乘拟合准则问题,任何现有的能解决加权 隐节点总数,d是原始数据的维数。2)将原始数据 最小二乘问题的方法都可以用来估计参数。模型参 映射到L维的隐空间中。每一个输入数据都是一个 数可以通过式(8)求解: d维的向量,x=[x,x2…x]T。该特征映射可以表 示为: B:= [X DXXDY (8) h(r)=[h(x)…h,(x)…h(x)]I= [G(01,b1,x)…G(0:,b:,x)…G(e,b,x)]T 式中:X∈2CR(是以(1,x)=(1,x,…,)为 (1) 行向量输入数据矩阵。Y∈2CR”是以输出y为行 式中G(x)是激励函数,其映射过程如图1所示。 向量的输出列向量:D:∈2CRx是以第j个对角 h(x=[h,(x)·h(x)…h,x] 元素的对角矩阵,D,=diag(a,a,…,%)。FCR算 ELM隐含层 法的步骤为: 1)给定模型参数c(1≤c≤n),模糊指数m>1, G(w.bx) G(wbx) 迭代终止条件ε>0,并初始化划分矩阵),迭代步 d)输入层 骤1=0; 2)根据式(8)计算模型参数B:; =x,…xJ 3)根据(y)2计算拟合误差,代入式(7)求 图1隐空间特征映射的过程 隶属度矩阵U; Fig.1 The process of hidden-space feature mapping 4)根据式(6)计算目标函数值,若
换回归模型中的参数学习问题,但是面向现实生活 中的复杂数据,仍然有诸多局限性,其学习能力有待 进一步提高。 近年来, 以极速学习机 ( extreme learning ma⁃ chine,ELM)为代表的单隐层前馈神经网络快速学 习理论得到了研究人员的深入研究[8⁃11] 。 研究表 明,将 ELM 特征映射技术代替已有核方法中的核映 射,可以有效提高学习器的学习能力,目前该技术已 被广泛用于分类、回归、聚类等学习任务中。 结合已 有的研究工作,本文重点研究基于 ELM 隐空间学习 理论的切换回归模型。 首先研究基于主成分分析 (principal component analysis, PCA) [12] 的压缩隐空 间构建新方法。 在此基础上,结合多层神经网络学 习方法,将单隐层结构改造为多隐层结构[13] ,提出 堆叠隐空间模糊 C 回归算法(cascaded hidden space FCR, CHS⁃FCR)。 该方法通过使用层次化的学习 结构对数据对象在不同层次上的表达形式进行抽 象,并通过重组低层概念来重新定义高层概念,从而 有效提高了学习系统处理复杂问题的能力。 经实验 验证,该算法能有效地弥补经典 FCR 的若干不足, 在保证学习精度和学习效率的前提下,该方法对噪 声数据和离群点有很好的鲁棒性。 1 相关工作 1.1 ELM 隐空间 在 ELM 中,隐节点所形成的特征空间构成隐空 间[14] 。 其映射过程如下:1)随机生成权重矩阵W∈ R L×d和偏移量矩阵 B= [b1 b2… bL ] T ,其中 L 是 ELM 隐节点总数,d 是原始数据的维数。 2)将原始数据 映射到 L 维的隐空间中。 每一个输入数据都是一个 d 维的向量,x = [x1 x2… xd ] T 。 该特征映射可以表 示为: h(x) = [h1(x) … hi(x) … hL(x)] T = [G w1 ,b ( 1 ,x) … G wi,b ( i,x) … G wL ,b ( L ,x) ] T (1) 式中 G(x)是激励函数,其映射过程如图 1 所示。 图 1 隐空间特征映射的过程 Fig.1 The process of hidden⁃space feature mapping 常用的激励函数有以下几种: Sigmoid: G(x) = 1 1 + exp( - x) (2) Sine: G(x) = sin(x) (3) Gaussian:G(xi,xj) = exp( - ‖xi - xj‖2 2σ 2 ) (4) 1.2 模糊 C 回归算法及其问题分析 1993 年 Richard J. Hathaway [5] 和 James C. Bezdek [15]提出了 FCR 算法。 该算法能在对观察数 据进行模糊划分的同时估计出划分数据满足的回归 模型参数。 设数据集 D = {( x1 , y1 ), ( x2 , y2 ),…, (xn ,yn )},其中 n 是数据点个数,xj = ( xj1 ,xj2 ,…, xjd )∈R d ,yj∈R 表示观察数据模型,d 是数据集的 特征数。 FCR 算法构建的回归模型为 yj,i = βi0 + βi1 xj1 + … + βid xjd i = 1,2,…,c; j = 1,2,…,n (5) 式中:c 是模型数目,j 是样本点个数,βi 为模型参 数。 FCR 算法的目标函数为 JFCR = ∑ c i = 1∑ n j = 1 u m ij (yj - yj,i) 2 (6) 式中 uij是隶属度,且满足 ∑ c i = 1 uij = 1,uij ∈ {0,1}, i = 1,2,…,c;j = 1,2,…,n。 m 是 模 糊 指 数 且 m > 1。 FCR 使用式(7)来更新隶属度: uij = (yj - yj,i) -2/ (m-1) ∑ c k = 1 (yj - yj,k) -2/ (m-1) k = 1,2,…,c (7) FCR 的目标函数是一个基于模糊划分的多模 型最小二乘拟合准则问题,任何现有的能解决加权 最小二乘问题的方法都可以用来估计参数。 模型参 数可以通过式(8)求解: βi = βi0 ︙ βid é ë ê ê ê ê ù û ú ú ú ú = [X T DiX] -1 X T DiY (8) 式中:X∈Ω⊂R n×(d+1)是以(1,xj)= (1,xj1 ,…,xjd )为 行向量输入数据矩阵。 Y∈Ω⊂R n 是以输出 yj 为行 向量的输出列向量;Di∈Ω⊂R n×n是以 u m ij 第 j 个对角 元素的对角矩阵,Di = diag(u m i1 ,u m i1 ,…,u m in )。 FCR 算 法的步骤为: 1)给定模型参数 c(1≤c≤n),模糊指数 m>1, 迭代终止条件 ε>0,并初始化划分矩阵 U (0) ,迭代步 骤 l = 0; 2)根据式(8)计算模型参数 β l i; 3)根据(yj -yj,i) 2 计算拟合误差,代入式(7)求 隶属度矩阵 U; 4 ) 根 据 式 ( 6 ) 计 算 目 标 函 数 值, 若 第 5 期 刘欢,等:堆叠隐空间模糊 C 回归算法及其在发酵数据多模型建模中的应用 ·671·
·672 智能系统学报 第11卷 IJ化-Jc0川≤e则迭代终止,其中e表示迭代 PCA隐含层 终止的阈值:否则1=+1,转至步骤2)。 PCA 研究表明,FCR可以较好地解决切换回归问 题,但是也存在以下问题:对噪声和离群点敏感,当 数据集中含有离群点或大量噪声数据时,算法性能 h h,xELM隐含层 就会受到影响:FCR算法在数据原空间中进行学 Gwbx) w.b.x) 习,针对现实生活中的复杂数据,FCR算法的性能 很难得到有效地提升。 输入层 本文将ELM隐空间学习理论与特征降维技术 相结合,基于多隐层神经网络学习方法,将传统的基 于浅层结构的学习方法改造为多隐层学习结构,从 图2基于PCA的压缩ELM隐空间 而提高对复杂数据的无监督学习能力。通过提出堆 Fig.2 Cascade hidden space based on PCA 叠隐空间学习结构,从而有效精简冗余信息和过滤 2.2 噪声数据,同时补充必要的信息,使得切换回归算法 堆叠隐空间模糊C回归算法CHS-FCR 具有更强的鲁棒性,并将其应用于多模型建模以取 在隐空间构建过程中,为了使学习器得到更好 得更好的效果。 的表达能力和稳定的学习效果,通常会使用较多的 隐节点数目。但是,这增加了额外的计算负担。研 2堆叠隐空间模糊C回归算法 究表明,在保证学习器泛化能力的前提下,将单隐层 2.1基于主成分分析的压缩ELM隐空间 结构改造为多隐层结构是降低隐节点数目的有效方 在ELM学习技术中,可以通过随机赋值的方法 法。为此,本文对上述基于PCA的压缩隐空间映射 来快速生成ELM隐空间,随着隐节点数目的增加, 过程进行改造,通过把ELM隐层中的隐节点分散到 学习精度也不断提高161)。但是随之而来的一个 多个隐含层中,并与PCA层的隐结点相结合,形成 重要问题是计算效率会逐步降低。此外,由于隐节 新的混合隐含层。将若干个混合隐含层进行叠加, 点生成过程中相关参数是随机生成的,因此不可避 得到多隐层学习结构,该过程如图3所示。 免地会引入大量噪声。针对这一问题,本文中将 PCA隐含层Q月 ELM隐空间技术与主成分分析相结合,提出基于主 PCA 成分分析的压缩隐空间构建方法,其过程如下: 1)根据图1所示过程将原始数据映射到高维 混合隐含层 空间R中,得到矩阵H)∈RM,n为样本点个数: ELM特征射 PCA :输入层 2)对H的每一列H,j=1,2,…,L进行归 混合隐含层 一化,得到矩阵A=[A1A2…A],其中A计算方 /ELM特征映射 法为 PCA 输人层 4="-12H"=12,…,1 ELM隐含层 (9) n i=1 ELM特征映射 输入层 3)计算矩阵A的协方差矩阵C,并计算矩阵C 的特征值入和特征向量V,i=1,2,…,L: 4)将特征值入:降序排序,取前p个特征值对应 的特征向量,按列组成矩阵V,特征提取后的矩阵为 图3堆叠隐空间学习结构 Fig.3 Cascade hidden space learning structure H)=AV (10) 其结构可映射为如图2所示的前馈神经网络模 堆叠隐空间模糊C回归算法CHS-FCR的描述 型。输入数据经过输入层后,通过ELM特征映射被 如下: 映射到高维ELM隐空间中。在此过程中,生成ELM 设隐节点总数为L,数据集D的维数为d,PCA 隐空间时的随机赋值操作会引入噪声,后续的PCA 压缩后的维数为P,隐空间压缩的次数为f,每层隐 对高维隐空间中的数据进行降维,从而有效地过滤 空间的ELM隐节点数T=L/f,n为样本点个数。 掉部分噪声,这有利于提高学习性能。 1)①随机生成值在[0,1]之间的权重矩阵
‖J (l+1) FCR -JFCR (l)‖≤ε则迭代终止,其中 ε 表示迭代 终止的阈值;否则 l = l+1,转至步骤 2)。 研究表明,FCR 可以较好地解决切换回归问 题,但是也存在以下问题:对噪声和离群点敏感,当 数据集中含有离群点或大量噪声数据时,算法性能 就会受到影响;FCR 算法在数据原空间中进行学 习,针对现实生活中的复杂数据,FCR 算法的性能 很难得到有效地提升。 本文将 ELM 隐空间学习理论与特征降维技术 相结合,基于多隐层神经网络学习方法,将传统的基 于浅层结构的学习方法改造为多隐层学习结构,从 而提高对复杂数据的无监督学习能力。 通过提出堆 叠隐空间学习结构,从而有效精简冗余信息和过滤 噪声数据,同时补充必要的信息,使得切换回归算法 具有更强的鲁棒性,并将其应用于多模型建模以取 得更好的效果。 2 堆叠隐空间模糊 C 回归算法 2.1 基于主成分分析的压缩 ELM 隐空间 在 ELM 学习技术中,可以通过随机赋值的方法 来快速生成 ELM 隐空间,随着隐节点数目的增加, 学习精度也不断提高[16⁃17] 。 但是随之而来的一个 重要问题是计算效率会逐步降低。 此外,由于隐节 点生成过程中相关参数是随机生成的,因此不可避 免地会引入大量噪声。 针对这一问题,本文中将 ELM 隐空间技术与主成分分析相结合,提出基于主 成分分析的压缩隐空间构建方法,其过程如下: 1)根据图 1 所示过程将原始数据映射到高维 空间 R L 中,得到矩阵 H (1)∈R n×L ,n 为样本点个数; 2)对 H (1) 的每一列 H (1) j ,j = 1,2,…,L 进行归 一化,得到矩阵 A = [A1 A2… AL ],其中 Aj 计算方 法为 Aj = H (1) j - 1 n ∑ N j = 1 H (1) j ,j = 1,2,…,L (9) 3)计算矩阵 A 的协方差矩阵 C,并计算矩阵 C 的特征值 λi 和特征向量 Vi,i = 1,2,…,L; 4)将特征值 λi 降序排序,取前 p 个特征值对应 的特征向量,按列组成矩阵 V ~ ,特征提取后的矩阵为 H (2) = AV ~ (10) 其结构可映射为如图 2 所示的前馈神经网络模 型。 输入数据经过输入层后,通过 ELM 特征映射被 映射到高维 ELM 隐空间中。 在此过程中,生成 ELM 隐空间时的随机赋值操作会引入噪声,后续的 PCA 对高维隐空间中的数据进行降维,从而有效地过滤 掉部分噪声,这有利于提高学习性能。 图 2 基于 PCA 的压缩 ELM 隐空间 Fig.2 Cascade hidden space based on PCA 2.2 堆叠隐空间模糊 C 回归算法 CHS⁃FCR 在隐空间构建过程中,为了使学习器得到更好 的表达能力和稳定的学习效果,通常会使用较多的 隐节点数目。 但是,这增加了额外的计算负担。 研 究表明,在保证学习器泛化能力的前提下,将单隐层 结构改造为多隐层结构是降低隐节点数目的有效方 法。 为此,本文对上述基于 PCA 的压缩隐空间映射 过程进行改造,通过把 ELM 隐层中的隐节点分散到 多个隐含层中,并与 PCA 层的隐结点相结合,形成 新的混合隐含层。 将若干个混合隐含层进行叠加, 得到多隐层学习结构,该过程如图 3 所示。 图 3 堆叠隐空间学习结构 Fig.3 Cascade hidden space learning structure 堆叠隐空间模糊 C 回归算法 CHS⁃FCR 的描述 如下: 设隐节点总数为 L,数据集 D 的维数为 d,PCA 压缩后的维数为 p,隐空间压缩的次数为 f,每层隐 空间的 ELM 隐节点数 T = L / f,n 为样本点个数。 1)① 随机生成值在[ 0,1] 之间的权重矩阵 ·672· 智 能 系 统 学 报 第 11 卷
第5期 刘欢,等:堆叠隐空间模糊C回归算法及其在发酵数据多模型建模中的应用 .673 WeR以及值在[0.5,1]之间的偏移量矩阵B∈R。 表1实验平台 ②根据式(1)以及图1将数据集D进行特征映 Table 1 Experimental platform 射,得到高维数据矩阵H)∈Rxr。 结构 配置 2)利用基于PCA的压缩隐空间方法对H)进 CPU Intel(R)Core(TM)i5-4590 3.30GHz 行压缩,得到维数为p的数据矩阵H2): 内存 8.00GB 操作系统 64bit Windows7 3)for j=1:f-1 软件平台 Matlab R2012a ①重复步骤1中1)、2); 3.2鲁棒性实验 ②将H2)与H)合并存入矩阵H3)中, 本实验中,基于文献[5]的模拟回归数据集,通 H3)=[H2H)]。 过分别加入噪声点和离群点来比较FCR以及CHS, ③利用PCA对H3)进行特征提取,得到矩阵记 FCR算法的鲁棒性。实验中,FCR算法和CHS-FCR 为H2; 算法的模型个数c=2,模糊指数m=2,CHS-FCR隐 循环结束; 空间压缩次数f=5,PCA特征提取后的维数p=3。 4)构造全一矩阵1∈Rax1,将最终获取的数据 3.2.1离群点实验 H2=[1,2)]利用FCR框架进行切换回归。 在切换回归分析中,离群点主要是指不符合任 CHS-FCR算法将基于PCA的压缩ELM隐空间 一模型的数据,它主要是在收集数据的过程中出现 单隐层学习结构改造为多隐层学习结构。假设从第 误操作或异常情况而引入的。本实验中基于式 二层开始,每个隐含层中随机生成的ELM隐节点数 (15)和(16)生成2个回归数据集,并分别加入离群 都是T,由前一层PCA压缩后得到的隐节点数为 点(16,8)。实验数据集分布如图4所示。 T',易得隐节点总数为 L=(T+T)×(f-1)+T (11) y1=18-x+0.03125x2 A: (15) 其中随机生成的ELM隐节点总数为 0y2=-2+x-0.03125x2 LELM =Txf (12) y1=172-26x+x2 经过多次隐空间压缩,噪声信息被过滤,同时会 B: (16) y2=364-38x+x2 发生相应的信息损失:但是每个混合层中新生成的 图5和图6给出了加入离群点之前模糊C均值 ELM隐节点信息弥补了这些丢失的信息,因此本文 回归算法(fuzzy C regression algorithm,FCR)和堆叠 的堆叠隐空间结构能得到更好的学习效果。 隐空间模糊C回归算法(cascaded hidden space 3实验研究与分析 FCR,CHS-FCR)的回归结果,图7和图8给出了加 入离群点之后两算法的回归结果。从中可以看出, 3.1实验平台以及算法性能的评价指标 加入离群点之前,FCR和CHS-FCR这2个算法均可 本文在表1中实验平台上进行所有实验并且采 以得到理想的结果。加入离群点之后,CR的拟合 用式(13)和(14)所示的指标来评价各算法的性能。 效果明显受到离群点的影响:但是CHS-FCR仍然能 得到令人满意的拟合结果。可见,压缩隐空间方法 的引入使本文所提的CHS-FCR算法对离群点具有 (13) 更好的鲁棒性。 12 11 [(1r,-()] 9 (14) 式中:N表示测试样本数,y:表示测试样本第i次输 6 入的输出,y:'表示测试样本第i次输入的模糊系统 输出,y=∑y:。式(13)和(14)所示的指标数值 1012141618202224 分别越接近于0和1,则算法的性能越好。 (a)数据集A
W∈R T×d以及值在[0.5,1]之间的偏移量矩阵 B∈R T×1 。 ②根据式(1)以及图 1 将数据集 D 进行特征映 射,得到高维数据矩阵 H (1)∈R n×T 。 2)利用基于 PCA 的压缩隐空间方法对 H (1) 进 行压缩,得到维数为 p 的数据矩阵H (2) ; 3)for j = 1:f-1 ①重复步骤 1 中 1)、2); ② 将 H (2) 与 H (1) 合 并 存 入 矩 阵 H (3) 中, H (3)= [H (2) H (1) ]。 ③利用 PCA 对 H (3)进行特征提取,得到矩阵记 为 H (2) ; 循环结束; 4)构造全一矩阵 1∈R n×1 ,将最终获取的数据 H (2)= [1,H (2) ]利用 FCR 框架进行切换回归。 CHS⁃FCR 算法将基于 PCA 的压缩 ELM 隐空间 单隐层学习结构改造为多隐层学习结构。 假设从第 二层开始,每个隐含层中随机生成的 ELM 隐节点数 都是 T,由前一层 PCA 压缩后得到的隐节点数为 T′,易得隐节点总数为 L = (T + T′) × (f - 1) + T (11) 其中随机生成的 ELM 隐节点总数为 LELM = T × f (12) 经过多次隐空间压缩,噪声信息被过滤,同时会 发生相应的信息损失;但是每个混合层中新生成的 ELM 隐节点信息弥补了这些丢失的信息,因此本文 的堆叠隐空间结构能得到更好的学习效果。 3 实验研究与分析 3.1 实验平台以及算法性能的评价指标 本文在表 1 中实验平台上进行所有实验并且采 用式(13)和(14)所示的指标来评价各算法的性能。 JRRSE = 1 N∑ N i = 1 (yi ′ - yi) 2 / 1 N∑ N i = 1 (yi - y - ) 2 (13) JSCC = N∑ N i = 1 yi ′·y ( i) 2 N∑ N i = 1 (yi ′) 2- (∑ N i = 1 yi) 2 [ ]· N∑ N i = 1 (yi) 2-(∑ N i = 1 yi) 2 [ ] (14) 式中:N 表示测试样本数,yi 表示测试样本第 i 次输 入的输出,yi ′表示测试样本第 i 次输入的模糊系统 输出, y - = 1 N∑ N i = 1 yi 。 式(13)和(14)所示的指标数值 分别越接近于 0 和 1,则算法的性能越好。 表 1 实验平台 Table 1 Experimental platform 结构 配置 CPU Intel(R)Core(TM) i5-4590 3.30GHz 内存 8.00 GB 操作系统 64bit Windows7 软件平台 Matlab R2012a 3.2 鲁棒性实验 本实验中,基于文献[5]的模拟回归数据集,通 过分别加入噪声点和离群点来比较 FCR 以及 CHS⁃ FCR 算法的鲁棒性。 实验中,FCR 算法和 CHS⁃FCR 算法的模型个数 c = 2,模糊指数 m = 2,CHS⁃FCR 隐 空间压缩次数 f = 5,PCA 特征提取后的维数 p = 3。 3.2.1 离群点实验 在切换回归分析中,离群点主要是指不符合任 一模型的数据,它主要是在收集数据的过程中出现 误操作或异常情况而引入的。 本实验中基于式 (15)和(16)生成 2 个回归数据集,并分别加入离群 点(16,8)。 实验数据集分布如图 4 所示。 A: y1 = 18 - x + 0.031 25x 2 y2 = - 2 + x - 0.031 25x { 2 (15) B: y1 = 172 - 26x + x 2 y2 = 364 - 38x + x { 2 (16) 图 5 和图 6 给出了加入离群点之前模糊 C 均值 回归算法(fuzzy C regression algorithm, FCR)和堆叠 隐空 间 模 糊 C 回 归 算 法 ( cascaded hidden space FCR, CHS⁃FCR)的回归结果,图 7 和图 8 给出了加 入离群点之后两算法的回归结果。 从中可以看出, 加入离群点之前,FCR 和 CHS⁃FCR 这 2 个算法均可 以得到理想的结果。 加入离群点之后,FCR 的拟合 效果明显受到离群点的影响;但是 CHS⁃FCR 仍然能 得到令人满意的拟合结果。 可见,压缩隐空间方法 的引入使本文所提的 CHS⁃FCR 算法对离群点具有 更好的鲁棒性。 (a)数据集 A 第 5 期 刘欢,等:堆叠隐空间模糊 C 回归算法及其在发酵数据多模型建模中的应用 ·673·
674 智能系统学报 第11卷 80 。原数据集 60 0 CHS-FCR算法实验结果 % 吃 40 30 20 20 10 10 8.e 0 0 12 14 16 18 20 22 1416182022 (b)数据集B (b)数据集B 图4加入离群点后的数据及分布 图6CHS-FCR算法原数据集测试结果 Fig.4 Data distribution after adding outliers Fig.6 CHS-FCR algorithm test results of original dataset 12 13 6 。带高群点数据集 11 12 一FCR算法实验结果 11 10 10 9 。原数据集 8 CHS-FCR算法实验结果 7 7 6 5 5 10 12 141618202224 8 10 1214 1618202224 (a)数据集A (a)数据集A 光 80r d 。原数据集 70 ·带高群点数据集 一CHS-FCR算法实验结果 60 FCR算法实验结果 吃 50 ,40 .40 30 30 a 20 20 6 10 100a。。0o61900.00o00 0 0 12 1416 1820 22 10 12 14 16 18 20 22 (b)数据集B (b)数据集B 图5FCR算法原数据集测试结果 图7FCR算法在离群点数据集上的测试结果 Fig.5 FCR algorithm test results of original dataset Fig.7 FCR algorithm test results of outliers dataset 12 12 。带高群点数据集 11 CHS-FCR算法实验结果 10 10 9 。原数据集 9 一CHS-FCR算法实险结果 7 7 6 6 5 r 5 1012141618202224 1012141618202224 (a)数据集A (a)数据集A
(b)数据集 B 图 4 加入离群点后的数据及分布 Fig.4 Data distribution after adding outliers (a)数据集 A (b)数据集 B 图 5 FCR 算法原数据集测试结果 Fig.5 FCR algorithm test results of original dataset (a)数据集 A (b)数据集 B 图 6 CHS⁃FCR 算法原数据集测试结果 Fig.6 CHS⁃FCR algorithm test results of original dataset (a)数据集 A (b)数据集 B 图 7 FCR 算法在离群点数据集上的测试结果 Fig.7 FCR algorithm test results of outliers dataset (a)数据集 A ·674· 智 能 系 统 学 报 第 11 卷
第5期 刘欢,等:堆叠隐空间模糊C回归算法及其在发酵数据多模型建模中的应用 ·675 2 9 70 。带高群点数据集 。 60 CHS-FCR算法实验结果 10 00e9 0 50 9 。加躁声点数据集 40 8 一CHS-FCR算法实验结果 30 7 20 109-g6 90121416182022 48 1012141618202224 (b)数据集B (c)CHS.FCR测试结果 图8CHS-FCR算法在离群点数据集上的测试结果 图9FCR以及CHS-FCR算法噪声数据集C上的测试结果 Fig.8 CHS-FCR algorithm test results of outliers dataset Fig.9 FCR and CHS-FCR algorithms test results of 3.2.2抗噪声实验 noise dataset 为了进一步验证本文算法的抗噪性能并将其与 综合以上2个实验不难发现,传统的FCR算法 FCR进行比较,本实验采用式(17)生成带随机噪声 性能易受离群点和噪声数据的干扰,而CHS-FCR算 的数据集。 法利用多次隐空间映射和压缩,使得隐空间中的冗 y1=18-x+0.03125x2+6 余信息被精简,噪声被有效过滤,同时每一层中进行 C: (17) y2=-2+x-0.03125x2+δ 了适度的信息弥补,这使得该算法在不同回归模型 式中6∈[-0.5,0.5]为服从均匀分布的随机值。分 中均能很好地完成学习过程。 别运行FCR和CHS-FCR,所得结果如图9所示。从 3.3发酵数据集多模型建模 图9的模拟实验结果中可以看出,在模拟数据集C 切换回归模型由多个简单回归模型混合而成, 中,FCR算法易受噪声点的影响,无法得到准确的 本文所研究的切换回归模型可用于发酵数据集多模 实验结果。相反,CHS-FCR算法在该数据集中能够 型建模。为了更好地表明多层压缩隐空间对回归性 取得较好的拟合效果。 能的影响,在保持ELM隐节点数目不变的前提下, 给出了CHS-FCR的2个不同版本:CHS-FCR(f=1) 12 和CHS-FCR(f=5),其中f为隐空间压缩的次数。 通过使用CHS-FCR(f=5)、FCR、HS-FCR以及 9 CHS-FCR(f=1)算法进行训练得到训练数据集中 各样本点的隶属度u,k=1,2,…,n;i=1,2,…,c 7 并使用式(18)计算各类聚类中心:。对于CHS FCR(f=5)和CHS-FCR(f=1),还分别记录各层中 4 的ELM隐空间映射矩阵W、偏移量矩阵B和PCA 10 12141618202224 过程中的变换矩阵7。在测试过程中,通过式(1)、 (a)加入噪声的数据集C (9)、(10)将测试样本x,映射到压缩隐空间中,再 由式(5)求出测试回归模型y,并使用式(18)、(19) 13 。加噪声点数据集 12 一FCR算法实验结果 11 得到各测试点的隶属度。预测值由=立g = 10 9 计算而得。 8 ua"h() 6 k=1 00。 0 i=1,2,…,c (18) 5 D.0 10 12 14 1618202224 dVm-1) Ui = (19) (b)FCR测试结果 ∑4
(b)数据集 B 图 8 CHS⁃FCR 算法在离群点数据集上的测试结果 Fig.8 CHS⁃FCR algorithm test results of outliers dataset 3.2.2 抗噪声实验 为了进一步验证本文算法的抗噪性能并将其与 FCR 进行比较,本实验采用式(17)生成带随机噪声 的数据集。 C: y1 = 18 - x + 0.031 25x 2 + δ y2 = - 2 + x - 0.031 25x 2 { + δ (17) 式中 δ∈[-0.5,0.5]为服从均匀分布的随机值。 分 别运行 FCR 和 CHS⁃FCR,所得结果如图 9 所示。 从 图 9 的模拟实验结果中可以看出,在模拟数据集 C 中,FCR 算法易受噪声点的影响,无法得到准确的 实验结果。 相反,CHS⁃FCR 算法在该数据集中能够 取得较好的拟合效果。 (a)加入噪声的数据集 C (b)FCR 测试结果 (c)CHS⁃FCR 测试结果 图 9 FCR 以及 CHS⁃FCR 算法噪声数据集 C 上的测试结果 Fig.9 FCR and CHS⁃FCR algorithms test results of noise dataset 综合以上 2 个实验不难发现,传统的 FCR 算法 性能易受离群点和噪声数据的干扰,而 CHS⁃FCR 算 法利用多次隐空间映射和压缩,使得隐空间中的冗 余信息被精简,噪声被有效过滤,同时每一层中进行 了适度的信息弥补,这使得该算法在不同回归模型 中均能很好地完成学习过程。 3.3 发酵数据集多模型建模 切换回归模型由多个简单回归模型混合而成, 本文所研究的切换回归模型可用于发酵数据集多模 型建模。 为了更好地表明多层压缩隐空间对回归性 能的影响,在保持 ELM 隐节点数目不变的前提下, 给出了 CHS⁃FCR 的 2 个不同版本:CHS⁃FCR (f = 1) 和 CHS⁃FCR (f = 5),其中 f 为隐空间压缩的次数。 通过使用 CHS⁃FCR ( f = 5) 、 FCR、 HS⁃FCR 以及 CHS⁃FCR (f = 1) 算法进行训练得到训练数据集中 各样本点的隶属度 uik , k = 1,2,…,n;i = 1,2,…,c 并使用式(18) 计算各类聚类中心 vi 。 对于 CHS⁃ FCR(f = 5)和 CHS⁃FCR( f = 1),还分别记录各层中 的 ELM 隐空间映射矩阵 W、偏移量矩阵 B 和 PCA 过程中的变换矩阵 V。 在测试过程中,通过式(1)、 (9)、(10)将测试样本 xt 映射到压缩隐空间中,再 由式(5)求出测试回归模型 yt,i并使用式(18)、(19) 得到各测试点的隶属度。 预测值由 yt ′ = ∑ c i = 1 u m it·yt,i 计算而得。 vi = ∑ n k = 1 uik m h(xi) ∑ n k = 1 uik m ,i = 1,2,…,c (18) uit = dit -1/ (m-1) ∑ c j = 1 djt -1/ (m-1) (19) 第 5 期 刘欢,等:堆叠隐空间模糊 C 回归算法及其在发酵数据多模型建模中的应用 ·675·
676 智能系统学报 第11卷 式中:j=1,2,,c;da=‖:-h(x,)‖2。 分别运行各算法10次,得到JRRSE Jscc这2个指标 本文使用参考文献[18]中所用的发酵数据集 的均值和标准差如表4所示。 并且采用10折交叉验证的方法进行实验。将CHS- 表3各算法的说明以及相关参数设置 FCR(f=5)算法和FCR、HS-FCR、CHS-FCR(f=I) Table 3 The description of each algorithms and associated 算法进行比较。实验中,对于不同的数据集,采用不 parameters 同的模糊指数m和模型个数c,并且让各算法都在 算法 算法说明以及相关参数 同样的参数条件下运行。表2给出各数据集的详细 FCR 最大迭代次数100次,收敛阈值10°。 信息及该数据集在实验中的相关参数设置,表3给 通过ELM特征映射后进行执行FCR算法, 出各算法说明及相关参数设置。 HS-FCR ELM隐节点总数1000,激励函数Sigmoid, 表2实验数据集 最大迭代次数100次,收敛阈值105。 Table 2 Experimental datasets 通过ELM特征映射后利用PCA进行1次 特模糊模型 数据集 CHS-FCR 隐空间压缩后执行FCR算法,ELM隐节点 数据集 样本数 征指数个数 序号 (f=1) 总数1000,PCA提取的特征数为5,最大迭 数m c 代次数100次,收敛阈值105。 D bio P scal P 1002 6 通过ELM特征映射后利用PCA进行5次 CHS-FCR 隐空间压缩后执行FCR算法,ELM隐节点 D, bio S scal P, 1002 6 3 5 (f=5) 总数1000,PCA提取的特征数为5,最大迭 D. bio_P_scal_P 3004 6 4 代次数100次,收敛阈值105。 从表4的实验结果可以发现,在发酵数据集中 D bio S scal P 3004 6 25 CHS-FCR(f=5)与FCR和HS-FCR这2个算法相比 3.3.1算法的拟合性能对比实验 拥有更好的学习效果。将CHS-FCR(f=5)与CHS 本实验从拟合精度出发来研究CHS-FCR(f= FCR(f=I)进行比较,不难发现,将ELM隐节点分 5)、CHS-FCR(f=1)与FCR以及HS-FCR在表2所 散到多个混合隐含层中,经过多次隐空间压缩,有助 示中的发酵数据集上的多模型建模效果。实验中, 于进一步提高算法的学习精度和算法的稳定性。 表4各算法在不同数据集中的拟合精度对比 Table 4 Each algorithm compared fitting accuracy on different datasets 数据集 性能指标 FCR HS-FCR CHS-FCR(f=1) CHS-FCR(f=5) RRSE 0.2366±0.0645 0.1217±0.0292 0.2047±0.0306 0.1940±0.0197 D Jscc 0.9639±0.0167 0.9853±0.0068 0.9621±0.0141 0.9696±0.0104 0.3861±0.0583 0.1935±0.0283 0.1581±0.0189 0.1467±0.0086 名 Jscc 0.9253±0.0102 0.9645±0.0054 0.9758±0.0058 0.9799±0.0037 JRRSE 0.3315±0.0352 0.2087±0.0435 0.2052±0.0378 0.2042±0.0301 D Jacc 0.9309±0.0117 0.9593±0.0207 0.9588±0.0087 0.9691±0.0063 JwE 0.7118±0.0767 0.1458±0.0213 0.1545±0.0214 0.1447±0.0174 名 Jsce 0.8431±0.0284 0.9800±0.0063 0.9780±0.00500.9808±0.0040 3.3.2算法效率对比实验 并为2个算法设置相同的ELM隐节点总数目为 本实验研究在相同ELM隐节点总数的前提下, 500、1000。分别使2个算法各运行10次,记录 浅层学习结构和多层学习结构对算法效率的影响。 JRRSE JscC以及算法运行时间这3个指标的均值如表 实验中分别执行CHS-FCR(f=5)与HS-FCR算法,5所示。由表5中的HS-FCR的运行结果可以看出
式中:j = 1,2,…,c;dit =‖vi -h(xt)‖2 。 本文使用参考文献[18] 中所用的发酵数据集 并且采用 10 折交叉验证的方法进行实验。 将 CHS⁃ FCR (f = 5)算法和 FCR、HS⁃FCR、CHS⁃FCR (f = 1) 算法进行比较。 实验中,对于不同的数据集,采用不 同的模糊指数 m 和模型个数 c,并且让各算法都在 同样的参数条件下运行。 表 2 给出各数据集的详细 信息及该数据集在实验中的相关参数设置,表 3 给 出各算法说明及相关参数设置。 表 2 实验数据集 Table 2 Experimental datasets 数据集 序号 数据集 样本数 特 征 数 模糊 指数 m 模型 个数 c D1 bio_P_scal_P1 1 002 6 2 5 D2 bio_S_scal_P1 1 002 6 3 5 D3 bio_P_scal_P3 3 004 6 4 5 D4 bio_S_scal_P3 3 004 6 4 25 3.3.1 算法的拟合性能对比实验 本实验从拟合精度出发来研究 CHS⁃FCR( f = 5)、CHS⁃FCR (f = 1)与 FCR 以及 HS⁃FCR 在表 2 所 示中的发酵数据集上的多模型建模效果。 实验中, 分别运行各算法 10 次,得到 JRRSE 、JSCC这 2 个指标 的均值和标准差如表 4 所示。 表 3 各算法的说明以及相关参数设置 Table 3 The description of each algorithms and associated parameters 算法 算法说明以及相关参数 FCR 最大迭代次数 100 次,收敛阈值10 -5 。 HS⁃FCR 通过 ELM 特征映射后进行执行 FCR 算法, ELM 隐节点总数 1 000,激励函数 Sigmoid, 最大迭代次数 100 次, 收敛阈值10 -5 。 CHS⁃FCR (f = 1) 通过 ELM 特征映射后利用 PCA 进行 1 次 隐空间压缩后执行 FCR 算法,ELM 隐节点 总数 1 000,PCA 提取的特征数为 5,最大迭 代次数 100 次, 收敛阈值10 -5 。 CHS⁃FCR (f = 5) 通过 ELM 特征映射后利用 PCA 进行 5 次 隐空间压缩后执行 FCR 算法,ELM 隐节点 总数 1 000,PCA 提取的特征数为 5,最大迭 代次数 100 次, 收敛阈值10 -5 。 从表 4 的实验结果可以发现,在发酵数据集中 CHS⁃FCR(f = 5)与 FCR 和 HS⁃FCR 这 2 个算法相比 拥有更好的学习效果。 将 CHS⁃FCR( f = 5)与 CHS⁃ FCR(f = 1) 进行比较,不难发现,将 ELM 隐节点分 散到多个混合隐含层中,经过多次隐空间压缩,有助 于进一步提高算法的学习精度和算法的稳定性。 表 4 各算法在不同数据集中的拟合精度对比 Table 4 Each algorithm compared fitting accuracy on different datasets 数据集 性能指标 FCR HS⁃FCR CHS⁃FCR(f = 1) CHS⁃FCR(f = 5) D1 JRRSE 0.236 6±0.064 5 0.121 7±0.029 2 0.204 7±0.030 6 0.194 0±0.019 7 JSCC 0.963 9±0.016 7 0.985 3±0.006 8 0.962 1±0.014 1 0.969 6±0.010 4 D2 JRRSE 0.386 1±0.058 3 0.193 5±0.028 3 0.158 1±0.018 9 0.146 7±0.008 6 JSCC 0.925 3±0.010 2 0.964 5±0.005 4 0.975 8±0.005 8 0.979 9±0.003 7 D3 JRRSE 0.331 5±0.035 2 0.208 7±0.043 5 0.205 2±0.037 8 0.204 2±0.030 1 JSCC 0.930 9±0.011 7 0.959 3±0.020 7 0.958 8±0.008 7 0.969 1±0.006 3 D4 JRRSE 0.711 8±0.076 7 0.145 8±0.021 3 0.154 5±0.021 4 0.144 7±0.017 4 JSCC 0.843 1±0.028 4 0.980 0±0.006 3 0.978 0±0.005 0 0.980 8±0.004 0 3.3.2 算法效率对比实验 本实验研究在相同 ELM 隐节点总数的前提下, 浅层学习结构和多层学习结构对算法效率的影响。 实验中分别执行 CHS⁃FCR( f = 5) 与 HS⁃FCR 算法, 并为 2 个算法设置相同的 ELM 隐节点总数目为 500、1 000。 分别使 2 个算法各运行 10 次,记录 JRRSE 、JSCC 以及算法运行时间这 3 个指标的均值如表 5 所示。 由表 5 中的 HS⁃FCR 的运行结果可以看出, ·676· 智 能 系 统 学 报 第 11 卷
第5期 刘欢,等:堆叠隐空间模糊C回归算法及其在发酵数据多模型建模中的应用 ·677 通过ELM映射将原数据经映射到高维ELM隐空间 法能够在高效处理复杂数据的同时具有更好的拟合 使得隐节点总数增加,后续学习过程的效率明显降 效果。由此可见,相同ELM隐节点总数的情况下, 低。而本文所提出的CHS-FCR(f=5)中,虽然涉及 本文提出的具有多层学习结构堆叠隐空间构造技术 了多次隐空间映射和压缩,但是在隐空间压缩过程 可以使后续的回归算法取得更好的学习效果。 中,冗余信息被有效精简,这使得CHS-FCR(f=5)算 表5CHS-FCR(f=5)与HS-FCR算法的效率对比 Table 5 CHS-FCR(f=5)compared with the efficiency of the HS-FCR 算法平均时间/s ELM隐节点总数 JRsE平均值 Jscc平均值 数据集 HS-FCR CHS-FCR(f=5) HS-FCR CHS-FCR(f=5) HS-FCR CHS-FCR(f=5)HS-FCR CHS-FCR(f=5) 62.1368 1.3700 500 500 0.1227 0.2318 0.9842 0.9606 D 332.5496 1.4478 1000 1000 0.1217 0.1940 0.9853 0.9696 74.9884 1.3694 500 500 0.1911 0.1638 0.9637 0.9667 D. 352.6092 1.7024 1000 1000 0.1935 0.1467 0.9645 0.9799 148.2690 15.7312 500 500 0.2112 0.2097 0.9597 0.9601 D 639.0147 17.1680 1000 1000 0.2087 0.2042 0.9588 0.9691 227.3086 25.8340 500 500 0.1523 0.1579 0.9729 0.9767 D. 750.4638 27.4083 1000 1000 0.1458 0.1447 0.9800 0.9808 3.3.3参数敏感性实验 1.00 在CHS-FCR(f=5)和FCR算法中,模糊指数m D 0.99 是一个重要指标,它严重影响着算法的执行效果。 0.98 基于表2中的各数据集,本实验将研究模糊指数m 0.97 的变化对算法性能产生的影响。给出了JRRSE Jscc 0.96 指标的变化情况,实验中,m值在{2,2.2,2.4,2.6, 0.95 .02.22.42.62.83.03.23.43.63.84.0 2.8,3.0,3.2,3.4,3.6,3.8,4.0}上变化.算法的其他 模糊指数m 参数如表3所示,2个算法分别运行10次。记录 (b)CHS-FCR(f=5) JsE和Jsc指标的均值,实验结果如图10、11所示。 图10FCR和CHS-FCR(=5)算法的J指标随m的 变化情况 1.00r e—D 0.98 Fig.10 Jscc index of FCR and CHS-FCR(f=5)algo- 0.96 D rithms with the change of m 0.94 0.92 从图10、11结果中可以看出FCR算法的性能 、0.88 在4个数据集中随着m的变化有着较大的波动。 0.86 例如在图11(a)中,当m=3.2时FCR算法的JRs 0.84 指标会出现明显的波动现象,而图11(b)中的CHS 0.82 2.02.22.42.62.83.03.23.43.63.84.0 FCR(f=5)算法无论其m值怎样变化,其Js指标 模糊指数m 基本呈现平稳变化的趋势。由此可见,虽然模糊指 (a)FCR 数m在较为宽广的范围内变化,但是CHS-FCR
通过 ELM 映射将原数据经映射到高维 ELM 隐空间 使得隐节点总数增加,后续学习过程的效率明显降 低。 而本文所提出的 CHS⁃FCR (f = 5)中,虽然涉及 了多次隐空间映射和压缩,但是在隐空间压缩过程 中,冗余信息被有效精简,这使得 CHS⁃FCR(f = 5)算 法能够在高效处理复杂数据的同时具有更好的拟合 效果。 由此可见,相同 ELM 隐节点总数的情况下, 本文提出的具有多层学习结构堆叠隐空间构造技术 可以使后续的回归算法取得更好的学习效果。 表 5 CHS⁃FCR(f= 5)与 HS⁃FCR 算法的效率对比 Table 5 CHS⁃FCR(f= 5) compared with the efficiency of the HS⁃FCR 数据集 算法平均时间/ s ELM 隐节点总数 JRRSE 平均值 JSCC 平均值 HS⁃FCR CHS⁃FCR(f = 5) HS⁃FCR CHS⁃FCR(f = 5) HS⁃FCR CHS⁃FCR(f = 5) HS⁃FCR CHS⁃FCR(f = 5) D1 62.136 8 1.370 0 500 500 0.122 7 0.231 8 0.984 2 0.960 6 332.549 6 1.447 8 1 000 1 000 0.121 7 0.194 0 0.985 3 0.969 6 D2 74.988 4 1.369 4 500 500 0.191 1 0.163 8 0.963 7 0.966 7 352.609 2 1.702 4 1 000 1 000 0.193 5 0.146 7 0.964 5 0.979 9 D3 148.269 0 15.731 2 500 500 0.211 2 0.209 7 0.959 7 0.960 1 639.014 7 17.168 0 1 000 1 000 0.208 7 0.204 2 0.958 8 0.969 1 D4 227.308 6 25.834 0 500 500 0.152 3 0.157 9 0.972 9 0.976 7 750.463 8 27.408 3 1 000 1 000 0.145 8 0.144 7 0.980 0 0.980 8 3.3.3 参数敏感性实验 在 CHS⁃FCR(f = 5)和 FCR 算法中,模糊指数 m 是一个重要指标,它严重影响着算法的执行效果。 基于表 2 中的各数据集,本实验将研究模糊指数 m 的变化对算法性能产生的影响。 给出了 JRRSE 、JSCC 指标的变化情况,实验中,m 值在{2,2.2,2.4,2.6, 2.8,3.0,3.2,3.4,3.6,3.8,4.0} 上变化,算法的其他 参数如表 3 所示,2 个算法分别运行 10 次。 记录 JRRSE 和 JSCC 指标的均值,实验结果如图 10、11 所示。 (a)FCR (b)CHS⁃FCR(f = 5) 图10 FCR 和 CHS⁃FCR(f= 5)算法的 JSCC 指标随 m 的 变化情况 Fig.10 JSCC index of FCR and CHS⁃FCR( f = 5) algo⁃ rithms with the change of m 从图 10、11 结果中可以看出 FCR 算法的性能 在 4 个数据集中随着 m 的变化有着较大的波动。 例如在图 11( a)中,当 m = 3.2 时 FCR 算法的 JRRSE 指标会出现明显的波动现象,而图 11(b)中的 CHS⁃ FCR(f = 5)算法无论其 m 值怎样变化,其 JRRSE 指标 基本呈现平稳变化的趋势。 由此可见,虽然模糊指 数 m 在较为宽广的范围内变化, 但是 CHS⁃FCR 第 5 期 刘欢,等:堆叠隐空间模糊 C 回归算法及其在发酵数据多模型建模中的应用 ·677·
·678. 智能系统学报 第11卷 (f=5)在各数据集上均可以取得令人满意且较稳定 的结果。 参考文献: 0.8 [1]王骏,王土同,邓赵红.聚类分析研究中的若干问题 D [J].控制与决策,2012,27(3):321-328. 0.7 D WANG Jun,WANG Shitong,DENG Zhaohong.Survey on 0.6 challenges in clustering analysis research[J].Control and 05 decision,2012.27(3):321-328. [2]蒋亦樟,邓赵红,王骏,等.嫡加权多视角协同划分模 0.3 糊聚类算法[J刀].软件学报,2014,25(10):2293-2311. JIANG Yizhang,DENG Zhaohong,WANG Jun,et al.Col- 2.02.22.42.62.83.03.23.43.63.84.0 laborative partition multi-view fuzzy clustering algorithm u- 模樹指数m sing entropy weighting[J].Journal of software,2014,25 (a)FCR (10):2293-2311 0.45 0.40 B [3]张敏,于剑.基于划分的模糊聚类算法[J].软件学报, 0.35 ★ D 2004,15(6):858-868 0.30 ZHANG Min,YU Jian.Fuzzy partitional clustering algo- 0.25 rithms[J].Joural of software,2004,15(6):858-868. 0.20 [4]秦蓓蓓.基于聚类分析的鲁棒自适应切换回归算法研究 0.15 [D].上海:上海交通大学,2012:14-39. 0.10 0.05 QIN Beibei.Research on the robust and adaptive switching 2.02.2242.62.83.03.23.43.63.84.0 C-regressions models based on cluster analysis[D].Shang- 模糊指数m hai:Shanghai Jiao Tong University,2012:14-39. (b)CHS-FCR(f=5) [5]HATHAWAY R J,BEZDEK J C.Switching regression mod- 图11FCR和CHS-FCR(f=5)算法的JsE指标随m的 els and fuzzy clustering[J].IEEE transactions on fuzzy sys- tems,1993,1(3):195-204. 变化情况 [6]WANG Shitong,JIANG Haifeng,LU Hongjun.A new inte- Fig.11 JRRSE index of FCR and CHS-FCR (f=5)algo- grated clustering algorithm GFC and switching regressions rithms with the change of m []International journal of pattern recognition and artificial 综上所述,经过堆叠隐空间的压缩与重组, intelligence,2002,16(4):433-446. CHS-FCR(f=5)算法对模糊指数m的变化具有更好 [7]沈红斌,王士同,吴小俊.离群模糊切换回归模型研究 的鲁棒性,这有利于用户在实际应用中更方便地选 [J].华东船舶工业学院学报:自然科学版,2003,17 取模糊指数。 (3):31-36. SHEN Hongbin,WANG Shitong,WU Xiaojun.Research on 4结束语 fuzzy switching regression models with outliers[].Journal 本文基于主成分分析和ELM映射技术将复杂 of east China shipbuilding institute:natural science edition, 数据映射到低维空间中,并结合多层神经网络学习 2003.17(3):31-36. 方法将单隐层结构改造为多隐层结构:在此基础上 [8]WANG Shitong,CHUNG Fulai.WANG Jun,et al.A fast 提出堆叠隐空间模糊C回归算法CHS-FCR。通过 learning method for feedforward neural networks[J].Neuro- 在模拟以及发酵数据集的实验结果,均表明本文方 computing,2015,149:295-307. [9]HUANG Guangbin,ZHU Qinyu,SIEW C K.Extreme learn- 法较其他相关算法有更好的鲁棒性且能够高效地处 ing machine:theory and applications[J].Neurocomputing, 理复杂数据,可以有效地应用于发酵数据集多模型 2006,70(1/2/3):489-501. 建模工作中。当前,随着回归模型算法研究的不断 [10]HUANG Guangbin,ZHOU Hongming,DING Xiaojian,et 深入,人们已经基于不同理论提出了更先进的回归 al.Extreme learning machine for regression and multiclass 技术。如何将本文所提的堆叠隐空间技术应用于这 classification[J.IEEE transactions on systems,man,and 些回归算法中,这将是今后研究的重点。 cybernetics,part b cybemetics),2012,42(2):513-529. [11]HUANG Guangbin,WANG Dianhui,LAN Yuan.Extreme
(f = 5)在各数据集上均可以取得令人满意且较稳定 的结果。 (a)FCR (b)CHS⁃FCR(f = 5) 图 11 FCR 和 CHS⁃FCR(f= 5)算法的 JRRSE指标随 m 的 变化情况 Fig.11 JRRSE index of FCR and CHS⁃FCR ( f = 5) algo⁃ rithms with the change of m 综上所述, 经过堆叠隐空间的压缩与重组, CHS⁃FCR(f = 5)算法对模糊指数 m 的变化具有更好 的鲁棒性,这有利于用户在实际应用中更方便地选 取模糊指数。 4 结束语 本文基于主成分分析和 ELM 映射技术将复杂 数据映射到低维空间中,并结合多层神经网络学习 方法将单隐层结构改造为多隐层结构;在此基础上 提出堆叠隐空间模糊 C 回归算法 CHS⁃FCR。 通过 在模拟以及发酵数据集的实验结果,均表明本文方 法较其他相关算法有更好的鲁棒性且能够高效地处 理复杂数据,可以有效地应用于发酵数据集多模型 建模工作中。 当前,随着回归模型算法研究的不断 深入,人们已经基于不同理论提出了更先进的回归 技术。 如何将本文所提的堆叠隐空间技术应用于这 些回归算法中,这将是今后研究的重点。 参考文献: [1]王骏, 王士同, 邓赵红. 聚类分析研究中的若干问题 [J]. 控制与决策, 2012, 27(3): 321⁃328. WANG Jun, WANG Shitong, DENG Zhaohong. Survey on challenges in clustering analysis research [ J]. Control and decision, 2012, 27(3): 321⁃328. [2]蒋亦樟, 邓赵红, 王骏, 等. 熵加权多视角协同划分模 糊聚类算法[J]. 软件学报, 2014, 25(10): 2293⁃2311. JIANG Yizhang, DENG Zhaohong, WANG Jun, et al. Col⁃ laborative partition multi⁃view fuzzy clustering algorithm u⁃ sing entropy weighting [ J]. Journal of software, 2014, 25 (10): 2293⁃2311. [3]张敏, 于剑. 基于划分的模糊聚类算法[ J]. 软件学报, 2004, 15(6): 858⁃868. ZHANG Min, YU Jian. Fuzzy partitional clustering algo⁃ rithms[J]. Journal of software, 2004, 15(6): 858⁃868. [4]秦蓓蓓. 基于聚类分析的鲁棒自适应切换回归算法研究 [D]. 上海: 上海交通大学, 2012: 14⁃39. QIN Beibei. Research on the robust and adaptive switching C⁃regressions models based on cluster analysis[D]. Shang⁃ hai: Shanghai Jiao Tong University, 2012: 14⁃39. [5]HATHAWAY R J, BEZDEK J C. Switching regression mod⁃ els and fuzzy clustering[J]. IEEE transactions on fuzzy sys⁃ tems, 1993, 1(3): 195⁃204. [6]WANG Shitong, JIANG Haifeng, LU Hongjun. A new inte⁃ grated clustering algorithm GFC and switching regressions [J]. International journal of pattern recognition and artificial intelligence, 2002, 16(4): 433⁃446. [7]沈红斌, 王士同, 吴小俊. 离群模糊切换回归模型研究 [J]. 华东船舶工业学院学报: 自然科学版, 2003, 17 (3): 31⁃36. SHEN Hongbin, WANG Shitong, WU Xiaojun. Research on fuzzy switching regression models with outliers[ J]. Journal of east China shipbuilding institute: natural science edition, 2003, 17(3): 31⁃36. [8]WANG Shitong, CHUNG Fulai, WANG Jun, et al. A fast learning method for feedforward neural networks[J]. Neuro⁃ computing, 2015, 149: 295⁃307. [9]HUANG Guangbin, ZHU Qinyu, SIEW C K. Extreme learn⁃ ing machine: theory and applications[J]. Neurocomputing, 2006, 70(1 / 2 / 3): 489⁃501. [10]HUANG Guangbin, ZHOU Hongming, DING Xiaojian, et al. Extreme learning machine for regression and multiclass classification[J]. IEEE transactions on systems, man, and cybernetics, part b (cybernetics), 2012, 42(2): 513⁃529. [11]HUANG Guangbin, WANG Dianhui, LAN Yuan. Extreme ·678· 智 能 系 统 学 报 第 11 卷
第5期 刘欢,等:堆叠隐空间模糊C回归算法及其在发酵数据多模型建模中的应用 ·679. learning machines:a survey[J].International journal of 作者简介: machine learning and cybernetics,2011,2(2):107-122. 刘欢,男,1993年生,硕士研究生, [12]JOLLIFFE I T.Principal component analysis [J].New 主要研究方向为人工智能与模式识别、 York:Springer,2002. 智能计算、数据挖掘。 [13 ]ZHOU Hongming,HUANG Guangbin,LIN Zhiping,et al. Stacked extreme learning machines[J].IEEE transactions on cybernetics,2014,45(9):2013-2025. [14]HE Qing,JIN Xin,DU Changying,et al.Clustering in ex- treme learning machine feature space[J].Neurocomput- 王骏,男,1978年生,副教授,博士, ing,2014,128:88-95. CCF会员,主要研究方向为人工智能与 [15]BEZDEK J C.Pattern recognition with fuzzy objective func- 模式识别、智能计算、数据挖掘。 tion algorithms M].New York:Plenum Press,1981: 203-239. [16]HUANG Guangbin,CHEN Lei.Convex incremental ex- treme learning machine[J].Neurocomputing,2007,70 (16/17/18):3056-3062. 邓赵红,男,1981年生,教授,博土, [17]HUANG Guangbin,CHEN Lei.Enhanced random search CCF高级会员,主要研究方向为人工智 based incremental extreme learning machine[J].Neuro- 能与模式识别、智能计算、系统建模。 computing,2008,71(16/17/18):3460-3468. [18]DENG Zhaohong,CHOI K S,CHUNG Fulai,et al.En- hanced soft subspace clustering integrating within-cluster and between-cluster information[J].Pattern recognition, 2010.43(3):767-781.. 2017第二届EEE云计算与大数据分析国际会议 2017 the 2nd IEEE International Conference on Cloud Computing and Big Data Analysis 云计算和大数据是近年来非常热的话题,也是近年来非常重要的技术。随着大数据时代来临,在以云计 算为代表的技术创新大幕的衬托下,它将在众多领域掀起变革的巨浪,大数据会逐步为人类创造更多的价 值。与此同时,中央和国家今年也在力推“互联网+”以及大数据战略,以及在十三五规划中强调的创新驱 动,均离不开当前信息技术中的云计算和大数据。 就目前国际国内对云计算和大数据发展趋势来看,加大对云计算和大数据的技术层面的理解,加深对云 计算和大数据在推动社会发展的层面的理解,以及增强各个研究和应用领域之间的交流显得尤为重要。 为此,将于2017年4月在中国成都联合展开为期3天的第二届EEE云计算与大数据分析国际会议。 会议旨在促进云计算与大数据分析等领域的学术交流与合作,热忱欢迎从事相关技术研究的专家、学者和专 业技术人员踊跃投稿并参加大会。 会议网站:htp:/www.iccebd..com/
learning machines: a survey [ J]. International journal of machine learning and cybernetics, 2011, 2(2): 107⁃122. [12] JOLLIFFE I T. Principal component analysis [ J]. New York: Springer, 2002. [13]ZHOU Hongming, HUANG Guangbin, LIN Zhiping, et al. Stacked extreme learning machines[ J]. IEEE transactions on cybernetics, 2014, 45(9): 2013⁃2025. [ 14]HE Qing, JIN Xin, DU Changying, et al. Clustering in ex⁃ treme learning machine feature space [ J]. Neurocomput⁃ ing, 2014, 128: 88⁃95. [ 15]BEZDEK J C. Pattern recognition with fuzzy objective func⁃ tion algorithms [ M]. New York: Plenum Press, 1981: 203⁃239. [16] HUANG Guangbin, CHEN Lei. Convex incremental ex⁃ treme learning machine [ J]. Neurocomputing, 2007, 70 (16 / 17 / 18): 3056⁃3062. [17]HUANG Guangbin, CHEN Lei. Enhanced random search based incremental extreme learning machine [ J]. Neuro⁃ computing, 2008, 71(16 / 17 / 18): 3460⁃3468. [18]DENG Zhaohong, CHOI K S, CHUNG Fulai, et al. En⁃ hanced soft subspace clustering integrating within⁃cluster and between⁃cluster information [ J]. Pattern recognition, 2010, 43(3): 767⁃781. . 作者简介: 刘欢,男,1993 年生,硕士研究生, 主要研究方向为人工智能与模式识别、 智能计算、数据挖掘。 王骏,男,1978 年生,副教授,博士, CCF 会员,主要研究方向为人工智能与 模式识别、智能计算、数据挖掘。 邓赵红,男,1981 年生,教授,博士, CCF 高级会员,主要研究方向为人工智 能与模式识别、智能计算、系统建模。 2017 第二届 IEEE 云计算与大数据分析国际会议 2017 the 2nd IEEE International Conference on Cloud Computing and Big Data Analysis 云计算和大数据是近年来非常热的话题,也是近年来非常重要的技术。 随着大数据时代来临,在以云计 算为代表的技术创新大幕的衬托下,它将在众多领域掀起变革的巨浪,大数据会逐步为人类创造更多的价 值。 与此同时,中央和国家今年也在力推“互联网+”以及大数据战略,以及在十三五规划中强调的创新驱 动,均离不开当前信息技术中的云计算和大数据。 就目前国际国内对云计算和大数据发展趋势来看,加大对云计算和大数据的技术层面的理解,加深对云 计算和大数据在推动社会发展的层面的理解,以及增强各个研究和应用领域之间的交流显得尤为重要。 为此,将于 2017 年 4 月在中国成都联合展开为期 3 天的第二届 IEEE 云计算与大数据分析国际会议。 会议旨在促进云计算与大数据分析等领域的学术交流与合作,热忱欢迎从事相关技术研究的专家、学者和专 业技术人员踊跃投稿并参加大会。 会议网站:http: / / www.icccbd.com / 第 5 期 刘欢,等:堆叠隐空间模糊 C 回归算法及其在发酵数据多模型建模中的应用 ·679·