机器学习：一种优化神经网络的教与学优化算法

团购合买资源类别：文库，文档格式：PDF，文档页数：6，文件大小：662.41KB

第8卷第4期智能系统学报 Vol.8 No.4 2013年8月 CAAI Transactions on Intelligent Systems Aug.2013 D0I:10.3969/j.issn.1673-4785.201305026 网络出版地址：http://www.cnki.net/kcms/detail/23.1538.TP.20130827.1104.002.html 一种优化神经网络的教与学优化算法拓守恒 (陕西理工学院数学与计算机科学学院，陕西汉中723001) 摘要：为了提高B即神经网络的输出精度，提出一种改进的教与学优化算法进行神经网络中的权值和阈值的优化调整算法对基本的教与学优化算法的“教”阶段和“学”阶段分别进行改进，并提出一种“自学”机制来增强算法的学习能力通过函数拟合实验和拖拉机齿轮箱故障诊断实验进行算法性能测试，结果表明，与遗传算法和基本的教与学优化算法相比，该算法具有收敛速度快、求解精度高等优势：关键词：改进的教与学优化算法；“自学”机制：神经网络；函数拟合；齿轮箱故障诊断中图分类号：TP31文献标志码：A文章编号：1673-4785(2013)04-0327-06 中文引用格式：拓守恒.一种优化神经网络的教与学优化算法[J].智能系统学报，2013,8(4)：327-332. 英文引用格式：TUO Shouheng..A modified teaching-.learning-based optimization algorithm and application in neural networks[J] CAAI Transactions on Intelligent Systems,2013,8(4):327-332. A modified teaching-learning-based optimization algorithm and application in neural networks TUO Shouheng (School of Mathematics and Computer Science,Shaanxi University of Technology,Hanzhong 723001,China) Abstract:In order to improve the output accuracy of back propagation neural network,a modified teaching-learn- ing-based optimization MTLBO)algorithm is proposed to train the weight and threshold value of neural network.In the MTLBO method,the "Teaching"phase and "Learning"phase were modified on the basis of TLBO algorithm, and a new "Self-Learning"mechanism was proposed to intensify global searching ability.Finally,the function fit- ting experiment and the tractor gearbox diagnosis experiment were used to test the performance of the proposed algo- rithm.Simulations show that this algorithm has a better convergence,prediction accuracy and robustness compared to the genetic algorithm (GA)and the basic teaching-learning-based optimization (TLBO)algorithm. Keywords:modified teaching-learning-based optimization algorithm;"self-learning"mechanism;neural network; function fitting;gearbox fault diagnosis 近年来，神经网络(neural network,NN)受到很输出和问题的实际输出值之间的误差尽可能小.因多学者的关注，它的应用取得了很好的成效.NN为此如何调节网络连接权值就成为确定BP神经网络解决大规模复杂问题提供了一种简单易行的方法，结构的重点.目前，对神经网络的优化主要是梯度优被广泛用于模式识别等分类和预测问题.BP(back 化技术，如反向传播学习算法.反向传播学习算 propagation)神经网络结构划分为输入层、隐含层和法[1]在神经网络中得到了广泛的应用，BP神经网输出层输人层节点用于接收一组预测变量，输出层络由信息的正向传播和误差的反向传播2个过程组节点输出相应的目标值（目标值可以不止一个）.BP 成.输入层各神经元负责接收来自外界的输入信息，神经网络构建的主要工作是通过调节连接输入层、并传递给中间层各神经元：中间层是内部信息处理隐含层和输出层之间的连接权值，使得神经网络的层，负责信息变换，根据信息变化能力的需求，中间层可以设计为单隐层或者多隐层结构：最后一个隐收稿日期：2013-05-09.网络出版日期：2013-08-27 基金项目：陕西省教育厅科研计划资助项目(12K0863):陕西理工科层传递到输出层各神经元的信息，经进一步处理后，研项目(SLGKY12-16). 通信作者：拓守恒.E-mail:tmo_sh@126.com 完成一次学习的正向传播处理过程，由输出层向外

第８卷第４期智能系统学报Ｖｏｌ．８ №．４２０１３年８月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｕｇ．２０１３ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１３０５０２６网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１３０８２７．１１０４．００２．ｈｔｍｌ一种优化神经网络的教与学优化算法拓守恒（陕西理工学院数学与计算机科学学院，陕西汉中７２３００１）摘要：为了提高ＢＰ神经网络的输出精度，提出一种改进的教与学优化算法进行神经网络中的权值和阈值的优化调整．算法对基本的教与学优化算法的“教”阶段和“学”阶段分别进行改进，并提出一种“自学”机制来增强算法的学习能力．通过函数拟合实验和拖拉机齿轮箱故障诊断实验进行算法性能测试，结果表明，与遗传算法和基本的教与学优化算法相比，该算法具有收敛速度快、求解精度高等优势．关键词：改进的教与学优化算法； “自学”机制；神经网络；函数拟合；齿轮箱故障诊断中图分类号：ＴＰ３１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１３）０４⁃０３２７⁃０６中文引用格式：拓守恒．一种优化神经网络的教与学优化算法［Ｊ］．智能系统学报，２０１３，８（４）：３２７⁃３３２．英文引用格式：ＴＵＯＳｈｏｕｈｅｎｇ．Ａｍｏｄｉｆｉｅｄｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍａｎｄａｐｐｌｉｃａｔｉｏｎｉｎｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１３，８（４）：３２７⁃３３２．Ａｍｏｄｉｆｉｅｄｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍａｎｄａｐｐｌｉｃａｔｉｏｎｉｎｎｅｕｒａｌｎｅｔｗｏｒｋｓＴＵＯＳｈｏｕｈｅｎｇ（ＳｃｈｏｏｌｏｆＭａｔｈｅｍａｔｉｃｓａｎｄＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，ＳｈａａｎｘｉＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｈａｎｚｈｏｎｇ７２３００１，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｉｎｏｒｄｅｒｔｏｉｍｐｒｏｖｅｔｈｅｏｕｔｐｕｔａｃｃｕｒａｃｙｏｆｂａｃｋｐｒｏｐａｇａｔｉｏｎｎｅｕｒａｌｎｅｔｗｏｒｋ，ａｍｏｄｉｆｉｅｄｔｅａｃｈｉｎｇ⁃ｌｅａｒｎ⁃ ｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ（ＭＴＬＢＯ）ａｌｇｏｒｉｔｈｍｉｓｐｒｏｐｏｓｅｄｔｏｔｒａｉｎｔｈｅｗｅｉｇｈｔａｎｄｔｈｒｅｓｈｏｌｄｖａｌｕｅｏｆｎｅｕｒａｌｎｅｔｗｏｒｋ．ＩｎｔｈｅＭＴＬＢＯｍｅｔｈｏｄ，ｔｈｅ “Ｔｅａｃｈｉｎｇ” ｐｈａｓｅａｎｄ “Ｌｅａｒｎｉｎｇ” ｐｈａｓｅｗｅｒｅｍｏｄｉｆｉｅｄｏｎｔｈｅｂａｓｉｓｏｆＴＬＢＯａｌｇｏｒｉｔｈｍ，ａｎｄａｎｅｗ “Ｓｅｌｆ⁃Ｌｅａｒｎｉｎｇ” ｍｅｃｈａｎｉｓｍｗａｓｐｒｏｐｏｓｅｄｔｏｉｎｔｅｎｓｉｆｙｇｌｏｂａｌｓｅａｒｃｈｉｎｇａｂｉｌｉｔｙ．Ｆｉｎａｌｌｙ，ｔｈｅｆｕｎｃｔｉｏｎｆｉｔ⁃ ｔｉｎｇｅｘｐｅｒｉｍｅｎｔａｎｄｔｈｅｔｒａｃｔｏｒｇｅａｒｂｏｘｄｉａｇｎｏｓｉｓｅｘｐｅｒｉｍｅｎｔｗｅｒｅｕｓｅｄｔｏｔｅｓｔｔｈｅｐｅｒｆｏｒｍａｎｃｅｏｆｔｈｅｐｒｏｐｏｓｅｄａｌｇｏ⁃ ｒｉｔｈｍ．Ｓｉｍｕｌａｔｉｏｎｓｓｈｏｗｔｈａｔｔｈｉｓａｌｇｏｒｉｔｈｍｈａｓａｂｅｔｔｅｒｃｏｎｖｅｒｇｅｎｃｅ，ｐｒｅｄｉｃｔｉｏｎａｃｃｕｒａｃｙａｎｄｒｏｂｕｓｔｎｅｓｓｃｏｍｐａｒｅｄｔｏｔｈｅｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍ（ＧＡ）ａｎｄｔｈｅｂａｓｉｃｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ（ＴＬＢＯ）ａｌｇｏｒｉｔｈｍ．Ｋｅｙｗｏｒｄｓ：ｍｏｄｉｆｉｅｄｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍ； “ ｓｅｌｆ⁃ｌｅａｒｎｉｎｇ” ｍｅｃｈａｎｉｓｍ；ｎｅｕｒａｌｎｅｔｗｏｒｋ；ｆｕｎｃｔｉｏｎｆｉｔｔｉｎｇ；ｇｅａｒｂｏｘｆａｕｌｔｄｉａｇｎｏｓｉｓ收稿日期：２０１３⁃０５⁃０９．网络出版日期：２０１３⁃０８⁃２７．基金项目：陕西省教育厅科研计划资助项目（１２ＪＫ０８６３）；陕西理工科研项目（ＳＬＧＫＹ１２⁃１６）．通信作者：拓守恒．Ｅ⁃ｍａｉｌ：ｔｕｏ＿ｓｈ＠１２６．ｃｏｍ．近年来，神经网络（ｎｅｕｒａｌｎｅｔｗｏｒｋ，ＮＮ）受到很多学者的关注，它的应用取得了很好的成效．ＮＮ为解决大规模复杂问题提供了一种简单易行的方法，被广泛用于模式识别等分类和预测问题．ＢＰ（ｂａｃｋｐｒｏｐａｇａｔｉｏｎ）神经网络结构划分为输入层、隐含层和输出层．输入层节点用于接收一组预测变量，输出层节点输出相应的目标值（目标值可以不止一个）．ＢＰ神经网络构建的主要工作是通过调节连接输入层、隐含层和输出层之间的连接权值，使得神经网络的输出和问题的实际输出值之间的误差尽可能小．因此如何调节网络连接权值就成为确定ＢＰ神经网络结构的重点．目前，对神经网络的优化主要是梯度优化技术，如反向传播学习算法．反向传播学习算法［１⁃２］在神经网络中得到了广泛的应用，ＢＰ神经网络由信息的正向传播和误差的反向传播２个过程组成．输入层各神经元负责接收来自外界的输入信息，并传递给中间层各神经元；中间层是内部信息处理层，负责信息变换，根据信息变化能力的需求，中间层可以设计为单隐层或者多隐层结构；最后一个隐层传递到输出层各神经元的信息，经进一步处理后，完成一次学习的正向传播处理过程，由输出层向外

·328· 智能系统学报第8卷界输出信息处理结果.当实际输出与期望输出不符习后的值，还有2个关键的参数：教学因子T℉，= 时，进入误差的反向传播阶段误差通过输出层，按 round[1+rand(0,1)]和学习步长r:=rand(0,1)用误差梯度下降的方式修正各层权值，向隐层、输入层于调整学习速率逐层反传但是，梯度下降优化法存在不稳定和不可 1.2学员之间相互“学”阶段预知的问题，并且对初始值非常敏感，对于多峰值优在学员相互“学”阶段，每个学员X(i=1,2,…, 化问题，很容易陷入局部搜索而失去全局最优解.为 NP)在班级中随机选取一个学习对象X(j=1,2, 此，近年来，很多启发式智能全局优化算法被用于神 …,NP,j≠)，X,通过分析自己和学员X的差异进经网络的优化设计，例如，遗传算法(genetic algo- 行学习调整，学习改进的方法类似于差分算法中的 rithm,GA)[)、粒子群优化算法(particle swarm opti-- 差分变异算子，不同在于，TLB0算法中的学习步长 mization,PSO)[)、模拟退火算法(simulated annea- r对每个学员采用不同的学习因子.采用式(3)实现 ling,SA)等.本文提出一种改进的教与学优化算法 “学”的过程 teaching-learning-based optimization,TLBO)[561 (X+·(X:-X),X优于X: 行BP神经网络的优化设计. (3) X+r·(X-X),X优于X 1教与学优化算法式中：=U(0,1)表示第i个学员的学习因子（学习教与学优化算法由印度学者R.V.Rao和V.D. 步长) Kalyankar于2010年提出，TLBO算法通过模拟人类 1.3学员更新在学习过程中的老师“教”和学生相互“学”2个阶学员经过“教”阶段和“学”阶段都要分别进行段的学习方法，促进每个学员的学习水平，更新操作更新方法如下：基本的TLBO算法是模拟以“班级”为单位的学 If X is better than Xod, 习方式，班级中学员水平的提高需要教师的“教”来 X=X", 引导，同时，学员之间需要相互“学习”交流来促进 End If. 知识的进步其中，教师和学员相当于进化算法中的 2 改进的教与学优化算法个体，而教师是适应值最好的个体之一.每个学员所学的某一科目相当于一个决策变量对低维单模优化问题，基本的TLB0算法的收下面是几个基本定义：敛速度很快，求解精度很高，运行代价较小，算法的 1)学习知识范围（对应于搜索区域）.学员所学时间复杂度为O(NP×T),(NP是学员数量，T是最知识范围定义为X=(x,x2,…,x4)∈[L,U],L= 大允许迭代次数).TLBO算法的缺点是，对于高维 (L,2,…,L)是空间下届，U=(U,U2,…,)是 “多模态”的复杂优化问题，全局探索能力较差，很空间上届，d是学员所学科目数（对应于优化问题的容易陷入局部搜索而丢失全局最优解.主要原因是维数) TLB0算法在“教”阶段对所有学员采用相同的差异 2)班级：所有学员的集合称为班级（种群）值Difference进行调整，使得算法的搜索策略比较单 3)教师：班级中水平最高的个体称为教师，记一，学员很容易快速向“老师”聚集，导致学员知识为icacher或Xen 多样性的快速丢失，从而陷入局部搜索.这样，对于 4)学员（个体）：班级中第i个学员定义为X= 高维“多模态”问题，TLB0算法往往会丢失全局最 (x,x,…,x),其中，(=1,2，…，d)表示学员X 优解而获得局部最优解8】」所学的第j门课程，在TLB0算法中，学员的学习过程完全依赖老师 1.1教师的“教”阶段的“教”和学员之间的交流“学习”，造成学员在学习在TLBO算法的“教”阶段，班级中每个学员X 过程中对他人的过度依赖，但却丧失了学习过程中自 (i=l,2,…,NP)根据Xaa和班级中学员平均水平我学习和自我创新能力的挖掘.因此，为了发挥群体中每个学员的智慧和才能，本文针对TLB0算法的缺值Mean=(∑X,)/NP之间的差异性进行学习.采陷，提出一种改进的教与学优化算法(modified teach- 用式(1)~(2)实现“教”的过程. ing-learning-based optimization,MTLBO),算法借鉴和 X.=Xal Difference, (1) 声搜索算法思想进行个体的自我学习和自我探索创 Difference=r:·(Ktacher-TF:·Mean).(2) 新能力挖掘，用于加强每个个体的自我局部搜索能式中：xX“和X"分别表示第i个学员学习前和学力，从而增加种群的全局探索能力

界输出信息处理结果．当实际输出与期望输出不符时，进入误差的反向传播阶段．误差通过输出层，按误差梯度下降的方式修正各层权值，向隐层、输入层逐层反传．但是，梯度下降优化法存在不稳定和不可预知的问题，并且对初始值非常敏感，对于多峰值优化问题，很容易陷入局部搜索而失去全局最优解．为此，近年来，很多启发式智能全局优化算法被用于神经网络的优化设计，例如，遗传算法（ｇｅｎｅｔｉｃａｌｇｏ⁃ ｒｉｔｈｍ，ＧＡ）［３］、粒子群优化算法（ｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉ⁃ ｍｉｚａｔｉｏｎ，ＰＳＯ）［４］、模拟退火算法（ｓｉｍｕｌａｔｅｄａｎｎｅａ⁃ ｌｉｎｇ，ＳＡ）等．本文提出一种改进的教与学优化算法（ｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ，ＴＬＢＯ）［５⁃６］进行ＢＰ神经网络的优化设计．１教与学优化算法教与学优化算法由印度学者Ｒ．Ｖ．Ｒａｏ和Ｖ．Ｄ．Ｋａｌｙａｎｋａｒ于２０１０年提出，ＴＬＢＯ算法通过模拟人类在学习过程中的老师“教”和学生相互“学” ２个阶段的学习方法，促进每个学员的学习水平．基本的ＴＬＢＯ算法是模拟以“班级”为单位的学习方式，班级中学员水平的提高需要教师的“教”来引导，同时，学员之间需要相互“学习” 交流来促进知识的进步．其中，教师和学员相当于进化算法中的个体，而教师是适应值最好的个体之一．每个学员所学的某一科目相当于一个决策变量．下面是几个基本定义：１）学习知识范围（对应于搜索区域）．学员所学知识范围定义为Ｘ＝（ｘ１，ｘ２，…，ｘｄ）∈ ［Ｌ，Ｕ］，Ｌ＝（Ｌ１，Ｌ２，…，Ｌｄ）是空间下届，Ｕ＝（Ｕ１，Ｕ２，…，Ｕｄ）是空间上届，ｄ是学员所学科目数（对应于优化问题的维数）．２）班级：所有学员的集合称为班级（种群）．３）教师：班级中水平最高的个体称为教师，记为Ｘｔｅａｃｈｅｒ或Ｘｂｅｓｔ．４）学员（个体）：班级中第ｉ个学员定义为Ｘｉ＝（ｘ１ｉ，ｘ２ｉ，…，ｘｄｉ），其中，ｘｊｉ（ｊ＝１，２，…，ｄ）表示学员Ｘｉ所学的第ｊ门课程．１．１教师的“教”阶段在ＴＬＢＯ算法的“教”阶段，班级中每个学员Ｘｉ（ｉ＝１，２，…，ＮＰ）根据Ｘｔｅａｃｈｅｒ和班级中学员平均水平值Ｍｅａｎ＝（∑ ＮＰｉ＝１Ｘｉ）／ＮＰ之间的差异性进行学习．采用式（１）～（２）实现“教”的过程．Ｘｎｅｗｉ＝Ｘｏｌｄｉ＋Ｄｉｆｆｅｒｅｎｃｅ，（１）Ｄｉｆｆｅｒｅｎｃｅ＝ｒｉ·（Ｘｔｅａｃｈｅｒ－ＴＦｉ·Ｍｅａｎ）．（２）式中：Ｘｏｌｄｉ和Ｘｎｅｗｉ分别表示第ｉ个学员学习前和学习后的值，还有２个关键的参数：教学因子ＴＦｉ＝ｒｏｕｎｄ [１＋ｒａｎｄ（０，１） ] 和学习步长ｒｉ＝ｒａｎｄ（０，１）用于调整学习速率．１．２学员之间相互“学”阶段在学员相互“学”阶段，每个学员Ｘｉ（ｉ＝１，２，…，ＮＰ）在班级中随机选取一个学习对象Ｘｊ（ｊ＝１，２， …，ＮＰ，ｊ≠ｉ），Ｘｉ通过分析自己和学员Ｘｊ的差异进行学习调整，学习改进的方法类似于差分算法中的差分变异算子，不同在于，ＴＬＢＯ算法中的学习步长ｒ对每个学员采用不同的学习因子．采用式（３）实现 “学”的过程．Ｘｎｅｗｉ＝Ｘｏｌｄｉ＋ｒｉ·（Ｘｉ－Ｘｊ），Ｘｉ优于Ｘｊ；Ｘｏｌｄｉ＋ｒｉ·（Ｘｊ－Ｘｉ），Ｘｊ优于Ｘｉ { ．（３）式中：ｒｉ＝Ｕ（０，１）表示第ｉ个学员的学习因子（学习步长）．１．３学员更新学员经过“教”阶段和“学”阶段都要分别进行更新操作．更新方法如下：ＩｆＸｎｅｗｉｉｓｂｅｔｔｅｒｔｈａｎＸｏｌｄｉ，Ｘｏｌｄｉ＝Ｘｎｅｗｉ，ＥｎｄＩｆ．２改进的教与学优化算法对低维单模优化问题，基本的ＴＬＢＯ算法的收敛速度很快，求解精度很高，运行代价较小，算法的时间复杂度为Ｏ（ＮＰ ×Ｔ），（ＮＰ是学员数量，Ｔ是最大允许迭代次数）．ＴＬＢＯ算法的缺点是，对于高维 “多模态”的复杂优化问题，全局探索能力较差，很容易陷入局部搜索而丢失全局最优解．主要原因是ＴＬＢＯ算法在“教”阶段对所有学员采用相同的差异值Ｄｉｆｆｅｒｅｎｃｅ进行调整，使得算法的搜索策略比较单一，学员很容易快速向“老师”聚集，导致学员知识多样性的快速丢失，从而陷入局部搜索．这样，对于高维“多模态”问题，ＴＬＢＯ算法往往会丢失全局最优解而获得局部最优解［７⁃８］．在ＴＬＢＯ算法中，学员的学习过程完全依赖老师的“教”和学员之间的交流“学习”，造成学员在学习过程中对他人的过度依赖，但却丧失了学习过程中自我学习和自我创新能力的挖掘．因此，为了发挥群体中每个学员的智慧和才能，本文针对ＴＬＢＯ算法的缺陷，提出一种改进的教与学优化算法（ｍｏｄｉｆｉｅｄｔｅａｃｈ⁃ ｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ，ＭＴＬＢＯ），算法借鉴和声搜索算法思想进行个体的自我学习和自我探索创新能力挖掘，用于加强每个个体的自我局部搜索能力，从而增加种群的全局探索能力． ·３２８· 智能系统学报第８卷

第4期拓守恒：一种优化神经网络的教与学优化算法 ·329· 2.1改进的“教”阶段弱，本文引入“自学”阶段，每个学员通过自学阶段，本文通过对Mean进行改进，使Mean=(Xost+ 充分发挥每个学员的能力，增强算法的全局探索能 X)/2,这样计算的好处是Mean对每个个体X其值力(exploration).本文中的“自学”阶段采用类似于作都不同，从而保证种群的多样性，避免算法早熟，改者提出的一种改进的和声算法[9思想进行. 进后的教学过程如下： 2.3“自我”学习阶段 For i=1:NP 在前面的“教”和相互“学”阶段，学习的对象是 TF=round [1+rand(1,d)], 学员整体进行，但是，由于每个学员都会学习多门科 Xe"=X,+rand(1,d)×[Xcacher-TF× 目（对应于搜索算法中的决策变量），学员学习时可 (Xm+X:)/2], 能会出现“偏科”现象，有些学员可能会部分科目学 End. 习较好，部分科目学习效果较差.因此，在“自学”阶 2.2改进的相互“学习”阶段段，根据每个学员的特点对成绩不够理想的科目进在相互“学习”阶段，TLB0算法中每个学员X 行针对性学习.采用3种学习策略对学员的某些科 (i=1,2,…,NP)每次随机选取另一个学习对象X 目进行自我学习调整：l)以学习率(learn from others (G=1,2,…,NP,≠i)进行学习.本文中，每次随机选 probability,LoP)选择学习对象；2)以概率(self re- 取2个学习对象X,和X,(r1=1,2,…,NP;r2=1,2, pair probability,SRP)进行自我学习方法调整；3)以 …,NP;1≠r2),通过比较X,和X,的优劣性并计算概率(innovative learning probability,ILP)进行创新二者的差异性进行学习，这样能够有效提高学习成学习具体“自我”学习阶段的算法如下：功率，避免“盲目学习”学习过程伪代码如下： For i=1 to NP For i=1:NP Forj=1tod//第i个学员开始“自我”学习随机从种群中选择2个个体X,和X,(X,≠ If rand()<LoP/向他人学习 X,) xe=X,a∈U{1,2,…,NP}; Else If rand()<SRP/自我学习方法调整 If FITS(X,)<FITS(X) =rand(0,1)*Step(j); Y=2xX,-X Else If rand()<LP/创新学习 Else x=V+rand(0,1)×(U-); Y=2×X2-X,; Else End xhe=i 差异学习 End X=X+rand(1,d).x(Y-X) Xnn=(xn,x2n,…,xdn） End End rand(1,d)表示在[0,1]随机生成一个d维的 End 行向量算法中，Step是自我学习调整步长，定义为在本文算法的相互“学习"”阶段，与TLB0算法 Step=mins+(maxsp -minsp)(1-t/T). 不同的有：式中：maxsup=(U-L)/50,minsp=(U-L)/3000,t 1)学习方法不同.根据文献[11]中的最好个体是当前迭代次数，T是允许最大迭代次数：与最差个体的差异性思想，算法首先利用2个随机选择的学员作差异计算：Y=2×X,-X,,对X,修正后 3利用MTLBO算法进行函数优化再次和学员X进行差异学习，使得算法具有更强的 3.1多峰值函数Schwefel2.26测试分析自适应学习能力. 为了验证本文算法的性能，首先对一个经典的 2)更新操作不同.首先判断产生的新个体X 高维多峰值函数Schwefel2.26进行测试检验，将本是否比原来的个体更好，如果是则用新个体替换原文算法与GA和基本的TLBO算法进行比较，设置个体，否则，再次判断新个体是否比种群中的最差个函数维数d=100,种群大小NP=50,最大迭代次数体X.优秀，如果是，则用X替换X. Tmx=5000.遗传算法参数：交叉概率cp=0.6,变异由于算法在应用上述的“教”与“学”过程时，收概率mp=0.1;本文算法参数：ToP=0.55,SRP=0.3, 敛速度很快，局部开发能力(exploitation)较强，种群 LP=0.1.为了公平起见，每个算法独立运行30次，的多样性容易丢失，全局搜索能力(exploration)较取其最优值，并统计其最佳解Best,最差解Worst,平

２．１改进的“教”阶段本文通过对Ｍｅａｎ进行改进，使Ｍｅａｎ＝（Ｘｗｏｒｓｔ＋Ｘｉ）／２，这样计算的好处是Ｍｅａｎ对每个个体Ｘｉ其值都不同，从而保证种群的多样性，避免算法早熟，改进后的教学过程如下：Ｆｏｒｉ＝１ ∶ ＮＰＴＦ＝ｒｏｕｎｄ [１＋ｒａｎｄ(１，ｄ) ] ，Ｘｎｅｗｉ＝Ｘｉ＋ｒａｎｄ（１，ｄ） × ［Ｘｔｅａｃｈｅｒ－ＴＦ × Ｘｗｏｒｓｔ＋Ｘｉ ( ) ／２］，Ｅｎｄ．２．２改进的相互“学习”阶段在相互“学习”阶段，ＴＬＢＯ算法中每个学员Ｘｉ（ｉ＝１，２，…，ＮＰ）每次随机选取另一个学习对象Ｘｊ（ｊ＝１，２，…，ＮＰ，ｊ≠ｉ）进行学习．本文中，每次随机选取２个学习对象Ｘｒ１和Ｘｒ２（ｒ１＝１，２，…，ＮＰ；ｒ２＝１，２， …，ＮＰ；ｒ１≠ｒ２），通过比较Ｘｒ１和Ｘｒ２的优劣性并计算二者的差异性进行学习，这样能够有效提高学习成功率，避免“盲目学习”．学习过程伪代码如下：Ｆｏｒｉ＝１：ＮＰ随机从种群中选择２个个体Ｘｒ１和Ｘｒ２（Ｘｒ１ ≠ Ｘｒ２）ＩｆＦＩＴＳＸｒ１ ( ) ＜ＦＩＴＳＸｒ２ ( ) Ｙ＝２×Ｘｒ１－Ｘｒ２；ＥｌｓｅＹ＝２×Ｘｒ２－Ｘｒ１；Ｅｎｄ差异学习Ｘｎｅｗ＝Ｘｉ＋ｒａｎｄ(１，ｄ) ．× Ｙ－Ｘｉ ( ) ；Ｅｎｄｒａｎｄ（１，ｄ）表示在［０，１］随机生成一个ｄ维的行向量．在本文算法的相互“学习”阶段，与ＴＬＢＯ算法不同的有：１）学习方法不同．根据文献［１１］中的最好个体与最差个体的差异性思想，算法首先利用２个随机选择的学员作差异计算：Ｙ＝２×Ｘｒ１－Ｘｒ２，对Ｘｒ修正后再次和学员Ｘｉ进行差异学习，使得算法具有更强的自适应学习能力．２）更新操作不同．首先判断产生的新个体Ｘｎｅｗ是否比原来的个体更好，如果是则用新个体替换原个体，否则，再次判断新个体是否比种群中的最差个体Ｘｗｏｒｓｔ优秀，如果是，则用Ｘｎｅｗ替换Ｘｗｏｒｓｔ．由于算法在应用上述的“教”与“学”过程时，收敛速度很快，局部开发能力（ｅｘｐｌｏｉｔａｔｉｏｎ）较强，种群的多样性容易丢失，全局搜索能力（ｅｘｐｌｏｒａｔｉｏｎ）较弱，本文引入“自学”阶段，每个学员通过自学阶段，充分发挥每个学员的能力，增强算法的全局探索能力（ｅｘｐｌｏｒａｔｉｏｎ）．本文中的“自学”阶段采用类似于作者提出的一种改进的和声算法［９⁃１１］思想进行．２．３ “自我”学习阶段在前面的“教”和相互“学”阶段，学习的对象是学员整体进行，但是，由于每个学员都会学习多门科目（对应于搜索算法中的决策变量），学员学习时可能会出现“偏科”现象，有些学员可能会部分科目学习较好，部分科目学习效果较差．因此，在“自学”阶段，根据每个学员的特点对成绩不够理想的科目进行针对性学习．采用３种学习策略对学员的某些科目进行自我学习调整：１）以学习率（ｌｅａｒｎｆｒｏｍｏｔｈｅｒｓｐｒｏｂａｂｉｌｉｔｙ，ＬｏＰ）选择学习对象；２）以概率（ｓｅｌｆｒｅ⁃ ｐａｉｒｐｒｏｂａｂｉｌｉｔｙ，ＳＲＰ）进行自我学习方法调整；３）以概率（ｉｎｎｏｖａｔｉｖｅｌｅａｒｎｉｎｇｐｒｏｂａｂｉｌｉｔｙ，ＩＬＰ）进行创新学习．具体“自我”学习阶段的算法如下：Ｆｏｒｉ＝１ｔｏＮＰＦｏｒｊ＝１ｔｏｄ／／第ｉ个学员开始“自我”学习Ｉｆｒａｎｄ（）＜ＬｏＰ／／向他人学习ｘｊｎｅｗ＝Ｘｊａ，ａ∈Ｕ{１，２，…，ＮＰ} ；ＥｌｓｅＩｆｒａｎｄ（）＜ＳＲＰ／／自我学习方法调整ｘｊｎｅｗ＝ｘｊｎｅｗ ±ｒａｎｄ(０，１) ∗Ｓｔｅｐ(ｊ) ；ＥｌｓｅＩｆｒａｎｄ（）＜ＩＬＰ／／创新学习ｘｊｎｅｗ＝Ｌｊ＋ｒａｎｄ（０，１）× Ｕｊ－Ｌｊ ( ) ；Ｅｌｓｅｘｊｎｅｗ＝ｘｊｉＥｎｄＸｎｅｗ＝（ｘ１ｎｅｗ，ｘ２ｎｅｗ，…，ｘｄｎｅｗ）ＥｎｄＥｎｄ算法中，Ｓｔｅｐ是自我学习调整步长，定义为Ｓｔｅｐ＝ｍｉｎＳｔｅｐ＋（ｍａｘＳｔｅｐ－ｍｉｎＳｔｅｐ）（１－ｔ／Ｔｍａｘ）．式中：ｍａｘＳｔｅｐ＝（Ｕ－Ｌ）／５０，ｍｉｎＳｔｅｐ＝（Ｕ－Ｌ）／３０００，ｔ是当前迭代次数，Ｔ是允许最大迭代次数．３利用ＭＴＬＢＯ算法进行函数优化３．１多峰值函数Ｓｃｈｗｅｆｅｌ２．２６测试分析为了验证本文算法的性能，首先对一个经典的高维多峰值函数Ｓｃｈｗｅｆｅｌ２．２６进行测试检验，将本文算法与ＧＡ和基本的ＴＬＢＯ算法进行比较，设置函数维数ｄ＝１００，种群大小ＮＰ＝５０，最大迭代次数Ｔｍａｘ＝５０００．遗传算法参数：交叉概率ｃｐ＝０．６，变异概率ｍｐ＝０．１；本文算法参数：ＴｏＰ＝０．５５，ＳＲＰ＝０．３，ＩＬＰ＝０．１．为了公平起见，每个算法独立运行３０次，取其最优值，并统计其最佳解Ｂｅｓｔ，最差解Ｗｏｒｓｔ，平第４期拓守恒：一种优化神经网络的教与学优化算法 ·３２９·

·330· 智能系统学报第8卷均最优解Mean,标准差Std和算法运行时间Runt- 刻的方差平均值.通过跟踪记录种群在搜索空间的 ime,具体结果如表1所示.图1和图2分别给出3中多样性变化，判断算法的空间探索能力.较好的优化算法的优化过程曲线和30次独立运行最优解统计算法前期具有较大的种群多样性，随着优化的进行，盒图种群逐步向全局最优点靠近，多样性逐步降低图3 表1算法GA、TLB0和MTLBO对函数Schwefel2.26的测是在D=l00时.多峰值函数Schwefel2.26的种群多试结果样性变化曲线.从图3可以看出，本文算法的收敛曲 Table 1 The test results of three algorithms (GA,TLBO 线是在“活跃跳动”中逐步下降，使其能够获得高精度 and MTLBO)for function Schwefel 2.26 的全局最优解，而算法GA和TLBO算法的多样性很参数 GA TLBO MTLBO 快就处于一种停滞状态，这是由于Schwefel2.26存在 Best 41507.39 16347.970 0.001590 很多函数值比较接近和相等的“局部”最优解，而全局 Mean 41503.93 25933.470 0.003708 最优解是在边界附近的点(420.9687,420.9687，…， Worst 41501.83 35622.770 0.007314 420.9687),在没有发现全局最优解时，个体是在各 Std 3.89908 5452.302 0.001547 个相近的局部最优解间跳动，使得搜索能力降低，全运行时间/s 41.04843 12.779560 16.899730 局收敛性变差 3.010 43*10 ---TLBO---MTLBO—GA 2.5 4. 业Y%上恤 3.5 2.0叶 3.0 9ttt656纯的pp 燕1.5 2.5 2.0 1.0 -GA 1.5 -TLBO 0.5M 1.0 *一MTLBO 0.5 0.51.01.52.02.53.03.54.04.55.0 000132艺5节岁芳若搭芳ǒ10 迭代次数迭代次数图3种群多样性变化曲线图13种算法平均优化过程曲线 Fig.3 The diversity curve of population Fig.1 The mean convergence curve of three algorithms 4.5r*10 基于MTLBO的BP神经网络优化 4.0h 本文目标是利用改进的教与学优化算法对神经 3.5 3.0 网络中的所有权值和阈值进行优化，使得网络的输 2.5 出值和期望输出值之间的误差尽可能的小、 2.0 盛为了检验本文算法在神经网络优化中的性能， 1.5 1.0 分别通过函数拟合实验和拖拉机齿轮箱故障测试进 0.5 行验证.并且与遗传算法(GA)和基本TLBO算法进行比较，算法的初始化参数设置如表2. GA TLBO MTLBO 图23种算法30次运行最优解统计盒表2算法参数设置 Fig.2 The box diagram of optimal solution for three al- Table 2 Parameters setting of algorithms gorithms over 30 separate runs 最大评价次 3.2算法多样性与收敛性分析算法 NP 其他参数数(FEs) 为了验证本文算法的种群多样性变化和收敛 GA 50 cp=0.6,mp=0.1 性，利用下列公式跟踪记录种群的多样性变化 TLBO 50 20 ToP=0.55,SRP=0.3, MTLBO 50 su() LP=0.1 PV()=d 4.1 函数拟合式中：Std,(t)表示在时刻t时，第i维上的标准差本文选取函数Griewank:y(x)= 1 PV(t)(population variance,PV)表示所有维在t时 4000台

均最优解Ｍｅａｎ，标准差Ｓｔｄ和算法运行时间Ｒｕｎｔ⁃ ｉｍｅ，具体结果如表１所示．图１和图２分别给出３中算法的优化过程曲线和３０次独立运行最优解统计盒图．表１算法ＧＡ、ＴＬＢＯ和ＭＴＬＢＯ对函数Ｓｃｈｗｅｆｅｌ２．２６的测试结果Ｔａｂｌｅ１Ｔｈｅｔｅｓｔｒｅｓｕｌｔｓｏｆｔｈｒｅｅａｌｇｏｒｉｔｈｍｓ（ＧＡ，ＴＬＢＯａｎｄＭＴＬＢＯ）ｆｏｒｆｕｎｃｔｉｏｎＳｃｈｗｅｆｅｌ２．２６参数ＧＡＴＬＢＯＭＴＬＢＯＢｅｓｔ４１５０７．３９１６３４７．９７００．００１５９０Ｍｅａｎ４１５０３．９３２５９３３．４７００．００３７０８Ｗｏｒｓｔ４１５０１．８３３５６２２．７７００．００７３１４Ｓｔｄ３．８９９０８５４５２．３０２０．００１５４７运行时间／ｓ４１．０４８４３１２．７７９５６０１６．８９９７３０图１３种算法平均优化过程曲线Ｆｉｇ．１Ｔｈｅｍｅａｎｃｏｎｖｅｒｇｅｎｃｅｃｕｒｖｅｏｆｔｈｒｅｅａｌｇｏｒｉｔｈｍｓ图２３种算法３０次运行最优解统计盒Ｆｉｇ．２Ｔｈｅｂｏｘｄｉａｇｒａｍｏｆｏｐｔｉｍａｌｓｏｌｕｔｉｏｎｆｏｒｔｈｒｅｅａｌ⁃ ｇｏｒｉｔｈｍｓｏｖｅｒ３０ｓｅｐａｒａｔｅｒｕｎｓ３．２算法多样性与收敛性分析为了验证本文算法的种群多样性变化和收敛性，利用下列公式跟踪记录种群的多样性变化．ＰＶ（ｔ）＝１ｄ ∑ ｄｉ＝１Ｓｔｄｉ（ｔ）．式中：Ｓｔｄｉ（ｔ）表示在时刻ｔ时，第ｉ维上的标准差．ＰＶ（ｔ）（ｐｏｐｕｌａｔｉｏｎｖａｒｉａｎｃｅ，ＰＶ）表示所有维在ｔ时刻的方差平均值．通过跟踪记录种群在搜索空间的多样性变化，判断算法的空间探索能力．较好的优化算法前期具有较大的种群多样性，随着优化的进行，种群逐步向全局最优点靠近，多样性逐步降低．图３是在Ｄ＝１００时，多峰值函数Ｓｃｈｗｅｆｅｌ２．２６的种群多样性变化曲线．从图３可以看出，本文算法的收敛曲线是在“活跃跳动”中逐步下降，使其能够获得高精度的全局最优解，而算法ＧＡ和ＴＬＢＯ算法的多样性很快就处于一种停滞状态，这是由于Ｓｃｈｗｅｆｅｌ２．２６存在很多函数值比较接近和相等的“局部”最优解，而全局最优解是在边界附近的点（４２０．９６８７，４２０．９６８７，…，４２０．９６８７），在没有发现全局最优解时，个体是在各个相近的局部最优解间跳动，使得搜索能力降低，全局收敛性变差．图３种群多样性变化曲线Ｆｉｇ．３Ｔｈｅｄｉｖｅｒｓｉｔｙｃｕｒｖｅｏｆｐｏｐｕｌａｔｉｏｎ４基于ＭＴＬＢＯ的ＢＰ神经网络优化本文目标是利用改进的教与学优化算法对神经网络中的所有权值和阈值进行优化，使得网络的输出值和期望输出值之间的误差尽可能的小．为了检验本文算法在神经网络优化中的性能，分别通过函数拟合实验和拖拉机齿轮箱故障测试进行验证．并且与遗传算法（ＧＡ）和基本ＴＬＢＯ算法进行比较，算法的初始化参数设置如表２．表２算法参数设置Ｔａｂｌｅ２Ｐａｒａｍｅｔｅｒｓｓｅｔｔｉｎｇｏｆａｌｇｏｒｉｔｈｍｓ算法最大评价次数（ＦＥｓ）ＮＰ其他参数ＧＡ５０ — ｃｐ＝０．６，ｍｐ＝０．１ＴＬＢＯ５０２０ＭＴＬＢＯ５０ — ＴｏＰ＝０．５５，ＳＲＰ＝０．３，ＩＬＰ＝０．１４．１函数拟合本文选取函数Ｇｒｉｅｗａｎｋ：ｙ（ｘ）＝１４０００ ∑ ｄｉ＝１ｘ２ｉ－ ·３３０· 智能系统学报第８卷

第4期拓守恒：一种优化神经网络的教与学优化算法 .331· (cos(点)+1(d=10)进行拟合测试在搜素空间 Errors norm(Y-T_test)= [-10,10]中随机产生40个点，其中30个作为训练式中：N是测试样本的个数，d是输出层输出的节点数输入数据，10个作为测试输入数据.通过对训练后分别采用遗传算法GA、基本的TLBO和本文算的神经网络进行测试数据的评价.评价函数定义为法MTLBO算法进行神经网络的优化，具体实验结户三引x-4,其中，x为测试数据对应的Grievan止果如表4.图5是3种算法的优化过程中误差变化曲线函数值，t:为神经网络输出值.在同样的条件下分别表43种算法对拖拉机齿轮箱故障诊断实验测试结果利用遗传算法、基本TLBO算法和本文算法MTLBO Table 4 The test results of three algorithms on the tractor 进行神经网络的训练和测试，结果如表3，图4中给 gearbox diagnosis experiment 出了4种算法对测试样本的预测输出和函数期望输算法测试样本误差训练样本误差预测准确率/% 出值. GA 0.0061671 0.015546 99 表33种算法对Griewank函数的拟合实验测试结果 TLBO 0.0254180 0.063720 94 Table 3 The function fitting error of three algorithms on function Griewank MTLB00.0005988 0.000803 100 算法测试样本的仿真误差训练样本的仿真误差 18r×10 米-MTLBO--TLBO--GA GA 1.16820 1.1609 16 14 TLBO 0.24106 1.6909 12 MTLBO 0.17336 1.1856 10 4.2拖拉机齿轮箱故障诊断齿轮箱由齿轮副、轴、轴承、箱体、润滑油等组成，故障大多出现在齿轮箱及传动轴等机械传动故障四)，对于其故障的诊断可以根据其在1~6挡时各个轴承的15个频率特征（转速、转频、滚珠数、内 1020 30 0 40 代数圈、外圈等)值进行判断.齿轮箱状态可划分为无故图53种算法进行神经网络故障诊断误差曲线障、齿根裂纹和齿断3种 Fig.5 The neural network error curve of three algo- 2.0m ,★，MTLBO rithms on the tractor gearbox diagnosis experi- 一。一函数期望值 1.8 ·-TLBO ment BGA 1.6 由表4可以明显看出，本文算法优化的神经网络进行齿轮箱故障诊断时误差非常小，诊断准确率鏢 100%.图5中的误差曲线变化可以看出，与GA和 1.2 TLB0相比，本文算法进行优化时具有收敛速度快，求解精度高等优势 0.8 5结束语 0.6 0.4 本文提出了一种用于神经网络优化的教与学优 c3 样本点化算法，该算法通过对神经网络的网络权值和阈值图43种算法对函数Griewank拟合输出结果对比进行优化，使得网络的输出和期望输出的误差最小 Fig.4 The function fitting curve comparison of three 最后，通过函数拟合实验和拖拉机齿轮箱故障诊断 algorithms on function Griewank 实验，实验结果表明，本文算法在对神经网络进行优本文使用文献[13]中提供的拖拉机故障检测化时，与遗传算法和基本的TLB0算法相比具有明数据中的9组数据作为训练样本和3组测试样本显优势优化算法的适应值评价函数定义[为：参考文献： f=minErrors, [1]YU X H.Can backpropagation error surface not have local

∏ ｄｉ＝１（ｃｏｓ（ｘｉｉ））＋１（ｄ＝１０）进行拟合测试．在搜索空间［－１０，１０］ｄ中随机产生４０个点，其中３０个作为训练输入数据，１０个作为测试输入数据．通过对训练后的神经网络进行测试数据的评价．评价函数定义为ｆ＝∑ ＮＰｉ＝１ｙｉ－ｔｉ，其中，ｙｉ为测试数据对应的Ｇｒｉｅｗａｎｋ函数值，ｔｉ为神经网络输出值．在同样的条件下分别利用遗传算法、基本ＴＬＢＯ算法和本文算法ＭＴＬＢＯ进行神经网络的训练和测试，结果如表３，图４中给出了４种算法对测试样本的预测输出和函数期望输出值．表３３种算法对Ｇｒｉｅｗａｎｋ函数的拟合实验测试结果Ｔａｂｌｅ３ＴｈｅｆｕｎｃｔｉｏｎｆｉｔｔｉｎｇｅｒｒｏｒｏｆｔｈｒｅｅａｌｇｏｒｉｔｈｍｓｏｎｆｕｎｃｔｉｏｎＧｒｉｅｗａｎｋ算法测试样本的仿真误差训练样本的仿真误差ＧＡ１．１６８２０１．１６０９ＴＬＢＯ０．２４１０６１．６９０９ＭＴＬＢＯ０．１７３３６１．１８５６４．２拖拉机齿轮箱故障诊断齿轮箱由齿轮副、轴、轴承、箱体、润滑油等组成，故障大多出现在齿轮箱及传动轴等机械传动故障［１２］，对于其故障的诊断可以根据其在１～６挡时各个轴承的１５个频率特征（转速、转频、滚珠数、内圈、外圈等）值进行判断．齿轮箱状态可划分为无故障、齿根裂纹和齿断３种．图４３种算法对函数Ｇｒｉｅｗａｎｋ拟合输出结果对比Ｆｉｇ．４ＴｈｅｆｕｎｃｔｉｏｎｆｉｔｔｉｎｇｃｕｒｖｅｃｏｍｐａｒｉｓｏｎｏｆｔｈｒｅｅａｌｇｏｒｉｔｈｍｓｏｎｆｕｎｃｔｉｏｎＧｒｉｅｗａｎｋ本文使用文献［１３］中提供的拖拉机故障检测数据中的９组数据作为训练样本和３组测试样本．优化算法的适应值评价函数定义［１４］为：ｆ＝ｍｉｎＥｒｒｏｒｓ，Ｅｒｒｏｒｓ＝ｎｏｒｍ（Ｙ－Ｔ＿ｔｅｓｔ）＝１Ｎ∑ Ｎｉ＝１ ∑ ｄｊｙｊｉ－ｔｊｉ ( ) ．式中：Ｎ是测试样本的个数，ｄ是输出层输出的节点数．分别采用遗传算法ＧＡ、基本的ＴＬＢＯ和本文算法ＭＴＬＢＯ算法进行神经网络的优化，具体实验结果如表４．图５是３种算法的优化过程中误差变化曲线．表４３种算法对拖拉机齿轮箱故障诊断实验测试结果Ｔａｂｌｅ４Ｔｈｅｔｅｓｔｒｅｓｕｌｔｓｏｆｔｈｒｅｅａｌｇｏｒｉｔｈｍｓｏｎｔｈｅｔｒａｃｔｏｒｇｅａｒｂｏｘｄｉａｇｎｏｓｉｓｅｘｐｅｒｉｍｅｎｔ算法测试样本误差训练样本误差预测准确率／％ＧＡ０．００６１６７１０．０１５５４６９９ＴＬＢＯ０．０２５４１８００．０６３７２０９４ＭＴＬＢＯ０．０００５９８８０．０００８０３１００图５３种算法进行神经网络故障诊断误差曲线Ｆｉｇ．５Ｔｈｅｎｅｕｒａｌｎｅｔｗｏｒｋｅｒｒｏｒｃｕｒｖｅｏｆｔｈｒｅｅａｌｇｏ⁃ ｒｉｔｈｍｓｏｎｔｈｅｔｒａｃｔｏｒｇｅａｒｂｏｘｄｉａｇｎｏｓｉｓｅｘｐｅｒｉ⁃ ｍｅｎｔ由表４可以明显看出，本文算法优化的神经网络进行齿轮箱故障诊断时误差非常小，诊断准确率１００％．图５中的误差曲线变化可以看出，与ＧＡ和ＴＬＢＯ相比，本文算法进行优化时具有收敛速度快，求解精度高等优势．５结束语本文提出了一种用于神经网络优化的教与学优化算法，该算法通过对神经网络的网络权值和阈值进行优化，使得网络的输出和期望输出的误差最小．最后，通过函数拟合实验和拖拉机齿轮箱故障诊断实验，实验结果表明，本文算法在对神经网络进行优化时，与遗传算法和基本的ＴＬＢＯ算法相比具有明显优势．参考文献：［１］ＹＵＸＨ．Ｃａｎｂａｃｋｐｒｏｐａｇａｔｉｏｎｅｒｒｏｒｓｕｒｆａｃｅｎｏｔｈａｖｅｌｏｃａｌ第４期拓守恒：一种优化神经网络的教与学优化算法 ·３３１·

.332. 智能系统学报第8卷 minims[J].Neural Networks,1992,3(6):1009-1021. [10]GEEM Z W,KIM J H,LOGANATHAN G V.A new heu- [2]YU X H,CHEN G A.On the local minima free condition of ristic optimization algorithm:harmony search[J].Simula- backpropagation learning[J].IEEE Transactions on Neural tiom,2001,76(2):60-68. Networks,1995,6(5):1300-1303. [11]TUO Shouheng,YONG Longquan.An improved harmony [3]GOLDBERG D E,KORB B.DEB K.Messy genetic algo- search algorithm with chaos[].Joural of Computational rithms:motivation,analysis,and first results[J.Complex Information Systems,2012,8(10):4269-4276. Systems,1989,3(5):493-530. [12]赵爽.基于SVM的拖拉机齿轮箱多故障诊断方法研究 [4]CLERC M,KENNEDY J.The particle swarm-explosion, [J刀.农机化研究，2011,33(5)：207-209. stability,and convergence in a multidimensional complex ZHAO Shuang.Research of multi-faults in the Tractor's space[J].IEEE Transactions on Evolutionary Computation, gearbox based on support vector machines method [J]. 2002,6(1):58-73. Journal of Agricultural Mechanization Research,2011,33 [5]RAO R V,SAVSANI V J,VAKHARIA D P.Teaching- (5):207-209. learning-based optimization:a novel method for constrained [l3]史峰，王辉，胡斐，等.Matlab智能算法30个案例分析 mechanical design optimization problems[].Computer Ai- [M].北京：北京航空航天大学出版社，2011：137- ded Design,2011,43(3):303-315. 144. [6]RAO R V,SAVSANI V J,VAKHARIA D P.Teaching- [14]杜文莉，周仁，赵亮，等.基于量子差分进化算法的神经 learning-based optimization:an optimization method for 网络优化方法[J].清华大学学报：自然科学，2012,52 continuous non-linear large scale problems[].Information (3):331-335. Sciences,2012,183(1):1-15. DU Wenli,ZHOU Ren,ZHAO Liang,et al.Cooperative [7]MATEJ C.LIU S H,MERNIK L.A note on teaching-learn- quantum differential evolution algorithm based method for ing-based optimization algorithm[].Information Sciences, optimizing neural networks[J].Journal of Tsinghua Univer- 2012,212(1):79-93. sity:Science and Technology,2012,52(3):331-335. [8]RAO R V,PATEL V.An elitist teaching-learning-based op- 作者简介： timization algorithm for solving complex constrained optimi- 拓守恒，男，1978年生，讲师，CCF zation problems[J.International Journal of Industrial Engi- 会员，主要研究方向为智能优化算法与 neering Computations,2012,3(4):535-560. 智能信息处理，发表学术论文多篇 [9]ZOU D X.GAO L Q,WU J H,et al.A novel global har- mony search algorithm for reliability problems[].Comput- ers and Industrial Engineering,2010,58(2):307-316

ｍｉｎｉｍｓ［Ｊ］．ＮｅｕｒａｌＮｅｔｗｏｒｋｓ，１９９２，３（６）：１００９⁃１０２１．［２］ＹＵＸＨ，ＣＨＥＮＧＡ．Ｏｎｔｈｅｌｏｃａｌｍｉｎｉｍａｆｒｅｅｃｏｎｄｉｔｉｏｎｏｆｂａｃｋｐｒｏｐａｇａｔｉｏｎｌｅａｒｎｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ，１９９５，６（５）：１３００⁃１３０３．［３］ＧＯＬＤＢＥＲＧＤＥ，ＫＯＲＢＢ，ＤＥＢＫ．Ｍｅｓｓｙｇｅｎｅｔｉｃａｌｇｏ⁃ ｒｉｔｈｍｓ：ｍｏｔｉｖａｔｉｏｎ，ａｎａｌｙｓｉｓ，ａｎｄｆｉｒｓｔｒｅｓｕｌｔｓ［Ｊ］．ＣｏｍｐｌｅｘＳｙｓｔｅｍｓ，１９８９，３（５）：４９３⁃５３０．［４］ＣＬＥＲＣＭ，ＫＥＮＮＥＤＹＪ．Ｔｈｅｐａｒｔｉｃｌｅｓｗａｒｍ—ｅｘｐｌｏｓｉｏｎ，ｓｔａｂｉｌｉｔｙ，ａｎｄｃｏｎｖｅｒｇｅｎｃｅｉｎａｍｕｌｔｉｄｉｍｅｎｓｉｏｎａｌｃｏｍｐｌｅｘｓｐａｃｅ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＥｖｏｌｕｔｉｏｎａｒｙＣｏｍｐｕｔａｔｉｏｎ，２００２，６（１）：５８⁃７３．［５］ＲＡＯＲＶ，ＳＡＶＳＡＮＩＶＪ，ＶＡＫＨＡＲＩＡＤＰ．Ｔｅａｃｈｉｎｇ⁃ ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ：ａｎｏｖｅｌｍｅｔｈｏｄｆｏｒｃｏｎｓｔｒａｉｎｅｄｍｅｃｈａｎｉｃａｌｄｅｓｉｇｎｏｐｔｉｍｉｚａｔｉｏｎｐｒｏｂｌｅｍｓ［Ｊ］．ＣｏｍｐｕｔｅｒＡｉ⁃ ｄｅｄＤｅｓｉｇｎ，２０１１，４３（３）：３０３⁃３１５．［６］ＲＡＯＲＶ，ＳＡＶＳＡＮＩＶＪ，ＶＡＫＨＡＲＩＡＤＰ．Ｔｅａｃｈｉｎｇ⁃ ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ：ａｎｏｐｔｉｍｉｚａｔｉｏｎｍｅｔｈｏｄｆｏｒｃｏｎｔｉｎｕｏｕｓｎｏｎ⁃ｌｉｎｅａｒｌａｒｇｅｓｃａｌｅｐｒｏｂｌｅｍｓ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅｓ，２０１２，１８３（１）：１⁃１５．［７］ＭＡＴＥＪＣ，ＬＩＵＳＨ，ＭＥＲＮＩＫＬ．Ａｎｏｔｅｏｎｔｅａｃｈｉｎｇ⁃ｌｅａｒｎ⁃ ｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅｓ，２０１２，２１２（１）：７９⁃９３．［８］ＲＡＯＲＶ，ＰＡＴＥＬＶ．Ａｎｅｌｉｔｉｓｔｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐ⁃ ｔｉｍｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍｆｏｒｓｏｌｖｉｎｇｃｏｍｐｌｅｘｃｏｎｓｔｒａｉｎｅｄｏｐｔｉｍｉ⁃ ｚａｔｉｏｎｐｒｏｂｌｅｍｓ［Ｊ］．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＩｎｄｕｓｔｒｉａｌＥｎｇｉ⁃ ｎｅｅｒｉｎｇＣｏｍｐｕｔａｔｉｏｎｓ，２０１２，３（４）：５３５⁃５６０．［９］ＺＯＵＤＸ，ＧＡＯＬＱ，ＷＵＪＨ，ｅｔａｌ．Ａｎｏｖｅｌｇｌｏｂａｌｈａｒ⁃ ｍｏｎｙｓｅａｒｃｈａｌｇｏｒｉｔｈｍｆｏｒｒｅｌｉａｂｉｌｉｔｙｐｒｏｂｌｅｍｓ［Ｊ］．Ｃｏｍｐｕｔ⁃ ｅｒｓａｎｄＩｎｄｕｓｔｒｉａｌＥｎｇｉｎｅｅｒｉｎｇ，２０１０，５８（２）：３０７⁃３１６．［１０］ＧＥＥＭＺＷ，ＫＩＭＪＨ，ＬＯＧＡＮＡＴＨＡＮＧＶ．Ａｎｅｗｈｅｕ⁃ ｒｉｓｔｉｃｏｐｔｉｍｉｚａｔｉｏｎａｌｇｏｒｉｔｈｍ：ｈａｒｍｏｎｙｓｅａｒｃｈ［Ｊ］．Ｓｉｍｕｌａ⁃ ｔｉｏｎ，２００１，７６（２）：６０⁃６８．［１１］ＴＵＯＳｈｏｕｈｅｎｇ，ＹＯＮＧＬｏｎｇｑｕａｎ．Ａｎｉｍｐｒｏｖｅｄｈａｒｍｏｎｙｓｅａｒｃｈａｌｇｏｒｉｔｈｍｗｉｔｈｃｈａｏｓ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔａｔｉｏｎａｌＩｎｆｏｒｍａｔｉｏｎＳｙｓｔｅｍｓ，２０１２，８（１０）：４２６９⁃４２７６．［１２］赵爽．基于ＳＶＭ的拖拉机齿轮箱多故障诊断方法研究［Ｊ］．农机化研究，２０１１，３３（５）：２０７⁃２０９．ＺＨＡＯＳｈｕａｎｇ．Ｒｅｓｅａｒｃｈｏｆｍｕｌｔｉ⁃ｆａｕｌｔｓｉｎｔｈｅＴｒａｃｔｏｒ’ ｓｇｅａｒｂｏｘｂａｓｅｄｏｎｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｓｍｅｔｈｏｄ［Ｊ］．ＪｏｕｒｎａｌｏｆＡｇｒｉｃｕｌｔｕｒａｌＭｅｃｈａｎｉｚａｔｉｏｎＲｅｓｅａｒｃｈ，２０１１，３３（５）：２０７⁃２０９．［１３］史峰，王辉，胡斐，等．Ｍａｔｌａｂ智能算法３０个案例分析［Ｍ］．北京：北京航空航天大学出版社，２０１１：１３７⁃ １４４．［１４］杜文莉，周仁，赵亮，等．基于量子差分进化算法的神经网络优化方法［Ｊ］．清华大学学报：自然科学，２０１２，５２（３）：３３１⁃３３５．ＤＵＷｅｎｌｉ，ＺＨＯＵＲｅｎ，ＺＨＡＯＬｉａｎｇ，ｅｔａｌ．Ｃｏｏｐｅｒａｔｉｖｅｑｕａｎｔｕｍｄｉｆｆｅｒｅｎｔｉａｌｅｖｏｌｕｔｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｍｅｔｈｏｄｆｏｒｏｐｔｉｍｉｚｉｎｇｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｊ］．ＪｏｕｒｎａｌｏｆＴｓｉｎｇｈｕａＵｎｉｖｅｒ⁃ ｓｉｔｙ：ＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，２０１２，５２（３）：３３１⁃３３５．作者简介：拓守恒，男，１９７８年生，讲师，ＣＣＦ会员，主要研究方向为智能优化算法与智能信息处理，发表学术论文多篇． ·３３２· 智能系统学报第８卷

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录