界输出信息处理结果．当实际输出与期望输出不符时，进入误差的反向传播阶段．

正在加载图片...

·328· 智能系统学报第8卷界输出信息处理结果.当实际输出与期望输出不符习后的值，还有2个关键的参数：教学因子T℉，= 时，进入误差的反向传播阶段误差通过输出层，按 round[1+rand(0,1)]和学习步长r:=rand(0,1)用误差梯度下降的方式修正各层权值，向隐层、输入层于调整学习速率逐层反传但是，梯度下降优化法存在不稳定和不可 1.2学员之间相互“学”阶段预知的问题，并且对初始值非常敏感，对于多峰值优在学员相互“学”阶段，每个学员X(i=1,2,…, 化问题，很容易陷入局部搜索而失去全局最优解.为 NP)在班级中随机选取一个学习对象X(j=1,2, 此，近年来，很多启发式智能全局优化算法被用于神 …,NP,j≠)，X,通过分析自己和学员X的差异进经网络的优化设计，例如，遗传算法(genetic algo- 行学习调整，学习改进的方法类似于差分算法中的 rithm,GA)[)、粒子群优化算法(particle swarm opti-- 差分变异算子，不同在于，TLB0算法中的学习步长 mization,PSO)[)、模拟退火算法(simulated annea- r对每个学员采用不同的学习因子.采用式(3)实现 ling,SA)等.本文提出一种改进的教与学优化算法 “学”的过程 teaching-learning-based optimization,TLBO)[561 (X+·(X:-X),X优于X: 行BP神经网络的优化设计. (3) X+r·(X-X),X优于X 1教与学优化算法式中：=U(0,1)表示第i个学员的学习因子（学习教与学优化算法由印度学者R.V.Rao和V.D. 步长) Kalyankar于2010年提出，TLBO算法通过模拟人类 1.3学员更新在学习过程中的老师“教”和学生相互“学”2个阶学员经过“教”阶段和“学”阶段都要分别进行段的学习方法，促进每个学员的学习水平，更新操作更新方法如下：基本的TLBO算法是模拟以“班级”为单位的学 If X is better than Xod, 习方式，班级中学员水平的提高需要教师的“教”来 X=X", 引导，同时，学员之间需要相互“学习”交流来促进 End If. 知识的进步其中，教师和学员相当于进化算法中的 2 改进的教与学优化算法个体，而教师是适应值最好的个体之一.每个学员所学的某一科目相当于一个决策变量对低维单模优化问题，基本的TLB0算法的收下面是几个基本定义：敛速度很快，求解精度很高，运行代价较小，算法的 1)学习知识范围（对应于搜索区域）.学员所学时间复杂度为O(NP×T),(NP是学员数量，T是最知识范围定义为X=(x,x2,…,x4)∈[L,U],L= 大允许迭代次数).TLBO算法的缺点是，对于高维 (L,2,…,L)是空间下届，U=(U,U2,…,)是 “多模态”的复杂优化问题，全局探索能力较差，很空间上届，d是学员所学科目数（对应于优化问题的容易陷入局部搜索而丢失全局最优解.主要原因是维数) TLB0算法在“教”阶段对所有学员采用相同的差异 2)班级：所有学员的集合称为班级（种群）值Difference进行调整，使得算法的搜索策略比较单 3)教师：班级中水平最高的个体称为教师，记一，学员很容易快速向“老师”聚集，导致学员知识为icacher或Xen 多样性的快速丢失，从而陷入局部搜索.这样，对于 4)学员（个体）：班级中第i个学员定义为X= 高维“多模态”问题，TLB0算法往往会丢失全局最 (x,x,…,x),其中，(=1,2，…，d)表示学员X 优解而获得局部最优解8】」所学的第j门课程，在TLB0算法中，学员的学习过程完全依赖老师 1.1教师的“教”阶段的“教”和学员之间的交流“学习”，造成学员在学习在TLBO算法的“教”阶段，班级中每个学员X 过程中对他人的过度依赖，但却丧失了学习过程中自 (i=l,2,…,NP)根据Xaa和班级中学员平均水平我学习和自我创新能力的挖掘.因此，为了发挥群体中每个学员的智慧和才能，本文针对TLB0算法的缺值Mean=(∑X,)/NP之间的差异性进行学习.采陷，提出一种改进的教与学优化算法(modified teach- 用式(1)~(2)实现“教”的过程. ing-learning-based optimization,MTLBO),算法借鉴和 X.=Xal Difference, (1) 声搜索算法思想进行个体的自我学习和自我探索创 Difference=r:·(Ktacher-TF:·Mean).(2) 新能力挖掘，用于加强每个个体的自我局部搜索能式中：xX“和X"分别表示第i个学员学习前和学力，从而增加种群的全局探索能力.界输出信息处理结果．当实际输出与期望输出不符时，进入误差的反向传播阶段．误差通过输出层，按误差梯度下降的方式修正各层权值，向隐层、输入层逐层反传．但是，梯度下降优化法存在不稳定和不可预知的问题，并且对初始值非常敏感，对于多峰值优化问题，很容易陷入局部搜索而失去全局最优解．为此，近年来，很多启发式智能全局优化算法被用于神经网络的优化设计，例如，遗传算法（ｇｅｎｅｔｉｃａｌｇｏ⁃ ｒｉｔｈｍ，ＧＡ）［３］、粒子群优化算法（ｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉ⁃ ｍｉｚａｔｉｏｎ，ＰＳＯ）［４］、模拟退火算法（ｓｉｍｕｌａｔｅｄａｎｎｅａ⁃ ｌｉｎｇ，ＳＡ）等．本文提出一种改进的教与学优化算法（ｔｅａｃｈｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ，ＴＬＢＯ）［５⁃６］进行ＢＰ神经网络的优化设计．１教与学优化算法教与学优化算法由印度学者Ｒ．Ｖ．Ｒａｏ和Ｖ．Ｄ．Ｋａｌｙａｎｋａｒ于２０１０年提出，ＴＬＢＯ算法通过模拟人类在学习过程中的老师“教”和学生相互“学” ２个阶段的学习方法，促进每个学员的学习水平．基本的ＴＬＢＯ算法是模拟以“班级”为单位的学习方式，班级中学员水平的提高需要教师的“教”来引导，同时，学员之间需要相互“学习” 交流来促进知识的进步．其中，教师和学员相当于进化算法中的个体，而教师是适应值最好的个体之一．每个学员所学的某一科目相当于一个决策变量．下面是几个基本定义：１）学习知识范围（对应于搜索区域）．学员所学知识范围定义为Ｘ＝（ｘ１，ｘ２，…，ｘｄ）∈ ［Ｌ，Ｕ］，Ｌ＝（Ｌ１，Ｌ２，…，Ｌｄ）是空间下届，Ｕ＝（Ｕ１，Ｕ２，…，Ｕｄ）是空间上届，ｄ是学员所学科目数（对应于优化问题的维数）．２）班级：所有学员的集合称为班级（种群）．３）教师：班级中水平最高的个体称为教师，记为Ｘｔｅａｃｈｅｒ或Ｘｂｅｓｔ．４）学员（个体）：班级中第ｉ个学员定义为Ｘｉ＝（ｘ１ｉ，ｘ２ｉ，…，ｘｄｉ），其中，ｘｊｉ（ｊ＝１，２，…，ｄ）表示学员Ｘｉ所学的第ｊ门课程．１．１教师的“教”阶段在ＴＬＢＯ算法的“教”阶段，班级中每个学员Ｘｉ（ｉ＝１，２，…，ＮＰ）根据Ｘｔｅａｃｈｅｒ和班级中学员平均水平值Ｍｅａｎ＝（∑ ＮＰｉ＝１Ｘｉ）／ＮＰ之间的差异性进行学习．采用式（１）～（２）实现“教”的过程．Ｘｎｅｗｉ＝Ｘｏｌｄｉ＋Ｄｉｆｆｅｒｅｎｃｅ，（１）Ｄｉｆｆｅｒｅｎｃｅ＝ｒｉ·（Ｘｔｅａｃｈｅｒ－ＴＦｉ·Ｍｅａｎ）．（２）式中：Ｘｏｌｄｉ和Ｘｎｅｗｉ分别表示第ｉ个学员学习前和学习后的值，还有２个关键的参数：教学因子ＴＦｉ＝ｒｏｕｎｄ [１＋ｒａｎｄ（０，１） ] 和学习步长ｒｉ＝ｒａｎｄ（０，１）用于调整学习速率．１．２学员之间相互“学”阶段在学员相互“学”阶段，每个学员Ｘｉ（ｉ＝１，２，…，ＮＰ）在班级中随机选取一个学习对象Ｘｊ（ｊ＝１，２， …，ＮＰ，ｊ≠ｉ），Ｘｉ通过分析自己和学员Ｘｊ的差异进行学习调整，学习改进的方法类似于差分算法中的差分变异算子，不同在于，ＴＬＢＯ算法中的学习步长ｒ对每个学员采用不同的学习因子．采用式（３）实现 “学”的过程．Ｘｎｅｗｉ＝Ｘｏｌｄｉ＋ｒｉ·（Ｘｉ－Ｘｊ），Ｘｉ优于Ｘｊ；Ｘｏｌｄｉ＋ｒｉ·（Ｘｊ－Ｘｉ），Ｘｊ优于Ｘｉ { ．（３）式中：ｒｉ＝Ｕ（０，１）表示第ｉ个学员的学习因子（学习步长）．１．３学员更新学员经过“教”阶段和“学”阶段都要分别进行更新操作．更新方法如下：ＩｆＸｎｅｗｉｉｓｂｅｔｔｅｒｔｈａｎＸｏｌｄｉ，Ｘｏｌｄｉ＝Ｘｎｅｗｉ，ＥｎｄＩｆ．２改进的教与学优化算法对低维单模优化问题，基本的ＴＬＢＯ算法的收敛速度很快，求解精度很高，运行代价较小，算法的时间复杂度为Ｏ（ＮＰ ×Ｔ），（ＮＰ是学员数量，Ｔ是最大允许迭代次数）．ＴＬＢＯ算法的缺点是，对于高维 “多模态”的复杂优化问题，全局探索能力较差，很容易陷入局部搜索而丢失全局最优解．主要原因是ＴＬＢＯ算法在“教”阶段对所有学员采用相同的差异值Ｄｉｆｆｅｒｅｎｃｅ进行调整，使得算法的搜索策略比较单一，学员很容易快速向“老师”聚集，导致学员知识多样性的快速丢失，从而陷入局部搜索．这样，对于高维“多模态”问题，ＴＬＢＯ算法往往会丢失全局最优解而获得局部最优解［７⁃８］．在ＴＬＢＯ算法中，学员的学习过程完全依赖老师的“教”和学员之间的交流“学习”，造成学员在学习过程中对他人的过度依赖，但却丧失了学习过程中自我学习和自我创新能力的挖掘．因此，为了发挥群体中每个学员的智慧和才能，本文针对ＴＬＢＯ算法的缺陷，提出一种改进的教与学优化算法（ｍｏｄｉｆｉｅｄｔｅａｃｈ⁃ ｉｎｇ⁃ｌｅａｒｎｉｎｇ⁃ｂａｓｅｄｏｐｔｉｍｉｚａｔｉｏｎ，ＭＴＬＢＯ），算法借鉴和声搜索算法思想进行个体的自我学习和自我探索创新能力挖掘，用于加强每个个体的自我局部搜索能力，从而增加种群的全局探索能力． ·３２８· 智能系统学报第８卷

<<向上翻页向下翻页>>

点击下载：机器学习：一种优化神经网络的教与学优化算法