（Ｘｗｏｒｓｔ＋Ｘｉ）／２，这样计算的好处是每个个体Ｘｉ在教

正在加载图片...

·604. 智能系统学报第9卷 (X+X)/2,这样计算的好处是每个个体X,在教 Select 2 individuals at random XX,,from the 学过程中Mean值都不同，从而保证种群的多样性， current population 避免算法过早收敛，具体如下： Iff(X,)<f(X) TF round [1 rand(1,d)] X,=2×X,-X2 Else X=X;rand(1,d).* (Xom+X:） X,=2×X2-X Te.* End 2 (i=1,2,…,d) X..=X,rand(1,d).x (X,-X) End (开始 rand(1,d)表示在[0,1]区间随机生成一个d 参数初始化维的行向量。 3.3“自我”学习(self-learning)阶段随机初始化种群本文算法提出一种类似于和声搜索算法的自我 i=1 学习策略。每个个体通过自我调整进行优化学习。 X..=Yu+difference 由于每个学员可能同时学习多门课程（多个决策变 “教” 量)，在进行“自我”学习时只是对部分科目进行调 KXKKX 食整学习，保持优势学科，增强劣势科目。采用3种自我调整策略进行学习： X:-=Xnguu 1)向“某一科”较为优秀的同学学习，增强单科从种群中随机挑取X(化) 水平。学习概率为LoP。 2)自我调整，以概率SRP进行科目调整，调整 N AXAX) 步长为Stepo 3)以概率LP进行创新学习。学” X.w=Y+r (YX) Xm=r4tr,(X-X）阶 “自我”学习阶段的具体算法如下： For i=1 to NP KXKX Xnew =Xi Y Forj=1 to d X=X If rand()<LoP X)=X0),a∈U以1,2，…，NP);/策略(1) Elself rand()<SRP Y <i≤NP> X.n)=X.)±rand(0,1)×Step()/策略(2) IN Elseif rand()<ILP 是否满足结束条件 X(0)=x()+and×(x'(G)-xt()）:/第略3) Y End 结束 End 图1TLBO算法流程图 End Fig.1 Flow chart of TLBO algorithm 其中， 3.2“学习”(Learning)阶段的改进 Step minStep (maxStep TLB0算法在相互“学习”阶段，每个学员X(i= 1,2,…,N)每次学习时随机选取一个学习对象 minStep) Xj=1,2,…,N,j≠i)进行学习，学习较为单一。 maxStep =(x-x)/50 本文算法要求每个学员在进行“相互学习”是，每次 minStep =(x)/3 000 从班级中随机选取2个学习对象X,和X2(1=1, t是当且迭代次数，T是允许最大迭代次数。 2,…,N;2=1,2,…,N;1≠2)进行学习，学习过 4. MTBO算法主动悬架LQR控制器优化程伪代码如下： 4.1车辆主动悬架LQR控制器模型 For i=1:NP 本文以单轮车辆模型作为研究对象，如图2。（Ｘｗｏｒｓｔ＋Ｘｉ）／２，这样计算的好处是每个个体Ｘｉ在教学过程中Ｍｅａｎ值都不同，从而保证种群的多样性，避免算法过早收敛，具体如下：ＴＦ＝ｒｏｕｎｄ [１＋ｒａｎｄ(１，ｄ) ] Ｘｎｅｗ＝Ｘｉ＋ｒａｎｄ(１，ｄ) ．∗ Ｘｔｅａｃｈｅｒ－ＴＦ．∗ Ｘｗｏｒｓｔ＋Ｘｉ ( ) ２ é ë ê ê êê ù û ú ú úú （ｉ＝１，２，…，ｄ）图１ＴＬＢＯ算法流程图Ｆｉｇ．１ＦｌｏｗｃｈａｒｔｏｆＴＬＢＯａｌｇｏｒｉｔｈｍ３．２ “学习”（Ｌｅａｒｎｉｎｇ）阶段的改进ＴＬＢＯ算法在相互“学习”阶段，每个学员Ｘｉ（ｉ＝１，２，…，Ｎ）每次学习时随机选取一个学习对象Ｘｊ（ｊ＝１，２，…，Ｎ，ｊ ≠ ｉ）进行学习，学习较为单一。本文算法要求每个学员在进行“相互学习”是，每次从班级中随机选取２个学习对象Ｘｒ１和Ｘｒ２（ｒ１＝１，２，…，Ｎ；ｒ２＝１，２，…，Ｎ；ｒ１ ≠ ｒ２）进行学习，学习过程伪代码如下：Ｆｏｒｉ＝１：ＮＰＳｅｌｅｃｔ２ｉｎｄｉｖｉｄｕａｌｓａｔｒａｎｄｏｍＸｒ１ ≠ Ｘｒ２ｆｒｏｍｔｈｅｃｕｒｒｅｎｔｐｏｐｕｌａｔｉｏｎＩｆｆＸｒ１ ( ) ＜ｆＸｒ２ ( ) Ｘｒ＝２ × Ｘｒ１－Ｘｒ２；ＥｌｓｅＸｒ＝２ × Ｘｒ２－Ｘｒ１；ＥｎｄＸｎｅｗ＝Ｘｉ＋ｒａｎｄ(１，ｄ) ． × Ｘｒ－Ｘｉ ( ) ；Ｅｎｄｒａｎｄ（１，ｄ）表示在［０，１］区间随机生成一个ｄ维的行向量。３．３“自我”学习（ｓｅｌｆ⁃ｌｅａｒｎｉｎｇ）阶段本文算法提出一种类似于和声搜索算法的自我学习策略。每个个体通过自我调整进行优化学习。由于每个学员可能同时学习多门课程（多个决策变量），在进行“自我”学习时只是对部分科目进行调整学习，保持优势学科，增强劣势科目。采用３种自我调整策略进行学习：１）向“某一科”较为优秀的同学学习，增强单科水平。学习概率为ＬｏＰ。２）自我调整，以概率ＳＲＰ进行科目调整，调整步长为Ｓｔｅｐ。３）以概率ＩＬＰ进行创新学习。 “自我”学习阶段的具体算法如下：Ｆｏｒｉ＝１ｔｏＮＰＸｎｅｗ＝ＸｉＦｏｒｊ＝１ｔｏｄＩｆｒａｎｄ（）＜ＬｏＰＸｎｅｗ (ｊ) ＝Ｘａ (ｊ) ，ａ ∈Ｕ{１，２，…，ＮＰ} ；／／策略（１）ＥｌｓｅＩｆｒａｎｄ（）＜ＳＲＰＸｎｅｗ (ｊ) ＝Ｘｎｅｗ (ｊ) ±ｒａｎｄ(０，１) × Ｓｔｅｐ(ｊ) ／／策略（２）Ｅｌｓｅｉｆｒａｎｄ（）＜ＩＬＰＸｎｅｗ (ｊ) ＝ｘＬ (ｊ) ＋ｒａｎｄ × ｘＵ (ｊ) －ｘＬ ( (ｊ) ) ；／／策略（３）ＥｎｄＥｎｄＥｎｄ其中，Ｓｔｅｐ＝ｍｉｎＳｔｅｐ＋（ｍａｘＳｔｅｐ－ｍｉｎＳｔｅｐ）１－ｔＴ æ è ç ö ø ÷ ｍａｘＳｔｅｐ＝（ｘＵ－ｘＬ）／５０ｍｉｎＳｔｅｐ＝（ｘＵ－ｘＬ）／３０００ｔ是当且迭代次数，Ｔ是允许最大迭代次数。４ＭＴＬＢＯ算法主动悬架ＬＱＲ控制器优化４．１车辆主动悬架ＬＱＲ控制器模型本文以单轮车辆模型作为研究对象，如图２。 ·６０４· 智能系统学报第９卷

<<向上翻页向下翻页>>

点击下载：智能系统：改进教与学优化算法的LQR控制器优化设计