【智能系统】个体最优共享GEP算法及其气象降水数据预测建模编辑部

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：1.55MB

第11卷第3期智能系统学报 Vol.11 No.3 2016年6月 CAAI Transactions on Intelligent Systems Jun.2016 D0I:10.11992/is.2016030 网s络出版地址：http:/www.cnki.net/kcms/detail/23.1538.TP.20160513.0918.010.html 个体最优共享GEP算法及其气象降水数据预测建模彭昱忠2，元昌安，李洁，许明涛，陈冰廉 (1.广西师范学院计算机与信息工程学院，广西南宁5300212.广西师范学院北部湾环境演变与资源利用教育部重点实验室，广西南宁530001：3.广西科技师范学院数计系，广西柳州545004) 摘要：针对基因表达式编程算法存在进化后期收敛慢且容易陷入局部最优而降低其数据建模的性能问题，和降水量因受诸多自然因素相互影响而难以准确地建模与预测的问题，提出了一种改进的基因表达式编程算法。该算法具有染色体最优状态记忆功能，在进化过程中可以按条件学习自身的历史经验知识，以加强局部搜索能力和促进收敛，同时尽量控制个体的趋同化而保持种群的多样性。3组不同区域和不同类型的真实降水数据集的实验验证了其可以改善传统GEP算法后期收敛慢的问题，寻优能力更强，降水数据拟合和预测效果均显著优于传统GEP算法，BP 神经网络和NAR神经网络等算法。关键词：基因表达式编程：经验共享：时间序列：气象建模：降水预测：演化计算：演化建模中图分类号：TP391文献标志码：A文章编号：1673-4785(2016)03-0401-09 中文引用格式：彭昱忠，元昌安，李洁，等.个体最优共享GP算法及其气象降水数据预测建模[J].智能系统学报，2016,11(3)： 401-409. 英文引用格式：PENG Yuzhong,YUAN Changan,LI Jie,etal.Individual optimal sharing GEP algorithm and its application in forecast modeling of meteorological precipitation[J].CAAI transactions on intelligent systems,2016,11(3):401-409. Individual optimal sharing GEP algorithm and its application in forecast modeling of meteorological precipitation PENG Yuzhong'2,YUAN Changan',LI Jie',XU Mingtao',CHEN Binglian' (1.College of Computer Information Engineering,Guangxi Normal University,Nanning 530023,China;2.Key Lab of Beibu Gulf Environment Change and Resource Use of ministry of Education,Guangxi Normal University,Nanning 530001,China;3.Department of Mathematics and computer science,Guangxi Science and Technology University,Liuzhou 545004,China) Abstract:Gene expression programming (GEP)is characterized by slow convergence and ease of falling into a lo- cal optimum in the later stages of its evolution.Many methods are difficult to model and use to accurately forecast precipitation because of the simultaneous influence of many natural factors.In this paper,we propose an improved GEP algorithm,which has an optimal state memory function,can learn from historical experience in the process of evolution to strengthen the local search ability,and can thus promote convergence and,at the same time,control the convergence of individuals and maintain the diversity of the population.The experimental results of three groups from different regions and different actual precipitation data sets show that the proposed algorithm can improve the slow convergence problem of the traditional GEP algorithm and has better search ability.Experimental results also show that the proposed algorithm's ability to fit and forecast precipitation data is significantly better than that of tra- ditional GEP algorithm,as well as the BP and NAR neural network algorithms. Keywords:gene expression programming;experience sharing;time series;meteorology modeling;precipitation forecasting;evolutionary computation;evolution modeling 大气系统是个极为复杂的动态巨系统，具有高维性、多尺度性、复杂性、开放性、混沌性、非平稳性、收稿日期：2016-03-18.网络出版日期：2016-05-13. 不确定性和动态性等特点。传统上，被主要用于建基金项目：国家自然科学基金项目(61562008、41575051)：广西科学研立预测模型的常规统计方法难以精确描述大气系统究与技术开发计划项目(15980191)、广西高校科学技术研究重点项目(ZD2014083). 的复杂关系，因而预测质量较低。近年来，利用先进通信作者：李洁.E-mail:lie980522@163.com

第１１卷第３期智能系统学报Ｖｏｌ．１１ №．３２０１６年６月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＪｕｎ．２０１６ＤＯＩ：１０．１１９９２／ｔｉｓ．２０１６０３０网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１６０５１３．０９１８．０１０．ｈｔｍｌ个体最优共享ＧＥＰ算法及其气象降水数据预测建模彭昱忠１，２，元昌安１，李洁３，许明涛１，陈冰廉１（１．广西师范学院计算机与信息工程学院，广西南宁５３００２１；２．广西师范学院北部湾环境演变与资源利用教育部重点实验室，广西南宁５３０００１；３．广西科技师范学院数计系，广西柳州５４５００４）摘要：针对基因表达式编程算法存在进化后期收敛慢且容易陷入局部最优而降低其数据建模的性能问题，和降水量因受诸多自然因素相互影响而难以准确地建模与预测的问题，提出了一种改进的基因表达式编程算法。该算法具有染色体最优状态记忆功能，在进化过程中可以按条件学习自身的历史经验知识，以加强局部搜索能力和促进收敛，同时尽量控制个体的趋同化而保持种群的多样性。３组不同区域和不同类型的真实降水数据集的实验验证了其可以改善传统ＧＥＰ算法后期收敛慢的问题，寻优能力更强，降水数据拟合和预测效果均显著优于传统ＧＥＰ算法、ＢＰ神经网络和ＮＡＲ神经网络等算法。关键词：基因表达式编程；经验共享；时间序列；气象建模；降水预测；演化计算；演化建模中图分类号：ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１６）０３⁃０４０１⁃０９中文引用格式：彭昱忠，元昌安，李洁，等．个体最优共享ＧＥＰ算法及其气象降水数据预测建模［Ｊ］．智能系统学报，２０１６，１１（３）：４０１⁃４０９．英文引用格式：ＰＥＮＧＹｕｚｈｏｎｇ，ＹＵＡＮＣｈａｎｇａｎ，ＬＩＪｉｅ，ｅｔａｌ．ＩｎｄｉｖｉｄｕａｌｏｐｔｉｍａｌｓｈａｒｉｎｇＧＥＰａｌｇｏｒｉｔｈｍａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｉｎｆｏｒｅｃａｓｔｍｏｄｅｌｉｎｇｏｆｍｅｔｅｏｒｏｌｏｇｉｃａｌｐｒｅｃｉｐｉｔａｔｉｏｎ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１６，１１（３）：４０１⁃４０９．ＩｎｄｉｖｉｄｕａｌｏｐｔｉｍａｌｓｈａｒｉｎｇＧＥＰａｌｇｏｒｉｔｈｍａｎｄｉｔｓａｐｐｌｉｃａｔｉｏｎｉｎｆｏｒｅｃａｓｔｍｏｄｅｌｉｎｇｏｆｍｅｔｅｏｒｏｌｏｇｉｃａｌｐｒｅｃｉｐｉｔａｔｉｏｎＰＥＮＧＹｕｚｈｏｎｇ１，２，ＹＵＡＮＣｈａｎｇａｎ１，ＬＩＪｉｅ３，ＸＵＭｉｎｇｔａｏ１，ＣＨＥＮＢｉｎｇｌｉａｎ１（１．ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒ＆ＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＧｕａｎｇｘｉＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ，Ｎａｎｎｉｎｇ５３００２３，Ｃｈｉｎａ；２．ＫｅｙＬａｂｏｆＢｅｉｂｕＧｕｌｆＥｎｖｉｒｏｎｍｅｎｔＣｈａｎｇｅａｎｄＲｅｓｏｕｒｃｅＵｓｅｏｆｍｉｎｉｓｔｒｙｏｆＥｄｕｃａｔｉｏｎ，ＧｕａｎｇｘｉＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ，Ｎａｎｎｉｎｇ５３０００１，Ｃｈｉｎａ；３．ＤｅｐａｒｔｍｅｎｔｏｆＭａｔｈｅｍａｔｉｃｓａｎｄｃｏｍｐｕｔｅｒｓｃｉｅｎｃｅ，ＧｕａｎｇｘｉＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙＵｎｉｖｅｒｓｉｔｙ，Ｌｉｕｚｈｏｕ５４５００４，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ（ＧＥＰ）ｉｓｃｈａｒａｃｔｅｒｉｚｅｄｂｙｓｌｏｗｃｏｎｖｅｒｇｅｎｃｅａｎｄｅａｓｅｏｆｆａｌｌｉｎｇｉｎｔｏａｌｏ⁃ ｃａｌｏｐｔｉｍｕｍｉｎｔｈｅｌａｔｅｒｓｔａｇｅｓｏｆｉｔｓｅｖｏｌｕｔｉｏｎ．Ｍａｎｙｍｅｔｈｏｄｓａｒｅｄｉｆｆｉｃｕｌｔｔｏｍｏｄｅｌａｎｄｕｓｅｔｏａｃｃｕｒａｔｅｌｙｆｏｒｅｃａｓｔｐｒｅｃｉｐｉｔａｔｉｏｎｂｅｃａｕｓｅｏｆｔｈｅｓｉｍｕｌｔａｎｅｏｕｓｉｎｆｌｕｅｎｃｅｏｆｍａｎｙｎａｔｕｒａｌｆａｃｔｏｒｓ．Ｉｎｔｈｉｓｐａｐｅｒ，ｗｅｐｒｏｐｏｓｅａｎｉｍｐｒｏｖｅｄＧＥＰａｌｇｏｒｉｔｈｍ，ｗｈｉｃｈｈａｓａｎｏｐｔｉｍａｌｓｔａｔｅｍｅｍｏｒｙｆｕｎｃｔｉｏｎ，ｃａｎｌｅａｒｎｆｒｏｍｈｉｓｔｏｒｉｃａｌｅｘｐｅｒｉｅｎｃｅｉｎｔｈｅｐｒｏｃｅｓｓｏｆｅｖｏｌｕｔｉｏｎｔｏｓｔｒｅｎｇｔｈｅｎｔｈｅｌｏｃａｌｓｅａｒｃｈａｂｉｌｉｔｙ，ａｎｄｃａｎｔｈｕｓｐｒｏｍｏｔｅｃｏｎｖｅｒｇｅｎｃｅａｎｄ，ａｔｔｈｅｓａｍｅｔｉｍｅ，ｃｏｎｔｒｏｌｔｈｅｃｏｎｖｅｒｇｅｎｃｅｏｆｉｎｄｉｖｉｄｕａｌｓａｎｄｍａｉｎｔａｉｎｔｈｅｄｉｖｅｒｓｉｔｙｏｆｔｈｅｐｏｐｕｌａｔｉｏｎ．ＴｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｏｆｔｈｒｅｅｇｒｏｕｐｓｆｒｏｍｄｉｆｆｅｒｅｎｔｒｅｇｉｏｎｓａｎｄｄｉｆｆｅｒｅｎｔａｃｔｕａｌｐｒｅｃｉｐｉｔａｔｉｏｎｄａｔａｓｅｔｓｓｈｏｗｔｈａｔｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍｃａｎｉｍｐｒｏｖｅｔｈｅｓｌｏｗｃｏｎｖｅｒｇｅｎｃｅｐｒｏｂｌｅｍｏｆｔｈｅｔｒａｄｉｔｉｏｎａｌＧＥＰａｌｇｏｒｉｔｈｍａｎｄｈａｓｂｅｔｔｅｒｓｅａｒｃｈａｂｉｌｉｔｙ．Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓａｌｓｏｓｈｏｗｔｈａｔｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍ＇ｓａｂｉｌｉｔｙｔｏｆｉｔａｎｄｆｏｒｅｃａｓｔｐｒｅｃｉｐｉｔａｔｉｏｎｄａｔａｉｓｓｉｇｎｉｆｉｃａｎｔｌｙｂｅｔｔｅｒｔｈａｎｔｈａｔｏｆｔｒａ⁃ ｄｉｔｉｏｎａｌＧＥＰａｌｇｏｒｉｔｈｍ，ａｓｗｅｌｌａｓｔｈｅＢＰａｎｄＮＡＲｎｅｕｒａｌｎｅｔｗｏｒｋａｌｇｏｒｉｔｈｍｓ．Ｋｅｙｗｏｒｄｓ：ｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ；ｅｘｐｅｒｉｅｎｃｅｓｈａｒｉｎｇ；ｔｉｍｅｓｅｒｉｅｓ；ｍｅｔｅｏｒｏｌｏｇｙｍｏｄｅｌｉｎｇ；ｐｒｅｃｉｐｉｔａｔｉｏｎｆｏｒｅｃａｓｔｉｎｇ；ｅｖｏｌｕｔｉｏｎａｒｙｃｏｍｐｕｔａｔｉｏｎ；ｅｖｏｌｕｔｉｏｎｍｏｄｅｌｉｎｇ收稿日期：２０１６⁃０３⁃１８．网络出版日期：２０１６⁃０５⁃１３．基金项目：国家自然科学基金项目（６１５６２００８、４１５７５０５１）；广西科学研究与技术开发计划项目（１５９８０１９⁃１）、广西高校科学技术研究重点项目（ＺＤ２０１４０８３）．通信作者：李洁．Ｅ⁃ｍａｉｌ：ｌｉｊｉｅ９８０５２２＠１６３．ｃｏｍ．大气系统是个极为复杂的动态巨系统，具有高维性、多尺度性、复杂性、开放性、混沌性、非平稳性、不确定性和动态性等特点。传统上，被主要用于建立预测模型的常规统计方法难以精确描述大气系统的复杂关系，因而预测质量较低。近年来，利用先进

·402. 智能系统学报第11卷的智能计算和数据挖掘方法，构建和改进气象预测的参数个数)。GEP的基因有基因型和表现型两种的方法与模型，帮助对未知气象规律的认识和提高表现形式，因此，每个基因对应一个K表达式（表示气象预测能力，已逐渐成为气象、数学和计算机领域基因编码的有效部分)和一棵表达式树。其中，K表专家和学者们关注的热点，多个相关国际会议上设达式就是基因型，表达式树就是表现型，两者之间可置了相关的专题和Workshop)。以相互转化。如，以√x+xy为例来说明GEP的染近年来，被众多学者应用到气象或灾害天气的色体编码方法，这个式子可以用基因：Q+**xxxy2 预测中的神经网络方法等智能计算方法[2]可有效表示，该基因对应的表达式树如图1所示。描述气象要素间的复杂关系，但这些算法结构和参数难选定、计算量过大而不利于大容量样本学习等自身固有的缺陷，严重降低了其应用和发展的效果。基于大量历史数据进行气象数据挖掘与建模预测是个较有发展前途的研究和应用方向，已吸引了不少的学者进行研究1)。但用传统数据挖掘算法难于避免由于气象数据的多层次特性造成的难以建立准确模型的缺陷，从而降低了气象预报的精度。基因表达式编程(gene expression programming, 图1表达式树 GEP)是借鉴生物遗传的基因表达规律，融合了遗传 Fig.1 The expression tree 算法(GA)和遗传编程(GP)的优点发展起来的进化 GEP的若干个染色体构成种群，然后通过个体计算家族中的革命性新成员。GEP不但可以轻易在种群中不断进化而逐渐逼近问题的解。GEP作地进化多种形态的复杂计算程序，构建稳健而精确、可解释性较强的计算模型，而且具有很强的问题表为进化计算家族的成员，其算法的进化过程类似于达能力、知识发现能力和寻优能力，可有效进行数据 GA和GP。具体算法过程描述见文献[14]。挖掘，发现公式、规则或规律，模型的最优化等。 2个体最优共享GEP算法相关研究表明，GEP能有效克服很多智能计算方法 GEP存在进化后期寻优缓慢且易陷局部最优和传统数据挖掘与知识发现的不足，求解很多复杂的问题，已经引起了一些学者的注意，并试图通过控问题表现更出色，可望是一个具有发展前途的气象数据建模与预测研究方向。但GEP自身还存在复制和调节种群结构s1切]、改进和调节遗传操杂问题建模的进化后期寻优缓慢且易陷入局部最优作1-0】，改变个体编码结构[2]等方式改进GEP算的缺陷。针对此问题，本文提出了个体最优共享的法，并取得了一定的成效。本文借鉴粒子群算法进化过程中粒子历史最优信息共享的机制促进粒子群改进GEP算法(best individual shared-based gene ex- 算法快速收敛的思想，对GEP进行了改进，提出了 pression programming,BIS_GEP),能更好地解决后期寻优缓慢和局部最优问题，并通过3组真实降水案个体最优共享GEP(BIS_GEP)。 2.1 BIS GEP的基本思想例的实验验证了其性能。 PS0是模拟鸟群寻找食物过程的动作迁徙和群 1 GEP基本原理概述聚行为的一种启发式随机搜索的演化计算方法。 GEP和PS0同属仿生演化算法，本质上都是基于自 GEP的个体（染色体）由单个或者多个基因组然性质和行为规则随机搜索解空间寻求问题最优成，基因之间可以用函数符号连接起来。GEP的基因用长度固定的符串来表示，由头和尾两部分组成。解。PS0具有良好的个体最优信息共享和全局最优信息共享与更新机制，能充分利用个体自身经验和其中头部既可以包含函数符号也可以包含终结符群体经验来调整自身的状态，使其位置与速度的更号，而尾部则只能包含终结符号。基因中的函数符新具有很好的导向性。故对局部空间最优解的逼近号是问题求解过程中的所需要的数学函数和逻辑运能力很强，收敛速度快，但同时这种导向性也导致其算等所有候选的函数和操作符的表示，终结符通常是问题求解过程所需要的候选变量或常量，其中尾全局搜索能力不强2。相对PS0算法，GEP的各种遗传操作都缺乏明确的导向性，因此其对空间最部长度t和头部长度h之间应该满足式(1)的关系：优解的逼近能力不强，但这同时让GEP算法对空间 t=h×(n-1)+1 (1) 最优解的搜索能力变得很强。经典的社会学理论认式中n代表函数符集中的最大操目数（可能的最多

的智能计算和数据挖掘方法，构建和改进气象预测的方法与模型，帮助对未知气象规律的认识和提高气象预测能力，已逐渐成为气象、数学和计算机领域专家和学者们关注的热点，多个相关国际会议上设置了相关的专题和Ｗｏｒｋｓｈｏｐ［１］。近年来，被众多学者应用到气象或灾害天气的预测中的神经网络方法等智能计算方法［２⁃９］可有效描述气象要素间的复杂关系，但这些算法结构和参数难选定、计算量过大而不利于大容量样本学习等自身固有的缺陷，严重降低了其应用和发展的效果。基于大量历史数据进行气象数据挖掘与建模预测是个较有发展前途的研究和应用方向，已吸引了不少的学者进行研究［１０⁃１３］。但用传统数据挖掘算法难于避免由于气象数据的多层次特性造成的难以建立准确模型的缺陷，从而降低了气象预报的精度。基因表达式编程（ｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ，ＧＥＰ）是借鉴生物遗传的基因表达规律，融合了遗传算法（ＧＡ）和遗传编程（ＧＰ）的优点发展起来的进化计算家族中的革命性新成员。ＧＥＰ不但可以轻易地进化多种形态的复杂计算程序，构建稳健而精确、可解释性较强的计算模型，而且具有很强的问题表达能力、知识发现能力和寻优能力，可有效进行数据挖掘，发现公式、规则或规律，模型的最优化等［１４］。相关研究表明，ＧＥＰ能有效克服很多智能计算方法和传统数据挖掘与知识发现的不足，求解很多复杂问题表现更出色，可望是一个具有发展前途的气象数据建模与预测研究方向。但ＧＥＰ自身还存在复杂问题建模的进化后期寻优缓慢且易陷入局部最优的缺陷。针对此问题，本文提出了个体最优共享的改进ＧＥＰ算法（ｂｅｓｔｉｎｄｉｖｉｄｕａｌｓｈａｒｅｄ⁃ｂａｓｅｄｇｅｎｅｅｘ⁃ ｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ，ＢＩＳ＿ＧＥＰ），能更好地解决后期寻优缓慢和局部最优问题，并通过３组真实降水案例的实验验证了其性能。１ＧＥＰ基本原理概述ＧＥＰ的个体（染色体）由单个或者多个基因组成，基因之间可以用函数符号连接起来。ＧＥＰ的基因用长度固定的符串来表示，由头和尾两部分组成。其中头部既可以包含函数符号也可以包含终结符号，而尾部则只能包含终结符号。基因中的函数符号是问题求解过程中的所需要的数学函数和逻辑运算等所有候选的函数和操作符的表示，终结符通常是问题求解过程所需要的候选变量或常量，其中尾部长度ｔ和头部长度ｈ之间应该满足式（１）的关系：ｔ＝ｈ × （ｎ－１）＋１（１）式中ｎ代表函数符集中的最大操目数（可能的最多的参数个数）。ＧＥＰ的基因有基因型和表现型两种表现形式，因此，每个基因对应一个Ｋ表达式（表示基因编码的有效部分）和一棵表达式树。其中，Ｋ表达式就是基因型，表达式树就是表现型，两者之间可以相互转化。如，以ｘ２＋ｘｙ为例来说明ＧＥＰ的染色体编码方法，这个式子可以用基因：Ｑ＋∗∗ｘｘｘｙｚ表示，该基因对应的表达式树如图１所示。图１表达式树Ｆｉｇ．１ＴｈｅｅｘｐｒｅｓｓｉｏｎｔｒｅｅＧＥＰ的若干个染色体构成种群，然后通过个体在种群中不断进化而逐渐逼近问题的解。ＧＥＰ作为进化计算家族的成员，其算法的进化过程类似于ＧＡ和ＧＰ。具体算法过程描述见文献［１４］。２个体最优共享ＧＥＰ算法ＧＥＰ存在进化后期寻优缓慢且易陷局部最优的问题，已经引起了一些学者的注意，并试图通过控制和调节种群结构［１５⁃１７］、改进和调节遗传操作［１８⁃２０］、改变个体编码结构［２１⁃２２］等方式改进ＧＥＰ算法，并取得了一定的成效。本文借鉴粒子群算法进化过程中粒子历史最优信息共享的机制促进粒子群算法快速收敛的思想，对ＧＥＰ进行了改进，提出了个体最优共享ＧＥＰ（ＢＩＳ＿ＧＥＰ）。２．１ＢＩＳ＿ＧＥＰ的基本思想ＰＳＯ是模拟鸟群寻找食物过程的动作迁徙和群聚行为的一种启发式随机搜索的演化计算方法。ＧＥＰ和ＰＳＯ同属仿生演化算法，本质上都是基于自然性质和行为规则随机搜索解空间寻求问题最优解。ＰＳＯ具有良好的个体最优信息共享和全局最优信息共享与更新机制，能充分利用个体自身经验和群体经验来调整自身的状态，使其位置与速度的更新具有很好的导向性。故对局部空间最优解的逼近能力很强，收敛速度快，但同时这种导向性也导致其全局搜索能力不强［２３］。相对ＰＳＯ算法，ＧＥＰ的各种遗传操作都缺乏明确的导向性，因此其对空间最优解的逼近能力不强，但这同时让ＧＥＰ算法对空间最优解的搜索能力变得很强。经典的社会学理论认 ·４０２· 智能系统学报第１１卷

第3期彭昱忠，等：个体最优共享GEP算法及其气象降水数据预测建模 ·403 为，人类在决策过程时，个体学习和文化传递这两类个体的趋同化，尽量保持种群的多样性，让种群向全信息（即自身的经验和其他人的经验）具有极为关局最优移动。为了实现此目标，需要抑制个体对历键的作用。对比分析PSO和GEP,GEP在对以往搜史最佳状态的学习程度，避免所有个体均无节制地索经验的学习利用上相对较差，因为GEP算法的个学习历史最佳状态而致个体快速趋同降低了种群的体并不像PS0那样具有记忆能力，以前的知识随着多样性。为此BIS_GEP将种群划分为两个子种群，种群的改变被破坏。本文认为这是导致GEP后期其中一个子种群的染色体在交叉时按一定的概率与搜索慢且易陷局部最优的重要原因。BIS_GEP算自身历史最优状态进行交叉操作，不断迭代进化，并法正是借鉴了社会学理论和PS0的个体经验学习每隔给定的step代通过轮盘赌选择二分之一的个优势而设计的，旨在尽可能保持GEP自身的全局搜体移到另一个子种群中：而另一个子种群则按常规索优势，增强局部搜索能力和加快收敛速度。因此，的GEP算法过程进行进化，并每隔给定的step代排在BIS_GEP设计上，为每个染色体设计了最优状态挤出适应度最差的二分之一个体移到另一子种群，记忆功能，让个体在进化过程中可以充分学习自身同时接收选自另一子种群的个体，在迭代终止条件的历史经验知识，以加强局部搜索和促进收敛。同达到时该子种群中的最优染色体即为本次寻优过程时还需控制因过度的个体学习历史经验而引起种群中的最优解。BIS_GEP算法基本思想如图2所示。个体历史最优 GEP染色状态参与交叉优秀GEP 体子群1 轮盘种群1 轮盘 GEP种群排挤赌择移移群移 GEP染色常规交叉群优秀GEP 、群最优GEP 体子群2 种群2 染色体初始状态i 状态i+step 状态i+n×step 最终态j 图2BIS_GEP算法基本思想示意图 Fig.2 The basic algorithm idea of BIS_GEP 2.2BIS_GEP算法过程 BIS_GEP在经典GEP的基础上，将种群划分为根据上述主要思想，设计了如图3所描述的两个等规模的子种群分别按精英保留策略进行进 BIS_GEP算法流程图。化，然后每隔若干代即对两个相对独立的子种群进初始化参数和种群行个体选择与交换，其中的一子种群按常规的GEP 遗传操作进化（详见文献[14]），另一子种群则在常种群二等分割规遗传操作的基础上增加按概率进行自身历史最佳子种群1 子种群2 状态（该染色体的适应度值最高时的编码表示）交叉的操作。选择个体的标准是按常规的GEP遗传常规遗是否达到终止条件传进化操作进化的子种群采用轮盘赌选择取余法选择个体 N 个体最优常规遗算法结束 (选取没被轮盘赌选择法选中而排挤出的那一半)，状态交叉传进化另一种群则按轮盘赌选择法进行需移群交换的个体选择。该算法通过划分子种群分别进行常规进化和 N 一迭代次数是否ep倍 N 外加个体历史最优交叉进化，然后隔若干代选择个体移群交换，既可通过充分学习个体自身经验加强轮盘赌选轮盘赌排出二分移群交换挤出二分局部搜索和促进收敛，也能保持种群的多样性，从而的个体的个体改善算法的寻优效果。BIS_GEP算法描述如下：输入训练数据集T,种群大小Gs、函数集、终图3BIS_GEP算法流程图结符集、基因头长HL、移群步数step、各遗传操作率 Fig.3 The algorithm procedure of BIS_GEP 和终止条件等算法的基本参数

为，人类在决策过程时，个体学习和文化传递这两类信息（即自身的经验和其他人的经验）具有极为关键的作用。对比分析ＰＳＯ和ＧＥＰ，ＧＥＰ在对以往搜索经验的学习利用上相对较差，因为ＧＥＰ算法的个体并不像ＰＳＯ那样具有记忆能力，以前的知识随着种群的改变被破坏。本文认为这是导致ＧＥＰ后期搜索慢且易陷局部最优的重要原因。ＢＩＳ＿ＧＥＰ算法正是借鉴了社会学理论和ＰＳＯ的个体经验学习优势而设计的，旨在尽可能保持ＧＥＰ自身的全局搜索优势，增强局部搜索能力和加快收敛速度。因此，在ＢＩＳ＿ＧＥＰ设计上，为每个染色体设计了最优状态记忆功能，让个体在进化过程中可以充分学习自身的历史经验知识，以加强局部搜索和促进收敛。同时还需控制因过度的个体学习历史经验而引起种群个体的趋同化，尽量保持种群的多样性，让种群向全局最优移动。为了实现此目标，需要抑制个体对历史最佳状态的学习程度，避免所有个体均无节制地学习历史最佳状态而致个体快速趋同降低了种群的多样性。为此ＢＩＳ＿ＧＥＰ将种群划分为两个子种群，其中一个子种群的染色体在交叉时按一定的概率与自身历史最优状态进行交叉操作，不断迭代进化，并每隔给定的ｓｔｅｐ代通过轮盘赌选择二分之一的个体移到另一个子种群中；而另一个子种群则按常规的ＧＥＰ算法过程进行进化，并每隔给定的ｓｔｅｐ代排挤出适应度最差的二分之一个体移到另一子种群，同时接收选自另一子种群的个体，在迭代终止条件达到时该子种群中的最优染色体即为本次寻优过程中的最优解。ＢＩＳ＿ＧＥＰ算法基本思想如图２所示。图２ＢＩＳ＿ＧＥＰ算法基本思想示意图Ｆｉｇ．２ＴｈｅｂａｓｉｃａｌｇｏｒｉｔｈｍｉｄｅａｏｆＢＩＳ＿ＧＥＰ２．２ＢＩＳ＿ＧＥＰ算法过程根据上述主要思想，设计了如图３所描述的ＢＩＳ＿ＧＥＰ算法流程图。图３ＢＩＳ＿ＧＥＰ算法流程图Ｆｉｇ．３ＴｈｅａｌｇｏｒｉｔｈｍｐｒｏｃｅｄｕｒｅｏｆＢＩＳ＿ＧＥＰＢＩＳ＿ＧＥＰ在经典ＧＥＰ的基础上，将种群划分为两个等规模的子种群分别按精英保留策略进行进化，然后每隔若干代即对两个相对独立的子种群进行个体选择与交换，其中的一子种群按常规的ＧＥＰ遗传操作进化（详见文献［１４］），另一子种群则在常规遗传操作的基础上增加按概率进行自身历史最佳状态（该染色体的适应度值最高时的编码表示）交叉的操作。选择个体的标准是按常规的ＧＥＰ遗传操作进化的子种群采用轮盘赌选择取余法选择个体（选取没被轮盘赌选择法选中而排挤出的那一半），另一种群则按轮盘赌选择法进行需移群交换的个体选择。该算法通过划分子种群分别进行常规进化和外加个体历史最优交叉进化，然后隔若干代选择个体移群交换，既可通过充分学习个体自身经验加强局部搜索和促进收敛，也能保持种群的多样性，从而改善算法的寻优效果。ＢＩＳ＿ＧＥＰ算法描述如下：输入训练数据集Ｔ，种群大小Ｇｓ、函数集、终结符集、基因头长ＨＬ、移群步数ｓｔｅｐ、各遗传操作率和终止条件等算法的基本参数第３期彭昱忠，等：个体最优共享ＧＥＰ算法及其气象降水数据预测建模 ·４０３·

·404 智能系统学报第11卷输出最优函数模型∫及其适应度用菲波那契(Fibonacci)数列作为时不变线性滤波器 1)生成初始种群：对输人的气象数据进行滤波抑制高频噪声，然后再 2)种群二等分割为G1和G2: 进行函数挖掘与建模预测。记待测时间序列为 3)种群进化过程： {x(t),t=1,2,…,N},根据Fibonacci数列性质，取 While(终止条件≠true) 线性滤波器H满足式(2)[2： G1.CommGeneticOperatelnProbability ();/ (Fib(Ui)/totalWeight,j≤K∈ h;= ,(2) 子种群1进行常规遗传操作 0,j>K∈N G1.divHistoryBestCrossInProbability(); totalWeight Fib(1)Fib(2)+.+Fib(K) /子种群1进行个体最优状态交叉 (3) G1.CaculateFitness(); 式中：K一般取值为滑动窗口大小减1，则该时不变 //计算子种群1个体适应度线性滤波器的输出为 G2.CommGeneticOperateInProbability ();/ Y,=(Fib(I)×X,-k+Fib(2)×X-k+1+…+ 子种群2进行常规遗传操作 Fib(K)xX,)/totalWeight G2.CaculateFitness(); 3.2建模方法 //计算子种群2个体适应度用GEP进行时间序列的建模和预测通常是将 If(generation Modulo step==0)/如果当前时间序列建模问题转换成符号回归问题，挖掘出对进化代数是step的倍数给定时间序列数据拟合度和对未来预测精度较高的 G1Exchdiv=G1.RoulSelectHalf(); 函数模型，将用此函数模型计算未来可能的值。先 /子种群1进行轮盘赌选出一半的个体待交换求时间序列X(t)的M阶延迟得到矩阵X,如式(4) G2Exchdiv=G2 -G2.RoulSelectHalf(); 所示，矩阵X中的元素与原序列对应关系为X。= /子种群2进行轮盘赌排挤出一半个体待交换 x+1,然后把矩阵X中的第N-M+1列看作是所求函 G1.Add(G2Exchdiv); 数模型的因变量，其余每一列看作所求函数模型的 /个体移群交换一个自变量，因而窗口大小为N-M+1,而矩阵X的 G2.Add(G1Exchdiv); 每一行即为一个样本数据，则所求的目标函数模型 End if 可记为x-M=f孔xo,x1,…,x-w)。接下来，GEP根据 G1.SelectNextPopulation(); 输入样本，在给定函数符组成的所有可能函数表达 /选择个体构成下一代空间中寻找拟合样本数据程度较佳的函数表达式。 G2.SelectNextPopulation(); X2 XN-M+1 X10 …X1,N-M generation++; X2 3 XN-M+2 X2.N-M End while 44 4)输出结果。 XM XM+I Xm XM.N-M 3基于BS_GS的气象降水建模与预测 (4) 3.3案例实验与结果分析 3.1数据预处理 3.3.1实验数据与方案输入数据的质量对数据挖掘与数据建模有着非本文分别用北京年降水量(1949-2013年，样本常重要的影响。气象数据资料在收集过程中受到较长度65，下文简称“北京降水”)、广西桂平冬季月均多主观因素（如操作员认知程度等）和客观因素（如降水量(1951-2013年，样本长度63，下文简称“桂仪器设备的工作状态、环境因素等)的影响，使得气平降水”)和UNION CITY早季的6月份降水量象数据不可避免地包含噪声，直接进行数据挖掘和 (1884-2006年，样本长度123，位于美国新泽西州预测建模必然会导致结果出现偏差。为了提高模型东北部，下文简称“UNION降水”)这3个典型的不的有效性和预测结果的准确性，本文在建模前先利同区域和类型的降水量作为建模预测对象，检验

输出最优函数模型ｆ及其适应度１）生成初始种群；２）种群二等分割为Ｇ１和Ｇ２；３）种群进化过程：Ｗｈｉｌｅ（终止条件 ≠ ｔｒｕｅ）Ｇ１．ＣｏｍｍＧｅｎｅｔｉｃＯｐｅｒａｔｅＩｎＰｒｏｂａｂｉｌｉｔｙ（）；／／子种群１进行常规遗传操作Ｇ１．ｄｉｖＨｉｓｔｏｒｙＢｅｓｔＣｒｏｓｓＩｎＰｒｏｂａｂｉｌｉｔｙ（）；／／子种群１进行个体最优状态交叉Ｇ１．ＣａｃｕｌａｔｅＦｉｔｎｅｓｓ（）；／／计算子种群１个体适应度Ｇ２．ＣｏｍｍＧｅｎｅｔｉｃＯｐｅｒａｔｅＩｎＰｒｏｂａｂｉｌｉｔｙ（）；／／子种群２进行常规遗传操作Ｇ２．ＣａｃｕｌａｔｅＦｉｔｎｅｓｓ（）；／／计算子种群２个体适应度Ｉｆ（ｇｅｎｅｒａｔｉｏｎＭｏｄｕｌｏｓｔｅｐ＝＝０）／／如果当前进化代数是ｓｔｅｐ的倍数Ｇ１Ｅｘｃｈｄｉｖ＝Ｇ１．ＲｏｕｌＳｅｌｅｃｔＨａｌｆ（）；／／子种群１进行轮盘赌选出一半的个体待交换Ｇ２Ｅｘｃｈｄｉｖ＝Ｇ２－Ｇ２．ＲｏｕｌＳｅｌｅｃｔＨａｌｆ（）；／／子种群２进行轮盘赌排挤出一半个体待交换Ｇ１．Ａｄｄ（Ｇ２Ｅｘｃｈｄｉｖ）；／／个体移群交换Ｇ２．Ａｄｄ（Ｇ１Ｅｘｃｈｄｉｖ）；ＥｎｄｉｆＧ１．ＳｅｌｅｃｔＮｅｘｔＰｏｐｕｌａｔｉｏｎ（）；／／选择个体构成下一代Ｇ２．ＳｅｌｅｃｔＮｅｘｔＰｏｐｕｌａｔｉｏｎ（）；ｇｅｎｅｒａｔｉｏｎ＋＋；Ｅｎｄｗｈｉｌｅ４）输出结果。３基于ＢＩＳ＿ＧＩＳ的气象降水建模与预测３．１数据预处理输入数据的质量对数据挖掘与数据建模有着非常重要的影响。气象数据资料在收集过程中受到较多主观因素（如操作员认知程度等）和客观因素（如仪器设备的工作状态、环境因素等）的影响，使得气象数据不可避免地包含噪声，直接进行数据挖掘和预测建模必然会导致结果出现偏差。为了提高模型的有效性和预测结果的准确性，本文在建模前先利用菲波那契（Ｆｉｂｏｎａｃｃｉ）数列作为时不变线性滤波器对输入的气象数据进行滤波抑制高频噪声，然后再进行函数挖掘与建模预测。记待测时间序列为｛ｘ（ｔ），ｔ＝１，２，…，Ｎ｝，根据Ｆｉｂｏｎａｃｃｉ数列性质，取线性滤波器Ｈ满足式（２）［２４］：ｈｊ＝Ｆｉｂ（ｊ）／ｔｏｔａｌＷｅｉｇｈｔ，ｊ ≤ Ｋ ∈ Ｎ０，ｊ＞Ｋ ∈ Ｎ { ，（２）ｔｏｔａｌＷｅｉｇｈｔ＝Ｆｉｂ（１）＋Ｆｉｂ（２）＋ … ＋Ｆｉｂ（Ｋ）（３）式中：Ｋ一般取值为滑动窗口大小减１，则该时不变线性滤波器的输出为Ｙｔ＝（Ｆｉｂ（１） × Ｘｔ－ｋ＋Ｆｉｂ（２） × Ｘｔ－ｋ＋１＋ … ＋Ｆｉｂ（Ｋ） × Ｘｔ）／ｔｏｔａｌＷｅｉｇｈｔ３．２建模方法用ＧＥＰ进行时间序列的建模和预测通常是将时间序列建模问题转换成符号回归问题，挖掘出对给定时间序列数据拟合度和对未来预测精度较高的函数模型，将用此函数模型计算未来可能的值。先求时间序列Ｘ（ｔ）的Ｍ阶延迟得到矩阵Ｘ，如式（４）所示，矩阵Ｘ中的元素与原序列对应关系为Ｘｊｉ＝ｘｊ＋１，然后把矩阵Ｘ中的第Ｎ－Ｍ＋１列看作是所求函数模型的因变量，其余每一列看作所求函数模型的一个自变量，因而窗口大小为Ｎ－Ｍ＋１，而矩阵Ｘ的每一行即为一个样本数据，则所求的目标函数模型可记为ｘＮ－Ｍ＝ｆ（ｘ０，ｘ１，…，ｘＮ－Ｍ）。接下来，ＧＥＰ根据输入样本，在给定函数符组成的所有可能函数表达空间中寻找拟合样本数据程度较佳的函数表达式。Ｘ＝ｘ１ｘ２ … ｘＮ－Ｍ＋１ｘ２ｘ３ … ｘＮ－Ｍ＋２ … … … … ｘＭｘＭ＋１ … ｘＮ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú ≡ ｘ１０ｘ１１ … ｘ１，Ｎ－Ｍｘ２０ｘ２１ … ｘ２，Ｎ－Ｍ … … … … ｘＭ０ｘＭ１ … ｘＭ，Ｎ－Ｍ é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú （４）３．３案例实验与结果分析３．３．１实验数据与方案本文分别用北京年降水量（１９４９－２０１３年，样本长度６５，下文简称“北京降水”）、广西桂平冬季月均降水量（１９５１－２０１３年，样本长度６３，下文简称“桂平降水”）和ＵＮＩＯＮＣＩＴＹ旱季的６月份降水量（１８８４－２００６年，样本长度１２３，位于美国新泽西州东北部，下文简称“ＵＮＩＯＮ降水”）这３个典型的不同区域和类型的降水量作为建模预测对象，检验 ·４０４· 智能系统学报第１１卷

第3期彭昱忠，等：个体最优共享GEP算法及其气象降水数据预测建模 ·405· BIS_GEP预测模型实用效果。这3组降水案例数据 valRatio=15/100,testRatio=15/100 的值分布如图4所示。其中，北京年降水数据逐年表1实验中的GEP及改进算法的主要参数变化差异较大，突变点多而尖锐，最大值是最小值的 Tablel Main parameters of GEPs on experiments 6倍之多，数据的分布曲线相当复杂：桂平降水数据参数名原始GEP ADF_GEP BIS GEP 尽管最大值是最小值的6倍之多，但其逐年变化曲最大进化代数 2000 线比北京年降水数据逐年变化曲线平滑，突变点少： UNION CITY降水数据波动幅度较小，数据的分布群体规模 100 曲线相对平稳。函数集 +,,X,/,sin,cos,exp,log,sqrt 1.42 终结符集 a,b,c,d,e,f 1.22 1.02 头长/同源基因头长 8/无 8/3 8/无 0.82 桂平冬季月均降水基因数/同源基因数 5/3 0.62 0.42 北京年降水交叉率（单点、两点一致） 0.2 0.2 0.2 unioneity6月份降水 0.22 变异率 0.25 0.25 0.25 0.02 年份基因迁移率(IS和RIS一致) 0.1 0.1 0.1 图4实验案例数据的值分布适应度函数 MREF Fig.4 The value distribution of experimental data 3.3.2收敛性验证实验与结果分析本文实验验证的主要方案是，先分别用原始本文首先对BIS_GEP算法的改进性能进行验 GEP算法、GEP改进算法ADF_GEP和本文所提证。分别用3种GEP算法对北京降水数据集、桂平 BIS_GEP算法对3个降水案例数据集进行拟合建降水数据集和UNION CITY降水数据集进行自动建模，观察和比较3种GEP算法的收敛过程，验证BIS 模，模型评价函数为平均相对误差。本文为避免因 _GEP收敛性能改善效果。然后用这3种方法，以进化过程中的初始几代的适应度与目标值间的差异及被大气科学领域运用较多的BP和NAR等神经过大影响收敛过程曲线图展示效果，在画图时均忽网络建模预测算法分别对3个降水案例数据集进行略前5代的收敛过程曲线。桂平降水数据集实验的建模与预测，比较分析所得结果进而验证BIS_GEP 进化过程（见图6）的前期适应度与中后期的差异较的建模预测性能。大，本文根据该收敛过程特点将其进化收敛过程图 3组实验均保留序列中最后10%的样本作为测拆分成5~125代（见图7(a))和125~2000代（见图7(b))两部分，以便更清晰地展示算法收敛过程试样本，其余样本为训练样本，采用逐月/年预报形式预测测试样本的结果。3组实验中所用的各算法的效果。的主要参数保持不变，其中，时间延迟系数都取1， 20.0 19.5 原始GEP平均嵌入维数取5。GEP相关算法的主要参数如表1所 19.0 BIS GEP平均 ADF GEP平均示，其中的终结符a,b,c,d,e,…分别代表目标函数 18.5 BIS GEP最佳 ADF GEP最佳 18.0 原始GEP最佳模型中的变量X。,X,…,X--1。本文实验中的 17.5 BP神经网络和NAR神经网络的均用MATLAB中 17.0 16.5 的神经网络相关类构建，隐层数均为20，BP采用的出周草兵后发会省信玉兰屋里园其他主要参数如下：传递函数为tansig,训练函数为进化代数 traingdm,epochs 10 000,Ir =0.000 1,mc=0.5; NAR采用的其他主要参数如下：trainRatio=70/1O0, 图5北京年降水量建模进化收敛过程 Fig onvergence process of precipitation modeling of Beijing

ＢＩＳ＿ＧＥＰ预测模型实用效果。这３组降水案例数据的值分布如图４所示。其中，北京年降水数据逐年变化差异较大，突变点多而尖锐，最大值是最小值的６倍之多，数据的分布曲线相当复杂；桂平降水数据尽管最大值是最小值的６倍之多，但其逐年变化曲线比北京年降水数据逐年变化曲线平滑，突变点少；ＵＮＩＯＮＣＩＴＹ降水数据波动幅度较小，数据的分布曲线相对平稳。图４实验案例数据的值分布Ｆｉｇ．４Ｔｈｅｖａｌｕｅｄｉｓｔｒｉｂｕｔｉｏｎｏｆｅｘｐｅｒｉｍｅｎｔａｌｄａｔａ本文实验验证的主要方案是，先分别用原始ＧＥＰ算法、ＧＥＰ改进算法ＡＤＦ＿ＧＥＰ和本文所提ＢＩＳ＿ＧＥＰ算法对３个降水案例数据集进行拟合建模，观察和比较３种ＧＥＰ算法的收敛过程，验证ＢＩＳ＿ＧＥＰ收敛性能改善效果。然后用这３种方法，以及被大气科学领域运用较多的ＢＰ和ＮＡＲ等神经网络建模预测算法分别对３个降水案例数据集进行建模与预测，比较分析所得结果进而验证ＢＩＳ＿ＧＥＰ的建模预测性能。３组实验均保留序列中最后１０％的样本作为测试样本，其余样本为训练样本，采用逐月／年预报形式预测测试样本的结果。３组实验中所用的各算法的主要参数保持不变，其中，时间延迟系数都取１，嵌入维数取５。ＧＥＰ相关算法的主要参数如表１所示，其中的终结符ａ，ｂ，ｃ，ｄ，ｅ，…分别代表目标函数模型中的变量Ｘ０，Ｘ１，…，ＸＮ－Ｍ－１。本文实验中的ＢＰ神经网络和ＮＡＲ神经网络的均用ＭＡＴＬＡＢ中的神经网络相关类构建，隐层数均为２０，ＢＰ采用的其他主要参数如下：传递函数为ｔａｎｓｉｇ，训练函数为ｔｒａｉｎｇｄｍ，ｅｐｏｃｈｓ＝１００００，ｌｒ＝０．０００１，ｍｃ＝０．５；ＮＡＲ采用的其他主要参数如下：ｔｒａｉｎＲａｔｉｏ＝７０／１００，ｖａｌＲａｔｉｏ＝１５／１００，ｔｅｓｔＲａｔｉｏ＝１５／１００。表１实验中的ＧＥＰ及改进算法的主要参数Ｔａｂｌｅ１ＭａｉｎｐａｒａｍｅｔｅｒｓｏｆＧＥＰｓｏｎｅｘｐｅｒｉｍｅｎｔｓ参数名原始ＧＥＰＡＤＦ＿ＧＥＰＢＩＳ＿ＧＥＰ最大进化代数２０００群体规模１００函数集＋，－，×，／，ｓｉｎ，ｃｏｓ，ｅｘｐ，ｌｏｇ，ｓｑｒｔ终结符集ａ，ｂ，ｃ，ｄ，ｅ，ｆ头长／同源基因头长８／无８／３８／无基因数／同源基因数５５／３５交叉率（单点、两点一致）０．２０．２０．２变异率０．２５０．２５０．２５基因迁移率（ＩＳ和ＲＩＳ一致）０．１０．１０．１适应度函数ＭＲＥＦ３．３．２收敛性验证实验与结果分析本文首先对ＢＩＳ＿ＧＥＰ算法的改进性能进行验证。分别用３种ＧＥＰ算法对北京降水数据集、桂平降水数据集和ＵＮＩＯＮＣＩＴＹ降水数据集进行自动建模，模型评价函数为平均相对误差。本文为避免因进化过程中的初始几代的适应度与目标值间的差异过大影响收敛过程曲线图展示效果，在画图时均忽略前５代的收敛过程曲线。桂平降水数据集实验的进化过程（见图６）的前期适应度与中后期的差异较大，本文根据该收敛过程特点将其进化收敛过程图拆分成５～１２５代（见图７（ａ））和１２５～２０００代（见图７（ｂ））两部分，以便更清晰地展示算法收敛过程的效果。图５北京年降水量建模进化收敛过程ＦｉｇＣ．５ｏｎｖｅｒｇｅｎｃｅｐｒｏｃｅｓｓｏｆｐｒｅｃｉｐｉｔａｔｉｏｎｍｏｄｅｌｉｎｇｏｆＢｅｉｊｉｎｇ第３期彭昱忠，等：个体最优共享ＧＥＰ算法及其气象降水数据预测建模 ·４０５·

·406· 智能系统学报第11卷 62 优。5)从图5~8可知，UNION CITY降水实验的平 %/W) 均相对误差比北京降水实验和桂平降水实验的明显 ADF GEP最佳小很多，桂平降水实验的平均相对误差也比北京降原始GEP平均 BIS GEP最佳水实验的明显小很多。这说明了GEP算法在进行 21D 原始GEP最佳 ADF GEP平均 BIS GEP平均 UNION CITY降水自动建模中的效果最好，在北京降水自动建模中的效果较差。三益从图4可看出UNION CITY的降水量数据波动进化代数范围相对较小、数据分布相对平稳、噪声少，而北京图6桂平冬季月均降水量建模进化收敛过程图降水数据逐年变化差异较大、突变点多而尖锐、最大 Fig.6 Convergence process of precipitation modeling of 值与最小值差距大、数据的分布曲线相当复杂。这 Guiping 些数据集的特点与4)和5)的情况充分表明了时间 BIS_GEP、原始GEP和ADF_GEP等对3组不序列建模的效果与数据集的复杂程度呈强相关，建同数据集的自动建模的进化收敛实验结果如图5~8 模数据分布和变化越简单，自动建模的平均相对误所示。由图可知：1)图5~8均表明了BIS_GEP算差越小，建模效果越好。法在这3组不同数据集的自动建模过程中，无论是 72 10次运行结果的平均值，还是最佳运行状况，BIS 62 GEP比原始GEP和ADF_GEP均有更好的收敛性 52 能和寻优结果表现。这充分说明了本文提出的改进 42 方法的有效性和优越性。2)图5~8中的左边部分 32 显示的进化过程初期的适应度曲线均显示了在算法 BIS GEP最佳原始GEP平均 22 ADF GEP最佳进化的初期，如图5显示的北京降水实验中的前70 BIS GEP平均原始GEP最佳 ADF GEP平均代、图7(a)显示的桂平降水实验中的前40代和图8 显示的UNION CITY降水实验中的前200代，BIS_ 8 GEP,原始GEP和ADF_GEP这3种GEP算法有近进化代数似的收敛性能表现。它们几乎都以极快速度趋于目 (a)generation 5~125 标方向收敛，然后收敛速度逐渐减小，甚至不同程度 7.3 地进入收敛缓慢状态，陷入局部最优。这说明了 BIS GEP最佳 6.6 GEP算法存在着遗传算法家族常见的不足一前原始GEP最佳ADF_GEP最佳期收敛快，后期收敛缓慢甚至陷入局部最优。3)图 %/HW) 6.0 5.4 BIS GEP平均 5、图7~8中的右边的适应度曲线均显示的进化过 4.9 原始GEP平均程中后期的BIS_GEP算法的适应度迭代进化比同 4.3 阶段的原始GEP和ADF_GEP的更频繁，更能跳出 3.7 ADF GEP平均局部最优而向全局最优方向逼近。这表明了经过本 3.1 文提出的个体最优共享改进GEP算法可有效改善 2.5 安 GEP算法后期收敛缓慢状态和易陷入局部最优的进化代数不足，寻优性能比原始GEP和ADF_GEP有显著的 (b)generation 125-2 000 提高。4)在UNION CITY的降水实验中，BIS_GEP、图7桂平冬季月均降水量建模进化收敛过程二分解图原始GEP和ADF_GEP这3种GEP算法在前6OO Fig.7 Second decomposition for convergence process of 代的适应度迭代进化较北京降水实验和桂平降水实 precipitation modeling of Guiping 验的表现更明显和更频繁，且更快速地逼近全局最

图６桂平冬季月均降水量建模进化收敛过程图Ｆｉｇ．６ＣｏｎｖｅｒｇｅｎｃｅｐｒｏｃｅｓｓｏｆｐｒｅｃｉｐｉｔａｔｉｏｎｍｏｄｅｌｉｎｇｏｆＧｕｉｐｉｎｇＢＩＳ＿ＧＥＰ、原始ＧＥＰ和ＡＤＦ＿ＧＥＰ等对３组不同数据集的自动建模的进化收敛实验结果如图５～８所示。由图可知：１）图５～８均表明了ＢＩＳ＿ＧＥＰ算法在这３组不同数据集的自动建模过程中，无论是１０次运行结果的平均值，还是最佳运行状况，ＢＩＳ＿ＧＥＰ比原始ＧＥＰ和ＡＤＦ＿ＧＥＰ均有更好的收敛性能和寻优结果表现。这充分说明了本文提出的改进方法的有效性和优越性。２）图５～８中的左边部分显示的进化过程初期的适应度曲线均显示了在算法进化的初期，如图５显示的北京降水实验中的前７０代、图７（ａ）显示的桂平降水实验中的前４０代和图８显示的ＵＮＩＯＮＣＩＴＹ降水实验中的前２００代，ＢＩＳ＿ＧＥＰ、原始ＧＥＰ和ＡＤＦ＿ＧＥＰ这３种ＧＥＰ算法有近似的收敛性能表现。它们几乎都以极快速度趋于目标方向收敛，然后收敛速度逐渐减小，甚至不同程度地进入收敛缓慢状态，陷入局部最优。这说明了ＧＥＰ算法存在着遗传算法家族常见的不足———前期收敛快，后期收敛缓慢甚至陷入局部最优。３）图５、图７～８中的右边的适应度曲线均显示的进化过程中后期的ＢＩＳ＿ＧＥＰ算法的适应度迭代进化比同阶段的原始ＧＥＰ和ＡＤＦ＿ＧＥＰ的更频繁，更能跳出局部最优而向全局最优方向逼近。这表明了经过本文提出的个体最优共享改进ＧＥＰ算法可有效改善ＧＥＰ算法后期收敛缓慢状态和易陷入局部最优的不足，寻优性能比原始ＧＥＰ和ＡＤＦ＿ＧＥＰ有显著的提高。４）在ＵＮＩＯＮＣＩＴＹ的降水实验中，ＢＩＳ＿ＧＥＰ、原始ＧＥＰ和ＡＤＦ＿ＧＥＰ这３种ＧＥＰ算法在前６００代的适应度迭代进化较北京降水实验和桂平降水实验的表现更明显和更频繁，且更快速地逼近全局最优。５）从图５～８可知，ＵＮＩＯＮＣＩＴＹ降水实验的平均相对误差比北京降水实验和桂平降水实验的明显小很多，桂平降水实验的平均相对误差也比北京降水实验的明显小很多。这说明了ＧＥＰ算法在进行ＵＮＩＯＮＣＩＴＹ降水自动建模中的效果最好，在北京降水自动建模中的效果较差。从图４可看出ＵＮＩＯＮＣＩＴＹ的降水量数据波动范围相对较小、数据分布相对平稳、噪声少，而北京降水数据逐年变化差异较大、突变点多而尖锐、最大值与最小值差距大、数据的分布曲线相当复杂。这些数据集的特点与４）和５）的情况充分表明了时间序列建模的效果与数据集的复杂程度呈强相关，建模数据分布和变化越简单，自动建模的平均相对误差越小，建模效果越好。（ａ）ｇｅｎｅｒａｔｉｏｎ５～１２５（ｂ）ｇｅｎｅｒａｔｉｏｎ１２５～２０００图７桂平冬季月均降水量建模进化收敛过程二分解图Ｆｉｇ．７ＳｅｃｏｎｄｄｅｃｏｍｐｏｓｉｔｉｏｎｆｏｒｃｏｎｖｅｒｇｅｎｃｅｐｒｏｃｅｓｓｏｆｐｒｅｃｉｐｉｔａｔｉｏｎｍｏｄｅｌｉｎｇｏｆＧｕｉｐｉｎｇ ·４０６· 智能系统学报第１１卷

第3期彭昱忠，等：个体最优共享GEP算法及其气象降水数据预测建模 .407. 表2各算法的3组降水案例数据集建模与预测实验结果 Table2 Experimental results of mentioned algorithms of modeling and forecasting on 3 group of precipitation cases BIS_GEP ADF_GEP 原始GEP BP NAR 数据与指标拟合预测拟合预测拟合预测拟合预测拟合预测 MREF最佳 16.64 23.71 16.85 24.98 16.87 26.78 27.48 47.15 29.17 36.77 北京降水 MREF平均 17.22 24.85 17.34 27.13 17.80 29.17 28.38 51.64 30.42 37.89 MREF最佳 2.57 7.16 2.92 7.83 2.95 8.04 15.69 30.86 10.97 19.65 桂平降水 MREF平均 3.16 10.25 3.28 11.51 3.90 12.18 17.08 32.17 12.29 21.83 MREF最佳0.02120.0347 0.02230.03620.02240.03921.20513.22110.08720.3682 UNION降水 MREF平均0.02230.04160.02410.04340.02370.04671.37843.75630.09650.4113 3.3.3建模与预测效果比较验证法更好。而BIS_GEP算法在实验上获得较其他算 BIS_GEP算法与其他GEP算法和气象界常用法更好的数据模型拟合性能和预测性能，模型具有神经算法进行了自动建模与预测比较实验，取3组一定的适用性。在UNION CITY降水数据集上的数降水案例数据集的后10%样本（北京降水和桂平降据拟合和预测的平均相对误差10次运行得的最佳水的数据集均取2008-2013年的样本，UNION CITY 值分别达到0.021%和0.034%。据表3数据可知，降水数据集取1995-2006年样本)作为预测的检验 BIS_GEP比实验中效果第二好的ADF_GEP的相应样本，其余样本为训练样本。采用逐月/年预报形式 MREF最佳值分别减少了4.93%和5.55%。这比实预测检验样本的结果，如，用1949-2007年真实的验中效果最差的BP的相应MREF最佳值分别减少北京降水数据建模所得模型预测2008年北京降水了99.45%和99.89%。即使在逐年变化差异较大、量，接着继续用1949-2008年真实的北京降水数据突变点多而尖锐、最大值与最小值差距大、数据的分建模所得模型预测2009年北京降水量，依次类推。布曲线相当复杂的北京降水数据集上，数据拟合和同理，用于北京降水、桂平降水和UNION CITY降水预测时，BIS_GEP算法的平均相对误差也都能分别实验中。比较结果如表2所示，MREF最佳预测值保持在18%和25%以内。据表3数据可知BIS 是取10独立运行算法所得的10次各个预测检验样 GEP比实验中效果第二好的ADF_GEP的相应本预测结果平均值中的最小者，而MREF平均预测 MREF最佳值分别减少了1.25%和5.08%。这比实值是取10独立运行算法所得的10次各个预测检验验中拟合效果最差的NAR和预测效果最差的BP 样本预测结果的综合平均值。的相应MREF最佳值分别减少了42.94%和 ×103 49.71%。这些实验对比结果充分表明了本文提出的 0.0275 BIS_GEP算法较其他算法在降水序列数据自动建 0.0265 模和预测上有较强优势。 0.0255 -ADF GEP平均 ADF GEP最佳 BIS GEP最佳 4 0.0245 结束语原始GEP最佳 BIS GEP平均 0.0235 原始GEP平均本文提出了一种个体最优共享的GEP改进算 0.0225 法BIS_GEP,并在3组真实时间序列的自动建模和 0.0215 预测实验中，与原始GEP算法、另一经典的GEP改 “的苦牌学兰的芳学兰的羊兰兰的进算法ADF_GEP,以及BP神经网络和NAR神经进化代数网络进行比较。算法收敛过程实验对比结果表明图8 UNION CITY每年6月降水量建模进化收敛过程 BIS_GEP能相对改善GEP进化后期收敛缓慢和容 Fig.8 Convergence process of precipitation modeling of 易陷入局部最优的缺陷，具有更强的逼近最优能力： UNION CITY 自动建模能力与预测能力实验对比结果表明，BS GEP在3组不同类型的降水数据的数据拟合和数从表3可看出，总体上，在3组不同类型和不同据预测实验中，10次独立运行的最佳平均相对误差复杂度的真实降水数据集的实验中的3种GEP方和平均相对误差均比实验中的其他GEP算法和神法的拟合和预测实验结果均比另外两种神经网络方经网络算法更小，说明其自动建模能力和模型泛化

表２各算法的３组降水案例数据集建模与预测实验结果Ｔａｂｌｅ２Ｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｏｆｍｅｎｔｉｏｎｅｄａｌｇｏｒｉｔｈｍｓｏｆｍｏｄｅｌｉｎｇａｎｄｆｏｒｅｃａｓｔｉｎｇｏｎ３ｇｒｏｕｐｏｆｐｒｅｃｉｐｉｔａｔｉｏｎｃａｓｅｓ数据与指标ＢＩＳ＿ＧＥＰＡＤＦ＿ＧＥＰ原始ＧＥＰＢＰＮＡＲ拟合预测拟合预测拟合预测拟合预测拟合预测北京降水ＭＲＥＦ最佳１６．６４２３．７１１６．８５２４．９８１６．８７２６．７８２７．４８４７．１５２９．１７３６．７７ＭＲＥＦ平均１７．２２２４．８５１７．３４２７．１３１７．８０２９．１７２８．３８５１．６４３０．４２３７．８９桂平降水ＭＲＥＦ最佳２．５７７．１６２．９２７．８３２．９５８．０４１５．６９３０．８６１０．９７１９．６５ＭＲＥＦ平均３．１６１０．２５３．２８１１．５１３．９０１２．１８１７．０８３２．１７１２．２９２１．８３ＵＮＩＯＮ降水ＭＲＥＦ最佳０．０２１２０．０３４７０．０２２３０．０３６２０．０２２４０．０３９２１．２０５１３．２２１１０．０８７２０．３６８２ＭＲＥＦ平均０．０２２３０．０４１６０．０２４１０．０４３４０．０２３７０．０４６７１．３７８４３．７５６３０．０９６５０．４１１３３．３．３建模与预测效果比较验证ＢＩＳ＿ＧＥＰ算法与其他ＧＥＰ算法和气象界常用神经算法进行了自动建模与预测比较实验，取３组降水案例数据集的后１０％样本（北京降水和桂平降水的数据集均取２００８－２０１３年的样本，ＵＮＩＯＮＣＩＴＹ降水数据集取１９９５－２００６年样本）作为预测的检验样本，其余样本为训练样本。采用逐月／年预报形式预测检验样本的结果，如，用１９４９－２００７年真实的北京降水数据建模所得模型预测２００８年北京降水量，接着继续用１９４９－２００８年真实的北京降水数据建模所得模型预测２００９年北京降水量，依次类推。同理，用于北京降水、桂平降水和ＵＮＩＯＮＣＩＴＹ降水实验中。比较结果如表２所示，ＭＲＥＦ最佳预测值是取１０独立运行算法所得的１０次各个预测检验样本预测结果平均值中的最小者，而ＭＲＥＦ平均预测值是取１０独立运行算法所得的１０次各个预测检验样本预测结果的综合平均值。图８ＵＮＩＯＮＣＩＴＹ每年６月降水量建模进化收敛过程Ｆｉｇ．８ＣｏｎｖｅｒｇｅｎｃｅｐｒｏｃｅｓｓｏｆｐｒｅｃｉｐｉｔａｔｉｏｎｍｏｄｅｌｉｎｇｏｆＵＮＩＯＮＣＩＴＹ从表３可看出，总体上，在３组不同类型和不同复杂度的真实降水数据集的实验中的３种ＧＥＰ方法的拟合和预测实验结果均比另外两种神经网络方法更好。而ＢＩＳ＿ＧＥＰ算法在实验上获得较其他算法更好的数据模型拟合性能和预测性能，模型具有一定的适用性。在ＵＮＩＯＮＣＩＴＹ降水数据集上的数据拟合和预测的平均相对误差１０次运行得的最佳值分别达到０．０２１％和０．０３４％。据表３数据可知，ＢＩＳ＿ＧＥＰ比实验中效果第二好的ＡＤＦ＿ＧＥＰ的相应ＭＲＥＦ最佳值分别减少了４．９３％和５．５５％。这比实验中效果最差的ＢＰ的相应ＭＲＥＦ最佳值分别减少了９９．４５％和９９．８９％。即使在逐年变化差异较大、突变点多而尖锐、最大值与最小值差距大、数据的分布曲线相当复杂的北京降水数据集上，数据拟合和预测时，ＢＩＳ＿ＧＥＰ算法的平均相对误差也都能分别保持在１８％和２５％以内。据表３数据可知ＢＩＳ＿ＧＥＰ比实验中效果第二好的ＡＤＦ＿ＧＥＰ的相应ＭＲＥＦ最佳值分别减少了１．２５％和５．０８％。这比实验中拟合效果最差的ＮＡＲ和预测效果最差的ＢＰ的相应ＭＲＥＦ最佳值分别减少了４２．９４％和４９．７１％。这些实验对比结果充分表明了本文提出的ＢＩＳ＿ＧＥＰ算法较其他算法在降水序列数据自动建模和预测上有较强优势。４结束语本文提出了一种个体最优共享的ＧＥＰ改进算法ＢＩＳ＿ＧＥＰ，并在３组真实时间序列的自动建模和预测实验中，与原始ＧＥＰ算法、另一经典的ＧＥＰ改进算法ＡＤＦ＿ＧＥＰ，以及ＢＰ神经网络和ＮＡＲ神经网络进行比较。算法收敛过程实验对比结果表明ＢＩＳ＿ＧＥＰ能相对改善ＧＥＰ进化后期收敛缓慢和容易陷入局部最优的缺陷，具有更强的逼近最优能力；自动建模能力与预测能力实验对比结果表明，ＢＩＳ＿ＧＥＰ在３组不同类型的降水数据的数据拟合和数据预测实验中，１０次独立运行的最佳平均相对误差和平均相对误差均比实验中的其他ＧＥＰ算法和神经网络算法更小，说明其自动建模能力和模型泛化第３期彭昱忠，等：个体最优共享ＧＥＰ算法及其气象降水数据预测建模 ·４０７·

·408· 智能系统学报第11卷能力均有较强的优势。 [7]ZHAO Huasheng,JIN Long,HUANG Ying,et al.An ob- 对3组不同类型和不同复杂度的真实降水数据 jective prediction model for typhoon rainstorm using particle 集的拟合和预测的对比实验结果表明，本文BS_ swarm optimization:neural network ensemble[J].Natural GEP算法对降雨时间序列数据的建模和预测结果 hazards,2014,73(2):427-437. 比传统GEP及其改进算法ADF_GEP、常用的BP和 [8]HE Suhong,FENG Taichen,GONG Yanchun,et al.Pre- dicting extreme rainfall over eastern Asia by using complex NAR神经网络自动建和预测算法的效果好，模型具 networks[J].Chinese physics B,2014,23(5):059202. 有一定的适用性，同时由于该算法模型对资料要求 [9]WU Jiansheng,LONG Jin,LIU Mingzhe.Evolving RBF 比较单一，只需降水历史数据，因而具有广泛的应 neural networks for rainfall prediction using hybrid particle 用价值。 swarm optimization and genetic algorithm[J].Neurocomput- 总之，BIS_GEP的改进是有效的，并为气象时 ing,2015,148:136-142. 间序列预测建模提供了一种切实可行的方法。下一 [10]DHANYA C T,KUMAR D N.Data mining for evolving 步工作是进一步研究和修改BIS_GEP算法，并将其 fuzzy association rules for predicting monsoon rainfall of In- 应用于高维多要素气象预测建模的研究和应用中。 dia[J].Journal of intelligent systems,2009.18(3):193- 另外，该方法若在实际业务中大规模推广应用还有 210. 若干问题有待解决，如海量高维气象数据建模的适 [11]TERZI O.Monthly rainfall estimation using data-mining process[J].Applied computational intelligence and soft 应性和稳定性问题等，都有待进一步研究。 computing,2012,2012:698071. 参考文献： [12]BERNARD E,NAVEAU P,VRAC M,et al.Clustering of maxima:spatial dependencies among heavy rainfall in [1]彭显忠，王谦，元昌安，等.数据挖掘技术在气象预报 France[J].Journal of climate,2013,26(20):7929- 研究中的应用J].干旱气象，2015,33(1)：19-27. 7937. PENG Yuzhong,WANG Qian,YUAN Chang'an,et al. [13]TENG Shaohua,FAN Jihui,ZHU Haibin,et al.A cooper- Review of research on data mining in application of meteoro- ative multi-classifier method for local area meteorological logical forecasting[J].Journal of arid meteorology,2015, data mining[C]//Proceedings of the 18th IEEE Interna- 33(1):19-27. tional Conference on Computer Supported Cooperative [2]金龙，吴建生，林开平，等.基于遗传算法的神经网络 Work in Design.Hsinchu,Taiwan,China,2014:435- 短期气候预测模型[J].高原气象，2005,24(6)：981- 440. 987 [14]FERREIRA C.Gene expression programming:mathemati- JIN Long,WU Jiansheng,LIN Kaiping,et al.Short-term cal modeling by artificial intelligence[M].Portugal:Angra climate prediction model of neural network based on genetic do Heroismo,2002:1-15. algorithms[J].Plateau meteorology,2005,24(6):981- [15]胡建军，唐常杰，段磊，等.基因表达式编程初始种群 987 的多样化策略[J].计算机学报，2007,30(2)：305- [3]EL-SHAFIE A,JAAFER O,AKRAMI S A.Adaptive neu- 310. ro-fuzzy inference system based model for rainfall forecas- HU Jianjun,TANG Changiie,DUAN Lei,et al.The strat- ting in Klang River,Malaysia[J].International journal of egy for diversifying initial population of gene expression the physical sciences,2011,6(12):2875-2885 programming[J].Chinese journal of computers,2007,30 [4]GOSAV S,TIRON G.Artificial neural networks built for the (2):305-310. rainfall estimation using a concatenated database[J].Envi- [16]李太勇，唐常杰，吴江，等.基因表达式编程种群多样 ronmental engineering and management journal,2012,11 性自适应调控算法[J].电子科技大学学报，2010,39 (8):1383-1388. (2):279-283. [5]VENKADESH S,HOOGENBOOM G,POTTER W,et al. LI Taiyong,TANG Changjie,WU Jiang,et al.Adaptive A genetic algorithm to refine input data selection for air tem- population diversity tuning algorithm for gene expression perature prediction using artificial neural networks[J].Ap- programming[].Journal of university of electronic science plied soft computing,2013,13(5):2253-2260. and technology of China,2010,39(2):279-283. [6]RAHMAN M,SAIFUL ISLAM A H M,NADVI S Y M,et [17]宣士斌，刘怡光.基于混合差异度控制的基因表达式编 al.Comparative study of ANFIS and ARIMA model for 程[J].模式识别与人工智能，2012,25(2)：186-194. weather forecasting in Dhaka[C]//Proceedings of IEEE in- XUAN Shibin,LIU Yiguang.GEP evolution algorithm ternational conference on informatics,electronics vision. based on control of mixed diversity degree[J].Pattern rec- Dhaka,Bangladesh,2013:1-6. ognition artificial intelligence,2012,25(2):186-194

能力均有较强的优势。对３组不同类型和不同复杂度的真实降水数据集的拟合和预测的对比实验结果表明，本文ＢＩＳ＿ＧＥＰ算法对降雨时间序列数据的建模和预测结果比传统ＧＥＰ及其改进算法ＡＤＦ＿ＧＥＰ、常用的ＢＰ和ＮＡＲ神经网络自动建和预测算法的效果好，模型具有一定的适用性，同时由于该算法模型对资料要求比较单一，只需降水历史数据，因而具有广泛的应用价值。总之，ＢＩＳ＿ＧＥＰ的改进是有效的，并为气象时间序列预测建模提供了一种切实可行的方法。下一步工作是进一步研究和修改ＢＩＳ＿ＧＥＰ算法，并将其应用于高维多要素气象预测建模的研究和应用中。另外，该方法若在实际业务中大规模推广应用还有若干问题有待解决，如海量高维气象数据建模的适应性和稳定性问题等，都有待进一步研究。参考文献：［１］彭昱忠，王谦，元昌安，等．数据挖掘技术在气象预报研究中的应用［Ｊ］．干旱气象，２０１５，３３（１）：１９⁃２７．ＰＥＮＧＹｕｚｈｏｎｇ，ＷＡＮＧＱｉａｎ，ＹＵＡＮＣｈａｎｇ’ ａｎ，ｅｔａｌ．Ｒｅｖｉｅｗｏｆｒｅｓｅａｒｃｈｏｎｄａｔａｍｉｎｉｎｇｉｎａｐｐｌｉｃａｔｉｏｎｏｆｍｅｔｅｏｒｏ⁃ ｌｏｇｉｃａｌｆｏｒｅｃａｓｔｉｎｇ［Ｊ］．Ｊｏｕｒｎａｌｏｆａｒｉｄｍｅｔｅｏｒｏｌｏｇｙ，２０１５，３３（１）：１９⁃２７．［２］金龙，吴建生，林开平，等．基于遗传算法的神经网络短期气候预测模型［Ｊ］．高原气象，２００５，２４（６）：９８１⁃ ９８７．ＪＩＮＬｏｎｇ，ＷＵＪｉａｎｓｈｅｎｇ，ＬＩＮＫａｉｐｉｎｇ，ｅｔａｌ．Ｓｈｏｒｔ⁃ｔｅｒｍｃｌｉｍａｔｅｐｒｅｄｉｃｔｉｏｎｍｏｄｅｌｏｆｎｅｕｒａｌｎｅｔｗｏｒｋｂａｓｅｄｏｎｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍｓ［Ｊ］．Ｐｌａｔｅａｕｍｅｔｅｏｒｏｌｏｇｙ，２００５，２４（６）：９８１⁃ ９８７．［３］ＥＬ⁃ＳＨＡＦＩＥＡ，ＪＡＡＦＥＲＯ，ＡＫＲＡＭＩＳＡ．Ａｄａｐｔｉｖｅｎｅｕ⁃ ｒｏ⁃ｆｕｚｚｙｉｎｆｅｒｅｎｃｅｓｙｓｔｅｍｂａｓｅｄｍｏｄｅｌｆｏｒｒａｉｎｆａｌｌｆｏｒｅｃａｓ⁃ ｔｉｎｇｉｎＫｌａｎｇＲｉｖｅｒ，Ｍａｌａｙｓｉａ［Ｊ］．Ｉｎｔｅｒｎａｔｉｏｎａｌｊｏｕｒｎａｌｏｆｔｈｅｐｈｙｓｉｃａｌｓｃｉｅｎｃｅｓ，２０１１，６（１２）：２８７５⁃２８８５．［４］ＧＯＳＡＶＳ，ＴＩＲＯＮＧ．Ａｒｔｉｆｉｃｉａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓｂｕｉｌｔｆｏｒｔｈｅｒａｉｎｆａｌｌｅｓｔｉｍａｔｉｏｎｕｓｉｎｇａｃｏｎｃａｔｅｎａｔｅｄｄａｔａｂａｓｅ［Ｊ］．Ｅｎｖｉ⁃ ｒｏｎｍｅｎｔａｌｅｎｇｉｎｅｅｒｉｎｇａｎｄｍａｎａｇｅｍｅｎｔｊｏｕｒｎａｌ，２０１２，１１（８）：１３８３⁃１３８８．［５］ＶＥＮＫＡＤＥＳＨＳ，ＨＯＯＧＥＮＢＯＯＭＧ，ＰＯＴＴＥＲＷ，ｅｔａｌ．Ａｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍｔｏｒｅｆｉｎｅｉｎｐｕｔｄａｔａｓｅｌｅｃｔｉｏｎｆｏｒａｉｒｔｅｍ⁃ ｐｅｒａｔｕｒｅｐｒｅｄｉｃｔｉｏｎｕｓｉｎｇａｒｔｉｆｉｃｉａｌｎｅｕｒａｌｎｅｔｗｏｒｋｓ［Ｊ］．Ａｐ⁃ ｐｌｉｅｄｓｏｆｔｃｏｍｐｕｔｉｎｇ，２０１３，１３（５）：２２５３⁃２２６０．［６］ＲＡＨＭＡＮＭ，ＳＡＩＦＵＬＩＳＬＡＭＡＨＭ，ＮＡＤＶＩＳＹＭ，ｅｔａｌ．ＣｏｍｐａｒａｔｉｖｅｓｔｕｄｙｏｆＡＮＦＩＳａｎｄＡＲＩＭＡｍｏｄｅｌｆｏｒｗｅａｔｈｅｒｆｏｒｅｃａｓｔｉｎｇｉｎＤｈａｋａ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆＩＥＥＥｉｎ⁃ ｔｅｒｎａｔｉｏｎａｌｃｏｎｆｅｒｅｎｃｅｏｎｉｎｆｏｒｍａｔｉｃｓ，ｅｌｅｃｔｒｏｎｉｃｓ＆ｖｉｓｉｏｎ．Ｄｈａｋａ，Ｂａｎｇｌａｄｅｓｈ，２０１３：１⁃６．［７］ＺＨＡＯＨｕａｓｈｅｎｇ，ＪＩＮＬｏｎｇ，ＨＵＡＮＧＹｉｎｇ，ｅｔａｌ．Ａｎｏｂ⁃ ｊｅｃｔｉｖｅｐｒｅｄｉｃｔｉｏｎｍｏｄｅｌｆｏｒｔｙｐｈｏｏｎｒａｉｎｓｔｏｒｍｕｓｉｎｇｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ：ｎｅｕｒａｌｎｅｔｗｏｒｋｅｎｓｅｍｂｌｅ［Ｊ］．Ｎａｔｕｒａｌｈａｚａｒｄｓ，２０１４，７３（２）：４２７⁃４３７．［８］ＨＥＳｕｈｏｎｇ，ＦＥＮＧＴａｉｃｈｅｎ，ＧＯＮＧＹａｎｃｈｕｎ，ｅｔａｌ．Ｐｒｅ⁃ ｄｉｃｔｉｎｇｅｘｔｒｅｍｅｒａｉｎｆａｌｌｏｖｅｒｅａｓｔｅｒｎＡｓｉａｂｙｕｓｉｎｇｃｏｍｐｌｅｘｎｅｔｗｏｒｋｓ［Ｊ］．ＣｈｉｎｅｓｅｐｈｙｓｉｃｓＢ，２０１４，２３（５）：０５９２０２．［９］ＷＵＪｉａｎｓｈｅｎｇ，ＬＯＮＧＪｉｎ，ＬＩＵＭｉｎｇｚｈｅ．ＥｖｏｌｖｉｎｇＲＢＦｎｅｕｒａｌｎｅｔｗｏｒｋｓｆｏｒｒａｉｎｆａｌｌｐｒｅｄｉｃｔｉｏｎｕｓｉｎｇｈｙｂｒｉｄｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎａｎｄｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍ［Ｊ］．Ｎｅｕｒｏｃｏｍｐｕｔ⁃ ｉｎｇ，２０１５，１４８：１３６⁃１４２．［１０］ＤＨＡＮＹＡＣＴ，ＫＵＭＡＲＤＮ．ＤａｔａｍｉｎｉｎｇｆｏｒｅｖｏｌｖｉｎｇｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓｆｏｒｐｒｅｄｉｃｔｉｎｇｍｏｎｓｏｏｎｒａｉｎｆａｌｌｏｆＩｎ⁃ ｄｉａ［Ｊ］．Ｊｏｕｒｎａｌｏｆｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２００９，１８（３）：１９３⁃ ２１０．［１１］ＴＥＲＺＩＯ．Ｍｏｎｔｈｌｙｒａｉｎｆａｌｌｅｓｔｉｍａｔｉｏｎｕｓｉｎｇｄａｔａ⁃ｍｉｎｉｎｇｐｒｏｃｅｓｓ［Ｊ］．Ａｐｐｌｉｅｄｃｏｍｐｕｔａｔｉｏｎａｌｉｎｔｅｌｌｉｇｅｎｃｅａｎｄｓｏｆｔｃｏｍｐｕｔｉｎｇ，２０１２，２０１２：６９８０７１．［１２］ＢＥＲＮＡＲＤＥ，ＮＡＶＥＡＵＰ，ＶＲＡＣＭ，ｅｔａｌ．Ｃｌｕｓｔｅｒｉｎｇｏｆｍａｘｉｍａ：ｓｐａｔｉａｌｄｅｐｅｎｄｅｎｃｉｅｓａｍｏｎｇｈｅａｖｙｒａｉｎｆａｌｌｉｎＦｒａｎｃｅ［Ｊ］．Ｊｏｕｒｎａｌｏｆｃｌｉｍａｔｅ，２０１３，２６（２０）：７９２９⁃ ７９３７．［１３］ＴＥＮＧＳｈａｏｈｕａ，ＦＡＮＪｉｈｕｉ，ＺＨＵＨａｉｂｉｎ，ｅｔａｌ．Ａｃｏｏｐｅｒ⁃ ａｔｉｖｅｍｕｌｔｉ⁃ｃｌａｓｓｉｆｉｅｒｍｅｔｈｏｄｆｏｒｌｏｃａｌａｒｅａｍｅｔｅｏｒｏｌｏｇｉｃａｌｄａｔａｍｉｎｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１８ｔｈＩＥＥＥＩｎｔｅｒｎａ⁃ ｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＳｕｐｐｏｒｔｅｄＣｏｏｐｅｒａｔｉｖｅＷｏｒｋｉｎＤｅｓｉｇｎ．Ｈｓｉｎｃｈｕ，Ｔａｉｗａｎ，Ｃｈｉｎａ，２０１４：４３５⁃ ４４０．［１４］ＦＥＲＲＥＩＲＡＣ．Ｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ：ｍａｔｈｅｍａｔｉ⁃ ｃａｌｍｏｄｅｌｉｎｇｂｙａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ［Ｍ］．Ｐｏｒｔｕｇａｌ：ＡｎｇｒａｄｏＨｅｒｏｉｓｍｏ，２００２：１⁃１５．［１５］胡建军，唐常杰，段磊，等．基因表达式编程初始种群的多样化策略［Ｊ］．计算机学报，２００７，３０（２）：３０５⁃ ３１０．ＨＵＪｉａｎｊｕｎ，ＴＡＮＧＣｈａｎｇｊｉｅ，ＤＵＡＮＬｅｉ，ｅｔａｌ．Ｔｈｅｓｔｒａｔ⁃ ｅｇｙｆｏｒｄｉｖｅｒｓｉｆｙｉｎｇｉｎｉｔｉａｌｐｏｐｕｌａｔｉｏｎｏｆｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ［Ｊ］．Ｃｈｉｎｅｓｅｊｏｕｒｎａｌｏｆｃｏｍｐｕｔｅｒｓ，２００７，３０（２）：３０５⁃３１０．［１６］李太勇，唐常杰，吴江，等．基因表达式编程种群多样性自适应调控算法［Ｊ］．电子科技大学学报，２０１０，３９（２）：２７９⁃２８３．ＬＩＴａｉｙｏｎｇ，ＴＡＮＧＣｈａｎｇｊｉｅ，ＷＵＪｉａｎｇ，ｅｔａｌ．Ａｄａｐｔｉｖｅｐｏｐｕｌａｔｉｏｎｄｉｖｅｒｓｉｔｙｔｕｎｉｎｇａｌｇｏｒｉｔｈｍｆｏｒｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ［Ｊ］．ＪｏｕｒｎａｌｏｆｕｎｉｖｅｒｓｉｔｙｏｆｅｌｅｃｔｒｏｎｉｃｓｃｉｅｎｃｅａｎｄｔｅｃｈｎｏｌｏｇｙｏｆＣｈｉｎａ，２０１０，３９（２）：２７９⁃２８３．［１７］宣士斌，刘怡光．基于混合差异度控制的基因表达式编程［Ｊ］．模式识别与人工智能，２０１２，２５（２）：１８６⁃１９４．ＸＵＡＮＳｈｉｂｉｎ，ＬＩＵＹｉｇｕａｎｇ．ＧＥＰｅｖｏｌｕｔｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｃｏｎｔｒｏｌｏｆｍｉｘｅｄｄｉｖｅｒｓｉｔｙｄｅｇｒｅｅ［Ｊ］．Ｐａｔｔｅｒｎｒｅｃ⁃ ｏｇｎｉｔｉｏｎ＆ａｒｔｉｆｉｃｉａｌｉｎｔｅｌｌｉｇｅｎｃｅ，２０１２，２５（２）：１８６⁃１９４． ·４０８· 智能系统学报第１１卷

第3期彭昱忠，等：个体最优共享GEP算法及其气象降水数据预测建模 409· [18]TANG Changjie,DUAN Lei,PENG Jing,et al.The strat- Journal of frontiers of computer science and technology, egies to improve performance of function mining by gene 2014,8(1):90-102. expression programming:genetic modifying,overlapped [24]陈宇，唐常杰，钟义啸，等.基于基因表达式编程和时 gene,backtracking and adaptive mutation[C]//Proceed- 变强度的时间序列预测[J].计算机科学，2005,32(7 ings of the 17th Data Engineering Workshop.Ginowan,Ja- Suppl.B):269-271. pan,2006:100-106. CHEN Yu,TANG Changjie,ZHONG Yixiao,et al.Time [19]BAUTU E,BAUTU A,LUCHIAN H.AdaGEP-an adap- series predication based on gene expression programming tive gene expression programming algorithm[C]//Proceed- and time series vibration intensity[J].Computer science, ings of IEEE International Symposium on Symbolic and Nu- 2005,32(7 Suppl.B):269-271 meric Algorithms for Scientific Computing.Timisoara,Ro- 作者简介： mania,2007:403-406. 彭昱忠，男，1980年生，副教授，主 [20]元昌安，唐常杰，左劫，等.基于基因表达式编程的函要研究方向为智能计算及数据挖掘。数挖掘-收敛性分析与残差制导进化算法[J].四川大主持国家级和省级基金项目4项，发表学学报：工程科学版，2004,36(6)：100-105. 学术论文21篇。 YUAN Chang'an,TANG Changjie,ZUO Jie,et al.Func- tion mining based on gene expression programming-conver- gency analysis and remnant-guided evolution algorithm[J]. Journal of Sichuan university engineering science edition, 元昌安，男，1964年生，教授，主要 2004.36(6):100-105. 研究方向为数据库与知识工程，先后主 [21]RYAN N,HIBLER D.Robust gene expression program- 持国家级和省级基金项目8项，获广西 ming[J].Procedia computer science,2011,6:165-170. 科技进步奖5项，发表学术论文58篇。 [22]ZHONG Jinghui,ONG Y S,CAI Wentong.Self-learning gene expression programming[J].IEEE transactions on ev- olutionary computation,2016,20(1):65-80. [23]张鑫源，胡晓敏，林盈.遗传算法和粒子群优化算法的李洁，女，1980年生，讲师，主要研性能对比分析[J].计算机科学与探索，2014,8(1)：究方向为智能计算及数据挖掘，发表学 90-102. 术论文7篇。 ZHANG Xinyuan,HU Xiaomin,LIN Ying.Comparisons of genetic algorithm and particle swarm optimization[J]

［１８］ＴＡＮＧＣｈａｎｇｊｉｅ，ＤＵＡＮＬｅｉ，ＰＥＮＧＪｉｎｇ，ｅｔａｌ．Ｔｈｅｓｔｒａｔ⁃ ｅｇｉｅｓｔｏｉｍｐｒｏｖｅｐｅｒｆｏｒｍａｎｃｅｏｆｆｕｎｃｔｉｏｎｍｉｎｉｎｇｂｙｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ：ｇｅｎｅｔｉｃｍｏｄｉｆｙｉｎｇ，ｏｖｅｒｌａｐｐｅｄｇｅｎｅ，ｂａｃｋｔｒａｃｋｉｎｇａｎｄａｄａｐｔｉｖｅｍｕｔａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆｔｈｅ１７ｔｈＤａｔａＥｎｇｉｎｅｅｒｉｎｇＷｏｒｋｓｈｏｐ．Ｇｉｎｏｗａｎ，Ｊａ⁃ ｐａｎ，２００６：１００⁃１０６．［１９］ＢＡＵＴＵＥ，ＢＡＵＴＵＡ，ＬＵＣＨＩＡＮＨ．ＡｄａＧＥＰ⁃ａｎａｄａｐ⁃ ｔｉｖｅｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇａｌｇｏｒｉｔｈｍ［Ｃ］／／Ｐｒｏｃｅｅｄ⁃ ｉｎｇｓｏｆＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＳｙｍｂｏｌｉｃａｎｄＮｕ⁃ ｍｅｒｉｃＡｌｇｏｒｉｔｈｍｓｆｏｒＳｃｉｅｎｔｉｆｉｃＣｏｍｐｕｔｉｎｇ．Ｔｉｍｉｓｏａｒａ，Ｒｏ⁃ ｍａｎｉａ，２００７：４０３⁃４０６．［２０］元昌安，唐常杰，左劼，等．基于基因表达式编程的函数挖掘⁃收敛性分析与残差制导进化算法［Ｊ］．四川大学学报：工程科学版，２００４，３６（６）：１００⁃１０５．ＹＵＡＮＣｈａｎｇ􀆳ａｎ，ＴＡＮＧＣｈａｎｇｊｉｅ，ＺＵＯＪｉｅ，ｅｔａｌ．Ｆｕｎｃ⁃ ｔｉｏｎｍｉｎｉｎｇｂａｓｅｄｏｎｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ⁃ｃｏｎｖｅｒ⁃ ｇｅｎｃｙａｎａｌｙｓｉｓａｎｄｒｅｍｎａｎｔ⁃ｇｕｉｄｅｄｅｖｏｌｕｔｉｏｎａｌｇｏｒｉｔｈｍ［Ｊ］．ＪｏｕｒｎａｌｏｆＳｉｃｈｕａｎｕｎｉｖｅｒｓｉｔｙ：ｅｎｇｉｎｅｅｒｉｎｇｓｃｉｅｎｃｅｅｄｉｔｉｏｎ，２００４，３６（６）：１００⁃１０５．［２１］ＲＹＡＮＮ，ＨＩＢＬＥＲＤ．Ｒｏｂｕｓｔｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍ⁃ ｍｉｎｇ［Ｊ］．Ｐｒｏｃｅｄｉａｃｏｍｐｕｔｅｒｓｃｉｅｎｃｅ，２０１１，６：１６５⁃１７０．［２２］ＺＨＯＮＧＪｉｎｇｈｕｉ，ＯＮＧＹＳ，ＣＡＩＷｅｎｔｏｎｇ．Ｓｅｌｆ⁃ｌｅａｒｎｉｎｇｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｅｖ⁃ ｏｌｕｔｉｏｎａｒｙｃｏｍｐｕｔａｔｉｏｎ，２０１６，２０（１）：６５⁃８０．［２３］张鑫源，胡晓敏，林盈．遗传算法和粒子群优化算法的性能对比分析［Ｊ］．计算机科学与探索，２０１４，８（１）：９０⁃１０２．ＺＨＡＮＧＸｉｎｙｕａｎ，ＨＵＸｉａｏｍｉｎ，ＬＩＮＹｉｎｇ．Ｃｏｍｐａｒｉｓｏｎｓｏｆｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍａｎｄｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ［Ｊ］．Ｊｏｕｒｎａｌｏｆｆｒｏｎｔｉｅｒｓｏｆｃｏｍｐｕｔｅｒｓｃｉｅｎｃｅａｎｄｔｅｃｈｎｏｌｏｇｙ，２０１４，８（１）：９０⁃１０２．［２４］陈宇，唐常杰，钟义啸，等．基于基因表达式编程和时变强度的时间序列预测［Ｊ］．计算机科学，２００５，３２（７Ｓｕｐｐｌ．Ｂ）：２６９⁃２７１．ＣＨＥＮＹｕ，ＴＡＮＧＣｈａｎｇｊｉｅ，ＺＨＯＮＧＹｉｘｉａｏ，ｅｔａｌ．Ｔｉｍｅｓｅｒｉｅｓｐｒｅｄｉｃａｔｉｏｎｂａｓｅｄｏｎｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇａｎｄｔｉｍｅｓｅｒｉｅｓｖｉｂｒａｔｉｏｎｉｎｔｅｎｓｉｔｙ［Ｊ］．Ｃｏｍｐｕｔｅｒｓｃｉｅｎｃｅ，２００５，３２（７Ｓｕｐｐｌ．Ｂ）：２６９⁃２７１．作者简介：彭昱忠，男，１９８０年生，副教授，主要研究方向为智能计算及数据挖掘。主持国家级和省级基金项目４项，发表学术论文２１篇。元昌安，男，１９６４年生，教授，主要研究方向为数据库与知识工程，先后主持国家级和省级基金项目８项，获广西科技进步奖５项，发表学术论文５８篇。李洁，女，１９８０年生，讲师，主要研究方向为智能计算及数据挖掘，发表学术论文７篇。第３期彭昱忠，等：个体最优共享ＧＥＰ算法及其气象降水数据预测建模 ·４０９·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录