·304 智能系统学报 第5卷 1.2适应度函数选择 为种群大小,L为总进化代数,M为训练集的长度, 除了个体的表示外,还需要定义个体的适应值 证明在算法中计算个体针对M个训练样本的 评价函数.这是本文的研究重点.在GEP中,适应度 复杂度为O(M),算法需要计算种群中各个体的适应度 函数设计非常重要,一般采用如下3种方式: 值,故种群适应度计算的复杂度为O(K*M),因算法 最多进化L代,故算法复杂度为O(K*L*M). f=∑(M-1C-T1), (1) 3.3IGEP算法收敛性分析 (2) 在基于IGEP的复杂函数参数识别反问题球解中, 将适应度函数设计如(4)式所示其中,E=1 in≥2C,henf=,def=l m (3) (Y0-y)2为均方误差和计算公式,简记为SSE.设遗 式中:M为一常量,f是控制适应度∫的取值范围; 传变异率Pm≤0.5,则可得如下2个结论: C()表示第i个基因对应的函数表达式中利用第j 1)IGEP复杂函数反问题求解进化第K代的最 个样本变量数据求得的函数值;TD表示第j个样本 小均方误差和的数学期望满足 中包含的实际测得的该目标函数的真实值;C:是测 k-1 试样本数据总数,n是正确适例的个数.式(1)和式 E(SEa)≤E(SSE)-P,PPue∑E(b,). 台 (2)可以解决任何一个符号回归问题.式(3)主要解 (5) 决逻辑合成问题.在适应度的设计上,目标非常明 2)最小均方误差和以概率收敛,即对任意ε> 确,让系统按照要求的方向进化, 0,有 2 改进的基因表达式编程方法算法 limp(SSEi.>e)=0. (6) 以上分析可看出,基于IGEP的复杂函数参数 2.1IGEP算法描述 识别反问题求解是依概率收敛到全局最优染色体 经典的GEP算法对变异算子的考虑不够,本文 的,但是,由于不是强收敛到全局最优点,因此不能 在做了大量的实验后,就变异算子的变异方法给出 排除收敛到局部最优的可能。 了一种改进的方案.基于改进变异算子的IGEP算 法结构如下[4: 3 数值实验一基于GEP和IGEP的 1)初始化种群,随机产生60组(过大会增大算 法运行时间,过小则很难收敛)初始染色体,每个染 上证指数时间序列分析 色体由5个基因构成,每个基因头长度为15(或更 多);初始化时采用KARVA编码4: 3.1股票指数预测研究 Q*+-ab c d 股票市场是一个复杂的非线性动力系统,同时 2)按照适应值函数求解初始种群的各染色体 受多种因素的交互影响,对于股票未来价格的精确 的适应值(本文采用的适应度函数) 预测是非常困难的.股市预测被认为是当前时间序 1 列预测中最富挑战性的应用之一,受到数据挖掘界 f(i)=1000×Ei+1' (4) 的广泛关注5].股票指数涨跌数据是一种时间序列 并将适应值排序,保存适应值最高的个体; 数据,它既具有一定的趋势性又具有较大随机性.自 3)执行变异,并按照染色体所含基因的多少决 19世纪股票市场建立以来,股票指数预测模型就成 定变异的基因位个数,本文选择每个基因变异一个 为各国学者研究的焦点.在时间序列预测中,线形的 基因位的方法; 概率统计模型曾得到广泛的应用,如:ARMA模型 4)执行IS插串、RIS插串、Gene插串: 法、AR模型法、阈值自回归、多项式自回归、指数自 5)执行单点重组、两点重组、基因重组; 回归模型等,后来还有灰色预测、混沌时间序列预测 6)运行代数增加1,如果运行达到预先设定的 等方法.如White(1985)[6曾经尝试利用神经网络 最大代数,则停止运行,用图形输出结果并保存到记 来预测BM普通股每日报酬率,但是预测结果不甚 录文件中,否则转到2)继续运行, 理想;Bergerson and Wunsch(1991)I利用S&P指数 2.2IGEP算法复杂度分析: 训练神经网络,预测股价涨跌方向的正确率相当 引理算法的的复杂度是O(K*L*M),其中K 高;Pesaran and Timmermann(990)[8]对过去25年