正在加载图片...
第4期 钱晓山,等:改进基因表达式编程在股票中的研究与应用 ·305· 的伦敦证券指数进行预测,采用神经网络技术预测 股票指数预测建模:取f(i)=1000×1/ 指数的月变化率可以达到60%的正确性;台湾地区 (E:+1)为适应值函数,并假设股票指数与最近13 的研究中,张文信(1995)以总体经济变量预测股价 天有关,以此最近13天为变量建立微分方程,求解 加权指数走势,其预测正确率约为50%~60%等 算法简述如下: 等.但随着人工神经网络研究的深人,人们认识到它 1)将微分方程作为遗传计算对象(染色体),初 存在的严重不足,在原理上缺乏实质性的突破,同时 始化IGEP种群,从训练数据中挖掘出微分方程和 也缺乏理论依据910],这些研究结果表明股票指数 初始条件; 是具有可预测性的.基于此,本文提出改进变异算子 2)用Runge-Kutta法求解微分方程,计算出微 的IGEP应用于股票指数的预测 分方程的(作为染色体)适应度,若满足终止条件, 3.2上证指数时间序列模型 成功退出; 以上证指数2003年共239个交易日的数据为 3)执行IGEP的各种操作.产生下一代种群,转1) 训练数据,应用GEP和IGEP方法进行时间序列分 本文在实验中还引人了对于含噪时间序列的处理 析,以2004年的数据作为测试数据.时间序列分析 算法,实验中使用了显微插值法去噪,算法简述如下: 中,一个重要的参数是历史数据长度的选择.我们对 1)对含噪的时间序列用傅立叶变换,去掉高频 历史数据为1~13天分别进行了模型的建立,发现 部分; 对训练数据均能进行准确的模拟.但历史数据天数 2)把时间区间放大m倍(10<m<200); 太短时,由于提供的资料信息太少,预测时效果不 3)对上述结果作反傅里叶变换; 好.GEP的函数集可以包含运算符 4)插值、光滑化、还原(缩小)时间区间, {+,-,*,/}以外再加上其它初等函数.在实 3.3实验数据 验中发现基于基本运算符建立的模型就能够达到较 本文实验数据来源于www.sohu.com财经版, 高的精度,所以在分析中,选择这些运算符作为函数 3.3.1GEP算法[ 集对13天的历史数据进行建摸 使用GEP算法,参考文献[5]给出拟合函数公 该文在求解中,用到了数值常量集合,数值常量 式为 集合C由初始函数任意生成,范围在[-10,10]之 D=du/(d4/(d2-d4)-(d1+d4))+d2/(d/(2 间,常量的个数与基因尾部长度值相同.实验中的参 -d3)-d)+ds/(d3+d/(d-d3)+d6+ 数及参数值如表1所示. d2)+(d6+d4*d6/d)/((d+d2)*(d,- 表1参数定义 da)+d4/(d/(d2+d4-d5-d)+d,)+d2 Table 1 Definition of parameters 式中:d:表示前第13-i天的数据, 参数名 参数值 文献[11]指出此公式拟合曲线的相关系数为 最大代数 300 0.9533. 种群大小 60 利用此式给出训练数据和测试数据的真实数据 函数集 +’,‘-’,*’,/八,‘8,c 与模型数据的曲线比较图,参见图1,图2: 基因头长度 10 基因个数 5 1650 1600 连接符 1550 变异率 0.044 1500 单点重组率 0.3 兰1400 上证指数实际俏 两点重组率 0.3 I350 上证指数模型值 基因重组率 0.1 S插串率 0.1 H期 S插串长度 1,2,3 图1上证指数部分训练数据真实值与模型值比较曲线图 RIS插串率 0.1 Fig.1 The compared curve between the true value and model RIS插串长度 1,2,3 values of the Shanghai index part training data Gene插串率 0.1
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有