第5卷第3期 智能系统学报 Vol.5 No.3 2010年6月 CAAI Transactions on Intelligent Systems Jun.2010 doi:10.3969/j.issn.1673-4785.2010.03.012 改进的灰色模型与ARMA模型的股指预测 吴朝阳 (康考迪亚大学统计与数学系,蒙特利尔H3G2H9) 摘要:当前基于灰色GM(1,1)模型和ARMA模型的组合模型GM-ARMA模型存在着2点不足:一是由于GM(1,1) 模型不是最优的,导致了GM-ARMA模型也不是最优的;二是GM-ARMA模型并没有恰当地结合2个子模型,这也导 致了GM-ARMA模型不是最优的.为此,首先引入数据维度参数和白化背景值的系数2个参数来改进GM(1,1)模 型,然后同时优化ARMA模型中的P、Q2个参数来改进GM-ARMA模型,称新的模型为Revised GM-ARMA(RGM- ARMA)模型.实例证明RGM-ARMA的误差小于ARIMA和GM-ARMA模型,并且为组合模型的建立提供了新的思 路 关键词:灰色模型;GM(1,1)模型;ARMA模型:GM-ARMA模型;股指预测 中图分类号:TP18文献标识码:A文章编号:1673-4785(2010)030277-05 Forecasting stock indexes based on a revised grey model and the ARMA model WU Zhao-yang (The Department of Mathematics and Statistics,Concordia University,Montreal H3G 2H9,Canada) Abstract:A hybrid grey model-autoregressive moving average(GM-ARMA)model,constructed by combing the GM (1,1)model and the ARMA model,has two drawbacks.One drawback is that the GM-ARMA model may not be optimal since the traditional GM(1,1)model is not optimal.The other is that the GM-ARMA model does not combine two sub-models properly;this may also cause the GM-ARMA model to be suboptimal.This paper tries to first modify the GM(1,1)model by introducing 2 parameters,the grey dimension degree and white background value.A revised GM-ARMA model was constructed by optimizing all parameters in the GM(1,1)model and the ARMA model simultaneously.For convenience,we called this revised GM-ARMA model the RGM-ARMA model. Experimental results showed that the RGM-ARMA model has fewer prediction errors than the ARMA model or the GM-ARMA model and gives a new solution for construction of hybrid models. Keywords:grey model;GM (1,1)model;ARMA model;GM-ARMA model;stock prediction ARMA(autoregressive integrated moving average)有各自的侧重.由于股价序列的复杂和多样性,以上 模型作为使用最广泛的时间序列模型,一直以来被许2个模型中的任意一个都不能完全地描述股价运动, 多学者用于股票价格序列的研究中14].其本质是利因此一个常规的想法就是结合这2种预测模型建立 用平稳时间序列的统计相关性来进行未来价格的预 组合模型.其思想是用GM(1,1)模型来捕捉股价运 测.灰色GM(1,1)模型是基于灰色理论的时间序列 动的趋势,而用ARMA模型通过挖掘残差序列的相 预测方法,近年来也被广泛地用于股票价格的时间序 关性来进行股价的预测. 列预测中1.GM(1,1)模型的核心思想是用指数方 实际上,这种基于灰色GM(1,1)模型和ARMA 程来捕捉隐藏在时间序列中的能量聚集,而这种聚集 模型的组合模型已经被广泛地用于时间序列的预测 可以通过累加操作显现出来,从而可以用指数方程来 中,并被称呼为GM-ARMA模型(grey model--autore- 进行拟合.可以看出这2种办法对于股价的预测都 gressive integrated moving average model)[6.但是由 于组合模型中GM(1,1)模型不是最优的,并且没 收稿日期:2009-1122. 有考虑最优的结合点,因此传统的GM-ARMA模型 通信作者:吴朝阳.E-mail:hostingca@gmail.com 不是最优的.本文将针对这2点不足提出了RGM:
·278 智能系统学报 第5卷 ARMA模型并用于股指的预测 为了解决这个问题,他们引进了1个参数来替代常 数0.5.不同学者采用不同希腊字母代替常数0.5, 1通用的GM-ARMA模型 这里统一用希腊字母μ来表示这个参数,因此白化 对于给定的时间序列X=(x1,x2,…,xn),首先 背景值z”(k)新的定义为 用经典的GM(1,1)模型求出其灰色预测序列Z= z0(k)=(1-u)xD(k)+x0(k-1) (1,2,…,2n)和点n+1的灰色预测值n+1,然后针 这种改进的GM(1,1)模型通常称为GM(1,1, 对灰色残差序列Y=X-Z=(y1,y2,…,yn)建立 )模型.因为发展系数a和控制变量b是被白化背 ARMA模型,并用该模型求出灰色残差序列Y在点 景值z(k)所控制的,而z)(k)又是被参数u所 n+1的预测值y+.GM-ARMA模型可以被表示为 控制的,因此,优化GM(1,1)的过程就是优化参数 主=,+,=[1-e][xo(1)-b]e-)+ 的过程.为了找到最优的4,许多学者提出了各种 各样的算法,其中有刘虹等的微粒群算法四,谢开 豆-)+豆4-》 贵等的遗传算法2],陈举化等的最优拟合点群逼近 原始点群的算法13] 可以看出GM-ARMA模型存在2点不足:1)由 通过上面的研究可以看出数据维度和影响白化 于GM(1,1)模型不是最优的,导致了GM-ARMA模 背景值z)(k)的参数μ确实对预测精度有影响. 型也可能不是最优的;2)在用GM(1,1)模型进行建 同时也看到上面的研究主要集中在分开对这2种影 模的过程中,并不考虑对ARMA模型的影响,反之 响因素进行研究,而没有同时考虑这2个因素对预 亦然,因此也就不存在最优结合点,这也导致了GM- 测精度的影响.针对以上情况,本文尝试提出改进 ARMA模型不是最优的.针对以上情况,本文在先 的灰色模型以便同时考虑这2个因素对预测精度的 优化GM(1,1)模型的基础上,找到灰色模型和AR- 影响.为了方便和统一起见,这里称呼影响白化背 MA模型的最佳结合点,最后找到最优的GM-AR 景值zD(k)的参数为灰色变量,并用希腊字母u来 MA模型 表示,对数据维度用希腊字母来表示,并将这种改 2 优化的GM(1,1)模型 进的GM(1,1)模型命名为GM(1,1,,v)模型 由于本文的研究重点是对股票价格的灰色预 当前,对GM(1,1)模型的优化主要集中在2个 测,因此参数4和v的优化原则也将基于一定的金 方面. 融背景.在金融股票市场中,人们通常用点数的得 一个方面是通过选择合适的建模所用的数据维 失来评价他们的投资策略在过去一段时间的表现, 度来优化GM(1,1)模型.在经典的GM(1,1)预测 这种度量在统计上,可以用总绝对值误差σrs(to 中,灰色建模主要是基于少量的数据,因此一般都是 tal absolute error)来度量,orAE越小,说明投资误差 直接选择所有的数据进行建模.但是对于一些可以 在过去的一段时间越小.因此这里认为最优的参数 得到大量数据的时间序列来说,选择合适的数据维 L和v就是其σTAE最小的参数.基于最小σAE来选 度来建立GM(1,1)模型就变得很重要了,郝永红等 择最优参数组合(u,)的准则称为TAE准则.对于 在用GM(1,1)模型预测人口的时候指出,不同的数 不同的应用,建立GM(1,1,4,)模型可以用不同的 据维度将导致预测误差差别较大,他们分别用5~8 准则,但是原理上都是基本一样的. 维4种数据维度对人口进行了灰色预测,发现用6 用TAE准则建立GM(1,1,,v)模型的思路概 维数据进行预测时,预测误差最低).李国平等[刷 括来说就是首先对参数儿和v设立上下限:L∈(1, 也对这种问题进行了研究,他们指出:“在对股票价 L),v∈(r,R)并离散化以便构造1个有界的离散参 格进行灰色预测时,数据量不同,预测结果将有所不 数空间.对于给定的时间序列X=(x1,x2,…,x.)和 同,有时甚至差别很大”.为此他们提出了用黄金分 1个离散参数组合(u,v),∈(1,L),v∈(r,R)都可 割法来寻找合适的建模所需的数据量. 以构造GM(1,1,,v)模型并得到序列X的灰色预 另一类优化集中在对白化背景值z)(k)的优 测序列X=(无,2,…,n).因此也就可以得到 化上,在经典的灰色模型的教科书910中,对于累加 变量x)(k)的白化背景值z)(k)的定义是 OTAE ∑1考-年1 z(k)=0.5x(k)+0.5x(k-1). 式中:x表示真实值,无表示灰色预测值.对每一个 很多学者认为常数0.5将导致预测值不是最优的. 参数组合(u,v),都可以用以上方法就算出σrE参
第3期 吴朝阳:改进的灰色模型与ARMA模型的股指预测 ·279· 数组合(,)满足: 从表1可以看出,基于3种不同标准的预测误 min(orAE),u∈(l,L),v∈(r,R), 差并不大,实际上,基于TAE准则的预测误差甚至 就是最优的参数,相应的GM(1,1,,v)模型就是基 小于基于BIC准则的预测误差,这经验地证明了 于TAE准则的最优的灰色模型. TAE准则可以用来对参数(p,q)进行选择. 由于GM(1,1,4,v)中的参数(4,v)和 3RGM-ARMA模型 ARMA(P,q)中的参数(P,q)都可以用TAE准则来选 建立了优化的灰色模型GM(1,1,4,v)后,就可 择,这就为整合2个模型并找到最优的组合(u,,P, 以通过找到灰色模型和ARMA模型的最佳结合点 q)提供了基础,具体来说,构造RGM-ARMA模型的 来整合这2个模型了.整合GM(1,1,u,v)和 思想为: ARMA(p,q)的过程就是找到最佳组合(u,D,P,q)的 首先对参数(u,v,P,q)设定上下限,并对连续 过程,其基本的前提条件就是参数(u,v)和(P,q)的 参数进行相应的离散化处理,以便形成离散参数空 选择必须基于相同的统计准则. 间∈(1,L),v∈(,R),P≤P,9≤Q.对于给定的历 在ARMA(P,q)中,经典的选择参数(p,q)的准 史时间序列X=(x1,x2,…,x)和给定的位于离散 则是BIC(Bayes information criterion)和AIC 参数空间的参数组合(μ,v,P,q),通过式(1)可以建 (Akaike's information criteria)准则;但是由于BIC 立相应的GM-ARMA模型,并可以用该模型计算出 和AIC不能用于(u,v)的选择,那么惟一可能的就 拟合序列X=(,2,…,名),因此也就可以计算出 是看(P,q)是否可以用TAE准则进行选择.为了验 OTAE为 证TAE准则是否可以用来建立ARMA(P,q),首先 要针对ARMA(P,q)模型定义TAE准则.参考BIC 0e=∑1考-主1. 和AIC的定义,定义TAE准则如下. 最优的GM-ARMA模型满足: 对AR(autoregressive model)模型和MA(moving min(oE),u∈(l,L), average model)模型的级数设定上界P和Q,针对每 v∈(T,R),0≤p≤P,0≤q≤Q. 个参数组合(P,9),0≤p≤P,0≤q≤Q建立 4 实例研究 ARMA(p,q)模型,并基于相同的历史数据计算 0TAB,最佳的模型满足: 为了说明RGM-ARMA模型的建模过程,这里用与 min(oras),0≤p≤P,0≤q≤Q, 上例相同数据来建模,其中开始的126个数据用于模 相应的参数(P,q)也就是最优的参数.为了比较 型的建模,后面的26个数据用于模型的检验。 BIC、AIC和TAE准则在预测误差上的不同,用相同 首先需要对参数(u,v,P,q)建立合适的上下 的数据基于以上3个准则计算了平均绝对值误差 界,其原则是尽量包含最优的解,同时又让计算量不 OMAPE(mean absolute percent error).这里的数据来 要太大,经过研究比较,这里对参数(u,,P,q)定义 源于YAHOO金融板块,数据为TXS加拿大综合指 的上下界为 数日线数据,总数是2008年6月30日一2009年2 u∈(0,1),v∈(5,9),p≤3,9≤3. 月6日的一共152个数据,其中2008年6月30 其次需要对惟一的连续参数4进行离散化处 日一2008年12月31日的半年的126个数据用于建 理,这里用的离散间距为0.1以减少计算量.这样就 模,2009年1月2日一2009年2月6日的26个数 总共有了880个(4,v,P,q)的参数组合,针对每个组 据用于模型的评测,因此σM的计算为 合可以基于历史数据计算出相应的oE,最小O起 152 所对应参数组合(u,v,P,q)和相应的GM-ARMA模 1 100% 26,=7 型就是最优的模型. 结果见表1. 对于本例的历史数据X=(x1,2,…,x16)和某 表1不同准则下的MAE的比较 一个参数组合(u,,P,9)=(0.6,7,1,0),其具体的 Table 1 Comparison between different criterions OTE计算过程如下: 准则 APE/% 由于(4,)=(0.6,7),因此用相应的GM(1,1, 0.6,7)模型来得到时间序列X的灰色预测时间序 AIC 1.793 TAE 1.836 列Z=(1,2,…,6).这里GM(1,1,0.6,7)的意 BIC 1.946 思是用固定的7个灰色数据量和0.6的灰色参数建
280 智能系统学报 第5卷 立的GM(1,1)模型.其中开始的7个灰色预测数 152 据(云,三2,…,)等于原始的7个数据(x1,2,…, ODIR 1∑d,100%=53.84%. 12 x,),第8个灰色预测数据是7个原始数据(x1, 这里, 2,…,)建立的GM(1,1,0.6,7)模型预测出来的, 4= 0,(--1)(无--1)>0: 第9个灰色预测数据,是7个原始数据(2,3, 1, 其他 …x8)建立的GM(1,1,0.6,7)模型预测得来的,以 因为GM-ARMA模型并没有给出选择GM(1, 此类推,第126个灰色预测数据126是7个原始数据 1)模型的准则,这说明任何灰色维度超过3就可以 (x19,x10,…,x125)建立的GM(1,1,0.6,7)模型预 用,因此这里选择了几个不同的灰色维度来建立 测得来的.由此,可以得到全部126个灰色预测序 GM(1,1)模型,而对残差用常用的BIC准则来构建 列Z和灰色残差序列Y=X-Z=(y1,2,…,y6). 不同的GM-ARMA模型.用相同数据计算这些模型 由于(p,9)=(1,0),因此对灰色残差序列Y建立 的误差率,表2列出了各个模型的比较, ARMA(1,O)模型并可得到相应的Y的ARMA模型 表2不同模型的比较 Table 2 Comparisons between models 的预测拟合值Y=(少1,少2,…,少8,少9,yo,…,y126),这 里(y1,y2,…,ya)是空值.由于灰色模型和ARMA模 樟 型 OTAE MAPE/% CDIR/% 型都要用以前数据递推的缘故,y,是yg通过建立的 ARIMA 4500.16 1.95 57.69 ARMA(1,0)计算得到,以此类推y26是y12s通过建 GM(4)-ARMA4217.92 1.79 55.11 立的ARMA(1,O)计算得到.这样序列X基于参数 GM(5)-ARMA 4132.28 1.71 57.19 组(u,v,P,q)=(0.6,7,1,0)的GM-ARMA模型的 GM(6)-ARMA4230.92 1.78 55.26 拟合的X=(1,名2,…,无126)就为 GM(7)-ARMA 4319.07 1.81 56.19 名=乡+ GM(8)-ARMA 4328.08 1.83 57.26 总绝对值误差OTAE就为 GM(9)-ARMA4361.71 1.87 126 57.17 OTAE=】 1-… RGM-ARMA 3 852.97 1.69 53.84 以上算法可以用Matlab编程实现,本节的例子 由表2可以看出,RGM-ARMA模型的3种预测 中,当(u,,P,9)=(0.4,6,3,1)的时候,基于历史 误差都小于ARMA模型和GM-ARMA模型的各种 数据X计算出来的σE最小,因此用(u,v,P,q)= 组合,这也说明了RGM-ARMA模型在实践中是可 (0.4,6,3,1)建立的GM-ARMA模型就是基于TAE 行的 准则的最优GM-ARMA模型.其意思是要用6个数 据段和采取灰色参数0.6建立GM(1,1)来进行灰 5结束语 色预测,并对灰色残差建立ARMA(3,1)模型来进行 本文解决了传统的GM-ARMA模型中GM(1, 预测.效仿前面的(u,v,P,9)=(0.6,7,1,0)的例 1)模型并不是最优化的问题,也提出了整合GM(1, 子,用(,v,P,q)建立GM-ARMA模型,可以得到第 1)模型和ARMA模型的一个全新的解决思路,即基 127个点的灰色预测值和灰色预测残差的预测 于某种定量的原则来建立最优的组合模型而不是依 值y1,并由此得到序列X在127个点的预测值为 靠经验来建立组合模型.实验结果表明,这种整合思 x1m=21m+y17=8953.1. 想所得到的结果在误差上小于ARIMA模型和GM 因此,根据RGM-ARMA模型,对TSX指数第127 ARMA模型.更重要的是,提出了一种新的建立组合 个点的预测值,也就是时间2009年1月2日的日线收 模型的思想,通过修改组合的条件,该思想可以推广 盘价的预测值为8953.2.对于第128个数据,将用开始 到建立多种组合模型上去.虽然是针对股票的特点 的127个数据建立改进的GM-ARMA模型来预测,以 提出了基于TAE准则来建立GM(1,1)和ARMA模 此类推,可以得到从2009年1月2日一2009年2月6 型的组合模型,但是也可以基于TAE准则建立其他 日的全部26个预测数据.并计算出0uAPE为 模型的组合模型.例如基于TAE准则建立GM(1, 罗当-100%=1.69%. 0MA=26,名 1)、小波分解和ARMA模型的组合模型.或者也可 以针对其他的实际情况,通过修改准则来合成组合 由于股市判断方向也重要,这里也计算出了方 模型,例如预测国民生产总值GDP这种时间序列 向错误率goR(directional errors)为 时,可以修改成MAPE准则来建立GM(1,1)和AR
第3期 吴朝阳:改进的灰色模型与ARMA模型的股指预测 .281. MA模型的组合模型, gray system and its application to population forecasting [J].Mathematics in Practice and Theory,2002,32(5): 参考文献: 813-820. [1]朱宁,徐标,仝殿波.上证指数的时间序列预测模型[J刀· [8]邓聚龙.灰色系统基本方法[M].武汉:华中理工大学出 桂林电子工业学院学报,2006,26(2):124-128. 版杜,1988. ZHU Ning,XU Biao,TONG Dianbo.Time-series predic- [9]袁嘉祖.灰色系统理论及其应用[M].北京:科学出版 tion model of Shanghai composite index[J].Journal of Gui- 社,1991. lin University of Electronic Technology,2006,26(2):124- [10]李国平,林敬松.一种改进的灰色模型在股票价格中的 128. 应用[J].商场现代化,2005(10):188-189, [2]POTERBA J M,SUMMERS L H.The persistence of volatil- [11]刘虹,张岐山.基于微粒群算法的GM(1,1,λ)模型的 ity and stock market fluctuations[J].American Economic 机械产品寿命预测[J].机械设计,2007,24(10):4- Review,1986,76:1143-1151. 5,61. [3]郭宁,向凤红.灰色理论和神经元网络在证券市场中的 LIU Hong,ZHANG Qishan.Life-span prediction on me- 应用[J].自动化技术与应用,2008,27(10):13. chanical products of GM (1,1,A)model based on particle GUO Ning,XIANG Fenghong.Application of grey model swarm algorithm[J].Journal of Machine Design,2007, and neural network in the stock-market[J].Techniques of 24(10):4-5,61. Automation and Applications,2008,27(10):1-3. [12]谢开贵,李春燕,周家启.基于遗传算法的GM(1,1,λ) 4]FRENCH K R.SCHWERT G W,STAMHAUGH R F.Ex- 模型[J].系统工程学报,2000,15(2):168-172. pected stock returs and volatility[J].Journal of Financial XIE Kaigui,LI Chunyan,ZHOU Jiaqi.Gray model (GM Economics,1987,19:3-29. (1,1,A))based on genetic algorithm[J].Journal of Sys- [5]李国平,于广青,陈森发.中国股票价格灰色预测研究综 tems Engineering,2000,15(2):168-172. 述[J].东南大学学报:哲学社会科学版,2005,7(2): [13]陈举华,史岩彬,沈学会.GM优化方法在机械系统寿 28-30,126. 命预测中的应用[J].山东大学学报:工学版,2003,33 LI Guoping,YU Guangqing,CHEN Senfa.A review of re- (4):379-381. search on stock price gray forecast in China[J].Journal of CHEN Juhua,SHI Yanbin,SHEN Xuehui.Application of Southeast University:Philosophy and Social Science,2005, GM(1,1,methods in the life prediction of mechani- 7(2):28-30,126. cal systems J].Joumal of Shandong University:Engi- [6]吴庚申,染平,龙新峰.基于GM-ARMA的年电力负荷组 neering Science,2003,33(4):379-381. 合模型[J].湖北电力,2005,29(2):21-23. 作者简介: WU Gengshen,LIANG Ping,LONG Xinfeng.An annual 吴朝阳,男,1975年生,工程师,主 electric consumption combined model based on GM-ARMA 要研究方向为灰色理论、时间序列和小 [J].Hubei Electric Power,2005,29(2):21-23. 波变换的股票预测。 [7]郝永红,王学萌.灰色动态模型及其在人口预测中的应 用[J].数学的实践与认识,2002,32(5):813820. HAO Yonghong,WANG Xuemeng.The dynamic model of