第6卷第3期 智能系统学报 Vol.6 No.3 2011年6月 CAAI Transactions on Intelligent Systems Jun.2011 doi:10.3969/j.issn.16734785.2011.03.014 小波变换和GM-ARMA组合模型的股指预测 吴朝阳 (康考迪亚大学统计与数学系,蒙特利尔H3G2H9)》 摘要:当前在利用小波分解和其他模型建立组合模型的过程中,对小波基方程的选择和分解层数并没有一个标 准,基本上是通过经验和一些实验来决定这2个因素;而且很多利用小波分解建立的组合模型并不考虑模型之间相 互的影响,对各个子模型的参数估计采取各自独立的估计,从而导致预测结果不是最优.为此,提出了先对小波基方 程和分解层数这2个特征进行参数化,然后定量地对所有子模型的特征参数进行统一、综合的评估,以达到建立最 佳组合模型的目的.由于该组合模型是由小波分解、灰色模型和ARMA模型组合而成的,因此称为WGM-ARMA模 型.股指预测的实例验证了WGM-ARMA模型大幅度地降低了预测误差,说明了该组合模型的有效性、实用性和可 行性. 关键词:小波分解;灰色模型;ARMA模型:GM-ARMA模型;股指预测 中图分类号:TP18文献标识码:A文章编号:16734785(2011)030279-04 Using wavelet transformation and a GM-ARMA model to forecast stock index WU Zhaoyang (The Department of Mathematics and Statistics,Concordia University,Montreal H3G 2H9,Canada) Abstract:During the process of building a hybrid model by combining wavelet decomposition and other techniques, there is no standard in terms of selecting a wavelet base function and decomposition level.The commonly used ways are usually based on the researcher's experience or several experiments instead of a quantitative approach.In addi- tion,many hybrid models based on wavelet decomposition do not consider the interaction between sub models.In- stead of estimating the parameters in all sub models as the whole,they estimate the parameters separately,which lead to that the prediction result is not optimal.In order to solve this problem,this paper first introduced two new parameters,wavelet functions and decomposition levels,then quantitatively estimated all the parameters as a whole for the purpose of building an optimal hybrid model.For convenience,the model was called the WGM-ARMA mod- el because it combines the wavelet decomposition,grey model,as well as autoregressive integrated moving average (ARMA)model.Experimental results show that the hybrid model significantly reduces prediction errors.As a re- sult,it can be concluded that the model in terms of forecasting stock index is valid and useful,along with the meth- od used to construct the optimal hybrid model. Keywords:wavelet decomposition;grey model;ARMA model;GM-ARMA model;stock prediction ARIMA(autoregressive integrated moving and autoregressive integrated moving average mod- average model)和GM(1,I)模型作为应用广泛的时el)[6.但是GM-ARMA模型并不是一个最优的模 间序列模型,长期以来被许多学者用于股票价格序型,因为子模型GM(1,1)模型没有经过优化,同时2 列的研究中15).由于这2种模型对于时间序列的 个子模型在结合时,也没有考虑进行最佳的整合.为 预测各有侧重,因此一些学者提出了整合这2个模 此笔者提出了改进的GM-ARMA模型以克服上述缺 型的组合模型并称之为GM-ARMA模型(grey model 点并称为RGM-ARMA(revised GM-ARMA)模型], 实例证明RGM-ARMA的预测误差小于单一模型和 收稿日期:201009-18. GM-ARMA模型, 通信作者:吳朝阳.E-mail:hostingca(@gmail.com. 但是RGM-ARMA模型在预测误差上还是偏
280 智能系统学报 第6卷 大,特别是方向预测误差超过了50%.从RGM-AR MA模型的特征参数是(P,q),在小波分解的特征参 MA模型的建模方法上可以看出,继续在GM(1,1) 数是(m,k),而整合灰色模型、ARMA模型和小波 模型和ARMA模型的组合上下功夫已经不太可能 分解的过程就是找到特征参数组合(u,v,P,q,m,k) 大幅度地降低预测误差,有必要引进新的建模技术 最佳组合的过程.同建立RGM-ARMA模型一样,其 到RMG-ARMA模型中来降低预测误差,其中一个 基本的前提条件是(u,v)、(P,q)和(m,)的选择 可以选择的技术就是小波分解.小波分解近年来开 必须基于相同的统计准则.显然参数(m,)可以用 始被用于结合其他模型进行股价时间序列的预 TAE准则[们选择,因此模型的整合可以依据TAE 测89j,其基于的经济学背景来源于Pepters,他认为 准则进行选择。 股票市场的投资者可以分为长期投资者、中期投资 具体来说,构造WGM-ARMA模型的思想如下, 者和短期投资者,不同投资者由于投资习惯的不同, 对于给定的时间序列X=(1,2,…,x),已知 所造成的统计特征也不同.基于以上分析,一个 小波基方程m和小波分解的层数k,根据小波分解, 可以尝试的办法就是把股票时间序列分解成不同频 该时间序列X可以被分解为 率的子时间序列,并对不同的子序列采用合适的模 X=A0+DT+Dg+…+Dg 型进行建模.本文对于代表趋势的低频序列,用灰色 式中:A0和D,D,…,D分别代表时间序列通过 模型进行预测,因为灰色模型具有很好的动态捕捉 小波基方程m,分解k层后得到的低频序列和高频 趋势的能力;对于代表波动的高频序列,采用ARMA 序列集.A。可以看作是序列X的近似,代表X的大 模型进行预测,因为可以猜想具有相同投资习惯的 致趋势,其特点适合用RGM-ARMA模型进行拟合; 投资者的投资习惯在某种程度上是自相关的,其特 DT,D2,…,D2是相对高频的时间序列集,其特点为 征应该基本类似并保持基本平稳. 没有趋势值并有近似为0的均值和相对稳定的方 至此,通过研究股市的特点,结合所需子模型的 差,适合用ARMA模型来拟合.这样序列X的模型 特点,本文最终决定引进小波分解技术来尝试降低 就为 预测误差.具体的思路为:首先用小波分解对原始股 X=X+6=A +Dm +D+.+D +8= 价序列进行分解,然后针对分解后的子序列的特点 [GM(1,1,,)+ARMA(p°,g°)]0+ 选择合适的模型,这里采用GM-ARMA模型和单个 的ARMA模型,对子序列进行建模并预测,最后把 [ARMA(p',g)]+[ARMA(p2,9)]2+…+ (1) 各自子序列的预测值合成为股价的最终预测值.为 ARMA(p",)]+. 阐述方便起见,称该组合模型为WGM-ARMA模型 式中:X是X的预测拟合序列;A0是A0的预测拟合 (wavelet transform,grey model and autoregressive in- 序列;D,D,…,D是D,D%,…,D的预测拟合 tegrated moving average model). 序列;B是WGM-ARMA模型的残差序列. 为了找到最佳的参数组合,需要对参数(m,k, WGM-ARMA模型 u,,p°,9°,p,9,…,p,9)设定上下限,并对连续 在WGM-ARMA模型中,需要整合3种模型技 参数进行相应的离散化处理,最终得到一个离散的 术,这里模型的整合优化是建立WGM-ARMA模型 参数空间: 的关键.在小波分解中,小波基方程的选择和分解层 u∈[l,L],w∈[r,R],p°∈[0,p°], 数对预测的影响很大,但是对小波基方程的选择和 g°∈[0,Q],…,p∈[0,P],9∈[0,Q], 分解层次并没有一个标准,基本上是通过经验和一 m∈[0,M],k∈[0,K].(2) 些实验来决定这2个因素.而且,很多利用小波分解 这样对于每个参数组合(m,k,μ,,p,9,p,g,…, 建立的组合模型并不考虑模型之间相互的影响,各 p,g),都可以通过式(1)建立模型,用该模型计算 个子模型的参数估计是独立的,而不是互相制约和 出拟合序列X=(1,2,…,n),并计算出对应的总 影响的,这使得组合模型并不是有机整合在一起的, 绝对值误差Ts(total absolute error)为 从而导致预测结果不是最优.为了有机地整合小波 OTAE ∑1x-. (3) 分解、灰色模型和ARMA模型,有必要对小波基和 分解层数参数化.这里用参数m代表小波基,参数k 而最终的WGM-ARMA模型满足: 代表分解层数 min(grs); 通过对小波分解的2个主要指标参数化后,就 u∈[l,L],v∈[r,R],p°∈[0,P], 可以参考RGM-ARMA模型的建模思路了.在灰色 q°∈[0,Q],…,p∈[0,P],9∈[0,Q], 模型GM(1,1,,v)中的特征参数是(u,v),在AR- m∈[0,M],k∈[0,K]. (4)
第3期 吴朝阳:小波变换和GM-ARMA组合模型的股指预测 281 2 实例研究 于模型的评测, 首先对参数(m,k,,v,p°,q°,p,9,…,p,9) 用实例说明WGM-ARMA模型的建模过程,并 设定上下限.对于代表小波基方程的参数m,由于用 用WGM-ARMA模型来进行股指的预测.本节所用 Matlab进行编程,因此对Matlab提供的小波基方程 数据及策略和文献[7]完全一样,总数据一共为152 进行如下编号,编号列在了表1中. 个,开始的126个用于模型的建立,随后的26个用 表1小波基方程的编号 Table 1 Wavelet base function number n 12 … 18 19 Haar Db1 … Db10 Sym2 … Sym8 Coifl 23 24 38 39 53 Coif5 Biorl.1 … Bior6.8 Rbiol.1 Rbio6.8 这里可以根据需要随时添加新的小波基方程. WGM-ARMA模型, 对于分解层数k,由于随着分解层数的增加,计算量 以上算法可以用Matlab编程实现,最终计算出 也会大幅度地增加,因此设k=2.对于特征参数组 来的最小OTAE的参数组合为 合(u,D,p°,g°,p,g,p2,92),采用和RGM-ARMA模 k=1,m=47,4=1,0=6, 型的设置一样,为 p°=3,9°=2,p=3,9=3. 4∈[0,0.1,…,1],e[5,6,…,9], 该参数说明,首先要用小波基方程“Rbio3.3”(m= p°,9°,p,9,p2,9e[0,3]. 47),通过小波分解把原始序列X分解1层(k=1), 到此,特征参数空间就定义完毕,对于每个参数组合 得到低频序列A°=(a,a9,…,a2s)和高频序列 (m,k,,v,p°,9°,p,9,p,q)都可以基于126个历 D=(d,d,…,d),对于低频序列A°构建GM 史数据X=(x1,2,…,x16)通过式(1)建立模型,并 ARMA模型(u=1,D=6,p°=3,g°=2),对于高频序 得到拟合序列X和残差序列ε,并通过式(3)计算出 列D构建ARMA(3,3)模型(p'=3,q=3).这样序 相应的oTAE·并且WGM-ARMA模型满足式(4). 列X的拟合序列可以表示为 对于本例的建模数据X=(x1,x2,…,xs)和任意 京=A°+D= 的一个参数组合(k=1,m=47,u=0.6,v=7,p°=1, [GM(1,1,1,6)+ARMA(2,3)]+[ARMA(3,3)]. g°=0,P=2,9=3),其具体的σT计算过程如下. 效仿上面的例子,可以得到低频序列A”在第 由于m=9,k=1,说明首先要用小波基方程 127点上的预测值a12,和高频序列D'在第127点上 “Db8”,通过小波变换把原始序列X分解1层,得到 的预测值a2,并由此得到序列X在127个点的预 低频序列A9和高频序列D。,为了方便书写,让 测值为 A9=(a1,a2,…,a1w),Dg=(d1,d,…,ds).由于 x1m=a12m+d1m=9248.1. u=0.6,m=7,p°=1,9°=0,因此对于低频序列A9用 式中:点a1z的计算公式为 参数(=0.6,=7,p°=1,g°=0)构建GM-ARMA 模型,并得到其拟合序列A9=(a1,a2,…,a12s),关 is=()(o)e 于建模过程请参考文献[7].对于高频序列D,由 3 于(p,g)=(2,3),说明需要对Dg构建ARMA(2, p(a3t-it)+ra+∑ris+t: 3)模型,得到其拟合序列D。=(a1,2,…,2s). 点am的计算公式为 这样原始序列X基于式(1)建立的模型的拟合 序列就为=(云1,2,…,16),其中: 宫aat-)+品+咖 %=a+d; 因此,根据WGM-ARMA模型,TSX指数第127 总绝对值误差OTAB为 个点的预测值,也就是2009年1月2日的日线收盘 价的预测值为9248.1.对于第128个数据,要用开 OTAE ,1-无. 始的127个数据建立WGM-ARMA模型来预测,以 对于每个参数组合都可以利用式(1)建立相应 此类推,可以得到从2009年1月2日一2009年2月 的模型并求出σTAE,其中最小的OrE的参数组合就 6日的全部26个预测数据.并计算出平均绝对值误 是最优的参数组合,对应的模型就是所要求的 差MApe(mean absolute percent error)为
282. 智能系统学报 第6卷 1了R岁- 128. AE=26j= 1100%=1.36%. [2]POTERBA J M,SUMMERS L H.The persistence of volatil- 由于股市判断方向也重要,这里也计算出了方 ity and stock market fluctuations[J].American Economic 向错误率ooR(directional errors)为 Review,1986,76(5):1143-1151. 3d,·100%=42.31%. [3]FRENCH K R,SCHWERT G W,STAMBAUGH R F.Ex- 1 ODIR 121 pected stock retums and volatility[J].Joural of Financial Economics,1987,19(1):3-29 式中: [4]李国平,于广青,陈森发.中国股票价格灰色预测研究综 ∫0,(--)(无--)>0 4=1,其他 述[J].东南大学学报:哲学社会科学版,2005,7(2): 28-30,126 为了比较WGM-ARMA模型和其他模型,这里 LI Guoping,YU Guangqing,CHEN Senfa.A review of re- 也用相同数据计算了其他模型的误差率,表2为这 search on stock price gray forecast in China[].Journal of 些模型的误差比较结果, Southeast University:Philosophy and Social Science,2005, 表2采用不同模型预测股指的误差 7(2):28-30,126. Table 2 Prediction errors based on different models [5]郭宁,向凤红.灰色理论和神经元网络在证券市场中的 模型 OTAE MAPE/10 PIR/10 应用[J].自动化技术与应用,2008,27(10):1-3, GUO Ning,XIANG Fenghong.Application of grey model ARIMA 4500.15 0.195 5.769 and neural network in the stock-market[J].Techniques of GM(1,1,,) 3990.67 0.173 5.769 Automation and Applications,2008,27(10):1-3. [6]吴庚申,梁平,龙新峰.基于GM-ARMA的年电力负荷组 RGM-ARMA 3852.97 0.169 5.384 合模型[J].湖北电力,2005,29(2):21-23 WGM-ARMA 3122.090.136 4.231 WU Gengshen,LIANG Ping,LONG Xinfeng.An annual e- 从表2可以看出,WGM-ARMA模型明显优于 lectric consumption combined model based on GM-ARMA 单个的ARMA模型、GM(1,1,4,v)模型,也优于 [J].Hubei Electric Power,2005,29(2):21-23. [7]吴朝阳.改进的灰色模型与ARMA模型的股指预测[J], RGM-ARMA模型.特别是方向误差低于50%,这说 智能系统学报,2010,5(3):277-281. 明了引进小波分解到RGM-ARAM模型中是一个很 WU Zhaoyang.Forecasting stock index based on revised 好的办法,同时也说明了直接在原始序列上建模不 grey model and ARMA model[J].CAAI Transactions on 能发挥出灰色模型和ARMA模型的优势,必须排除 Intelligent Systems,2010,5(3):277-281. 干扰后才能将这些模型的优势发挥出来,以达到减 [8]郑纪安.基于小波分析和神经网络的金融时间序列预测 少预测误差的目的. 研究[D].厦门:厦门大学,2009:4561. ZHENG Ji'an.The research on forecasting of financial time 3结束语 series baesd on wavelet analysis and neural network D]. 本文在分析股票运动特征的基础上,提出了基 Xiamen:Xianmen University,2009:45-61. 于小波分解、灰色模型和ARMA模型的组合模型, [9]曲文龙,李海燕,刘永伟,等.基于小波和支持向量机的 实例证明该模型在各个指标上都明显优于本文中用 多尺度时间序列预测[J].计算机工程与应用,2007,43 (29):182-185, 到的单个和其他的组合模型.更为重要的是,本文提 QU Wenlong,LI Haiyan,LIU Yongwei,et al.Research 出了一个全新的构建组合模型的思路,利用这个思 on multi-scale prediction of time series based on wavelet 路,可以对其他基于小波分解的组合模型进行有效 and support vector machines[J].Computer Engineering 的优化,进而构建出更多更精确的预测模型.尽管 and Applications,2007,43(29):182-185. WGM-ARMA模型的初衷是用来预测股票,但是 [10]PETERS EE.Fractal market analysis:applying chaos the- WGM-ARMA模型也可以用于其他时间序列的预 ory to investment and economics[M].New York,USA: 测,例如GDP和销售量的预测. John Wiley and Sons Inc,1996:39-50. 作者简介: 参考文献: 吴朝阳,男,1975年生,工程师,主 [1]朱宁,徐标,仝殿波.上证指数的时间序列预测模型[J]. 要研究方向为灰色系统理论、时间序列 和小波变换的股票预测 桂林电子工业学院学报,2006,26(2):124-128 ZHU Ning,XU Biao,TONG Dianbo.Time-series predic- tion model of Shanghai composite index[J].Joumnal of Gui- lin University of Electronic Technology,2006,26(2):124-