第38卷第10期 湖南大半学报(自然科学版) Vol.38,No.10 2011年10月 Journal of Hunan University(Natural Sciences) 0ct.2011 文章编号:1674-2974(2011)10-0082-06 基于MCMC的贝叶斯长记忆随机波动模型研究" 郝立亚,朱慧明,李素芳,曾惠芳 (湖南大学工商管理学院,湖南长沙410082) 摘要:针对贝叶斯长记忆随机波动撲型的单步Gibs抽样算法效率低下的问题,通过 对模型在状态空间拒架下的近似表示,将向前滤波向后柚样算法引入对波动变量的估计过 程中,同时在贝叶斯框架下分析了模型参数的满条件后验分布,设计出Gibbs联合抽样算 法.更进一步,在对模型进行参数估计的基础上,提出波动变量的向前多步预报分布的估计 方法.模拟实验结果表明:联合Gibbs抽样算法能够在保证估计精度的基础上得到优于单步 Gibs抽样方法的抽样效率,对预报分布的特征分析可用于对金融时间序列的风险控制, 关键词:仿真分析:随机波动;贝叶斯分析:抽样,马尔科夫过程 中图分类号:0212.8 文献标识码:A Markov Chain Monte Carlo Methods for Bayesian Long Memory Stochastic Volatility Models HAO Li-ya,ZHU Hui-ming',LI Su-fang,ZENG Hui-fang (College of Business Administration,Hunan Univ,Changsha,Hunan 410082,China) Abstract:This paper was concerned with simulation-based inference in generalized models of stochastic volatility with long memory.A more efficient Markov Chain Monte Carlo sampling method was exploited to the analysis of the model,compared with the single step Gibbs sampling method.Based on the truncated likelihood method,in which the long memory stochastic volatility model was expressed as a linear state space model,we utilized the forward filtering backward sampling method to sample all the unobserved volatilities simultaneously.A simulation method for Bayesian prediction analysis of the volatilities was also developed.The simulation study has given the results of estimated pa- rameters and evaluated the performance of our method.Moreover,the prediction analysis of the volatility can be used to control the risk of financial series. Key words:simulation;stochastic volatility;Bayesian analysis;simulation;markov processes 自从诺贝尔经济学奖获得者、美国著名的统计上,Bollerslev)发展出了广义条件异方差模型 学家Engle)于1982年提出条件异方差模型 (GARCH).与GARCH类模型不同,随机波动模型 (ARCH)以来,研究金融时间序列波动聚集性的模 (SV)令条件方差包含某些随机过程的不可见成分, 型逐步受到了学术界的关注,在ARCH模型的基础 因此波动的改变是随机变化的,这种动态结构更适 收精日期:2010-09-12 善金项自:国家自然科学基金资助项目(NSFC70771038):数育部留学回国人员科研启动基金项目(教外司留[2010]609),国家自然科 学基金项目重点项目(71031004):教育部长江学者与创新团队发展计划《经济管理复杂系统中的建模、优化与决策研究》 (1RT0916):国家社科基金意点资助项目(11AUL008) 作者葡介:郝立亚(1983一),女,河北邯郸人,潮南大学博士研究生 t通讯联系人,E-mal:zhuhuimingl999@yahoo.com.cn 万方数据
第38卷第io期 2 0 l 1年l 0月 湖南大学学报(自然科学版) Journal of Hunan University(Natural Sciences) V01.38。No.10 Oct.2 0 1 l 文章编号:1674·2974(2011)10-0082—06 基于MCMC的贝叶斯长记忆随机波动模型研究。 郝立亚,朱慧明+,李素芳,曾惠芳 (湖南大学工商管理学院,湖南长沙410082) 摘要:针对贝叶斯长记忆随机波动模型的单步Gibbs抽样算法效率低下的问题,通过 对模型在状态空间框架下的近似表示,将向前滤波向后抽样算法引入对波动变量的估计过 程中,同时在贝叶斯框架下分析了模型参数的满条件后验分布,设计出Gibbs联合抽样算 法.更进一步,在对模型进行参数估计的基础上,提出波动变量的向前多步预报分布的估计 方法.模拟实验结果表明:联合Gibbs抽样算法能够在保证估计精度的基础上得到优于单步 Gibbs抽样方法的抽样效率,对预报分布的特征分析可用于对金融时间序列的风险控制. 关键词:仿真分析;随机波动;贝叶斯分析;抽样;马尔科夫过程 中图分类号:0212.8 文献标识码:A Markov Chain Monte Carlo Methods for Bayesian Long Memory Stochastic Volatility Models HAO Li-ya,ZHU Hui—ming’,LI Su-fang,ZENG Hui-fang (College of Business Administration.Hunan Univ,Changsha,Hunan 410082。China) Abstract:TKs paper was concerned诚m simulation-based inference in generalized models of stochastic volatility with long memory.A more efficient Markov Chain Monte Carlo sampling method was exploited tO the analysis of the model,compared wi出the single step Gibbs sampling method.Based on the mmcated likelihood method,in which the long memory stochastic volatility model w弱expressed as a linear state space raodd,we utilized the forward filtering backward sampling method tO sample all the unobserved volatilities simultaneously.A simulation method for Bayesian prediction analysis of the volatilities was also devdoped.The simulation study has given the results of estimated pa— raImters and evaluated the performance 0f 0111"method.Moreover,the prediction analysis of the volatility cart be used tO control the risk of financial series. Key words:simulation;stochastic volatility;Bayesian analysis,simulation;markov processes 自从诺贞尔经济学奖获得者、美国著名的统计 学家Engletl3于1982年提出条件异方差模型 (ARCH)以来,研究金融时间序列波动聚集性的模 型逐步受到了学术界的关注.在ARCH模型的基础 上,Bollerslevc23发展出了广义条件异方差模型 (GARCH).与GARCH类模型不同,随机波动模型 (SV)令条件方差包含某些随机过程的不可见成分, 因此波动的改变是随机变化的,这种动态结构更适 · 收疆日期:2010-09—12 基金项目:国家自然科学基金资助项目(NSFC70771038),教育部留学回国人员科研启动基金项目(教外司留[ZOLO]609)I国家自然科 学基金项目重点项目(71031004)l教育部长江学者与创新团队发展计翅<经济管理复杂系统中的建模、优化与决策研究' (IRT0916)I国家社科基金重点资助项目(11AJL008) 作者简介:郝立亚(1983一),女,河北邯郸人,湖南大学博士研究生 t通讯联系人,E-maillzhuhuimin91999@yahoo.corn.∞ 万方数据
第10期 郝立亚等:基于MCMC的贝叶斯长记忆随机波动模型研究 83 合度量金融时间序列方差的聚集性特征,在实践中 值为4,方差为/(1一2)的正态分布.此外,误差 获得了广泛的应用3]. 项e:和7:分别为高斯白噪声过程且相互独立, 另一方面,大量实证研究也表明金融经济中的 为了刻画波动的长记忆特征,将模型中波动方 时间序列除了具有方差的时变性特征外,观测变量 程的自回归过程推广为分整ARMA过程,即: 之间同时也具有较强的相依性特征,即长记忆性.表 (1-B)p(B)h=(B)8· (3) 现为随着时间间隔的增加,观测序列的自相关系数 其中:d∈(-0.5,0.5),{6}为方差为x的高斯白 衰减的非常缓慢.为了在考虑波动聚集性的基础上 噪声过程。(B)代表波动的自回归过程多项式 刻画这种结构中的长记忆性特征,Breidt等人[们令 p(B)=1-m:B-B2一…-PBP;(B)代表移 SV的波动方程服从ARFIMA过程,构建了长记忆 动平均过程多项式(B)=1一B一2B2一…一 随机波动模型(LMSV).该模型及其各种扩展形式 被用于对股票收益率及经济时间序列长记忆特征的 日,B°,此处,阶数p和q均为非负整数,B为滞后算 研究中[5-门. 子.为保证波动过程的弱平稳性,自回归多项式和移 对于LMSV模型估计方法的研究,也是国内外 动平均多项式必须满足所有特征根都在单位圆内, 关注的热点问题.其中大部分方法都是建立在频域 并且设有公因子,此时式(1)和式(3)共同组成 估计的基础上,如Deo和Hurvich]提出了LMSV LMSV模型的一般形式 模型的频域半参数估计方法,Islas-Camargo和 为了便于对该模型进行统计推断,令y:=log Venegas-Martinez们利用Whittle方法估计LMSV 片,此时(1)式转化为如下的线性形式: 模型的谱密度并进行了实证分析.自20世纪90年 y.E(log e)+h+(log e:-E(log e2))= 代,随着贝叶斯统计推断技术特别是马尔科夫链蒙 -1.2704+h,+ (4) 特卡洛(MCMC)稳态模拟技术的发展,为SV模型 其中:E(loge)=-1.2704,Var(1oge)=4.93. 的研究提供了简便有效的途径1].针对LMSV模 由此可见,在观测方程的线性表达式中,扰动项 型,So1]利用单步Gibbs抽样算法估计模型的参 为自由度为1,方差为4.93的独立对数卡方分布. 数,波动变量的估计基于带误差项的高斯过程的平 另一方面,波动的长记忆过程(3)可以写成扰动 滑方法.然而LMSV模型中不仅存在与时间同维的 项的无限阶移动平均形式: 潜在波动变量,且波动过程的长记忆特征不便于对 h=(1-B)((B)-8(B)6= 模型进行贝叶斯估计,致使基于数据扩展的单步 Gibbs抽样算法效率比较低下,本文通过状态空间 (∑iAB)i 重列方法得到模型的近似表示,将向前滤波向后抽 容易证明,在d≠0时,长记忆过程没有维度有限 样算法引人对波动变量的估计过程中,设计了 的状态空间表示形式,其无限维的状态空间表示为: Gibbs联合抽样算法,通过模拟实验对两种算法的 h GM,+e,M,FM+He1. (5) 效率进行了比较分析. 此处M=(h-1,h+ir1,…)T,hw=E(h,| h;,h1,…).此外,状态空间模型的参数形式为: 1模型结构分析 H=(a1,2,…)T,G=(1,0,0,…), (010 标准SV模型是对在期权定价中普遍使用的扩 F 0 010 散过程进行离散化处理后得出的,模型形式如下: r:=exp (h:/2)e, 下面首先证明LMSV模型的状态空间近似表 e~i.i.dN(0,1), (1) 示形式,然后设计出高效的MCMC抽样算法. h,=u十p(hr1-μ)十on hi.i.dN(0,1). (2) 2贝叶斯分析及MCMC算法设计 其中:r,为t时刻经过均值修正后的收益率,h,代表 对应时刻的潜在对数波动,且服从一阶自回归过程, 在对SV模型进行MCMC抽样时,首先利用数 其中水平参数为μ,持续性参数为p.令服从均 据增广方法,得到新的参数空间⑧=HX0,此时, 万方数据
第10期 郝立亚等:基于MCMC的贝叶斯长记忆随机波动模型研究 83 合度量金融时间序列方差的聚集性特征,在实践中 获得了广泛的应用[3]. 另一方面,大量实证研究也表明金融经济中的 时间序列除了具有方差的时变性特征外,观测变量 之间同时也具有较强的相依性特征,即长记忆性.表 现为随着时间间隔的增加,观测序列的自相关系数 衰减的非常缓慢.为了在考虑波动聚集性的基础上 刻画这种结构中的长记忆性特征,Breidt等人¨3令 SV的波动方程服从ARFIMA过程,构建了长记忆 随机波动模型(LMSV).该模型及其各种扩展形式 被用于对股票收益率及经济时间序列长记忆特征的 研究中‘5-7]. 对于LMSV模型估计方法的研究,也是国内外 关注的热点问题.其中大部分方法都是建立在频域 估计的基础上,如Deo和Hurvieh【83提出了LMSV 模型的频域半参数估计方法;Islas-Camargo和 Venegas—Martinez;9]利用Whittle方法估计LMSV 模型的谱密度并进行了实证分析.自20世纪90年 代,随着贝叶斯统计推断技术特别是马尔科夫链蒙 特卡洛(MCMC)稳态模拟技术的发展,为SV模型 的研究提供了简便有效的途径[1州.针对LMSV模 型,SoEll 3利用单步Gibbs抽样算法估计模型的参 数,波动变量的估计基于带误差项的高斯过程的平 滑方法.然而LMSV模型中不仅存在与时间同维的 潜在波动变量,且波动过程的长记忆特征不便于对 模型进行贝叶斯估计,致使基于数据扩展的单步 Gibbs抽样算法效率比较低下.本文通过状态空间 重列方法得到模型的近似表示,将向前滤波向后抽 样算法引入对波动变量的估计过程中,设计了 Gibbs联合抽样算法,通过模拟实验对两种算法的 效率进行了比较分析. 1模型结构分析 标准SV模型是对在期权定价中普遍使用的扩 散过程进行离散化处理后得出的,模型形式如下: rt=exp(k/2)£。, e,~i.i.dN(O,1), (1) hr=产+尹(^一l--/生)+白’7t, 琅~i.i.dN(O,1). (2) 其中:‘为t时刻经过均值修正后的收益率,屯代表 对应时刻的潜在对数波动,且服从一阶自回归过程, 其中水平参数为/.z,持续性参数为妒.令^-服从均 9(B)=1一qaB一伫B2一…--qopB’;一(B)代表移 h。一(1一B)。(9(B))一1口(B)&= (∑二。如B’)&. F=【;}1 肛I?:1.7...|. 01..:::]. 2贝叶斯分析及MCMC算法设计 在对SV模型进行MCMC抽样时,首先利用数 据增广方法,得到新的参数空间@,=H×0.此时, 万方数据
84 潮南大学学报(自然科学版) 2011年 一种直接的抽样方法是根据各个参数的满条件后验 差的协方差阵,则模型(5)的卡尔曼滤波为: 分布,逐次完成抽样更新过程,再利用蒙特卡洛积分 (M=E(M), 方法分析参数联合后验分布的矩属性1],即为单步 Vi E(MM)-E(M 1T), Gibbs抽样方法.然而由于SV模型的波动变量之 g=鼎1+M,-(绵1十x)o绵1+y/品+1D, 间具有较强的序列相关性,因此Markov链收敛速 M+=(…), 度较慢,估计效率较低.利用卡尔曼滤波框架下的向 +w=i+10+(h,-1®)(o鼎.1+)/(+1). 前滤波和向后抽样技术,能够对潜在波动向量进行 (6) 联合抽取,从而大大提高估计效率.对于LMSV模 模型的对数似然函数表达式为: 型,观测方程的扰动项仙,并不服从正态分布,因此 不能进行联合抽样.为解决这一问题,本文利用混合 logk=-受1og2x- 正态近似方法来通近仙,的分布.下面在给出具体抽 {容:+D+a} (7) 样算法前,首先证明对于无限维状态空间模型(5), 其确切似然函数只依赖于其前n个状态变量,n为 其中,=GM,=10. 向量h的时间维度. 若假设取M1中的前n个变量组成向量M,=E 假设V,=(c)代表时刻t状态M,的估计误 (M,M,…MD)T,此时的卡尔曼滤波为 1=(a)-1,2.=(E(MM9)-E(M9)-12,- 1)= ∫绵*1+,-(G蝌.1+1)(G+入)/(9+1)i,j≤n-1, ad/(+1)i=n或j=n: (8) M+1=(M+D,M,,+)T: MS+i)= M蝌+(h,-M0)(绵.:+λ)/(a+1)i≤n-1: l(h,-M)λ./(G+1)i=n 此时对数似然函数可表示为: h,=(o,1,…c)M log 1.-2log 2- 1M1=e0M+(1,0,…,0)re: (10) {宫aoga++会} (9) 其中:M,=(M1,M2,…,M.c1)r,Ic为C阶单 其中:=GM,=1w,由此可见,协方差矩阵7即 位矩阵,C为截尾阶数,其经验值在10~20之间. 为V1的前n行n列元素所组成的子矩阵,则鼎= 观测方程(4)误差项的差分也可以转化为状态 11.对比式(6)和式(8)可以得到,t时刻的协方差 空间形式: 矩阵7,等同于V,的前n一t+1行n一t+1列元素 △w:=X,十s (11) 组成的子矩阵,而M,的前n一t十1行n一t十1列元 X+1=一 素与M,相同,保证了=10=10=五.此外,由 注意到△y,=h,+w:,将状态空间模型(10) 对数似然函数的表达式容易看出log1n=log1,·由 和(11)进行合并,得到: 此可见,无限维状态空间模型的确切似然函数只依 △y.=(1,0,1,…c)Z+w 赖于状态向量中的前”个变量,因此在计算过程中 00 Z1= o Q Z,十(-仙e+10…0)T. 可以只考虑前n个状态变量.进一步,由于利用差分 截尾方法可以对移动平均状态空间模型产生较好的 (12) 近似,因此可采用差分截尾方法进行近似计算·首 0 其中,Q= 0 Z=(X MI)T. 先对波动序列(h)进行一阶差分得到序列(M), Ic 0 得到波动差分序列的状态空间表达式: 而模型初始状态变量的定义为: 万方数据
湖南大学学报(自然科学版) 2011每 一种直接的抽样方法是根据各个参数的满条件后验 分布,逐次完成抽样更新过程,再利用蒙特卡洛积分 方法分析参数联合后验分布的矩属性[1们,即为单步 Gibbs抽样方法.然而由于SV模型的波动变量之 间具有较强的序列相关性,因此Markov链收敛速 度较慢,估计效率较低.利用卡尔曼滤波框架下的向 前滤波和向后抽样技术,能够对潜在波动向量进行 联合抽取,从而大大提高估计效率.对于LMSV模 型,观测方程的扰动项蛳并不服从正态分布,因此 不能进行联合抽样.为解决这一问题,本文利用混合 正态近似方法来逼近cc,。的分布.下面在给出具体抽 样算法前,首先证明对于无限维状态空间模型(5), 其确切似然函数只依赖于其前挖个状态变量,,l为 向量h的时间维度. 假设Ⅵ=(∥)代表时刻t状态M,的估计误 差的协方差阵,则模型(5)的卡尔曼滤波为: 似=以晒), lⅥ=E(M孵)一E(磁1T), .{∥’=龆.i+1+|:IAj一(掮.。+丸)(档.·+≈)/(击P+1), I矾I=('’.··)T, 【f(州)=f+1_co+(屯一1(o)(貔,l+九)/(蠢{I+1). (6) 模型的对数似然函数表达式为: log z-=一罢log 27c一 丢{室1 mg _、f— ca{{’Ⅷ+箫11箬,).∽ u 上 , 其中ji,=CA//,=1(1). 若假设取髓。中的前,1个变量组成向量新。=E (M{",膨”,…M:”)丁,此时的卡尔曼滤波为 讧一(厅5l’)埘。1.2..、。=(E(M:1’Mjl’)一E(硒1’M—sm))¨.1.2.….., ;(m)一户翁.卅+AAj一(厅翁.1+.:It)(群-。l+.;I,)/(孑ifI+1) f,歹≤行一1I 哪 I^矾’尹-1(t1)八II口-1(t1)+1)f=咒或歹一竹; 甄+。=(硒州),j时1,…,硒m’)r, …‘礤升,);.『砑翁+(k一蕊。)(厅翁。t+天·)/(方柠+1)i≤豫一1; I(k一翮o)A。/(蟊fI+1)f=‰ 此时对数似然函数可表示为: log厶=一詈log 2丌一 号{骞mgⅢ∽+D+祭等,).㈨ 其中:元;=G砑。=1(1).由此可见,协方差矩阵钆即 为V。的前竹行,l列元素所组成的子矩阵,则盯i{'= 11∽.对比式(6)和式(8)可以得到,t时刻的协方差 矩阵K等同于Ⅵ的前,l—t+1行以一t+1列元素 组成的子矩阵,而M:的前,l一£+1行以一£+1列元 素与磁相同,保证了左,=1(D一1(o=五。.此外,由 对数似然函数的表达式容易看出log Z。=log厶.由 此可见,无限维状态空间模型的确切似然函数只依 赖于状态向量中的前行个变量,因此在计算过程中 可以只考虑前”个状态变量.进一步,由于利用差分 截尾方法可以对移动平均状态空间模型产生较好的 近似,因此可采用差分截尾方法进行近似计算.首 先对波动序列(虬)进行一阶差分得到序列(肚,), 得到波动差分序列的状态空间表达式: (8) I龇t 2(知’A1’.“Ac)Mr, .i‰z一(■M铷,o,…mT岛.n∞ 其中:M=(M.1’iV/,,2’…,M.DH)f,Ic为C阶单 位矩阵,C为截尾阶数,其经验值在10"--20之间. 观测方程(4)误差项的差分也可以转化为状态 空间形式: 』锄一;五十她’ ‘ (11) I l I J 【X件1 2一∞I· 注意到旬。=△^,+血,,将状态空间模型(10) 和(11)进行合并,得到: f却t=(1,k,jLl,…Ac)五十∞t, 1z斗。=[:三]z。+c一触£件t 。 … 。,T. (12) 其中,Q=[芝:],z—c五M丁,T. 而模型初始状态变量的定义为: 万方数据
第10期 郝立亚等:基于MCMC的贝叶斯长记忆随机波动模型研究 85 X1=-w,M1y=6-5j=1,2,…,C+1. 列过程,分别运行单步Gibbs抽样算法和Gibbs联 在采用混合正态近似方法来逼近仙:的分布时, 合抽样技术进行参数估计.设定参数真实值为“ 即在5=i的条件下,模型(12)为高斯线性状态空 =-0.1,d=0.1,x=1.令y=服从参数为ar 间模型形式,状态变量的满条件联合后验分布可以 和R.的共轭逆伽玛分布,参数μ和d服从支撑域上 直接利用向前滤波向后抽样的MCMC方法得到. 的扩散分布.为消除参数的初始值对估计过程的影 下面给出该算法的具体实施步骤.给定各参数 响,构造了两条Markov链进行稳态模拟,前10000 的初始化值{s8,do),o,日o},依次迭代:1)从 次迭代做退火处理,后10000次迭代作为参数估计 潜在波动序列(h)-1的联合满条件后验分布 的Monte Carlo试验数据. r((h)-1m|rh,s,do,o,⑧o)中抽取 图1为双条Markov链的收敛诊断图.容易看 (h)出*,2)从(s)-1的满条件后验分布 出,Gelman-Rubin收敛因子随着迭代次数的增加逐 π(s,)-1|rm,h)中抽取s出3)从d的满条件 渐趋近于l,说明所构造的两条Markov链没有明显 后验分布π(d|n,m,h,o),⊙o)中抽取d,4) 的差别,并且都已经收敛到目标分布,图2为参数后 从重的联合满条件后验分布π(Φ|nn,h,d”, 验分布核密度估计图,其中虚线表示Gibbs联合抽 ⑧)中抽取Φ1),5)从日的联合满条件后验分布 样技术得到的各参数的后验分布核密度图,实线表 π(⑧|nm,h,,d)中抽取⊙),重复上述步 示单步Gibbs抽样算法得到的参数估计图.可以看 骤N次,直至Markov链平稳.前M次样本做退火 出,模型参数μ的后验分布具有对称性,而长记忆参 处理,用抽样序列{h,s0.,d0,重0,⊙D}=cM4D,N 数d的后验分布呈现出偏态特征.一般来说,这种偏 估计模型经过的参数联合后验分布, 态特征可以通过增加Monte Carlo抽样次数,以及 在此基础上对潜在波动的预报分布进行贝叶斯 相应增加退火的样本数而得到控制.图3和图4分 分析.在已有观测变量信息下,潜在波动变量的向前 别给出了两种算法下参数的相关系数图,容易看出 1步后验预报分布为: 联合抽样下的相关系数以较快速度衰减为0,具有 f(h+1|n1n)= 较高的抽样效率, f(h Ih,A)f(h,AI r)d(h,A). 根据Gibbs抽样结果,利用MCMC数值算法 可以得到模型参数的贝叶斯估计值以及相应的分位 (13) 区间估计,如表1和表2所示.容易看出,两种算法 容易看出,预报分布的具体形式可以通过对密 得到的后验估计值基本接近模拟真实值,MC误差 度函数f(h+1|h0,AD)的蒙特卡洛模拟过程得 远小于后验标准差且相对于不同的算法没有明显差 到,即利用获得的预测样本(h得)-(4D,N估计波动 别,说明Gibbs联合抽样算法和单步Gibbs算法在 变量的后验预报分布.则对于波动变量的P步向前 模型参数的估计精度方面没有明显的差别, 预报分布,其抽样过程如下:1)首先对密度函数 1.4 f(h+1|h,A)进行抽样,得到(h)-MmDN 1.3 2)然后对于方=2,3,…,P,分别进行如下两步抽 12 样:(a)从观测量预报密度函数f(rtr|h1, 11 10 Ao,r9-2)中抽取(r)-mN,(b)从波动变 10000 14000 18000 量预报密度函数f(h+;|h-1,Ao,r保1)中抽取 (a)参数4的抽样收敛诊断图 (h,)-(M4DN· 由此可以得到模型潜在波动变量的 35: 3.0 P步向前预报分布的模拟样本,并据此对分布形式 25 进行推断 20 L5 1.0L 10000 14000 18000 3模拟算例 (b)参数d的抽样收敛诊断图 图1双条Markov链的收敛诊断图 为检验上述算法的有效性,模拟长记忆时间序 Fig.1 The shrink factor plot of the two Markov chains 万方数据
第10期 郝立亚等:基于MCMC的贝叶斯长记忆随机波动模型研究 85 Xl=一蛳,Ml。,=192-j,歹=1,2,…,C+1. 在采用混合正态近似方法来逼近她的分布时, 即在&=f的条件下,模型(12)为高斯线性状态空 间模型形式,状态变量的满条件联合后验分布可以 直接利用向前滤波向后抽样的MCMC方法得到. 下面给出该算法的具体实施步骤.给定各参数 的初始化值(S.(0。:,d∞’,西‘0’,0∞’),依次迭代:1)从 潜在波动序列(^I)l—l。。的联合满条件后验分布 ,r((^。),,l。。 I n.。,sio三,d∞’,①‘o’,O‘o’) 中抽取 (^。)譬。。;2)从(&)川。。的满条件后验分布 石((函)Ⅲ。。I n刚.Il班)中抽取s绺;3)从d的满条件 后验分布,r(d rl刖h‘1’,①‘0’,0如’)中抽取dn’;4) 从①的联合满条件后验分布丌(垂l 7"1刚h“’,d‘1’, O如’)中抽取垂n’I 5)从@的联合满条件后验分布 ,r(@J 7"1刚hn’,西n’,dn’)中抽取0n’,重复上述步 骤N次,直至Markov链平稳.前M次样本做退火 处理,用抽样序列{,‘lhCO刚si曼,d‘o,西∽,0∞}州褂1).Ⅳ 估计模型经过的参数联合后验分布. 在此基础上对潜在波动的预报分布进行贝叶斯 分析.在已有观测变量信息下,潜在波动变量的向前 1步后验预报分布为: ,(_}l井l T1。。)= r l厂(矗井l h。,A)f(h。,A I,1。。)矗(^。,A). J (13) 容易看出,预报分布的具体形式可以通过对密 度函数,(^井-I^:o,A∽)的蒙特卡洛模拟过程得 到,即利用获得的预测样本(^算.)州蝌mN估计波动 变量的后验预报分布.则对于波动变量的P步向前 预报分布,其抽样过程如下:1)首先对密度函数 ,(IIl一-I^≯,A∽)进行抽样,得到(^算1)川肼1)lN, 2)然后对于.f一2,3,…,P,分别进行如下两步抽 样:(a)从观测量预报密度函数厂(o伊,I^%-, A∞,硝k。)中抽取(—譬。)州黼)IN,(b)从波动变 量预报密度函数,(^州J.Il绺。,A∞,稃k。)中抽取 (^譬)州脚1)IN.由此可以得到模型潜在波动变量的 P步向前预报分布的模拟样本,并据此对分布形式 进行推断. 3模拟算例 为检验上述算法的有效性,模拟长记忆时间序 列过程,分别运行单步Gibbs抽样算法和Gibbs联 合抽样技术进行参数估计.设定参数真实值为卢 =一0.1,d一0.1,r一1.令y=,服从参数为口f 和展的共轭逆伽玛分布,参数卢和d服从支撑域上 的扩散分布.为消除参数的初始值对估计过程的影 响,构造了两条Markov链进行稳态模拟,前10 000 次迭代做退火处理,后10 000次迭代作为参数估计 的Monte Carlo试验数据. 图l为双条Markov链的收敛诊断图.容易看 出,Gelman-Rubin收敛因子随着迭代次数的增加逐 渐趋近于1,说明所构造的两条Markov链没有明显 的差别,并且都已经收敛到目标分布.图2为参数后 验分布核密度估计图,其中虚线表示Gibbs联合抽 样技术得到的各参数的后验分布核密度图,实线表 示单步Gibbs抽样算法得到的参数估计图.可以看 出,模型参数弘的后验分布具有对称性,而长记忆参 数d的后验分布呈现出偏态特征.一般来说,这种偏 态特征可以通过增加Monte Carlo抽样次数,以及 相应增加退火的样本数而得到控制.图3和图4分 别给出了两种算法下参数的相关系数图,容易看出 联合抽样下的相关系数以较快速度衰减为0,具有 较高的抽样效率. 根据Gibbs抽样结果,利用MCMC数值算法 可以得到模型参数的贝叶斯估计值以及相应的分位 区间估计,如表1和表2所示.容易看出,两种算法 得到的后验估计值基本接近模拟真实值,MC误差 远小于后验标准差且相对于不同的算法没有明显差 别,说明Gibbs联合抽样算法和单步Gibbs算法在 模型参数的估计精度方面没有明显的差别. 10 000 14 000 18 1200 (a)参数JEl的抽样收敛诊断图 lO 0∞ 14 000 18 OOO (b)参数d的抽样收敛诊断图 图1双条Markov链的收敛诊断图 Fig.1 11艟shrink factor plot of the two Markov chains 万方数据
86 湖南大学学报(自然科学版) 2011年 0.5 05 20 (a):的后敛核密度图 0 (a)u的自相关系数图 0.5 025 0.50 40 (b)d的后敛核密度图 (b)d的自相关系数图 图2两种抽样方法参戴的后验密度估计图 Fig.2 Estimated posterior density plots 图4联合Gibbs抽样算法中参数的相关系数图 of both the methods Fig.4 Correlogram of the parameters by block Gibbs sampling 表1 GIbbs联合抽样算法的后验估计值 Tab.1 The posterior estimation of the block Gibbs sampling 0.3F MC 2.5% 97.5% 参数 均值 标准差 误差 分位数 分位数 025 -0.09320.18730.0107-0.49910.2660 0.1 d0.1127 0.21470.0157-0.36950.4503 t0.9681 0.18460.01570.60761.3420 (a)h1的经验密峦度函数图 表2单步Gbbs抽样算法的后难估计值 Tab.2 The posterior estimation of the single Gibbs sampling 0.50 参数 MC 97.5% 均值 标准差 2.5% 误差 分位数 分位数 0.25 -0.09450.18760.0105-0.50030.2671 d 0.1113 0.22180.0137-0.36810.4498 0.96600.18890.01620.60531.3412 4 (b)r+1的经验密度函数图 在上述MCMC抽样的基础上,图5给出了潜 图5波动和收益序列的一步向前预报密度分布图 Fig.5 The one-step-ahead predictive distribution 在波动变量和观测变量的向前1步后验预报密度函 数图.显然,两个预报密度函数具有对称性,观测变 4结论 量的预报分布具有较大的峰度,预报分布的统计特 征可用于计算观测序列的VaR值并进行风险控制. 本文针对LMSV模型的参数估计和预报分布 1.0 的问题,首先证明了对于具有长记忆结构的无限维 状态空间模型,其确切似然函数只依赖于n个状态 0.5 变量,n为向量h的时间维度.在此基础上,通过对 模型在状态空间框架下的近似表示,将向前滤波向 后抽样算法引人对波动变量的估计过程中,设计了 (a)u的相关系数图 Gibbs联合抽样算法,并提出波动变量预报分布的 .0 估计方法.相对于单步Gibbs抽样算法的模拟实验 表明:两种抽样方法在估计精度方面没有明显区别, 05 但是联合Gibbs抽样算法的抽样效率明显优于单步 Gibbs抽样方法,而对潜在波动变量和观测变量的 50 100 (b)d的相关系数图 后验预报分布的分析可用于计算观测序列的VaR 图3单步Gibb3抽样算法中参数的相关系数图 值并进行风险管理和控制. Fig.3 Correlogram of the parameters by single Gibbs sampling 万方数据
86 湖南大学学报(自然科学版) 2011年 (B)脚的后敛核密度图 (b)d的后敛核密度图 图2 两种抽样方法参数的后验密度估计图 Fig.2 Estimated posterior density plots of both the methods 襄1 Gibbs联合抽样算法的后验估计值 卫山.1 The posm-ior esthnation of the block Gibl葛mmp,rmg 衰2单步Gibbs抽样算法的后难估计值 "lhb.2 The post,栅estimation 0f the曲吲Ie Gibbs唧I细g 在上述MCMC抽样的基础上,图5给出了潜 在波动变量和观测变量的向前1步后验预报密度函 数图.显然,两个预报密度函数具有对称性,观测变 量的预报分布具有较大的峰度.预报分布的统计特 征可用于计算观测序列的VaR值并进行风险控制. (b)d的相关系效图 图3 单步Gibbs抽样算法中参数的相关系数图 Fig.3 Correlogram of the parameters by single Gibbs sampling 汛…….h…….. (a)卢的自相关系敷图 (b)d的自相关系数图 图4联合Gibbs抽样算法中参数的相关系数图 Fig.4 Correlogram of the parameters by block Gibbs sampling (a)JlI—l的经验密度函数图 -6J.A _4 -2 0纵。2 4 6 (b)r—l的经验密度函数图 图5波动和收益序列的一步向前预报密度分布图 Fig.5 The one-step-ahead predictive distribution 4结论 本文针对LMSV模型的参数估计和预报分布 的问题,首先证明了对于具有长记忆结构的无限维 状态空间模型,其确切似然函数只依赖于行个状态 变量,咒为向量h的时间维度.在此基础上,通过对 模型在状态空间框架下的近似表示,将向前滤波向 后抽样算法引入对波动变量的估计过程中,设计了 Gibbs联合抽样算法,并提出波动变量预报分布的 估计方法.相对于单步Gibbs抽样算法的模拟实验 表明:两种抽样方法在估计精度方面没有明显区别, 但是联合Gibbs抽样算法的抽样效率明显优于单步 Gibbs抽样方法,而对潜在波动变量和观测变量的 后验预报分布的分析可用于计算观测序列的VaR 值并进行风险管理和控制. 万方数据
第10期 郝立亚等:基于MCMC的贝叶斯长记忆随机波动模型研究 87 [7]BENT J C,MORTEN Q N.The effect of long memory in vol- 参考文献 atility on stock market fluctustions[J].The Review of Eco nomics and Statistics,2007,89(4)684-700. [1]ENGLE R.Autoregressive conditional heteroskedasticity with eatimates of the variance of UK inflation[J].Economet Rica, [8]DEO R,HURVICH C.On the log-periodogram regression es- timator of the memory parameter in the long-memory stochas- 1982,50,987-1008. [2]BOLLERSLEV T.Generalized autoregressive conditional het- tic volatility models[J].Econometric Theory,2001,17,686 eroscedasticity[J].Journal of Econometrics,1986,31,307- -710. [9]ISLAS CAMARGO A,VENEGAS-MARTINEZ F.Long 327. [3]KIM S,SHEPHARD N,CHIB S.Stochastic volatility,likeli- memory volatility in Latin American stock markets[R].De- hood inference and comparison with ARCH models[J].Re partment of Statistics,ITAM,2003. view of Economic Studies,1998,65(3):361-394. [10]朱慧明,李素芳,虞克明,等.基于Gibbs抽样的贝叶斯金融 [4]BREIDT FJ,CARTO N.DELIMA P.On the detection and 随机被动模型分析J门.潮南大学学报,自然科学版,2008,35 estimation of long memory in stochastic volatility[J Journal (12),88-92. of Econometrics,1998,83,325-348. ZHU Hui-ming,LI Su-fang,YU Ke-ming,et al.Bayesian a- nalysis of stochastic volatility model using gibbs sampling[J [5]SO M K P,SUSANNA W Y K.A multivariate long memory stochastic volatility model[J].Physica A,2006,362:450- Journal of Hunan University:Natural Sciences,2008,35(12) 88-92.(In Chinese) 464. [6]苏卫东,张世英。多元长记忆SV模型及其在护深股市的应用 [11]So MK P.Bayesian analysis of long memory stochastic volatil- [门.管理科学学报,2004,7(1):38一44. ity models[J].Sankhya,2002.64(1),1 -10. SU Wei-dong,ZHANG Shi-ying.Multivariate long memory [12]JACQUIER E,POLSON N G,ROSSI P E.Bayesian analysis SV model and its application to Shanghai and Shenzhen stock of stochastic volatility models (with discussion).Journal of markets[J].Journal of Management Sciences in China.2004, Business and Economic Statistics,1994,12 371-417. 7(1):38-44.(In Chinese) (上接第81页) o},{0,1,2,5,9,10,∞},{0,1,2,7,14,22,0},{0, Theory,1971,11,190-195. 1,2,8,12,19,0},{0,1,2,10,13,14,o},{0,1,4,5, [4]ALLTOP W O.An infinite class of 4-designs[J].Combin Theory,1969,6:320-322. 11,22,o}. [5]COLBOURN J,DINITZ H.The CRC handbook of combina- 定理4若G=PGL(2,37)区传递作用于4- torial designs[M].Boca Raton-New York-London-Tokyo: (38,7,入)设计,则入=24.且存在3个不同构的4- CRC Press,1996. (38,7,24)设计. [6] BIBERBRAUER J.A family of 4-designs with block sire 9 定理5证明以及设计的构造方法与定理3.2 [J].Discrete Math,1993,138,113-117. 完全相似.运行matlab得到3个不同构的4-(38, [7]陈静,陈署被,刘伟使.二维射影线性群与区传递4-(,6,) 设计[刀.中国科学:数学,2010,40(11),1045-1054. 7,24)设计(gx,B),其中 CHEN Jing,CHEN Shu-bo,LIU Wei-jun.Two-dimensional =GF(37)U{o},B={0,1,4,15,22,32,o linear groups and 4-(v,6,A)designs [J].Sci Sin Math,2010, },{0,1,4,20,22,28,o},{0,1,5,6,19,29,o}. 40(11),1045-1o54.(In Chinese) [8]BETH T,JUNGNICKEL DJ,LENZ H.Design Theory[M]. 参考文献 Cambridge:Cambridge University Press,1993. [9]CAMERON PJ,PRAEGER C E.Block-transitive designs I, [1]CAMERON P J,MAIMANI H R,OMIDI G R,et al.3-De- Point-imprimitive designs [J]Discrete Math,1993,118,33 signs from PSL(2,q)[J].Discrete Math,2006,306:3063- -43. 3073. [10]VAN LELJENHORST D C.Orbits on the projective line[J]. [2]LI W X.Simple 3-designs from PSL (2[D].Shanghai Combin Theory Ser A,1981,31:146-154 Shanghai Jiao Tong University,2006. [3]ALLTOP W O.Some 3-designs and a 4-design[J].Combin 万方数据
第10期 郝立亚等:基于MCMC的贝叶斯长记忆随机波动模型研究 87 参考文献 [1]ENGLE R Autoregressive conditional heteroskedasticity with estimates of the variance of UK inflation[J].Economet Rica, 1982,501987--1008. [2]BOLLERSLEV T.Generalized autoregrcssive conditional heteroscedasticity[,J].Journal of Econometrics,1988,31 l 307— 327. [3]KIM S。SHEPHARD N。CHIB&Stochastic volatility s likdi— hood inference and comparison with ARCH models[J].Review of Economic Studies,1998,65(3)l 361--394. [43 BREIDT F J,CARTO N·DELIMA P.On the detection and estimation of long memory in stochastic volatility[J].Journal of Econometrics。1998,83,325--348. [5]so M K P,SUSANNA WY K.A multivariate long memory stochastic volatility modelCJ].Physica A,2006。362 l 450一 464. [6]苏卫东,张世英.多元长记忆sv模塑及其在沪深股市的应用 [J].管理科学学报,2004,7(1)t 38—44. SU Wei-dong,ZHANG Sh卜ying.Multivariate 10ng memory SV model and its application to Shanghai and Shenshen stock markets[J].Journal of Management Sciences in China.2004. 7(1)l 38—44.(In Chinese) (上接第81页l ∞},{0,l,2,5,9,10,∞},{0,1,2,7,14,22,∞),{0, 1,2,8,12,19,∞),{0,1,2,10,13,14,∞),{0,1,4,5, 11,22,∞}. 定理4若G=PGL(2,37)区传递作用于4一 (38,7,A)设计,则A一24.且存在3个不同构的4一 (38,7,24)设计. 定理5证明以及设计的构造方法与定理3.2 完全相似.运行matlab得到3个不同构的4一(38, 7,24)设计(甄BG),其中 彩=GF(37)U{∞},B={0,l,4,15,22,32,∞ ),{0,1,4,20,22,28,∞),{0,1,5,6,19,29,∞}. 参考文献 [1]CAMERON PJ,MAIMANI H R·OMIDI G R,“a1.3-Designs from PSL(2.q)[J].Discrete Math.2006,306l 3063— 3073. [2]L1 wx Simple 3-designs from PSL(2·口)[D].Shanghai s Shanghai Jiao Tong University.2008. Is]ALLTOP W O.Some 3-designs and a 4-design[,J'1.Combin [7]BENTJ C,MORTEN Q N.The effect of long memory in vol— atility on stock market fluctuations[,J].The Review of Economics and Statistics,2007,89(4)I 684—700. [8]DEO R,HURⅥCH C.On the log-periodogram regression as。 timator of the memory parameter in the long-memory stochas— tic volatility models[,J].Econometric Theory,2001,17,686 —710. [9]lsLA孓CAMARGo A,Ⅵ£NEGAs.MARllNEz F.Longmemory volatility in Latin American stock markets[R].Department of Statistics,ITAM,2003. [10]朱慧明,李索芳,虞克明,等.基于Gibbs抽样的贝叶斯金融 随机波动模型分析口].湖南大学学报,自然科学版t 2008,35 (12)t 88—92. ZHU Hui-ming。LI Su-fang,YU Ke-ming,et a1.Bayesian a。 nalysis of stochastic volatility model using gibbs sampling[J]. Journal of Hun蚰UniversitylNatural Sciences,2008,35(12)I 88—92.(In Chinese) [1 1]So M K P.Bayesian analysis of long memory stochastic volatil。 ity models[J].Sankhya.2002,64(1)l l—10. [12]JACQUIER E,POLSON N G,ROSSI P E.Bayesian analysis of stochastic volatility mndds(with discussion)I-J].Journal of Buainess and Economic Statistics。1994,12l 371—417. Theory,1971,11 l 190一195· [4]ALLTOP W o.An infinite class of 4-designs['J'].Combin Theory.1969,6t 320--322. [5]COLBOURN J,DINITZ H.The CRC handbook of combina。 torial designs['M].Boca Raton—New York-London-Tokyo, CRC Press,1996. [6] mBERBRAUER J.A family of 4-designs with block size 9 [刀.Discrete Math,1993,138I 113—117. [7]腺静,陈署波,刘伟俊.二维射髟线性群与区传递4一(口,6,A) 设计[J].中国科学t数学,2010,40(11)·1045--1054. CHEN Jing。CHEN Sh”bo,LIU Wei-iun.Two-dimensinnal linear groups and4-(t..6.^)designs FJ].Sci Sin Math,2010, 40(11)l 1045—1054.(In Chinese) [8]BETH T,JUNGNICKEL DJ,LENZ H。Design Thcory[M]. CambridgeI Cambridge University Press,1993. [9]CAMERON P J·PRAEGER C E.Block-transitive designs Il Point-imprimitive designs[J].Discrete Math,1993,118,33 --43. [10]VAN LELJENHORST D C Orbits on the projective line[,J]. Combin Theory Set A,1981,31 l 146--154. 万方数据