正在加载图片...
第2期 胡素华,等:正态逆高斯扩散模型的MCMC估计 135 式中:c是标准化常数;p(X|)是以0为条件的似然 式中,函数f(·)是一个实值函数,遍历均值的中心 函数;π()是0的先验密度。贝叶斯方法要求统计推 极限定理有: 断必须是基于参数的后验分布,然而直接处理后验 √/N(fN-E.(f(0))P+N(0,a)(12) 是很困难的.但是,如果可从后验分布抽取参数向量 E,(·)是关于分布π(θ|X)的期望算子,为讨论 的样本,关于参数向量的统计推断就可以使用一般 E.(f()做为遍历均值估计的准确性,必须估计 的蒙特卡罗方法实现。MCMC方法的目的就是提供 a形。估计o形最普遍的方法就是由Roberts提出的 一种从参数后验分布中抽取样本的一种机制。由于 块均值。 从后验中直接取样是很困难的,从而可以用MCMC 为了使用块均值估计σ子,MCMC算法运行N= 方法建立马尔可夫链,使它的稳定分布和后验分布 m×n,这里n足够大,取: 相同,当马尔可夫链收敛时,模拟值可以看作是从后 验分布中抽取的样本。 y= f() (13) n;-(使)+1 关于MCMC方法有Gibbs取样和MH算法二 对于=1,2,…,m,y近似于独立同分布 类。本文采用MH算法,需要注意的是:①接受概率 N(E,(f()),/n),这样a的估计值为 的计算不需要后验函数中正规化常量的知识;②建 议密度的选择。 所-m” Fm二12-fw)2 (14) MH算法从建议密度q(·I)生成备选0,该 同时,fx的标准误差可以用√σ/N来估计,该标准 建议密度必须满足一定的性质1。备选&以概率 误差也成为参数估计值的蒙特卡罗标准误差 T(0,8)被接受,而接受概率11为 (MCSE)。另外还要计算所有样本的标准离差: T(0,0)=min1,rg901f) π(0x)q(0T0) (9) 算法如下: =√2f0)-1 (15) (1)给定现在状态,从建议密度g(·|) Kim2]提出了可以用模拟无效因子(SIF)来评 生成备选值日; 价抽样样本的模拟效果,Meyer和Yu1a]给出了SIF (2)按照式(9)计算接受概率T(0,0): 的计算公式: (3)以概率T(0,8)接受备选值,即+”= SIF=G/所 (16) 8;反之,拒绝备选值,即+》=: 4 实证研究 (4)重复前面的步骤,获得{,1,…,剔除 前面的d个值,则{0d+》,d+》,…}都具有相同的后 4.1参数的估计结果 验密度π(X)。 使用MCMC方法来估计NIG扩散模型,数据 3.2经验结果 分别采用上海和深圳股市的周综合指数,即从 假定参数的联合先验信息是π(),基于Euler 1992-05-03~2004-04-30共12年的上海和深圳股 似然函数为E(0|X),则联合后验为r(0|X)心 市周综合指数。 π()pe(O1X)。在随机游走MH算法中,建议密度是 参数先验分布利用文献[3,9]中介绍的先验分 在[一0.5,0.5]上的均匀分布,参数向量0按照下面 布,各个参数的先验分别假定为:心~N(0,10),a~T 的方法更新: (1,20),82~T(0.05,20),4~N(5,10),~ 8=8+re (10) U(-a,a),a2~IG(5,0.05)。 式中:e是在区间上[一0.5,0.5]生成的随机数;x是 按照随机游走MH算法对NIG扩散模型进行 调和参数,因此,x的选择应使参数被接受的概率 参数估计,每个参数共产生60000个样本,剔除前 在20%~30%。一般来说,如果参数之间是弱相关 面的10000个模拟样本,记录的模拟样本为后面的 的,π就可以是一个常数:否则,π应是一个常向量。 50000个。其中,上海综指参数的样本曲线见图1, 3.3参数模拟的收敛性分析 上海和深圳综合指数的参数估计结果为表1所示。 在MCMC算法中,取样的样本路线为{: 表1总结了各个参数的遍历平均(Mean)、标准 i=1,2,…,N},并且输出的遍历均值有下列形式: 离差(SD)、95%的贝叶斯置信区间(CI)、蒙特卡罗 标准误差(MCSE)和SIF:贝叶斯置信区间说明了 (11) 各参数估计的有效性。 万方数据第2期 胡素华,等:正态逆高斯扩散模型的MCMC估计 式中:f是标准化常数;p(X I曰)是以0为条件的似然 函数;丌(曰)是口的先验密度。贝叶斯方法要求统计推 断必须是基于参数的后验分布,然而直接处理后验 是很困难的。但是,如果可从后验分布抽取参数向量 的样本,关于参数向量的统计推断就可以使用一般 的蒙特卡罗方法实现。MCMC方法的目的就是提供 一种从参数后验分布中抽取样本的一种机制。由于 从后验中直接取样是很困难的,从而可以用MCMC 方法建立马尔可夫链,使它的稳定分布和后验分布 相同,当马尔可夫链收敛时,模拟值可以看作是从后 验分布中抽取的样本。 关于MCMC方法有Gibbs取样和MH算法二 类。本文采用MH算法,需要注意的是:①接受概率 的计算不需要后验函数中正规化常量的知识;②建 议密度的选择。 MH算法从建议密度q(·l口)生成备选曰7,该 建议密度必须满足一定的性质[1…。备选口’以概率 T(O,07)被接受,而接受概率[1叩为 算法如下: 丁㈣∽一叫,,篙揣)㈤ (1)给定现在状态0“’,从建议密度q(·|0“’) 生成备选值07; (2)按照式(9)计算接受概率T(O“’,0’); (3)以概率71(护“’,07)接受备选值,即0“+1’一 07;反之,拒绝备选值,即0“+1’一护“’; (4)重复前面的步骤,获得{0∞’,0n’,…},剔除 前面的d个值,则{0叫+1’,0叫+2’,…)都具有相同的后 验密度7r(口lX)。 3.2经验结果 假定参数的联合先验信息是玎(臼),基于Euler 似然函数为Ps(口I x),则联合后验为7r(0 X)。C 丌(护)户E(伊|X)。在随机游走MH算法中,建议密度是 在[一0.5,0.5]上的均匀分布,参数向量臼按照下面 的方法更新: 07—0+r£ (10) 式中:e是在区间上[一0.5,0.5]生成的随机数;r是 调和参数,因此,r的选择应使参数07被接受的概率 在20%~30%。一般来说,如果参数之间是弱相关 的,r就可以是一个常数;否则,r应是一个常向量。 3.3参数模拟的收敛性分析 在MCMC算法中,取样的样本路线为{0“’: i一1,2,…,Ⅳ),并且输出的遍历均值有下列形式: 1旦 ^一寺>:f(o“’) (11) 式中,函数厂(·)是一个实值函数,遍历均值的中心 极限定理有: √Ⅳ(/'Ⅳ一E。(厂(臼)))D—N(O,仃;) (12) E。(·)是关于分布丌(口I X)的期望算子,为讨论 E。(厂(护))做为遍历均值估计的准确性,必须估计 盯}。估计盯}最普遍的方法就是由Roberts E113提出的 块均值。 为了使用块均值估计d},MCMC算法运行Ⅳ一 优×72,这里n足够大,取: 1 kn yk=土2 i厶八∥J y厂(∥) (13) L J ’‘,=(女一1)n+1 对于是=1,2,…,m,弘近似于独立同分布 Ⅳ(E。(厂(伊)),唠/咒),这样盯}的估计值为 ;多一—∑∑(挑一兀)z 仃,一而垄‘挑一-,Ⅳ)‘ (14) 同时,7Ⅳ的标准误差可以用√a}/N来估计,该标准 误差也成为参数估计值的蒙特卡罗标准误差 (MCSE)。另外还要计算所有样本的标准离差: 厂—■——]r—————————一 爵一√南圣[,(0“’)一九]2(15) Kim[121提出了可以用模拟无效因子(SIF)来评 价抽样样本的模拟效果,Meyer和yuE133给出了SIF 的计算公式: SIF一仃}/d} (16) 4实证研究 4.1参数的估计结果 使用MCMC方法来估计NIG扩散模型,数据 分别采用上海和深圳股市的周综合指数,即从 1992—05—03~2004—04—30共12年的上海和深圳股 市周综合指数。 参数先验分布利用文献[3,9]中介绍的先验分 布,各个参数的先验分别假定为:Ⅳ~Ⅳ(O,10),a~r (1,20),艿2~r(0.05,20),产~N(5,10),p~ U(一a,a),盯2~JG(5,0.05)。 按照随机游走MH算法对NIG扩散模型进行 参数估计,每个参数共产生60 000个样本,剔除前 面的10 000个模拟样本,记录的模拟样本为后面的 50 000个。其中,上海综指参数的样本曲线见图1, 上海和深圳综合指数的参数估计结果为表1所示。 表1总结了各个参数的遍历平均(Mean)、标准 离差(SD)、95%的贝叶斯置信区间(CI)、蒙特卡罗 标准误差(MCSE)和SIF;贝叶斯置信区间说明了 各参数估计的有效性。 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有