正在加载图片...
第2期 林静等:基于MCMC稳态模拟的贝叶斯经验费率厘定信用模型 ·35· Y的联合密度函数为: 复杂难于计算,此时采用蒙特卡罗积分进行近似,即: fv(y)=Fy,/o(w./0)](0)d0 E[h(U)]≈1(Ue) n-1 Y1,…,Y,+1的联合密度函数为: 当U1,…,U相互独立时,由大数定律可知,样 本容量n越大,其近似程度越高。但在很多复杂模型 fymy(Y1…,Yit1)= [fy/a(y9)]· 中,并不能简单地对U1,…,U做出相互独立的假 π(8)d8 设,这就需要使用MCMC稳态模拟方法。MCMC 给定Y=y条件下Y,+:的条件分布为: 模拟本质上是使用马尔可夫链的蒙特卡罗积分,基 I[fy,e(y/0)]·x(0)d0 本思想是:建立马尔可夫链对未知变量进行抽样模 fy(1/y)= Ji-1 拟,当链达到稳态分布时即得所求的后验分布。基 fy(y) 又因给定Y条件下⊙的条件分布为: 于贝叶斯推断原理的MCMC方法主要用于产生后 fr.e(y,0) 验分布的样本,计算边缘分布以及后验分布的矩。 r8/y(0/y)= fy(y) 不同的抽样方法导致了不同的MCMC方法,Gibbs 抽样是其中最简单也是应用最广泛的一种。 n[fx,va(y/0)]·π(0)d0 (1) Gibbs抽样过程属于马尔可夫更新机制的范 fy(y) 畴。在上述假设条件下,令U:代表某种随机变量 则,(1)式可化为: 或同组的几个随机变量;第j组变量的边缘分布为 .y=上a10en(8a0 U,)。给定任意初始向量Uo)=(U),…, fy(y) U),我们由(U11U),…,U)中抽取样本 -fv(/0)av(0/y)d0 U;由(U21U,U,…,U)中抽取样本 值得注意的是,当日已知时: U0;由f(U1U,…,U丹,U9,…,U抽 *1(8) E(Yj+1/0 8) 取样本U;并由f(Us1U,U,…,U)抽 y(0)dy =E(Y)= 取样本U;由上即完成了由Uo)到U)= (U),…,U)的转移。经过t次迭代,可以得到 E[E(Y+1/Θ=8)]=E[4+1(0)]可得:H为6的 U)=(U,…,U),并最终得到U,U2), 均值。由于日未知,我们利用可观测值Y对Y)+1进 U3),…。易证:由不同的U0)出发,当t→∞,在遍 行估计,其中: 历条件下,可以认为各时刻U)的边际分布为平稳 E(Yn/Y =y)=fe()dv1 分布,此时它收敛,并可以被看作是样本的仿真观测 点。而在收敛出现前的次迭代中,各状态的边际 =+1(0)πe/r(0/y)d 分布还不能认为是π(U),因此在估计E[h(U)] 综上,Buhlmann-Straub模型的贝叶斯求解关 时应将前m个迭代值去掉,即: 键在于对结构参数条件分布π91y(81y)进行积分。 然而,基于传统的高维数值积分方法很难得出参数 Ea(u1=空Auo) 的联合后验分布。本文中,我们将利用MCMC方法 在Buhlmann-Straub模型中,设: 得出参数联合后验分布的抽样,以解决高维数值积 Yg=H+e=(μ+a;)+E 分的因难。 其中,假定:(1)a;与e相互独立且E(a:)=0, 4基于Gibbs抽样的MCMC模拟分析 Var(a;)=a2,E(E)=0,Var(ei)=a;(2)Yi 服从均值为:,方差为σ/w的正态分布;(3)4服 设k维随机向量U=(U1,…,U:)具有联合分 布π(U1,…,U),其中,U:(i=1,…,k)为模型参 从均值为4,方差为π的正态分布;(4)σ与σ均具 数或缺的的观测值,π(·)为其后验分布。则对于我 有无先验信息分布;(5)特别地,按实际应用的需要 们感兴趣的函数h(U)的数学期望为:E[h(U)]= 假设:的先验分布为某一常数。令π(·)代表有关参 数的先验分布,则: h(u)π(u)du/(π(u)du),由于该积分往往形式 π(μ/a,o2,o) 万方数据第2期 林静等:基于MCMC稳态模拟的贝叶斯经验费率厘定信用模型 ·35· y的联合密度函数为: 复杂难于计算,此时采用蒙特卡罗积分进行近似,即: r 1i 、fv(Y)2 jj璺[^,8(yr朋)]’丌(8)枷 yl,…,L+1的联合密度函数为: ^。,…l+。(Y1'.一,E+,)2 j引fYj/O(∞朋)]· 7r(a)da 给定Y=Y条件下y州的条件分布为: l盯[^/8(y/口)]·丌(9)dO fY+I/Y(舶/y)=妞—L焘万一 又因给定y条件下0的条件分布为: 嘶Y(O/y,=每铲 :坦生:坐掣:型竺 — v(y) (1)f ¨7 则,(1)式可化为: 咖c舶咖垃堕等掣 =.I fvT+I/O(YT+I/0),re/y(O/y)dO 值得注意的是,当0已知时: 一+1(曰) = E(匕+I/O = 疗) = j∞+1■+l/8(∞+l/e)ayj+1且卢2 E(匕+1)= E[E(y¨/@=口)]=E[p,+l(口)]可得:卢为0的 均值。由于0未知,我们利用可观测值Y对yHl进 行估计,其中: E(V+1/Y 2 y)。JYj+l■+,lo(ys+I/O)dyjtl =I所+l(口)丌。/y(O/y)dO 综上,Buhlmann—Straub模型的贝叶斯求解关 键在于对结构参数条件分布丌@I y(0 y)进行积分。 然而,基于传统的高维数值积分方法很难得出参数 的联合后验分布。本文中,我们将利用MCMC方法 得出参数联合后验分布的抽样,以解决高维数值积 分的困难。 4基于Gibbs抽样的MCMC模拟分析 设k维随机向量U=(U1,.一,U^)具有联合分 布兀(Ul,…,U),其中,Ui(i=1,…,k)为模型参 数或缺的的观测值,丌(·)为其后验分布。则对于我 们感兴趣的函数h(U)的数学期望为:E[h(U)]= l h(H)7r(甜)du/(I丌(“)du)。由于该积分往往形式 E[h(u)]≈土∑h(u(t’) H·=1 当U1’.一,U^相互独立时,由大数定律可知,样 本容量1/越大,其近似程度越高。但在很多复杂模型 中,并不能简单地对U1'.~,氓做出相互独立的假 设,这就需要使用MCMC稳态模拟方法。MCMC 模拟本质上是使用马尔可夫链的蒙特卡罗积分,基 本思想是:建立马尔可夫链对未知变量进行抽样模 拟,当链达到稳态分布时即得所求的后验分布。基 于贝叶斯推断原理的MCMC方法主要用于产生后 验分布的样本,计算边缘分布以及后验分布的矩。 不同的抽样方法导致了不同的MCMC方法,Gibbs 抽样是其中最简单也是应用最广泛的一种。 Gibbs抽样过程属于马尔可夫更新机制的范 畴。在上述假设条件下,令Ui代表某种随机变量 或同组的几个随机变量;第歹组变量的边缘分布为 厂(uj)。给定任意初始向量U(o)=(ui∞,…, ulo’),我们由f(Ul u严’,…,u护’)中抽取样本 【,{1’;由f(U2 u{¨,u5叫,…,u(0’)中抽取样本 u11’;由/(uj f己,i¨,…,u;冀,u50j,…,己,lo’)抽 取样本u:1’;并由厂(UI ui¨,ui¨,…,u101)抽 取样本L,11’;由上即完成了由u(o)到u(1)= (【,;¨,…,u铅’)的转移。经过t次迭代,可以得到 u(r)=(vl“,…,u铝’),并最终得到u(¨,u(扪, U(3),…。易证:由不同的U(o’出发,当t—oo,在遍 历条件下,可以认为各时刻U“)的边际分布为平稳 分布,此时它收敛,并可以被看作是样本的仿真观测 点。而在收敛出现前的刀z次迭代中,各状态的边际 分布还不能认为是71"(U),因此在估计E[^(U)] 时应将前一z个迭代值去掉,即: 1 ” E[h(【,)]≈—上一乏:h(u(‘’) lL—r’lptn}1 在Buhlmann—Straub模型中,设: YO=卢i+e玎=(卢+ai)+£巧 其中,假定:(1)ai与£i,相互独立且E(口i)=0, Var(口i)=d2。,E(e“)=0,Vat(£i,)=d;;(2)Yi, 服从均值为Pf,方差为盯:/coi,的正态分布;(3)∥i服 从均值为卢,方差为r的正态分布;(4)仃2。与盯:均具 有无先验信息分布;(5)特别地,按实际应用的需要 假设/l的先验分布为某一常数。令7l"(·)代表有关参 数的先验分布,则: 丌(.££/口,盯2。,口:) 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有