赵昕东:基于蒙特卡洛-马尔科夫链(MCMC)的ARMA模型选择 163 就代表了(1)式中全模型所包含的所有的备选模型,w=(u1,…ug,v1,…,)可以代表任意一 个备选模型。 考虑到AIC与SC都具有共同的形式: S(u,o)=log2.。+c(u,v) 这里u和分别表示向量U与V中最后一个“1”的位置,分别等于自回归阶数与移动平均阶 数。 我们首先定义一个M上的概率分布 P(w)=T exp(-S(u,v)) ∈Mexp(-S(u,u) 进一步定义w0为真实模型,显然S(uo,o)为S(u,v)所有可能取值中的最小值,并且P (ω)在w0取得最大值。假设有一组备选模型(:i=1,…,K),令 fk=之Iw,=u/K i=l 为模型。在该组备选模型中出现的频率,我们有 limf,k=P(wo)=maP(a) (2) u∈M 的概率为1。因此,只要K足够大,真模型0将以最高的频率出现在备选模型中。 为便于表达。我们定义向量 W=(w1,…,,…,wp+g),i=1,…,p+9 以表示模型w=(u1…,up'v1,…,g)。 我们将W=(w1…,心,…,p+g),i=1,…,p+q看成p+q维随机变量的联合分布, 每个随机变量的条件分布服从二项分布,这样就可以应用吉伯斯样本生成方法生成W1)= (D,…,wg),W2》=(2,…,g),…,W=(w,…,wg)一组随机样本,即随 机产生一组备选模型。因为该组模型是随机产生的,当模型足够多时,根据(2)式,真实模型出 现的次数将最多。 根据吉伯斯样本生成方法,为计算P(W)我们需要计算条件概率P(|1,“,-1' +1…,p+g),i=1,…,p+qP(w|1,…,-1+1…,p+g) P(;l1,…,;-1+1…,p+g) p(w1,…,;-1'=1,5+1’…,p+g)+P(1,…,w-1'5=0,+1…,wp+g) P(W) P(W,:=1)+P(W,;=0) exp(-S(W)) ≥m∈Mexp-S(W)) exp(-S(W,e;=1))exp(-S(W,,=0) S.ewexp(-s(W))+Srexp(-s(W)) exp(-S(W)) exp(-S(W,,=1)+exp(-S(W,,=0) 在备选模型的数量很多时,∑∈Mexp(一S(u,v)的值是难以计算的,而本文的模型选择 方法无须计算∑∈Mexp(-S(u,v)的值。 以下塞据伯斯样本生成方法的ARMA模型选择算法:就代表了(!)式中全模型所包含的所有的备选模型,!"(!!,…!",#!,…#")可以代表任意一 个备选模型。 考虑到#$%与&$%都具有共同的形式: $(!,#)%’()&"* !,#’((!,#) 这里!和#分别表示向量) 与* 中最后一个“!”的位置,分别等于自回归阶数与移动平均阶 数。 我们首先定义一个 + 上的概率分布 +(!)% ,-. (,$(!,#)) !!"-,-. (,$(!,#)) 进一步定义!/为真实模型,显然$(!/,#/)为$(!,#)所有可能取值中的最小值,并且+ (!)在!/取得最大值。假设有一组备选模型(!.:."!,…,/),令 0!/ % ! / .%! 1(!. %!)// 为模型! 在该组备选模型中出现的频率,我们有 ’01/#2 0!// %+(!/)% 13-!"- +(#) (*) 的概率为!。因此,只要 4足够大,真模型!/将以最高的频率出现在备选模型中。 为便于表达。我们定义向量 2 %(3!,…,3.,…,34’"),.%!,…,4’" 以表示模型!"(!!,…,!4,#!,…,#")。 我们将 2"(3!,…,3.,…,345"),."!,…,45"看成45"维随机变量的联合分布, 每个随机变量的条件分布服从二项分布,这样就可以应用吉伯斯样本生成方法生成 2(!) " (3(!) ! ,…,3(!) 45"),2(*) "(3(*) ! ,…,3(*) 45"),…,2(5) "(3(5) ! ,…,3(5) 45")一组随机样本,即随 机产生一组备选模型。因为该组模型是随机产生的,当模型足够多时,根据(*)式,真实模型出 现的次数将最多。 根据吉伯斯样本生成方法,为计算$+(2)我们需要计算条件概率$+(3.%3!,…,3.6!, 3.5!,…,345"),."!,…,45",$+(3.%3!,…,3.6!,3.5!,…,345") " $+(3.%3!,…,3.6!,3.5!,…,345") $+(3!,…,3.6!,3."!,3.5!,…,345")5$+(3!,…,3.6!,3."/,3.5!,…,345") " $+(2) $+(2,3."!)5$+(2,3."/) " ,-. (6$(2)) !!"-,-. (6$(2)) ,-. (6$(2,3."!)) !!"-,-. (6$(2))5 ,-. (6$(2,3."/)) !!"-,-. (6$(2)) " ,-. (6$(2)) ,-. (6$(2,3."!))5,-. (6$(2,3."/)) 在备选模型的数量很多时,!!"-,-. (6$(!,#))的值是难以计算的,而本文的模型选择 方法无须计算!!"-,-. (6$(!,#))的值。 以下是基于吉伯斯样本生成方法的#7+#模型选择算法: 赵昕东:基于蒙特卡洛6马尔科夫链(+%+%)的#7+#模型选择 !98 万方数据