正在加载图片...
统计与信息论坛 函数的参数与边缘分布函数的参数组成的参数向 二、Copula函数 量,π()、(、()分别为相应的后验分布、似 Nelsen对N维Copula函数定义为具有以下性 然函数、先验分布。 质的函数C:(1)C=N=[0,1],(2)C的边缘分 为不失一般性,令(X1,X2)为一二维连续随机 布Cn()满足Cn(u)=C(1,…,1,,1…l)=4, 变量,那么其在Copula函数下相应的联合概率密度 其中,u∈[0,1],n∈[1,N];(3)C对它的每一个变 函数为: 量都是递增的3]27-250 f(x,x2|)=c(F(x1I,F2(x2{) 显然,一个N维Copula函数是一个N维概率分 fi(x1f2(x2|)(1) 布函数,其边缘分布是限制在[0,1]上的均匀分 其中,F、F2与f、f分别为相应变量的边缘分布 布,在二维情况下,如果F(x1),F2(x2)是随机变量 函数与边缘密度函数,c为Copula函数的概率密度 X1,X2的分布函数,那么C(F1(x1),F2(x2)可以 函数。 作为(X1,X2)的联合分布函数。 如果X=(x1,x2),…,(x1w,x2n)是上述分 目前常用的Copula函数估计方法主要有以下 布的一个云.i.d样本,那么其似然函数为6们13: 几种:精确极大似然估计法(EML),该方法需要已 L(=Ic(F(u),F2() 知边缘分布,其缺陷是当碰到高维数据时,会有很大 fi(x:|f2(x2:|) (2) 的计算量;分步极大似然估计法(IFM),该方法也需 这样,在已知Copula函数模型参数向量的先验 已知边缘分布,对参数的日的估计分为2步,缓解了 分布时,就可以得到其后验分布的核。 计算量的问题,但估计2次会导致误差积累放大;规 (二)MCMC方法 范化的极大似然估计法(CML),从理论上来讲, MCMC方法是使用马尔科夫链的蒙特卡罗积 CML是以上三种估计方法中最好的方法,因为它没 分,其基本思想是:构造一条Markov链,使其平稳 有对边缘分布形式作出假设。如果对边缘分布的形 分布为待估参数的后验分布,通过这条马尔科夫链 式作出错误的判断,EML和IFM方法将改变变量 产生的后验分布的样本,并给予马尔科夫链达到平 间的相依结构;非参数估计方法,该方法较其他方法 稳分布时的样本进行蒙特卡罗积分。在采用 来说计算简单,但使用范围主要适用于 MCMC方法时,马尔科夫链转移核的构造至关重 Archimedean Copulas. 要,不同的转移核构造方法,将产生不同的MCMC 对于最优Copula函数的选取,基于Copula分 方法,目前常用的MCMC方法主要有两种,Gibbs 布函数与条件分布的QQ图法直观、快捷,但其缺乏 抽样和Metropolis-一Hastings算法。 量化的标准,且有时无法辨别图形间微小差别;计算 Metropolis一Hastings算法是比较一般化的 并比较理论Copula函数C与经验Copula函数Cn MCMC方法[]176-25,该方法的基本思路是:任意选 之间的距离,也是比较常用的方法;Roberto De 择一个不可约转移概率g(,·)以及一个函数α(, Matteis和Dobric et al.分别提出了基于K-S检验 与P维x检验的拟合优度检验,Daniel Berg对 ·),0<a(,)≤1,对任一组合(x,x)(x≠x),定 义: Copula函数选取的拟合优度检验做了系统的总结 (3) 和比较],Chen和Fan提出一种伪似然比检验方法 p(x,x)=q(z,z')a(z,z')' 则(x,x)形成一个转移核。在有了q(,·) 来选择最优Copula函数;Huard et al.建议一种基 于贝叶斯理论的Copula函数选取方法。以上方法 后,应选择一个a(·,),使相应的(x,x)以r(x) 为其平稳分布,最常用的选择是: 基本均需对原变量序列进行数据变换,因此会对样 本数据信息造成一定的丢损。 a(,)=min(1,(2(( (4) x(z)q(z,x') 三、Copula函数模型的贝叶斯分析 此时,(x,x)为: (x,x)= (一)模型的贝叶斯推断 9(x,x') (z)q(z',z)(x)q(I,I) 根据贝叶斯定理,对Copula函数模型进行贝叶 斯推断,关键是在已知观察数据下,获得模型参数的 q(x',)( x(x) a(x')q(I',z)<()q(x,x') 后验分布。即x()oc()(),其中平为Copula (5) 34 万方数据统计与信息论坛 二、Copula函数 Nelsen对N维Copula函数定义为具有以下性 质的函数C:(1)C=p=[o,1]N;(2)C的边缘分 布C。(·)满足G(uD=C(1’..·,l,‰,l…1)=‰, 其中,U∈[o,1],以∈[1,N];(3)C对它的每一个变 量都是递增的[3]227-250。 显然,一个N维Copula函数是一个N维概率分 布函数,其边缘分布是限制在[O,1]N上的均匀分 布,在二维情况下,如果F1(z1),F2(z2)是随机变量 X。,x2的分布函数,那么C(F1(z1),F2(zz))可以 作为(X,,Xz)的联合分布函数。 目前常用的Copula函数估计方法主要有以下 几种:精确极大似然估计法(EMI。),该方法需要已 知边缘分布,其缺陷是当碰到高维数据时,会有很大 的计算量;分步极大似然估计法(IFM),该方法也需 已知边缘分布,对参数的0的估计分为2步,缓解了 计算量的问题,但估计2次会导致误差积累放大;规 范化的极大似然估计法(CMI。),从理论上来讲, CMI。是以上三种估计方法中最好的方法,因为它没 有对边缘分布形式作出假设。如果对边缘分布的形 式作出错误的判断,EMI。和IFM方法将改变变量 间的相依结构;非参数估计方法,该方法较其他方法 来说计算简单,但使用范围主要适用于 Arehimedean Copulas。 对于最优Copula函数的选取,基于Copula分 布函数与条件分布的QQ图法直观、快捷,但其缺乏 量化的标准,且有时无法辨别图形间微小差别;计算 并比较理论Copula函数C与经验Copula函数G 之间的距离,也是比较常用的方法;Roberto De Matteis和Dobric et a1.分别提出了基于K—S检验 与P维x2检验的拟合优度检验[4],Daniel Berg对 Copula函数选取的拟合优度检验做了系统的总结 和比较[51;Chen和Fan提出一种伪似然比检验方法 来选择最优Copula函数;Huard et a1.建议一种基 于贝叶斯理论的Copula函数选取方法。以上方法 基本均需对原变量序列进行数据变换,因此会对样 本数据信息造成一定的丢损。 三、Copula函数模型的贝叶斯分析 (一)模型的贝叶斯推断 根据贝叶斯定理,对Copula函数模型进行贝叶 斯推断,关键是在已知观察数据下,获得模型参数的 后验分布。即,r(Y0。c l(掣)p(1lQ,其中y为Copula 34 函数的参数与边缘分布函数的参数组成的参数向 量,7r(奶、z(奶、夕(奶分别为相应的后验分布、似 然函数、先验分布。 为不失一般性,令(X·,X2)为一二维连续随机 变量,那么其在Copula函数下相应的联合概率密度 函数为: f(zl,z2 I奶=c(F1(z1 I奶,F2(z2 l蚧) ^(xl I奶^(xz I奶 (1) 其中,Fl、F2与厂1√;分别为相应变量的边缘分布 函数与边缘密度函数,c为Copula函数的概率密度 函数。 如果X=((xtl,z21),..·,(zl。,X2。))是上述分 布的一个i.i.d样本,那么其似然函数为[6]3卜髓: L(奶=Ⅱ:,c(F。(她I奶,F2(x2;I奶) ^(zlf l奶^(xzf I奶 (2) 这样,在已知Copula函数模型参数向量的先验 分布时,就可以得到其后验分布的核。 (二)MCMC方法 MCMC方法是使用马尔科夫链的蒙特卡罗积 分,其基本思想是:构造一条Markov链,使其平稳 分布为待估参数的后验分布,通过这条马尔科夫链 产生的后验分布的样本,并给予马尔科夫链达到平 稳分布时的样本进行蒙特卡罗积分。在采用 MCMC方法时,马尔科夫链转移核的构造至关重 要,不同的转移核构造方法,将产生不同的MCMC 方法,目前常用的MCMC方法主要有两种,Gibbs 抽样和Metropolis--Hastings算法。 Metropolis--Hastings算法是比较一般化的 MCMC方法[7]17卜235,该方法的基本思路是:任意选 择一个不可约转移概率q(·,·)以及一个函数口(·, ·),o<口(·,·)≤1,对任一组合(z,z7)(z≠z7),定 义: p(x,z7)=q(x,z7)口(z,z7) z≠z7 (3) 则p(x,z7)形成一个转移核。在有了q(·,·) 后,应选择一个口(·,-),使相应的p(x,z7)以,r(z) 为其平稳分布,最常用的选择是: 缸√)=min{·,≤黜) (4) 此时,p(x,z7)为。 p(x,z7)= fq(x,z7) 丌(z7)q(z7,z)≥,r(z)q(z,z7) 1如7彤)籍“z,)q&7汀)<“动如汀,) (5) 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有