第25卷第2期 统计与信息论坛 2010年2月 Vol.25 No.2 Statistics Information Forum Feb.,2010 【统计应用研究】 POT模型在巨灾损失预测中的应用 基于MCMC方法的估计 解强 (南开大学经济学院,天津300071) 摘要:极值统计学主要研究随机事件极端情况的统计规律性。运用POT模型拟合中国暴雨损失数据,确 定损失超出量的分布形式。实证分析表明,借助POT模型对巨灾风险损失分布进行估计是较为合理的,但当 数据量较小时,使用基于Gbts抽样的MCMC方法估计POT模型的参数,可以解决样本数据不足导致的极 大似然估计中误差增大的问题。 关键词:极值理论;超起阔值模型;MCMC方法;巨灾损失 中图分类号:F224.7:0212.1 文献标志码:A文章编号:1007-3116(2010)02-0084-04 一、引言 转移巨灾风险的作用也是有限的。国家由于拥有充 足的社会资源和强制力,在危机管理方面有种种优 近年来,巨灾事件在中国频繁发生,而每一次巨 势,但按计划制定的财政预算和巨灾风险的随机性 灾的发生都会带来成千上万的受灾人口和数以亿计 之间存在冲突。加之中国政府财政的基本原则是量 的经济损失。2008年5月12日在中国四川省汶川 入为出,若巨灾风险完全由国家预算承受,势必影响 发生的里氏8.0级大地震就是一次典型的巨灾事 财政的平衡和稳健。 件,直接严重受灾地区达10万平方公里,失踪及遇 极值理论作为概率统计的一个重要分支,主要 难人数超过8万,造成直接经济损失8451亿元人民 研究随机样本以及随机过程中极端情况的统计规律 币,是中国建国以来影响最大的一次地震。实际上 性。对极值的研究具有特殊的理论价值在于使用极 不仅是在中国,在世界范围内巨灾都是频繁发生的。 值的一个很大优点,是它受到数据可能的残缺影响 1992年美国的安德鲁观风、1998年的中国大洪水、 不大,因为极端值往往是最使人注意的,也是最重要 2003年上海地铁四号线的渗水事件、2004年的印度 的,因而忽略它的可能性比较小,这在使用历史数据 洋海啸、2005年美国的卡特里娜飓风、2008年初的 时尤其重要。另外,关于个别观察值的总体分布形 中国南方雪灾、2008年5月中国四川大地震等都给 式通常所知甚少。 人类带来了几百亿甚至上千亿美元的损失,这也对 20世纪30年代初,Frechet、Fisher和Tippett 保险业经营的稳定性造成了巨大的冲击,对这种带 开始对极值理论进行研究,Fisher和Tippet证明了 来巨大损失的极值事件的管理已经成为保险业风险 极值的极限分布的三大类型定理,为极值理论的发 管理的研究热点之一。 展研究奠定了基石[1]。随后,如Mises对极值理论 自然灾害频繁地向人类袭来,为应对台风、暴 进行了进一步研究2],Genedenko给出了三大类型 雨、洪水、地震、海啸等强大自然灾害造成的巨灾有 定理的严格证明及三类极限分布存在的充要条 许多途径,如国家救援、社会救助等。一般国际上通 件[3)]。Gumbel的著作反映了极值概率模型的统计 行的做法是建立政府支持下的巨灾保险制度。现在 应用成果,系统地归纳了一元极值理论[4)。由于人 中国巨灾风险的损失基本上是由政府承担,但政府 们很难获得极值的精确分布,所以通常利用经验数 收稿日期:20C9-09-08 作者简介:解强(1982-),男,山东淄博人,博士生,研究方向:风险管理与精算。 84 万方数据
第25卷第2期 Vd.25 No.2 统计与信息论坛 Statistics&Information Forum 2010年2月 Feb..2010 【统计应用研究】 POT模型在巨灾损失预测中的应用 ——基于MCMC方法的估计 解 强 (南开大学经济学院,天津300071) 摘要:极值统计学主要研究随机事件极端情况的统计规律性。运用POT模型拟合中国暴雨损失数据,确 定损失超出量的分布形式。实证分析表明,借助POT模型对巨灾风险损失分布进行估计是较为合理的,但当 数据量较小时,使用基于Gibbs抽样的MCMC方法估计POT模型的参数,可以解决样本数据不足导致的极 大似然估计中误差增大的问题。 关键词:极值理论;超越阈值模型;MCMC方法;巨灾损失 中图分类号:F224.7:0212.1 文献标志码:A 文章编号:1007—3116(2010)02—0084—04 一、引 言 近年来,巨灾事件在中国频繁发生,而每一次巨 灾的发生都会带来成千上万的受灾人口和数以亿计 的经济损失。2008年5月12日在中国四川省汶川 发生的里氏8.O级大地震就是一次典型的巨灾事 件,直接严重受灾地区达10万平方公里,失踪及遇 难人数超过8万,造成直接经济损失8 451亿元人民 币.是中国建国以来影响最大的一次地震。实际上 不仅是在中国,在世界范围内巨灾都是频繁发生的。 1992年美国的安德鲁飓风、1998年的中国大洪水、 2003年上海地铁四号线的渗水事件、2004年的印度 洋海啸、2005年美国的卡特里娜飓风、2008年初的 中国南方雪灾、2008年5月中国四川大地震等都给 人类带来了几百亿甚至上千亿美元的损失,这也对 保险业经营的稳定性造成了巨大的冲击,对这种带 来巨大损失的极值事件的管理已经成为保险业风险 管理的研究热点之一。 自然灾害频繁地向人类袭来,为应对台风、暴 雨、洪水、地震、海啸等强大自然灾害造成的巨灾有 许多途径,如国家救援、社会救助等。一般国际上通 行的做法是建立政府支持下的巨灾保险制度。现在 中国巨灾风险的损失基本上是由政府承担,但政府 转移巨灾风险的作用也是有限的。国家由于拥有充 足的社会资源和强制力,在危机管理方面有种种优 势,但按计划制定的财政预算和巨灾风险的随机性 之间存在冲突。加之中国政府财政的基本原则是量 人为出,若巨灾风险完全由国家预算承受,势必影响 财政的平衡和稳健。 极值理论作为概率统计的一个重要分支,主要 研究随机样本以及随机过程中极端情况的统计规律 性。对极值的研究具有特殊的理论价值在于使用极 值的一个很大优点,是它受到数据可能的残缺影响 不大,因为极端值往往是最使人注意的,也是最重要 的,因而忽略它的可能性比较小,这在使用历史数据 时尤其重要。另外,关于个别观察值的总体分布形 式通常所知甚少。 20世纪30年代初,Frechet、Fisher和Tipper 开始对极值理论进行研究,Fisher和Tippett证明了 极值的极限分布的三大类型定理,为极值理论的发 展研究奠定了基石…。随后,如Mises对极值理论 进行了进一步研究【2J,Genedenko给出了三大类型 定理的严格证明及三类极限分布存在的充要条 件[31。Gumbel的著作反映了极值概率模型的统计 应用成果,系统地归纳了一元极值理论【4I。由于人 们很难获得极值的精确分布,所以通常利用经验数 收稿日期:2069—09—08 作者简介:解强(1982一),男,山东淄博人,博士生,研究方向:风险管理与精算。 万方数据
解强:POT模型在巨灾损失预剥中的应用 据拟合极值分布,对极值的渐进分布进行研究。结 果表明:极值分布可以对极大值或极小值分布进行 G(x)=1-(1+ ,进而超过国值4的分 很好的描述,即可以用Frechet、.Gumbel和Weibull 布可定义为: 分布对此类随机变量进行拟合研究。此后,极值理 F(x)=(1-F(x)GE.(x-u)+F(u) 论有了进一步发展,Pickands证明了经典的极限定 理,为80年代、90年代完善建模作出了巨大贡 =1-路(1+ ,x>u(2) 献5)。此外,在80年代,许多学者研究了时间序列 :,·可用极大似然法估计,被称为形状参数和 的极值特性。80年代中期,多元极值理论的统计推 尺度参数,极大似然函数为 断又有了进一步的发展,而且成为目前极值理论研 l(,;x)=-nlna- 究的热点问题。 (层+宫+ 基于此,本文针对巨灾损失的低频高损、数据稀 (3) 少这一特点,创造性地在使用广义帕累托分布对损 在大样本条件下,极大似然估计法是非常有效 失尾部进行拟合的过程中引人MCMC方法,力图使 的,然而当样本较少、超阈值数据不足时,极大似然 模型的估计更加稳定,误差更小。 估计法将不再可靠,其参数估计结果也将变得很不 稳定。为此,可以采用马尔可夫一蒙特卡洛 二、POT模型及基于MCMC的 (MCMC)方法来对广义帕累托分布的参数进行估 参数估计 计。由于是对厚尾损失分布进行讨论,因此:>0。令 极值理论是由Fisher和Tippet(1920)首先提 :=1>0,则GPD(x!,)=1-(1+x)t, g 出的。极值理论是次序统计学的一个分支,主要处 x>0。 理严重背离分布均值的统计数据。设X:,i=1,2, 设x,F互相独立,并有以下先验分布,即: “,n是取自分布函数Fx(x)的总体的一个样本,将 ~Paretol(a,c),a >0,c>0 其按大小排序X()≤X(2)≤…≤X(m),称(X(1)≤ -Gamma(a,6),a >0,6 >0 (4) X(2)≤…≤X(m)为次序统计量,X(1)=min(X, 其中a,c为帕累托分布的参数,a,b为Gamma分布 X2,…,Xm),X(n)=max(X1,X2,…,Xn),分别称 的参数。具体来说,形状参数:服从帕累托先验分 为样本极小值和样本极大值,统称为样本极值,它们 布,其密度函数为: 的分布称为极值分布。 极值分布可以归结为一个单参数分布,该分布 f(e1a,c)=r/gx≥c (5) x0,c>0。帕累托先验的一个特点是帕累托 -+7e0 (1) 分布有一个正的下限c,这样可避免模拟中由于样 本较小导致形状参数:过分逼近0。根据贝叶斯法 当E=0时,H:对应的是薄尾分布,如常见的伽 则,参数£和x的联合后验分布为 玛分布、指数分布等,但这一类分布对于巨灾损失的 L(xIEx)fE)f(x) 尾部拟合效果较差,因而在此处不予考虑。本文中仅 f(,x)= L(x IE,)f()f(r)dadr 考虑E≠0的情况,由Fisher一Tippet定理可以知 道,若已知标准化的极大值序列依分布收敛,其极限 (6) 分布可以化为参数5,则B取某特定值得广义极值 其中,L(xIE,x)为似然函数,估计方程中的似然 分布H:,(x)。一般而言,有两种方法常被用来确定 函数反映了样本信息,进而参数的后验分布为 极值:区间选取方法(Block Method,简称BMM)和 (.z)-exp-(1+) 超越阂值的方法(Peak Over Threshold,.简称POT)。 第一种方法需将研究的样本划分成不同的区间,然 2n1+e-b1r】1(r>0)1(e>0)(m 后在每一区间内寻找研究样本的极值,需要的数据 其中I(x>0),I(E>0)均为示性函数,仅在参数大 相对较多,故本文以超越阈值法作为建模的依据。 于0时存在。由f(5,xlx)cL(x15,x)f()f(x)可 对于充分大的阈值,超额数的分布可以用广义 知,f(1x)与f(xIx)为非已知的分布,其不能从封 帕雷托分布近似。广义帕雷托分布一般定义如下: 闭形式获得,但可以通过马尔可夫一蒙特卡洛模拟得 85 万方数据
解强.POT模型在巨灾损失预测中的应用 据拟合极值分布,对极值的渐进分布进行研究。结 果表明:极值分布可以对极大值或极小值分布进行 很好的描述,即可以用Frechet、Gumbel和Weibull 分布对此类随机变量进行拟合研究。此后,极值理 论有了进一步发展,Pickands证明了经典的极限定 理,为80年代、90年代完善建模作出了巨大贡 献【5J。此外,在80年代,许多学者研究了时间序列 的极值特性。80年代中期,多元极值理论的统计推 断又有了进一步的发展,而且成为目前极值理论研 究的热点问题。 基于此,本文针对巨灾损失的低频高损、数据稀 少这一特点,创造性地在使用广义帕累托分布对损 失尾部进行拟合的过程中引入MCMC方法,力图使 模型的估计更加稳定,误差更小。 二、POT模型及基于MCMC的 ‘ ’参数估计 极值理论是由Fisher和Tippet(1920)首先提 出的。极值理论是次序统计学的一个分支,主要处 理严重背离分布均值的统计数据。设Xi,i=l,2, …,rt是取自分布函数Fx(z)的总体的一个样本,将 其按大小排序X(1)≤X(2)≤…≤X(。),称(X(1)≤ X(2)≤…≤X(。))为次序统计量,x(1)=min(Xl, X2,…,墨),X(。)=max(X1,X2,…,咒),分别称 为样本极小值和样本极大值,统称为样本极值,它们 的分布称为极值分布。 极值分布可以归结为一个单参数分布,该分布 函数可简记为: ,, fexp[1一(1+和)]-1膳e≠0 … 一。3 1eXp(一矿) 导:0 … 当搴=0时,4对应的是薄尾分布,如常见的伽 玛分布、指数分布等,但这一类分布对于巨灾损失的 尾部拟合效果较差,因而在此处不予考虑。本文中仅 考虑乎≠0的情况,由Fisher—Tippet定理可以知 道。若已知标准化的极大值序列依分布收敛,其极限 分布可以化为参数e,则卢取某特定值得广义极值 分布碡,卢(z)。一般而言,有两种方法常被用来确定 极值:区间选取方法(Block Method,简称BMM)和 超越阈值的方法(Peak Over Threshold,简称POT)。 第一种方法需将研究的样本划分成不同的区间,然 后在每一区间内寻找研究样本的极值,需要的数据 相对较多。故本文以超越阈值法作为建模的依据。 对于充分大的阈值,超额数的分布可以用广义 帕雷托分布近似。广义帕雷托分布一般定义如下: 唤.。(z)=1一(1+拿詈)。,进而超过阈值“的分 布可定义为: F(x)=(1一F(x))Ge。,(z—t‘)+F(乱) =1一鱼rt(1+e宁rz>“(2) 、 盯 , },口可用极大似然法估计,被称为形状参数和 尺度参数,极大似然函数为 胀∽加刊一(专+1)骞1n(1+}z) (3) 在大样本条件下,极大似然估计法是非常有效 的,然而当样本较少、超阈值数据不足时,极大似然 估计法将不再可靠,其参数估计结果也将变得很不 稳定。为此,可以采用马尔可夫一蒙特卡洛 (MCMC)方法来对广义帕累托分布的参数进行估 计。由于是对厚尾损失分布进行讨论,因此e>00令 r=土>0,贝0 GPD(=l拿,r)=1一(1十e瞄)一{, z>0。 设r,拿互相独立,并有以下先验分布,即: e~ParetoI(a,c),0t>0,c>0 r~Gamma(口,b),a>0,b>0 (4) 其中口,f为帕累托分布的参数,a,b为Gamma分布 的参数。具体来说,形状参数e服从帕累托先验分 布,其密度函数为: 瓜…c)-∥∥1三耄: (5) 其中a>0,c>00帕累托先验的一个特点是帕累托 分布有一个正的下限c,这样可避免模拟中由于样 本较小导致形状参数拿过分逼近0。根据贝叶斯法 则,参数S和r的联合后验分布为 f(拿,r I a17)= (6) 其中,L(z e,r)为似然函数,估计方程中的似然 函数反映了样本信息,进而参数的后验分布为 p(拿,r z)∞,L.n+al-1搴一(。+1)exp[-(1+{) ∑ln(1+彘f—blr)],(r>o)J(s>o)(7) 其中J(r>0),,(毒>0)均为示性函数,仅在参数大 于0时存在。由.厂(S,r z)ocL(z I拿,r)“e)“r)可 知,八S z)与八r z)为非已知的分布,其不能从封 闭形式获得,但可以通过马尔可夫一蒙特卡洛模拟得 85 万方数据
统计与信息论坛 到,即:模拟一条马尔可夫链的样本路径,链的状态空 数据进行了相应的处理。首先,提取发生时间、发生 间是被估计参数的值,链的极限分布为被估参数的贝 地点、降雨量、受灾人口、受灾面积、经济损失等几个 叶斯后验分布。在充分的迭代后,马尔可夫链将收敛 指标的数据,舍弃损失额度在1亿元以下的损失数 于一个平稳的目标分布f1x,而不依赖于原始状态, 据,另外有些损失记录并不完整,没有包括经济损失 或时间t。将测试期阶段的n个状态滤去,剩下的链将 值的记录,同样将这些数据予以舍弃。在提取数据 作为目标后验分布的样本。 过程中发现部分损失事件有重复记录,把发生时间、 三、数据来源及整理 发生地点和经济损失相同的事件视为同一事件,再 将重复记录全部剔除后,最后从1100多条数据中筛 本文选取了1987,-2007年间在中国各地发生 选出702余条,相关数据的描述性统计如表1所示。 的暴雨灾害损失数据,数据来源于《中国减灾》,并对 表1暴雨损失的描述性统计表 偏度 斜度 最小值 最大值 均值 标准差 统计量 标准差 统计量 标准差 暴雨损失 1.00 280.00 12,77851 25.70551 5.613 0.092 41.720 0.184 四、基于MCMC估计方法的 合后验分布中获得样本,从而得到需要的边际分布。 总的来说,在给定损失数据后,使用MQMC模拟产生 POT模型参数估计 一个与条件后验参数分布相近似的经验参数分布,最 使用Winbugs软件进行Gibbs抽样,从参数的联 后使用这个经验分布的均值作为最终的估计值。 表2极大似然法与MCMC方法参数估计结果比较表 阀值“(亿元)超额数n 超额数百分比(%)极大似然估计MCMC估计E极大似然估计。 MCMC估计a 30 67 9.56 0.3231294 0.3261 28.561458 28.481914 40 46 6.56 0.2124108 0.2671 37.972308 36.114121 50 38 5.42 0.3840824 0.3939 30.603487 30.339806 60 26 3.71 0.1518904 0.3187 47.92517 41.169205 70 20 2.85 -0.018995 0.3031 62.515812 46.554935 80 16 2.28 -0.204528 0.3239 79.63754 50.200803 90 14 2.00 -0.240408 0.3781 81.074501 46.685341 根据前面假设,本文选取不同的侧值(从30~ 超阈值样本数下降到20个以下时,形状参数变为负 90亿元),使用Winbugs软件进行10000次迭代,滤 数,特征已经发生了改变。相比之下,MCMC方法 去前5000次迭代,将剩下的5000次作为目标后验 不但误差小得多,而且被估计参数随着阈值的升高 分布的样本,得到参数E和。的MCMC估计值。如 依然维持相对稳定。表3给出了E的MCMC估计 表2所示,当样本较少时,MCMC方法的估计结果 的均值、MC的误差以及MCMC的分位数。图1给 明显优于极大似然估计。在阈值从30亿元增加到 出了模型参数的迭代轨迹。 90亿元的过程中,极大似然估计变得很不稳定,在 表3E的MCMC误差及分位数表 阀值u(亿元) 三的MCMC估计值 MC误差 E的MCMC分位数(2.5%) E的MCMC分位数(97.5%) 30 0.3261 0.007608 0.1126 0.7542 40 0.2671 0.007556 0.1042 0.6286 50 0.3939 0.009813 0.1102 0.9564 60 0.3187 0.01279 0.1051 0.9092 70 0.3031 0.01329 0.1041 0.9383 80 0.3239 0.01626 0.1052 1.0420 90 0.3781 0.02196 0.1036 1.3500 86 万方数据
统计与信息论坛 到,即:模拟一条马尔可夫链的样本路径,链的状态空 间是被估计参数的值,链的极限分布为被估参数的贝 叶斯后验分布。在充分的迭代后,马尔可夫链将收敛 于一个平稳的目标分布如Ix,而不依赖于原始状态岛 或时间£。将测试期阶段的尼个状态滤去,剩下的链将 作为目标后验分布的样本。 三、数据来源及整理 本文选取了1987,一2007年间在中国各地发生 的暴雨灾害损失数据,数据来源于《中国减灾》,并对 数据进行了相应的处理。首先,提取发生时间、发生 地点、降雨量、受灾人口、受灾面积、经济损失等几个 指标的数据,舍弃损失额度在1亿元以下的损失数 据,另外有些损失记录并不完整,没有包括经济损失 值的记录,同样将这些数据予以舍弃。在提取数据 过程中发现部分损失事件有重复记录,把发生时间、 发生地点和经济损失相同的事件视为同一事件,再 将重复记录全部剔除后,最后从1 100多条数据中筛 选出702余条,相关数据的描述性统计如表1所示。 表1暴雨损失的描述性统计表 四、基于MCMC估计方法的 POT模型参数估计 合后验分布中获得样本,从而得到需要的边际分布。 总的来说,在给定损失数据后,使用MCiVIC模拟产生 一个与条件后验参数分布相近似的经验参数分布,最 使用Winbugs软件进行Gibbs抽样,从参数的联 后使用这个经验分布的均值作为最终的估计值。 表2极大似然法与MCMC方法参数估计结果比较表 根据前面假设,本文选取不同的阈值(从30~ 90亿元),使用Winbugs软件进行10 000次迭代,滤 去前5 000次迭代,将剩下的5 000次作为目标后验 分布的样本,得到参数搴和盯的MCMC估计值。如 表2所示,当样本较少时,MCMC方法的估计结果 明显优于极大似然估计。在阈值从30亿元增加到 90亿元的过程中,极大似然估计变得很不稳定,在 超阈值样本数下降到20个以下时,形状参数变为负 数,特征已经发生了改变。相比之下,MCMC方法 不但误差小得多,而且被估计参数随着阈值的升高 依然维持相对稳定。表3给出了e的MCMC估计 的均值、MC的误差以及MCMC的分位数。图1给 出了模型参数的迭代轨迹。 表3 e的MCMC误差及分位数表 万方数据
解强:POT模型在巨灾损失预测中的应用 0.08 1.0 80.04 0.5 la 0.00 0.0 49996000 8000 49996000 8000 iteration iteration 图1模型参数的迭代轨迹图 五、结论 时,极大似然方法对广义帕累托分布参数的估计将 变得不稳定,且阈值越高、超阈值损失样本越少,估 在预测巨灾风险数据的损失时,保险公司往往 计能力就越低,精度越差,甚至分布的特征都发生了 更关心“极端点”的损失程度,因为“极端点”的损失 改变。为此,本文引人贝叶斯统计中的马尔可夫一 最有可能危及保险公司的偿付能力,甚至使其破产。 蒙特卡洛(MCMC)方法来对POT模型进行估计,结 本文选取了1987-2007年间在中国发生的暴雨灾 果表明,在小样本情况下,MCMC方法比极大似然 害损失数据作为研究对象,并针对巨灾损失这种低 估计更加稳定,误差更小。这充分证明了MCMC方 频率高强度的损失类型,数据稀少是一个本质问题。 法在小样本情况下解决参数估计问题的优越性。 当我们通过提高阈值使超过阈值的损失样本减少 参考文献: [1]Fisher RA,Tippett L H C.Limiting forms of the frequency distribution of the largest or smallest member of a sample[J]. Proceedings of the Cambrigde Philosophical Society,1928,24(2):180-190. [2]Mises R von.La distribution de la plus grande de n valeurs[C].Reviews of Matchsticks Union Interbalk,1936:141-160. [3]Gnedenko B V.On Lyapunov's work in the theory of probability[J].Istoriko Matematicheskie Issledovaniya,1959,12(1): 135-160. [4]Gumbel EJ.Statistics of extremes[M].New York:Columbia University Press,1958. [5]Pickands J.Statistical inference using extreme order statistics[]].Annual of Statistics,1975,3(1):119-131 The Application of POT Model in Loss Data:Based on MCMC Method XIE Qiang (School of Economics,Nankai University,Tianjin 300071,China) Abstract:Extreme statistics is an important branch of the main events on extreme cases of random statistical regularity.We fit the loss data of rainstorm in China by POT model to determine the distribution form of excess loss.The empirical shows,POT Model,which proved to be effective in extreme loss measurement,deals with the loss distribution of catastrophe risk under the Loss Distribution Method framework.A MCMC model with Gibbs sampling is established to estimate the parameters required in POT. Key words:extreme value theory;POT model;MCMC method;catastrophe loss (责任编辑:崔国平) 87 万方数据
解强:P(玎模型在巨灾损失预测中的应用 五、结论 图1模型参数的迭代轨迹图 在预测巨灾风险数据的损失时,保险公司往往 更关心“极端点”的损失程度,因为“极端点”的损失 最有可能危及保险公司的偿付能力,甚至使其破产。 本文选取了1987—2007年间在中国发生的暴雨灾 害损失数据作为研究对象,并针对巨灾损失这种低 频率高强度的损失类型,数据稀少是一个本质问题。 当我们通过提高阈值使超过阈值的损失样本减少 时,极大似然方法对广义帕累托分布参数的估计将 变得不稳定,且阈值越高、超阈值损失样本越少,估 计能力就越低,精度越差,甚至分布的特征都发生了 改变。为此,本文引入贝叶斯统计中的马尔可夫一 蒙特卡洛(MCMC)方法来对POT模型进行估计,结 果表明,在小样本情况下,MCMC方法比极大似然 估计更加稳定,误差更小。这充分证明了MCMC方 法在小样本情况下解决参数估计问题的优越性。 参考文献: [1]Fisher R A,Tippett L H C.Limiting forms of the{requency distribution of the largest or smallest member of a sample[J]. FSxgceedings of the CarrlIbfigde Philosophical Society,1928,24(2):180—190. [2]Mises R von.La distribution de la plus grande de nvaleurs[C].Reviews of Matchsficks Union Interbalk,1936:141—160. [3]C,fleder&oB V.On Lyapunov’s work in the theon,of probability[J].Istoriko Matmaatieheskie Issledovaniya,1959,12(1): 135—160. [4]Gumbel EJ.Statistics of extremes[M].New York:Columbia University Press,1958. [5]Pickands J.Statistical inference using ext/'ea'neorder statistics[J].AnnualofStatistics,1975,3(1):119—131. The Application of Por Model in LOsS Data:Based On MCMC Method XIE Qiang (Sch00l of Economics,Nankai University,Titan 300071,China) Abstract:Extreme statistics iS all important branch of the main events on extreme eases of random statistical regularity.We fit the loss data of rainstorm in China by P叽model to determine the distribution form of excess loss.The empirical shows,POT Model,which proved to be effective in extreme loss measurement,deals with the loss distilbution of catastrophe risk under the Loss Distribution Method framework.A MCMC model with Gibbs sampling is established to estimate the parameters required in M. Key words:extreme value theory;PaT model;MCMC method;catastrophe loss (责任编辑:崔国平) 万方数据