正在加载图片...
水 利 学 报 2013年8月 SHUILI XUEBAO 第44卷第8期 文章编号:0559-9350(2013)08-0942-08 基于广义极值分布和Metropolis-Hastings抽样算法的 贝叶斯MCMC洪水频率分析方法 鲁帆,严登华 (中国水利水电科学研究院流域水循环模拟与调控国家重点实验室,北京100038) 摘要:广义极值(GEV)分布是国内外洪水频率分析建模中广泛应用的一种概率分布。本文将水文频率分布线型的 未知参数看作随机变量,通过基于Metropolis--Hastings抽样算法的贝叶斯MCMC方法估计GEV分布参数和设计洪 水的后验分布:并据此进行极值洪水的频率分析。汉江流域丹江口水库年最大1日(3日、5日、7日)洪量和年最 大洪峰流量频率分析结果表明,基于Metropolis-Hastings抽样的MCMC模拟在GEV分布参数的贝叶斯估计计算中 行之有效;由于利用了与似然函数渐近性质无关的先验信息,贝叶斯估计方法得到的高分位数设计洪量的后验分 布比经典统计方法得到的设计洪量能包含更多的信息,从而能表达由于参数不确定性而引起的预测不确定性。该 方法能显著地通过分位数图、PPCC法、均方根误差法、K-S法等多种拟合优度检验方法,拟合效果不亚于矩 法、极大似然估计法等常用的经典统计方法。 关键词:洪水频率分析;贝叶斯估计;广义极值分布;Metropolis--Hastings抽样;拟合优化度检验 中图分类号:P333 文献标识码:A 1研究背景 极值洪水是一类非常典型的极值事件,其发生频率小,而一旦发生却影响巨大。相对于一般样 本而言,极值洪水的观测数据比较缺乏,这导致洪水频率分析中分布参数和分位数的估计存在较大 的不确定性。因此,极值洪水的频率计算及不确定性评估方法一直是水文领域的一个研究热点。 贝叶斯估计是一种综合考虑未知总体分布参数的先验信息与样本信息的统计方法,其依据贝叶 斯定理,先求出后验分布,再根据后验分布推断未知总体分布参数。它与矩法、权函数法、极大似 然法等经典统计之间的主要区别在于:它认为未知参数可以看作是随机变量,在关于总体分布参数 的任何统计推断问题中,除了使用样本所提供的信息外,还必须在抽样之前就依据经验或历史资料 规定一个总体分布参数先验信息的概率表述,即先验分布。在洪水频率分析中,如果有其他信息可 以利用,并能表示成先验分布的形式,则即使样本系列较短,也可以获得相对比较精确的推断。此 外,利用贝叶斯估计得到的高分位数的后验分布,由于考虑了模型的不确定性和参数的随机性,通 常比经典统计方法估计的高分位数包含更多的信息。近年来,贝叶斯估计方法逐步被引入到水文频 率分析研究中。例如:Daniel R.H.O'Connell研究了一种新颖的非参数贝叶斯洪水频率估计方法a, W Femandes等s利用贝叶斯方法和具有上界的分布函数研究极值洪水的概率。应用贝叶斯方法的最 大障碍在于后验统计推断中分母积分的计算。虽然选择好的先验分布族可以简化后验分布中的积分 计算,但对于具有高维参数向量的复杂总体分布,即便是用数值积分方法,后验分布计算式中分母 的计算也比较困难。模拟方法的新近发展使这一难题得到了有效的解决,其中的马尔科夫链蒙特卡 罗(MCMC)方法就是较好的方法。 收稿日期:2012-10-30 基金项目:国家自然科学基金项目(51109224):国家重点基础研究发展计划课题(2013CB036406、2010CB951102) 作者简介:鲁帆(1981-),男,湖北天门人,博士,高级工程师,主要从事水文水资源研究。E-mail:19805320@163.com -942-收稿日期:2012-10-30 基金项目:国家自然科学基金项目(51109224);国家重点基础研究发展计划课题(2013CB036406、2010CB951102) 作者简介:鲁帆(1981-),男,湖北天门人,博士,高级工程师,主要从事水文水资源研究。E-mail:lf9805320@163.com 2013 年 8 月 第 44 卷 第 8 期 文章编号:0559-9350(2013)08-0942-08 水 利 学 报 SHUILI XUEBAO 基于广义极值分布和 Metropolis-Hastings抽样算法的 贝叶斯 MCMC 洪水频率分析方法 鲁 帆,严登华 (中国水利水电科学研究院 流域水循环模拟与调控国家重点实验室,北京 100038) 摘要:广义极值(GEV)分布是国内外洪水频率分析建模中广泛应用的一种概率分布。本文将水文频率分布线型的 未知参数看作随机变量,通过基于 Metropolis-Hastings 抽样算法的贝叶斯 MCMC 方法估计 GEV 分布参数和设计洪 水的后验分布,并据此进行极值洪水的频率分析。汉江流域丹江口水库年最大 1 日(3 日、5 日、7 日)洪量和年最 大洪峰流量频率分析结果表明,基于 Metropolis-Hastings 抽样的 MCMC 模拟在 GEV 分布参数的贝叶斯估计计算中 行之有效;由于利用了与似然函数渐近性质无关的先验信息,贝叶斯估计方法得到的高分位数设计洪量的后验分 布比经典统计方法得到的设计洪量能包含更多的信息,从而能表达由于参数不确定性而引起的预测不确定性。该 方法能显著地通过分位数图、PPCC 法、均方根误差法、K-S 法等多种拟合优度检验方法,拟合效果不亚于矩 法、极大似然估计法等常用的经典统计方法。 关键词:洪水频率分析;贝叶斯估计;广义极值分布;Metropolis-Hastings抽样;拟合优化度检验 中图分类号:P333 文献标识码:A 1 研究背景 极值洪水是一类非常典型的极值事件,其发生频率小,而一旦发生却影响巨大。相对于一般样 本而言,极值洪水的观测数据比较缺乏,这导致洪水频率分析中分布参数和分位数的估计存在较大 的不确定性[1-2] 。因此,极值洪水的频率计算及不确定性评估方法一直是水文领域的一个研究热点。 贝叶斯估计是一种综合考虑未知总体分布参数的先验信息与样本信息的统计方法,其依据贝叶 斯定理,先求出后验分布,再根据后验分布推断未知总体分布参数[3] 。它与矩法、权函数法、极大似 然法等经典统计之间的主要区别在于:它认为未知参数可以看作是随机变量,在关于总体分布参数 的任何统计推断问题中,除了使用样本所提供的信息外,还必须在抽样之前就依据经验或历史资料 规定一个总体分布参数先验信息的概率表述,即先验分布。在洪水频率分析中,如果有其他信息可 以利用,并能表示成先验分布的形式,则即使样本系列较短,也可以获得相对比较精确的推断。此 外,利用贝叶斯估计得到的高分位数的后验分布,由于考虑了模型的不确定性和参数的随机性,通 常比经典统计方法估计的高分位数包含更多的信息。近年来,贝叶斯估计方法逐步被引入到水文频 率分析研究中。例如:Daniel R.H. O’Connell 研究了一种新颖的非参数贝叶斯洪水频率估计方法[4] , W Femandes 等[5] 利用贝叶斯方法和具有上界的分布函数研究极值洪水的概率。应用贝叶斯方法的最 大障碍在于后验统计推断中分母积分的计算。虽然选择好的先验分布族可以简化后验分布中的积分 计算,但对于具有高维参数向量的复杂总体分布,即便是用数值积分方法,后验分布计算式中分母 的计算也比较困难[6] 。模拟方法的新近发展使这一难题得到了有效的解决,其中的马尔科夫链蒙特卡 罗(MCMC)方法就是较好的方法[7] 。 — 942 —
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有