工程科学学报.第41卷.第11期:1412-1421.2019年11月 Chinese Journal of Engineering,Vol.41,No.11:1412-1421,November 2019 D0L:10.13374.issn2095-9389.2019.06.03.004,http://journals.ustb.edu.cn 基于PCA和MCMC的贝叶斯方法的海下矿山水害源识 别分析 颜丙乾2),任奋华1,2)四,蔡美峰12),郭奇峰1,2,王培涛12) 1)北京科技大学土木与资源工程学院,北京1000832)北京科技大学城市与地下空间工程北京市重点实验室,北京100083 ☒通信作者.E-mail:renfh2001@163.com 摘要海底金矿矿山水害对矿山生产、人员施工及矿山设备等产生较大威胁,是矿山开采中的自然灾害之一,快速有效的 判别出矿山水害水源对于事故的防治有重要意义,三山岛金矿的巷道围岩裂隙普遍并长期存在涌水现象,矿区开采中矿井 水害的水源主要有海水、第四系水、基岩裂隙水、地下水等,为了准确快速的判别矿井水水源,有效预防矿井水突水及水害威 胁,本研究结合监测点水样的水文地质条件与不同监测点水样的水化学成分分析,选取Mg+、Na+K、Ca、SO2、CI和 HCO共6项指标作为判别因子,通过主成分分析得出不同水样的矿化程度.在贝叶斯算法分析原理的基础上,将马尔可夫链 蒙特卡洛(Markov Chain Monte Carlo,MCMC)引入到贝叶斯方法中,运用统计软件SPSS统计,构建贝叶斯判别分析模型,得 出基于水样样本信息的算法估计的后验分布,得出矿山水害水源的分析方法.运用三山岛金矿水害取水点的水样分析数据 进行详细的分析验证,建立矿井突水水源模型,进行不同水样的信息分析,得出贝叶斯统计函数并进行水源判别结果分析,验 证了贝叶斯矿山水害水源判别模型的准确性和实用性,对现场工作的开展和水害防治有一定的指导意义 关键词矿井水害水源:贝叶斯方法:马尔可夫链蒙特卡洛:主成分分析:水样分析:矿山突水 分类号TD741.7 Application of PCA and Bayesian MCMC to discriminate between water sources in seabed gold mines YAN Bing-qian)REN Fen-hua CAl Mei-feng2GUO Qi-feng2),WANG Pei-tao2 1)School of Civil and Resource Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Beijing Key Laboratory of Urban Underground Space Engineering,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:renfh 2001@163.com ABSTRACT Water hazards in submarine gold mines pose a great threat to mine production,construction personnel,and mining equipment,and represent one of the natural disasters that occur in mining.To prevent and control accidents,it is critical to quickly and effectively identify water sources.Cracks in the rocks surrounding the roadway in the Sanshandao Gold Mine are a widespread and long- term water gushing phenomenon.The main sources of mine water hazards in mining areas are seawater,Quaternary water,bedrock fissure water,and groundwater.To accurately and quickly identify mine water sources and effectively prevent inrushes of mine water and water-hazard threats,the hydrogeological conditions and chemical composition of water samples from different monitoring points were analyzed and six indicators,i.e.,Mg",Na+K',Ca,SO,CI,and HCO,were selected as discriminant factors.Based on the analysis principle of the Bayesian algorithm,the Markov chain Monte Carlo(MCMC)approach was introduced into the Bayesian method.A Bayesian discriminant analysis model was then constructed using SPSS Statistics and the MCMC Bayesian method.The 收稿日期:2019-06-03 基金项目:国家自然科学基金面上资助项目(51774022):国家重点研发计划资助项目(2017YFC0804101)
基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识 别分析 颜丙乾1,2),任奋华1,2) 苣,蔡美峰1,2),郭奇峰1,2),王培涛1,2) 1) 北京科技大学土木与资源工程学院,北京 100083 2) 北京科技大学城市与地下空间工程北京市重点实验室,北京 100083 苣通信作者,E-mail:renfh_2001@163.com 摘 要 海底金矿矿山水害对矿山生产、人员施工及矿山设备等产生较大威胁,是矿山开采中的自然灾害之一,快速有效的 判别出矿山水害水源对于事故的防治有重要意义. 三山岛金矿的巷道围岩裂隙普遍并长期存在涌水现象,矿区开采中矿井 水害的水源主要有海水、第四系水、基岩裂隙水、地下水等,为了准确快速的判别矿井水水源,有效预防矿井水突水及水害威 胁,本研究结合监测点水样的水文地质条件与不同监测点水样的水化学成分分析,选取 Mg2+、Na++K+、Ca2+、SO4 2−、Cl−和 HCO3 −共 6 项指标作为判别因子,通过主成分分析得出不同水样的矿化程度. 在贝叶斯算法分析原理的基础上,将马尔可夫链 蒙特卡洛 (Markov Chain Monte Carlo, MCMC) 引入到贝叶斯方法中,运用统计软件 SPSS 统计,构建贝叶斯判别分析模型,得 出基于水样样本信息的算法估计的后验分布,得出矿山水害水源的分析方法. 运用三山岛金矿水害取水点的水样分析数据 进行详细的分析验证,建立矿井突水水源模型,进行不同水样的信息分析,得出贝叶斯统计函数并进行水源判别结果分析,验 证了贝叶斯矿山水害水源判别模型的准确性和实用性,对现场工作的开展和水害防治有一定的指导意义. 关键词 矿井水害水源;贝叶斯方法;马尔可夫链蒙特卡洛;主成分分析;水样分析;矿山突水 分类号 TD741.7 Application of PCA and Bayesian MCMC to discriminate between water sources in seabed gold mines YAN Bing-qian1,2) ,REN Fen-hua1,2) 苣 ,CAI Mei-feng1,2) ,GUO Qi-feng1,2) ,WANG Pei-tao1,2) 1) School of Civil and Resource Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Beijing Key Laboratory of Urban Underground Space Engineering, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E-mail: renfh_2001@163.com ABSTRACT Water hazards in submarine gold mines pose a great threat to mine production, construction personnel, and mining equipment, and represent one of the natural disasters that occur in mining. To prevent and control accidents, it is critical to quickly and effectively identify water sources. Cracks in the rocks surrounding the roadway in the Sanshandao Gold Mine are a widespread and longterm water gushing phenomenon. The main sources of mine water hazards in mining areas are seawater, Quaternary water, bedrock fissure water, and groundwater. To accurately and quickly identify mine water sources and effectively prevent inrushes of mine water and water-hazard threats, the hydrogeological conditions and chemical composition of water samples from different monitoring points were analyzed and six indicators, i.e., Mg2+, Na++K+ , Ca2+, SO4 2−, Cl− , and HCO3 − , were selected as discriminant factors. Based on the analysis principle of the Bayesian algorithm, the Markov chain Monte Carlo (MCMC) approach was introduced into the Bayesian method. A Bayesian discriminant analysis model was then constructed using SPSS Statistics and the MCMC Bayesian method. The 收稿日期: 2019−06−03 基金项目: 国家自然科学基金面上资助项目(51774022);国家重点研发计划资助项目(2017YFC0804101) 工程科学学报,第 41 卷,第 11 期:1412−1421,2019 年 11 月 Chinese Journal of Engineering, Vol. 41, No. 11: 1412−1421, November 2019 DOI:10.13374/j.issn2095-9389.2019.06.03.004; http://journals.ustb.edu.cn
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 ·1413 posterior distribution estimated by the algorithm is based on water-sample information,which enables the analysis of the mine water source.Based on the water-sample data from a water intake point at the Sanshandao Gold Mine,detailed analysis and verification were performed,and a water-source model for the inrush of mine water was established.An analysis of different water samples was then performed.Through the selection of variables,variables with a strong discriminant ability and high degree of correlation were introduced into the discriminant function to obtain the Bayesian statistical function,thus enabling a discriminatory analysis of the water sources.The accuracy and practicability of the proposed Bayesian mine-water-source identification model were verified.This model has certain significance for guiding future field work and water-hazard prevention and control efforts KEY WORDS mine water source;Bayes method;Markov Chain Monte Carlo (MCMC);principal component analysis(PCA);water sample analysis:mine water inrush 矿产资源是人类生产活动的重要物质基础, 叶斯方法只考虑了参数不确定性的影响,近年来, 多年来,资源的开发和利用导致金属矿山开采方 贝叶斯方法中综合考虑输入不确定性、数据不确 向转变到深部矿体、破碎松软矿体、高寒地区矿 定性和结构不确定性在参数率定中的影响 体及低品位矿体等复杂难采矿体和“三下一上”矿 本文基于不同监测点水样的水化学分析,选 体.三山岛金矿是我国第一个海下采矿的金属矿 取六项指标作为判别因子,运用SPSS软件通过基 山,属于水体下开采的范畴,其独特的自然环境及 于MCMC的贝叶斯方法,得出水样样本信息的算 开采技术条件是矿山灾害预防和治理的难点,采 法估计的后验分布,经过分析验证得出水源判别 矿对矿山围岩应力场和渗流场的扰动导致矿山存 模型的准确性和实用性 在高渗透压甚至海水馈入的风险-]因此竖井施 1贝叶斯算法分析基本原理 工及采矿活动中的注浆堵水、海水突涌的预测 及多场耦合下岩体力学性质的改变等问题值得深 1.1贝叶斯统计原理 入研究,用以减少矿井涌水对矿山生产的影响,降 贝叶斯方法源于Thomas Bayes发表于1763年 低高盐卤离子对井下工作人员和设备的威胁和破坏 的遗作,文中根据二项分布的观测值对其参数进 矿区开采中矿井水害的水源主要有海水、第 行概率推断,之后经过多人研究完善了其基本理 四系水、基岩裂隙水、地下水等.与煤矿普遍存在 论和基本框架.贝叶斯算法是一种概率统计算法, 的“湿帮-涌水一淋水一流水-突水”突水先兆不同, 根据概率论和随机变量,利用人们主观判断的先 三山岛金矿的巷道围岩裂隙普遍并长期存在涌水 验概率和样本信息,利用似然函数,经过反演得到 现象山因此,充分利用和揭示矿山不同水源水样 后验分布,进而判别水样水源类别,其中各阶段的 所携带的信息及其变化对开展矿山水文地质结构 不确定性因素可以通过概率分布表达.因此贝叶 相关研究及水害防治具有重要的意义为了防止 斯分布具有更可信、精度高、信息量大等特点1 矿井水害,及时准确判别矿井水害的水源尤为重 对于A和B两个事件,在B事件发生前,人们 要,水化学分析可以反映水样的水质特性,用以快 主观判断得出事件A的发生概率的基本判断是 速准确的判别水源类型.目前,根据水化学成分判 A的先验概率(prior probability)P(A):而在事件 别矿山突水水源的方法有很多种,常用的不确定 B发生之后,由于受B事件的影响需要对A事件 性数学方法有模糊综合评判法、灰色聚类分析法)、 重新进行概率评估,这种评估结果是事件A的后 多组逐步贝叶斯法、Fisher判别法、距离判别法 验概率(posterior probability)P(AB).P(BlA)/P(B)是 等G刀,非线性识别方法有支持向量机法和BP神 事件A的发生对事件B的支持程度,即似然函数 经网络法等.以上每种方法都得到了一定程度的 (likelihood function). 应用,同时也存在一定的局限性 贝叶斯公式主要通过先验信息与样本信息的 贝叶斯方法结构体系较为完备、结构灵活,与 耦合分析得出后验信息山,即: 贝叶斯统计相关的采样方法一马尔可夫链蒙特 P(AIB)=P(BIA)P(A) (1) 卡洛方法(Markov chain Monte Carlo,MCMC)ys-近 P(B) 年来发展迅速.贝叶斯方法主要是根据选定参数 将上述中的A设定为样本(sample)X,把B设 的先验信息和参数在测定的数据下总结似然信 定为参数(parameter))0,样本x=(Xi,…,X)的密度函 息,进而得到参数的后验信息及概率分布.早期贝 数属于参数族F={f(x;0:0∈⊙,X(=l,…,m)是
posterior distribution estimated by the algorithm is based on water-sample information, which enables the analysis of the mine water source. Based on the water-sample data from a water intake point at the Sanshandao Gold Mine, detailed analysis and verification were performed, and a water-source model for the inrush of mine water was established. An analysis of different water samples was then performed. Through the selection of variables, variables with a strong discriminant ability and high degree of correlation were introduced into the discriminant function to obtain the Bayesian statistical function, thus enabling a discriminatory analysis of the water sources. The accuracy and practicability of the proposed Bayesian mine-water-source identification model were verified. This model has certain significance for guiding future field work and water-hazard prevention and control efforts. KEY WORDS mine water source;Bayes method;Markov Chain Monte Carlo (MCMC);principal component analysis (PCA);water sample analysis;mine water inrush 矿产资源是人类生产活动的重要物质基础, 多年来,资源的开发和利用导致金属矿山开采方 向转变到深部矿体、破碎松软矿体、高寒地区矿 体及低品位矿体等复杂难采矿体和“三下一上”矿 体. 三山岛金矿是我国第一个海下采矿的金属矿 山,属于水体下开采的范畴,其独特的自然环境及 开采技术条件是矿山灾害预防和治理的难点,采 矿对矿山围岩应力场和渗流场的扰动导致矿山存 在高渗透压甚至海水馈入的风险[1−2] . 因此竖井施 工及采矿活动中的注浆堵水、海水突涌[3−4] 的预测 及多场耦合下岩体力学性质的改变等问题值得深 入研究,用以减少矿井涌水对矿山生产的影响,降 低高盐卤离子对井下工作人员和设备的威胁和破坏. 矿区开采中矿井水害的水源主要有海水、第 四系水、基岩裂隙水、地下水等. 与煤矿普遍存在 的“湿帮−涌水−淋水−流水−突水”突水先兆不同, 三山岛金矿的巷道围岩裂隙普遍并长期存在涌水 现象[1] . 因此,充分利用和揭示矿山不同水源水样 所携带的信息及其变化对开展矿山水文地质结构 相关研究及水害防治具有重要的意义[4] . 为了防止 矿井水害,及时准确判别矿井水害的水源尤为重 要,水化学分析可以反映水样的水质特性,用以快 速准确的判别水源类型. 目前,根据水化学成分判 别矿山突水水源的方法有很多种,常用的不确定 性数学方法有模糊综合评判法、灰色聚类分析法[5]、 多组逐步贝叶斯法、Fisher 判别法、距离判别法 等[6−7] ,非线性识别方法有支持向量机法和 BP 神 经网络法等. 以上每种方法都得到了一定程度的 应用,同时也存在一定的局限性. 贝叶斯方法结构体系较为完备、结构灵活,与 贝叶斯统计相关的采样方法−马尔可夫链蒙特 卡洛方法 (Markov chain Monte Carlo, MCMC)[8−9] 近 年来发展迅速. 贝叶斯方法主要是根据选定参数 的先验信息和参数在测定的数据下总结似然信 息,进而得到参数的后验信息及概率分布. 早期贝 叶斯方法只考虑了参数不确定性的影响,近年来, 贝叶斯方法中综合考虑输入不确定性、数据不确 定性和结构不确定性在参数率定中的影响. 本文基于不同监测点水样的水化学分析,选 取六项指标作为判别因子,运用 SPSS 软件通过基 于 MCMC 的贝叶斯方法,得出水样样本信息的算 法估计的后验分布,经过分析验证得出水源判别 模型的准确性和实用性. 1 贝叶斯算法分析基本原理 1.1 贝叶斯统计原理 贝叶斯方法源于 Thomas Bayes 发表于 1763 年 的遗作,文中根据二项分布的观测值对其参数进 行概率推断,之后经过多人研究完善了其基本理 论和基本框架. 贝叶斯算法是一种概率统计算法, 根据概率论和随机变量,利用人们主观判断的先 验概率和样本信息,利用似然函数,经过反演得到 后验分布,进而判别水样水源类别,其中各阶段的 不确定性因素可以通过概率分布表达. 因此贝叶 斯分布具有更可信、精度高、信息量大等特点[10] . 对于 A 和 B 两个事件,在 B 事件发生前,人们 主观判断得出事件 A 的发生概率的基本判断是 A 的 先 验 概 率 (prior probability)P(A); 而 在 事 件 B 发生之后,由于受 B 事件的影响需要对 A 事件 重新进行概率评估,这种评估结果是事件 A 的后 验概率 (posterior probability)P(A|B). P(B|A)/P(B) 是 事件 A 的发生对事件 B 的支持程度,即似然函数 (likelihood function). 贝叶斯公式主要通过先验信息与样本信息的 耦合分析得出后验信息[11] ,即: P(A|B) = P(B|A)P(A) P(B) (1) F = {f (x; θ) : θ ∈ Θ} 将上述中的 A 设定为样本 (sample)X,把 B 设 定为参数 (parameter)θ,样本 x=(X1 , …, Xi ) 的密度函 数属于参数族 ,Xi (i=1, …, n) 是 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1413 ·
.1414 工程科学学报,第41卷,第11期 相互独立的样本,其中参数0是一个未知的常数 E[h(©x=∫h(eπ(dB (6) 得到贝叶斯公式: 在后验概率分布π(x)中抽取大量的独立分布 f(xe)π(0) π(x)= (2) 样本观测值0其中=l,2,…,m,可得下式: ∑:f(axe)π(o)de 该公式中,参数0的分布是离散的.如果参数 =∑ (7) 0的分布是连续的,则贝叶斯公式则变为如下所示: 根据选择的似然函数、先验分布(y为独立分 f(xπ(0 π(x)= (3) 布样本)等,利用Proposal分布py)与不变分布 「f(x0π(0d0 q(ybyXy"为MCMC抽样后的建议新样本值),从当 前位置抽取候选值Markov链从y转移到y的可能 其中,其中π指的是参数的概率分布,π()和π(x) 性是1: 分别指的是0的先验概率和后验概率,x)指的 是观测到的样本信息,也就是似然函数,日是0的 A(y.y)= p(y")qly) (8) p(y)g(yly) 参数空间 先验分布是贝叶斯理论的重要一环,是对事 当Proposal分布函数满足对称随机q6ly)= 件的主观经验和主观判断,先验分布的构造主要 q0y时,接受概率简化为 有扩散先验分布和共扼先验分布两类.扩散先验 A0y)=1, (9) p(vi) 分布的构造方法除最大嫡法外,还包括相对似然 函数法、蒙特卡洛方法、积累函数法等) 式中,(*)为似然度算子,其值越小表示模拟值与 似然函数是贝叶斯方法的重要基础,其理论 观测值相似程度越高,为独立样本,=1,2,…,m 发展主要得益于Fisher提出的似然原理]贝叶 通过以上公式,产生一个[0,1]间均匀分布的随机 斯方法极大后验估计方法来源于似然原理中的极 数R,如果R<A,y),则接受该测试参数并设定为 大似然估计法,目前该方法仍然广泛应用在各学 当前模型参数o,即y+)=y;否则不接收该测试 科中 参数,y+1山)=i. 若样本X,(=1,…,n)的每个样本信息相互独 通过迭代重复上述步骤,这样对足够大的 立,则样本x=(X,…,X)的似然函数x0可用下 k值,序列yk+)yk+2·ym可以认为是后验分布的 式计算 抽样2四.和独立样本一样,可以用这个序列来估 计一些数字特征,比如后验均值.这种方法可以完 f(x0= (4) 全不考虑所选的q(yy)(当然必须服从某些正则 i=l 条件)2四 1.2贝叶斯统计推断模型的求解方法 在多参数问题的反演分析中,虽然已知其后 2矿井突水水源模型样本 验分布,但是很难用显式表示,更难以用数值分析 2.1突水水源判别指标的确定 方法进行参数估计]因此,需要采用舍选法、重 各含水层中的水化学成分众多,而各含水层 要抽样法或马尔可夫链蒙特卡洛法(Markov chain 又是受天然、人为因素共同影响的统一体.水中 Monte Carlo,MCMC)等方法在后验分布空间抽样4-1, 主要离子有:Na+K*、Ca2+、Mg2+、HCO、C、SO2 进行参数估计. (这6项是水中的主要离子,也是常用分析离子), 马尔可夫链蒙特卡洛法(MCMC)方法的样本 以及Fe、Fe2+、CO}、NO5、Mn2+等.但是,考虑每 是通过Markov链搜索变量空间u,Markov链在最 一种化学离子是不现实的,也是不经济的,必须综 可能的区间进行搜索通过迭代产生模拟序列 合考虑离子的重要性和数据的有效性4因此,本 Yo,Yi,Y2,…,Yn,其中Yo为任意初始值,Yn+的转移 文选取了Mg2+、Na+K*、Ca2+、SO、CI和HCO共 概率只与其前一个状态Yn有关,即: 6项指标作为判别因子 P(Yn+I=ylYn,Yn-1,..,Yo)=P(Yn+ilYn) (5) 2.2贝叶斯判别样本的建立 蒙特卡洛抽样方法刀基本思想是通过大量取 根据各含水层的水质特征和实际的判别需 样近似得到预期结果.根据后验概率π(x,如果 要,将矿区的突水水源分为4类:海水为I类、第 h()=0.那么h()的后验概率为 四系孔隙水为Ⅱ类、基岩裂隙水为Ⅲ类、淡水为
相互独立的样本,其中参数 θ 是一个未知的常数. 得到贝叶斯公式: π(θi |x) = f (x|θi)π(θi) ∑ i f (x|θi)π(θ)dθi (2) 该公式中,参数 θ 的分布是离散的. 如果参数 θ 的分布是连续的,则贝叶斯公式则变为如下所示: π(θ|x) = f (x|θ)π(θ) r Θ f (x|θ)π(θ)dθ (3) 其中,其中 π 指的是参数的概率分布,π(θ) 和 π(θ|x) 分别指的是 θ 的先验概率和后验概率,f(x|θ) 指的 是观测到的样本信息,也就是似然函数,Θ 是 θ 的 参数空间[12] . 先验分布是贝叶斯理论的重要一环,是对事 件的主观经验和主观判断,先验分布的构造主要 有扩散先验分布和共扼先验分布两类. 扩散先验 分布的构造方法除最大熵法外,还包括相对似然 函数法、蒙特卡洛方法、积累函数法等[13] . 似然函数是贝叶斯方法的重要基础,其理论 发展主要得益于 Fisher 提出的似然原理[13] . 贝叶 斯方法极大后验估计方法来源于似然原理中的极 大似然估计法,目前该方法仍然广泛应用在各学 科中. 若样本 Xi (i=1, …, n) 的每个样本信息相互独 立,则样本 x =(X1 , …, Xi ) 的似然函数 f(x|θ) 可用下 式计算. f (x|θ) = ∏n i=1 f (x; θ) (4) 1.2 贝叶斯统计推断模型的求解方法 在多参数问题的反演分析中,虽然已知其后 验分布,但是很难用显式表示,更难以用数值分析 方法进行参数估计[13] . 因此,需要采用舍选法、重 要抽样法或马尔可夫链蒙特卡洛法(Markov chain Monte Carlo, MCMC)等方法在后验分布空间抽样[14−15] , 进行参数估计. Y0 Y1 Y2 Yn Y0 Yn+1 Yn 马尔可夫链蒙特卡洛法(MCMC)方法的样本 是通过 Markov 链搜索变量空间[16] ,Markov 链在最 可能的区间进行搜索[10] . 通过迭代产生模拟序列 , , ,…, ,其中 为任意初始值, 的转移 概率只与其前一个状态 有关,即: P(Yn+1 = y|Yn,Yn−1,· · ·,Y0) = P(Yn+1|Yn) (5) π(θ|x) h(θ) = θ h(θ) 蒙特卡洛抽样方法[17] 基本思想是通过大量取 样近似得到预期结果. 根据后验概率 ,如果 ,那么 的后验概率为 E [h(θ)|x] = ∫ h(θ)π(θ)dθ (6) π(θ|x) θi 在后验概率分布 中抽取大量的独立分布 样本观测值 其中 i=1, 2, …, m,可得下式: hm = 1 m ∑m i=1 h(θi) (7) p(y) q(y ∗ |y) y ∗ y ∗ 根据选择的似然函数、先验分布(y 为独立分 布样本 )等 ,利 用 Proposal 分 布 与不变分布 ( 为 MCMC 抽样后的建议新样本值),从当 前位置抽取候选值 Markov 链从 转移到 y 的可能 性是[18] : A(y, y ∗ ) = { 1, p(y ∗ )q(y|y ∗ ) p(y)q(y ∗ |y) } (8) q(y ∗ |y) = q(y|y ∗ ) 当 Proposal 分布函数满足对称随机 时,接受概率简化为[19] : A(yi , y ∗ ) = { 1, p(y ∗ ) p(yi) } (9) R < A(yi , y ∗ ) y(i+1) = y ∗ y(i+1) = yi 式中,p(*) 为似然度算子,其值越小表示模拟值与 观测值相似程度越高,yi 为独立样本,i=1, 2, …, m. 通过以上公式,产生一个 [0, 1] 间均匀分布的随机 数 R,如果 ,则接受该测试参数并设定为 当前模型参数[20] ,即 ;否则不接收该测试 参数, . y(k+1) , y(k+2) ,··· , yn q(y ∗ |y) 通过迭代重复上述步骤. 这样对足够大的 k 值,序列 可以认为是后验分布的 抽样[21] . 和独立样本一样,可以用这个序列来估 计一些数字特征,比如后验均值. 这种方法可以完 全不考虑所选的 (当然必须服从某些正则 条件)[22] . 2 矿井突水水源模型样本 2.1 突水水源判别指标的确定 各含水层中的水化学成分众多,而各含水层 又是受天然、人为因素共同影响的统一体. 水中 主要离子有:Na++K+、Ca2+、Mg2+、HCO3 −、Cl−、SO4 2−[23] (这 6 项是水中的主要离子,也是常用分析离子), 以及 Fe3+、Fe2+、CO3 2−、NO3 −、Mn2+等. 但是,考虑每 一种化学离子是不现实的,也是不经济的,必须综 合考虑离子的重要性和数据的有效性[24] . 因此,本 文选取了 Mg2+、Na++K+、Ca2+、SO4 2−、Cl−和 HCO3 −共 6 项指标作为判别因子. 2.2 贝叶斯判别样本的建立 根据各含水层的水质特征和实际的判别需 要,将矿区的突水水源分为 4 类:海水为Ⅰ类、第 四系孔隙水为Ⅱ类、基岩裂隙水为Ⅲ类、淡水为 · 1414 · 工程科学学报,第 41 卷,第 11 期
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 ·1415 Ⅳ类从参考文献[26]所提供的从大量的矿井 p统计表),其中突(涌)水水源为I类水层的有17个, 突水案例中选取40个典型突水水样作为训练样本 Ⅱ类含水层的有4个,Ⅲ类含水层的有15个,W类 (如表1所示为不同水样的主要离子成分质量浓度 含水层的有4个 表1矿井突水水源判别的变量资料 Table 1 Variable data for discrimination of water inrush sources in mine 序号pHCO)MmgL)p(C)mgL-)pSO方)(mgL)p(K+Na)/(mgL-)p(Ca)(mgL-)pMg(mgL-)水样水源结果贝叶斯法判别结果 268.4 20585.5 2713.7 11707.5 716.4 1175.5 I 2 295.3 23158.4 3097.9 13025.5 651.3 1427.6 I 244.0 22644.0 3001.9 13025.5 676.4 1412.4 237.9 24702.3 2977.9 13442.5 876.8 1576.5 5 262.3 21408.6 2929.8 11957.5 651.3 1366.9 6 274.5 23981.9 3122.0 13783 751.5 1549.1 I 244.0 39112.3 4418.8 19692.5 2204.4 3049.7 m Ⅲ 8 268.4 21099.8 2881.8 11957.5 576.2 1351.7 274.5 21614.6 2833.8 12395.5 626.3 1369.9 10 286.7 24393.5 3314.1 13783 776.6 1582.5 11 268.4 27790.3 3362.1 16362.5 891.8 1767.8 12 317.3 32936.6 4130.6 18505 1052.1 2126.3 Ⅲ 13 323.4 36024.3 4514.8 19448 1262.5 2423.9 Ⅲ 14 329.5 38082.9 4682.9 21295 1067.1 2530.2 Ⅲ 15 335.6 33965.7 4156.0 19365 926.9 2098.9 m Ⅲ 16 268.4 46317.2 5283.3 25574 1703.4 3462.8 ) Ⅲ 少 280.6 29848.9 3001.9 15760 1392.8 1889.3 《 Ⅱ 18 207.4 39626.7 4755.0 21170 1853.7 3007.1 Ⅲ 19 280.6 31392.7 3962.5 17490 1112.2 2272.1 Ⅲ 219.6 33348.2 3266.0 16582 2148.3 2196.7 M 21 286.7 33183.7 3746.3 17362 1242.5 2308.5 ⑧ Ⅲ 22 250.1 28654.9 3688.7 15928 1042.1 1905.1 I 23 195.2 26184.4 3073.9 13518 1162.3 1715.6 I 24 250.1 23467.2 2881.8 12912 681.4 1458.0 25 244.0 23467.2 2881.8 12692 825.6 1492.0 250.1 23879.1 3035.5 12892 881.8 1569.8 27 250.1 43641,1 4956.7 23226 1603.2 3134.7 Ⅲ 225.7 35406.8 4169.0 19250 1362.7 2478.6 Ⅲ Ⅲ 29 268.4 34171.7 4265.1 18910 1162.3 2269.6 四 30 323.4 37053.8 4514.8 20530.8 1202.4 2527.2 ⑧ Ⅲ 31 274.5 39112.3 4923.1 21270 1468.9 2694.3 Ⅲ 32 158.6 16468.3 2439.9 9412.5 380.8 1125.1 33 152.5 16303.5 2267.1 9150 392.8 1122.7 I 1 34 317.3 20585.5 2881.8 12847.5 551.1 1184.6 I 35 225.7 19762.0 2473.5 11098.8 551.1 1233.2 I 36 176.9 17456.3 2228.6 10112.5 320.6 1093.5 37 140.3 89.0 76.8 61.2 100.2 14.6 N W 38 256.2 212.3 405.4 200 138.3 42.5 N W 39 209.9 21.3 55.7 322 81.0 4.4 V W 40 219.6 257.0 134.5 133.7 144.3 26.7 N
Ⅳ类[25] . 从参考文献 [26] 所提供的从大量的矿井 突水案例中选取 40 个典型突水水样作为训练样本 (如表 1 所示为不同水样的主要离子成分质量浓度 ρ 统计表),其中突(涌)水水源为Ⅰ类水层的有 17 个, Ⅱ类含水层的有 4 个,Ⅲ类含水层的有 15 个,Ⅳ类 含水层的有 4 个. 表 1 矿井突水水源判别的变量资料[26] Table 1 Variable data for discrimination of water inrush sources in mine[26] 序号 ρ(HCO3 − )/(mg·L−1) ρ(Cl− )/(mg·L−1) ρ(SO4 2−)/(mg·L−1) ρ(K++Na+ )/(mg·L−1) ρ(Ca2+)/(mg·L−1) ρ(Mg2+)/(mg·L−1) 水样水源结果 贝叶斯法判别结果 1 268.4 20585.5 2713.7 11707.5 716.4 1175.5 Ⅰ Ⅰ 2 295.3 23158.4 3097.9 13025.5 651.3 1427.6 Ⅰ Ⅰ 3 244.0 22644.0 3001.9 13025.5 676.4 1412.4 Ⅰ Ⅰ 4 237.9 24702.3 2977.9 13442.5 876.8 1576.5 Ⅰ Ⅰ 5 262.3 21408.6 2929.8 11957.5 651.3 1366.9 Ⅰ Ⅰ 6 274.5 23981.9 3122.0 13783 751.5 1549.1 Ⅱ Ⅱ 7 244.0 39112.3 4418.8 19692.5 2204.4 3049.7 Ⅲ Ⅲ 8 268.4 21099.8 2881.8 11957.5 576.2 1351.7 Ⅰ Ⅰ 9 274.5 21614.6 2833.8 12395.5 626.3 1369.9 Ⅰ Ⅰ 10 286.7 24393.5 3314.1 13783 776.6 1582.5 Ⅱ Ⅱ 11 268.4 27790.3 3362.1 16362.5 891.8 1767.8 Ⅱ Ⅱ 12 317.3 32936.6 4130.6 18505 1052.1 2126.3 Ⅲ Ⅲ 13 323.4 36024.3 4514.8 19448 1262.5 2423.9 Ⅲ Ⅲ 14 329.5 38082.9 4682.9 21295 1067.1 2530.2 Ⅲ Ⅲ 15 335.6 33965.7 4156.0 19365 926.9 2098.9 Ⅲ Ⅲ 16 268.4 46317.2 5283.3 25574 1703.4 3462.8 Ⅲ Ⅲ 17 280.6 29848.9 3001.9 15760 1392.8 1889.3 Ⅱ Ⅱ 18 207.4 39626.7 4755.0 21170 1853.7 3007.1 Ⅲ Ⅲ 19 280.6 31392.7 3962.5 17490 1112.2 2272.1 Ⅲ Ⅲ 20 219.6 33348.2 3266.0 16582 2148.3 2196.7 Ⅲ Ⅲ 21 286.7 33183.7 3746.3 17362 1242.5 2308.5 Ⅲ Ⅲ 22 250.1 28654.9 3688.7 15928 1042.1 1905.1 Ⅰ Ⅰ 23 195.2 26184.4 3073.9 13518 1162.3 1715.6 Ⅰ Ⅰ 24 250.1 23467.2 2881.8 12912 681.4 1458.0 Ⅰ Ⅰ 25 244.0 23467.2 2881.8 12692 825.6 1492.0 Ⅰ Ⅰ 26 250.1 23879.1 3035.5 12892 881.8 1569.8 Ⅰ Ⅰ 27 250.1 43641.1 4956.7 23226 1603.2 3134.7 Ⅲ Ⅲ 28 225.7 35406.8 4169.0 19250 1362.7 2478.6 Ⅲ Ⅲ 29 268.4 34171.7 4265.1 18910 1162.3 2269.6 Ⅲ Ⅲ 30 323.4 37053.8 4514.8 20530.8 1202.4 2527.2 Ⅲ Ⅲ 31 274.5 39112.3 4923.1 21270 1468.9 2694.3 Ⅲ Ⅲ 32 158.6 16468.3 2439.9 9412.5 380.8 1125.1 Ⅰ Ⅰ 33 152.5 16303.5 2267.1 9150 392.8 1122.7 Ⅰ Ⅰ 34 317.3 20585.5 2881.8 12847.5 551.1 1184.6 Ⅰ Ⅰ 35 225.7 19762.0 2473.5 11098.8 551.1 1233.2 Ⅰ Ⅰ 36 176.9 17456.3 2228.6 10112.5 320.6 1093.5 Ⅰ Ⅰ 37 140.3 89.0 76.8 61.2 100.2 14.6 Ⅳ Ⅳ 38 256.2 212.3 405.4 200 138.3 42.5 Ⅳ Ⅳ 39 209.9 21.3 55.7 32.2 81.0 4.4 Ⅳ Ⅳ 40 219.6 257.0 134.5 133.7 144.3 26.7 Ⅳ Ⅳ 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1415 ·
·1416 工程科学学报,第41卷,第11期 3 矿井突水水源模型建立及应用 荷PC1和PC2的解释方差,结果如表2所示.综合 成分指标可以通过主成分元素数值与对应主成分 3.1不同水样的信息分析 解释方差百分数的乘积之和计算获得27,水样的 表1所示为文献26]中在三山岛金矿开展的 主成分经过计算的综合成分指标分布结果如图1 矿山深部巷道水样采集分析数据,按照图1下方 所示 公式对表1中的水样进行主要成分综合分析 从图中可以看出Ⅲ类水样的矿化度(TDS)较 (PCA),经过抽样适当性检验,可以得出主成分载 高,与其他水样相比,含有较高浓度的Na、Mg+阳 2.5 离子和C1、S042-阴离子,与I类海水水样同属 2.0 Na-C类型水样.I类水样和Ⅱ类水样矿化程度类 1.5 似,属于中等矿化度.Ⅳ类淡水矿化程度最低山 1.0- 根据表1所示三山岛金矿所取水样的样本信 0.5 息绘制的PIPER三线图如图2所示,图中所示为 0 0.5 主要阳离子(Mg2、Na+K、Ca2)和主要阴离子 -1.0 (CT、HCO3、SO,2)的质量浓度分布散点图 -1.5- 分析图2可得,选取的水样除了淡水水样外, -2.0 其他水样均表现出明显的Na+Mg2+C1-+SO42-类 型,水质较为稳定,I类水样、Ⅱ类水样和Ⅲ类水 主成分1综合指标 PC1(Principal Component1)=-0.004[O]-0.034FH]+0.208[TDS]+ 样各含水层之间的水质区别不明显,存在明显的 0.209[C1]+0.141[S04]+0.047HC03]+0.193Na+0.140Ca]+ 0.205Mgl 表2主成分载荷解释方差 PC2(Principal Component2)=0.306[1%O]+0.034[H]+0.015[TDS]+ Table 2 Interpretation variance of principal component load 0.034[C]+0.155S0]+0.239[HC0]+0.035Na+0.251[Ca]+ 主成分载荷 特征值 解释方差% 累计解释方差% 0.042Mg] 图1水样主成分分析结果 PC1 4.952 72.694 75.627 PC2 1.338 17.354 80.735 Fig.1 Principal component analysis of water samples Cr+SO,2的质量浓度mgL) 'A0 "y 00 Mg2的质量浓度(mgL-) 8 *+K的质量浓度mg HCO,的质量浓度(mgL) 20 40 60 SO,的质量浓度1mg 0 20 80 00 0 100 60 40 0 0 20 40 60 80 100 Ca的质量浓度/(mgL-) C的质量浓度(mgL 图2 三山岛金矿水样的PIPER图 Fig.2 PIPER diagram of water samples from Sanshandao gold mine
3 矿井突水水源模型建立及应用 3.1 不同水样的信息分析 表 1 所示为文献 [26] 中在三山岛金矿开展的 矿山深部巷道水样采集分析数据,按照图 1 下方 公式对 表 1 中的水样进行主要成分综合分 析 (PCA),经过抽样适当性检验,可以得出主成分载 荷 PC1 和 PC2 的解释方差,结果如表 2 所示. 综合 成分指标可以通过主成分元素数值与对应主成分 解释方差百分数的乘积之和计算获得[27] ,水样的 主成分经过计算的综合成分指标分布结果如图 1 所示. 从图中可以看出Ⅲ类水样的矿化度 (TDS) 较 高,与其他水样相比,含有较高浓度的 Na+、Mg2+阳 离子和 Cl-、SO4 2-阴离子,与Ⅰ类海水水样同属 Na-Cl 类型水样. Ⅰ类水样和Ⅱ类水样矿化程度类 似,属于中等矿化度. Ⅳ类淡水矿化程度最低[1] . 根据表 1 所示三山岛金矿所取水样的样本信 息绘制的 PIPER 三线图如图 2 所示,图中所示为 主要阳离子(Mg2+、Na++K+、Ca2+)和主要阴离子 (Cl−、HCO3 −、SO4 2−)的质量浓度分布散点图. 分析图 2 可得,选取的水样除了淡水水样外, 其他水样均表现出明显的 Na++Mg2++Cl-+SO4 2-类 型,水质较为稳定,Ⅰ类水样、Ⅱ类水样和Ⅲ类水 样各含水层之间的水质区别不明显,存在明显的 表 2 主成分载荷解释方差 Table 2 Interpretation variance of principal component load 主成分载荷 特征值 解释方差/% 累计解释方差/% PC1 4.952 72.694 75.627 PC2 1.338 17.354 80.735 −6 −4 −2 0 2 4 −2.0 −1.5 −1.0 −0.5 0 0.5 1.0 1.5 2.0 2.5 主成分2综合指标 主成分1综合指标 Ⅳ Ⅱ Ⅲ Ⅰ PC1(Principal Component1) = −0.004[18O] -0.034[2H] + 0.208[TDS] + 0.209[Cl] + 0.141[SO4 ] + 0.047[HCO3 ] + 0.193[Na] + 0.140[Ca] + 0.205[Mg] PC2(Principal Component2) = 0.306[18O] + 0.034[2H] + 0.015[TDS] + 0.034[Cl] + 0.155[SO4 ] + 0.239[HCO3 ] + 0.035[Na] + 0.251[Ca] + 0.042[Mg] 图 1 水样主成分分析结果 Fig.1 Principal component analysis of water samples 100 80 60 40 20 0 100 80 60 40 20 0 Cl −+SO4 2−的质量浓度/(mg·L −1 ) Ca 2++Mg 2+的质量浓度/(mg·L −1 ) 100 80 60 40 20 0 0 20 40 60 80 100 0 20 40 60 80 100 Mg 2+的质量浓度/(mg·L −1 ) Na ++K 的质量浓度 + /(mg·L −1 ) Ca2+的质量浓度/(mg·L−1) 0 20 40 60 80 100 0 20 40 60 80 0 100 20 40 60 80 100 SO4 2−的质量浓度/(mg·L −1 ) HCO3 −的质量浓度/(mg·L −1 ) Cl−的质量浓度/(mg·L−1) 图 2 三山岛金矿水样的 PIPER 图 Fig.2 PIPER diagram of water samples from Sanshandao gold mine · 1416 · 工程科学学报,第 41 卷,第 11 期
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 1417 交织情况2图中所示水样中阳离子主要为Mg+ HCO3+SO42相比Ca2+Mg2+略有不足.而HCO3与 (主要阳离子质量浓度关系为Mg2>Ca2>Na+K), Ca的对比得出,两者之间关系表现出明显的 阴离子主要为C1一(主要阴离子质量浓度关系为 Ca2*远高于HCO3的情况,但是S042与Ca2*的对比 CI>S042>HC03). 发现两者之间的比例在5:1和2:1之间,因此相 从水样的离子分布对比图(图3)可以明显看 对于Ca,SO2表现出2到5倍的关系,因此水样 出,HC03+S042与Ca2+Mg2的比例分布在2:1 中的SO2远高于HCO3.CI与Na的对比可以看 和1:1之间(图中辅助线=2x和=x之间),与 出两者大致表现出1:1的关系 6000- 35001 (a) (b) ·I类水样 ·Ⅱ类水样 3000- ▲Ⅲ类水样 )=2x AAA 02500. +N类水样 4000 2000 3000 1500 OS+-O 2000 ■I类水样 。Ⅱ类水样 1000 ▲Ⅲ类水样 1000 +W类水样 500 晶吸P自公。4 10002000300040005000 600 500100015002000250030003500 (Ca+Mg2+)的质量浓度/mgL-) Ca2的质量浓度/(mgL-) y 50000 (c) (d) 5000- .40000- 4000 J=5x J=2x 30000 3000- 20000 ◆ 2000 ■I类水样 ■I类水样 。Ⅱ类水样 。Ⅱ类水样 10000 ▲Ⅲ类水样 1000 ▲Ⅲ类水样 +N类水样 +V类水样 500010000.150002000025000 500 100015002000 250i Na的质量浓度/(mgL) Ca“的质量浓度/(mgL- 图3水样中的离子比分布图.(a)HCO+SO旷与Ca+Mg2的对比:(b)HCO与Ca的对比:(c)Cr与Na的对比:(d)SO与Ca+的对比 Fig.3 Distribution of ion ratios in water samples:(a)comparison of HCO+SO and Ca+Mg";(b)comparison of HCO and Ca2;(c)comparison of CF and Na';(d)comparison of SO and Ca 从不同含水层的水样分布可以明显看出,淡 相关性达到0781.样本指标之间的信息重叠,相 水中的阴阳离子含量非常少,但是其他含水层的 互间依赖性很强 阴阳离子表现出较为明显的浓度变化:I类水样> 3.2贝叶斯统计函数和结果分析 Ⅱ类水样>Ⅲ类水样 采用基于MCMC的贝叶斯方法,将样本数据 对表1中的矿井水水源样本数据标准化处理 带入进行水源判别,判断第j类样本x信息进行迭 之后,经过处理的水源成分判别因子之间的相关 代计算,得出后验分布日的结果.经过初始化阶 系数矩阵如表3所示.从协方差结果可以看出, 段,样本数据生成的直方图如图4(a)所示,将x的 HCO3与自身期望相比的变化趋势同K+Na、 后验分布同样生成直方图如图4(©)所示,经过拟 Ca2+、Mg的变化趋势相反,类似的还有CT、SO42、 合,先验分布和后验分布的直方图符合正态分布, Ca+、Mg+与K+Na的变化趋势关系.从水源样本 分布结果相对对称.同时图4(b)和图4(d)所示的 成分的相关性关系矩阵可以得出,CI与SO42、Mg2+ 先验信息的常规残差百分位图和后验信息的常规 的相关性分别达到0.935和0.838,S042与Mg2+的 残差百分位图也表明信息符合正态分布的特性
交织情况[28] . 图中所示水样中阳离子主要为 Mg2+ (主要阳离子质量浓度关系为 Mg2+>Ca2+>Na++K+ ), 阴离子主要为 Cl-(主要阴离子质量浓度关系为 Cl−>SO4 2−>HCO3 − ). 从水样的离子分布对比图(图 3)可以明显看 出 , HCO3 −+SO4 2−与 Ca2++Mg2+的比例分布 在 2∶1 和 1∶1 之间 (图中辅助线 y=2x 和 y=x 之间 ) ,与 HCO3 −+SO4 2−相比 Ca2++Mg2+略有不足. 而 HCO3 −与 Ca2+的对比得出 ,两者之间关系表现出明显 的 Ca2+远高于 HCO3 −的情况,但是 SO4 2−与 Ca2+的对比 发现两者之间的比例在 5∶1 和 2∶1 之间,因此相 对于 Ca2+ ,SO4 2−表现出 2 到 5 倍的关系,因此水样 中的 SO4 2−远高于 HCO3 − . Cl−与 Na+的对比可以看 出两者大致表现出 1∶1 的关系. 从不同含水层的水样分布可以明显看出,淡 水中的阴阳离子含量非常少,但是其他含水层的 阴阳离子表现出较为明显的浓度变化:Ⅰ类水样> Ⅱ类水样>Ⅲ类水样. 对表 1 中的矿井水水源样本数据标准化处理 之后,经过处理的水源成分判别因子之间的相关 系数矩阵如表 3 所示. 从协方差结果可以看出, HCO3 −与 自 身 期 望 相 比 的 变 化 趋 势 同 K ++Na+、 Ca2+、Mg2+的变化趋势相反,类似的还有 Cl−、SO4 2−、 Ca2+、Mg2+与 K ++Na+的变化趋势关系. 从水源样本 成分的相关性关系矩阵可以得出,Cl−与 SO4 2−、Mg2+ 的相关性分别达到 0.935 和 0.838,SO4 2−与 Mg2+的 相关性达到 0.781. 样本指标之间的信息重叠,相 互间依赖性很强. 3.2 贝叶斯统计函数和结果分析 θ j 采用基于 MCMC 的贝叶斯方法,将样本数据 带入进行水源判别,判断第 j 类样本 xj 信息进行迭 代计算,得出后验分布 的结果. 经过初始化阶 段,样本数据生成的直方图如图 4(a) 所示,将 x 的 后验分布同样生成直方图如图 4(c) 所示,经过拟 合,先验分布和后验分布的直方图符合正态分布, 分布结果相对对称. 同时图 4(b) 和图 4(d) 所示的 先验信息的常规残差百分位图和后验信息的常规 残差百分位图也表明信息符合正态分布的特性. 0 1000 2000 3000 4000 5000 6000 0 1000 2000 3000 4000 5000 6000 y x y x y x y x (HCO3 −+SO42− )的质量浓度/(mg·L−1 ) Cl −的质量浓度/(mg·L−1 ) HCO3 −的质量浓度/(mg·L−1 ) SO42+的质量浓度/(mg·L−1 ) (Ca2++Mg2+)的质量浓度/(mg·L−1) y=2x y=5x y=2x y=x y=x 0 500 1000 1500 2000 2500 3000 3500 0 500 1000 1500 2000 2500 3000 3500 Ⅰ类水样 Ⅱ类水样 Ⅲ类水样 Ⅳ类水样 Ⅰ类水样 Ⅱ类水样 Ⅲ类水样 Ⅳ类水样 Ⅰ类水样 Ⅱ类水样 Ⅲ类水样 Ⅳ类水样 Ⅰ类水样 Ⅱ类水样 Ⅲ类水样 Ⅳ类水样 0 5000 10000 15000 20000 25000 0 10000 20000 30000 40000 50000 Na+的质量浓度/(mg·L−1) Ca2+的质量浓度/(mg·L−1) Ca2+的质量浓度/(mg·L−1) 0 500 1000 1500 2000 2500 0 1000 2000 3000 4000 5000 (c) (a) (d) (b) 图 3 水样中的离子比分布图. (a)HCO3 −+SO4 2−与 Ca2++Mg2+的对比;(b)HCO3 −与 Ca2+的对比;(c)Cl−与 Na+的对比;(d)SO4 2−与 Ca2+的对比 Fig.3 Distribution of ion ratios in water samples: (a) comparison of HCO3 −+SO4 2− and Ca2++Mg2+; (b) comparison of HCO3 − and Ca2+; (c) comparison of Cl− and Na+ ; (d) comparison of SO4 2− and Ca2+ 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1417 ·
1418 工程科学学报.第41卷,第11期 表3汇聚组内矩阵 Table 3 Convergence intra-group matrix 贝叶斯判别 协方差 相关性 主要离子 HCO; cr S02 K*+Na' Ca2 Mg" HCO CI SO K'+Na'Ca*Mg" HCO 1814.827 12616.899 5054.195 -195.334-3807.587-1747.6081.0000.0850.295-0.077-0.2950.136 Cr 12230598.9741177325.895-77121.740648781.708985384.161 1.0000.838-0.3720.6120.935 S02 161555.942 -1547.83128471.25394643.546 1.000-0.0650.2340.781 K'+Na" 3520.493-11349.173-4738.708 1.000-0.631-0.265 Ca 91887.25460781.440 1.0000.665 Mg" 90803.664 1.000 注:协方差矩阵的自由度为36 (a) 100- 99.56 80- 95.0 70.0 60 形 40.0- 40 10.0- 1.0- 1 0 2 )0 0 20 x,/10m) x的常规残差 120 (c) 95@ 100- 95.0 70.0 60 40.0 40 10.0 20 1.0- a山 0.81.01.21.41.61.82.0 2.2 -50 0 50 0/10gs) 日,的常规残差 图4先验信息和后验信息分布.(a)先验信息的直方图:(b)先验信息的常规残差:(c)后验信息的直方图;(d)后验信息的常规残差 Fig.4 Distribution of prior and posterior information:(a)histogram of prior information;(b)conventional residuals of prior information;(c)histogram of posterior information;(d)conventional residuals of posterior information 这与似然函数选取正态分布相符 类别完全一致 把水源样本I类、Ⅱ类、Ⅲ类和V类作为四个 利用贝叶斯判别法筛选出影响矿山突水水源 总体G1~G4,Kt+Na、Ca2+、Mg2+、CI、SOf、HCO3 分类的K*+Na、Ca2+、Mg2+、CI、SO、HCO这 这6种离子组合项指标依序分别作为贝叶斯模型 6项指标.通过SPSS软件对各总体的样本进行分 的判别因子1~6.根据各自样本数量确定先验概 布参数估算(如表4所示),MCMC抽样指定项如 率P1=17/40、P2=4/40、P3=15/40、P4=4/40,利用 表5所示 40个学习样本进行训练,利用MCMC似然函数估 表6所示的组统计量表格给出了不同水源水 算法得出后验分布进行检验,检验结果见表1 样的不同判别因子的均值、标准差等统计量 从表1中可以看出,贝叶斯判别结果和原有水源 表7所示的结构矩阵,得出根据矿山突水水源
这与似然函数选取正态分布相符. 把水源样本Ⅰ类、Ⅱ类、Ⅲ类和Ⅳ类作为四个 总体 G1~G4,K ++Na+、Ca2+、Mg2+、Cl−、SO4 2−、HCO3 − 这 6 种离子组合项指标依序分别作为贝叶斯模型 的判别因子 λ1~λ6 . 根据各自样本数量确定先验概 率 P1 =17/40、 P2 =4/40、 P3 =15/40、 P4 =4/40,利用 40 个学习样本进行训练,利用 MCMC 似然函数估 算法得出后验分布进行检验 ,检验结果见表 1. 从表 1 中可以看出,贝叶斯判别结果和原有水源 类别完全一致. 利用贝叶斯判别法筛选出影响矿山突水水源 分 类 的 K ++Na+、 Ca2+、 Mg2+、 Cl−、 SO4 2−、 HCO3 −这 6 项指标. 通过 SPSS 软件对各总体的样本进行分 布参数估算(如表 4 所示),MCMC 抽样指定项如 表 5 所示. 表 6 所示的组统计量表格给出了不同水源水 样的不同判别因子的均值、标准差等统计量. 表 7 所示的结构矩阵,得出根据矿山突水水源 表 3 汇聚组内矩阵 Table 3 Convergence intra-group matrix 贝叶斯判别 主要离子 协方差 相关性 HCO3 − Cl− SO4 2− K ++Na+ Ca2+ Mg2+ HCO3 − Cl− SO4 2− K ++Na+ Ca2+ Mg2+ HCO3 − 1814.827 12616.899 5054.195 −195.334 −3807.587 −1747.608 1.000 0.085 0.295 −0.077 −0.295 −0.136 Cl− 12230598.974 1177325.895 −77121.740 648781.708 985384.161 1.000 0.838 −0.372 0.612 0.935 SO4 2− 161555.942 −1547.831 28471.253 94643.546 1.000 −0.065 0.234 0.781 K ++Na+ 3520.493 −11349.173 −4738.708 1.000 −0.631 −0.265 Ca2+ 91887.254 60781.440 1.000 0.665 Mg2+ 90803.664 1.000 注:协方差矩阵的自由度为36. −2 −1 0 1 2 0 20 40 60 80 100 数量 x1 /(106m) −20 0 20 1.0 10.0 40.0 70.0 95.0 99.5 百分位数 1.0 10.0 40.0 70.0 95.0 99.5 百分位数 xj的常规残差 (a) (b) (c) (d) 0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 0 20 40 60 80 100 120 数量 θj /(104g·s−1) −50 0 50 θj的常规残差 图 4 先验信息和后验信息分布. (a)先验信息的直方图;(b)先验信息的常规残差;(c)后验信息的直方图; (d)后验信息的常规残差 Fig.4 Distribution of prior and posterior information: (a) histogram of prior information; (b) conventional residuals of prior information; (c) histogram of posterior information; (d) conventional residuals of posterior information · 1418 · 工程科学学报,第 41 卷,第 11 期
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 1419 表4估算的分布参数(正态分布) 表6组统计 Table 4 Estimated distribution parameter Table 6 Group statistics 判别离子种类 特定位置质量浓度mgL-) 特定标度 贝叶斯判别指标 有效个案数(成列) 平均值 标准差 HCO 254.0525 47.52158 类别因子 未加权 加权 cr 25785.2950 11531.13636 HCO 239.4882 45.51605 17 17.000 s02 3187.6700 1298.60022 Cr 21849.5059 3281.77955 17.000 K'+Na 222.9925 70.41759 S02 2840.5529 349.32311 > 17.000 I Ca 930.3350 523.64955 K+Na232.9882 61.52192 17 17.000 Mg" 1725.9400 840.87415 Ca2 6802529 225.75292 1) 17.000 Mgz 1387.0647 223.60322 17 17.000 表5抽样指定项 HCO 277.5500 7.87507 4.000 Table 5 Sampling specified item cr 26503.65002808.20950 4.000 抽样方法样本数 置信区间水平% 置信区间类型 S0,2- 3200.0250 167.95121 4.000 MCMC 1000 95.0 百分位数 K'+Na" 203.1250 46.15982 4 4.000 Ca 953.1750 299.38190 4 4.000 判别影响的K+Na、Ca2+、Mg2+、CI、SO?,HCO3 Mg2 1697.1750160.18371 4.000 这6个变量的三个判别函数.使用这三个判别函 HCO 276.9733 42.22783 15 15.000 数得出表8所示的特增值,在此基础上建立贝叶 cr 36891.7333 4177.20599 15 15.000 斯线性判别函数(函数系数由SPSS生成),并按似 S042 4382.9933 514.12583 15 15.000 然判别函数值进行归类,进而判别矿山突水水源 K*+Na247.9533 55.24753 15 15.000 种类 Ca 1424.8400 398.28648 15 15.000 Wilks'lambda值为是组内平方和与总平方和 Mg2 2572.0400 413.27733 15 15.000 之比(把水源样本I类、Ⅱ类、Ⅲ类和Ⅳ类作为四 HCO 206.5000 48.42761 4.000 个组),因此由表9可以看出,函数1,2,3检验 Cr 144.9000 108.79789 4.000 Wilks'lambda值最小,表示组内差异相较于总差 S0,2 168.1000 161.66808 4 4.000 异较小,所有观测的组组间有一定差异,而3的 K*+Na106.7750 75.39754 4.000 Wilks'lambda值较大,则各个组的均值相近.在 Ca" 115.9500 30.40181 4 4.000 贝叶斯判别分析中,组间均值不等时判别分析才 Mg 22.0500 16.39970 4.000 有意义 HCO; 254.0525 47.52158 40 40.000 经过SPSS软件进行的水源水样判别函数,得 Cr 25785.2950 11531.13636 40 40.000 出如表10所示的水样六个判别因子的各类分类 S0,2 3187.6700 1298.60022 40 40.000 函数系数,经过MCMC抽样得出的偏差及标准 总计 K'+Na' 222.9925 70.41759 0 40.000 差,以及在95%置信区间的上下限值 Ca* 930.3350 523.64955 40 40.000 经过SPSS计算得出,基于MCMC的贝叶斯 Mg 1725.9400 840.87415 40 40.000 判别函数建模样本的判别结果如表1所示,对三 山岛金矿水样水源进行识别,判别结果正确率为 人为因素的影响,而且矿井水水源类型不仅与水 100%.通过对变量的筛选得出判别能力强及较高 样的化学成分有关,而且需要考虑水中离子与岩 关联度的变量引入判别函数中,通过SPSS计算得 石的反应及生成物,值得进一步研究 出不同变量之间的相关系数,通过判别方程得出 4结论 变量的可信度.经过SPSS统计的贝叶斯逐步线性 判别函数从判别过程可以明显看出,贝叶斯函数 三山岛金矿作为海下采矿的金属矿山,其矿 对矿山突水水源的识别具有简便、精确度高的特 井突水水源识别和预测对于矿山生产的安全高效 点,在工程实践中的应用具有较为广泛的前景 有重要意义,为了有效预防和识别矿井水害的水 由于建立贝叶斯判别模型时,其先验信息受 源,借鉴判别分析理论建立贝叶斯判别模型
判别影响的 K ++Na+、Ca2+、Mg2+、Cl−、SO4 2−、HCO3 − 这 6 个变量的三个判别函数. 使用这三个判别函 数得出表 8 所示的特增值,在此基础上建立贝叶 斯线性判别函数 (函数系数由 SPSS 生成),并按似 然判别函数值进行归类,进而判别矿山突水水源 种类. Wilks’ lambda 值为是组内平方和与总平方和 之比(把水源样本Ⅰ类、Ⅱ类、Ⅲ类和Ⅳ类作为四 个 组 ) , 因 此 由 表 9 可 以 看 出 , 函 数 1,2,3 检 验 Wilks’ lambda 值最小,表示组内差异相较于总差 异较小,所有观测的组组间有一定差异,而 3 的 Wilks’ lambda 值较大,则各个组的均值相近. 在 贝叶斯判别分析中,组间均值不等时判别分析才 有意义. 经过 SPSS 软件进行的水源水样判别函数,得 出如表 10 所示的水样六个判别因子的各类分类 函数系数,经过 MCMC 抽样得出的偏差及标准 差,以及在 95% 置信区间的上下限值. 经过 SPSS 计算得出,基于 MCMC 的贝叶斯 判别函数建模样本的判别结果如表 1 所示,对三 山岛金矿水样水源进行识别,判别结果正确率为 100%. 通过对变量的筛选得出判别能力强及较高 关联度的变量引入判别函数中,通过 SPSS 计算得 出不同变量之间的相关系数,通过判别方程得出 变量的可信度. 经过 SPSS 统计的贝叶斯逐步线性 判别函数从判别过程可以明显看出,贝叶斯函数 对矿山突水水源的识别具有简便、精确度高的特 点,在工程实践中的应用具有较为广泛的前景. 由于建立贝叶斯判别模型时,其先验信息受 人为因素的影响,而且矿井水水源类型不仅与水 样的化学成分有关,而且需要考虑水中离子与岩 石的反应及生成物,值得进一步研究. 4 结论 三山岛金矿作为海下采矿的金属矿山,其矿 井突水水源识别和预测对于矿山生产的安全高效 有重要意义,为了有效预防和识别矿井水害的水 源,借鉴判别分析理论建立贝叶斯判别模型. 表 4 估算的分布参数 (正态分布) Table 4 Estimated distribution parameter 判别离子种类 特定位置质量浓度/(mg·L−1) 特定标度 HCO3 − 254.0525 47.52158 Cl− 25785.2950 11531.13636 SO4 2− 3187.6700 1298.60022 K ++Na+ 222.9925 70.41759 Ca2+ 930.3350 523.64955 Mg2+ 1725.9400 840.87415 表 5 抽样指定项 Table 5 Sampling specified item 抽样方法 样本数 置信区间水平/% 置信区间类型 MCMC 1000 95.0 百分位数 表 6 组统计 Table 6 Group statistics 贝叶斯判别指标 平均值 标准差 有效个案数(成列) 类别 因子 未加权 加权 Ⅰ HCO3 − 239.4882 45.51605 17 17.000 Cl− 21849.5059 3281.77955 17 17.000 SO4 2− 2840.5529 349.32311 17 17.000 K ++Na+ 232.9882 61.52192 17 17.000 Ca2+ 680.2529 225.75292 17 17.000 Mg2+ 1387.0647 223.60322 17 17.000 Ⅱ HCO3 − 277.5500 7.87507 4 4.000 Cl− 26503.6500 2808.20950 4 4.000 SO4 2− 3200.0250 167.95121 4 4.000 K ++Na+ 203.1250 46.15982 4 4.000 Ca2+ 953.1750 299.38190 4 4.000 Mg2+ 1697.1750 160.18371 4 4.000 Ⅲ HCO3 − 276.9733 42.22783 15 15.000 Cl− 36891.7333 4177.20599 15 15.000 SO4 2− 4382.9933 514.12583 15 15.000 K ++Na+ 247.9533 55.24753 15 15.000 Ca2+ 1424.8400 398.28648 15 15.000 Mg2+ 2572.0400 413.27733 15 15.000 Ⅳ HCO3 − 206.5000 48.42761 4 4.000 Cl− 144.9000 108.79789 4 4.000 SO4 2− 168.1000 161.66808 4 4.000 K ++Na+ 106.7750 75.39754 4 4.000 Ca2+ 115.9500 30.40181 4 4.000 Mg2+ 22.0500 16.39970 4 4.000 总计 HCO3 − 254.0525 47.52158 40 40.000 Cl− 25785.2950 11531.13636 40 40.000 SO4 2− 3187.6700 1298.60022 40 40.000 K ++Na+ 222.9925 70.41759 40 40.000 Ca2+ 930.3350 523.64955 40 40.000 Mg2+ 1725.9400 840.87415 40 40.000 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1419 ·
1420 工程科学学报,第41卷,第11期 表7结构矩阵 表10分类函数系数 Table 7 Structured matrix Table 10 Coefficient of classification function 贝叶斯线性判别函数 贝叶斯判别指标 MCMC抽样 变量 2 系数 95%置信区间 因子 类别 偏差 标准误差 cr 0.708 0.451 -0.005 下限 上限 S02 0.698 0.241 -0.215 I 0.141 0.115 0.235 -0.108 0.819 Mg" 0.579 0.580 -0.300 I 0.174 0.129- 0.255 -0.0830.924 HCO Ca* 0304 0.502 -0.002 m 0.167 0.140 0.303 -0.186 1.022 HCO; 0.116 0.162 0.607 W 0.259 0.142 0.202 0.194 0.95T K'+Na" 0.146 -0.228 -0.457 0.006 0.003 0.006 0.000 0.024 0.007 0.004 0.007 0.000 0.028 Cr Ⅲ 表8特征值 0.008 0.004 0.008 0.000 0.032 N -0.002 0.000 0.0049 -0.012° 0.006 Table 8 Eigenvalue 0.007 -0.002 0.045 -0.081 0.096 判别函数特征值方差百分数/%累计方差百分数%典型相关性 l 0.003 -0.004 0.050 -0.091° 0.101 1 21.018 94.5 94.5 0.977 SO m 0.007 -0.003 0.062 -0.117 0.128 2 1.139 5.1 99.6 0.730 W -0.015 -0.010 0.022 -0.083 0.002 3 0.091° 0.4 100.0 0.289 0.2740.171 0.243 0.145 1.105 注:a表示在分析中使用了贝叶斯抽样中涉及的前3个典则判别 函数 0.292 0.186 0.266 0.14户 1.200 K*+Na' Ⅲ 0.3500.217 0.308 0.195 1.400 表9 Wilks'lambda值统计 e 0.1140.0880.1660.035 0.696 Table 9 Wilks'lambda statistics 0.052 0.030 0.061 -0.007 0.239 检验函数 Wilks'Lambda值 卡方自由度显著性 ? 0.055 0.033 0.068 -0.007 0.258 Ca -0.027 1,2,3 0.019 133.938 0.065 0.035 0.081 0.314 18 0 0.020° 0.041e 0.005 2,3 0.428 28.815 10 0.001 N 0.023 0.151e 0.917 2.961 0.564 -0.073 -0.0340.085 -0.321 0.012 Ⅱ -0.075 -0.036 0.094 -0.377 0.025 Mg -0.088 -0.422 0.048 代表性强的判别离子的选取及贝叶斯方法的 么 -0.038 0.119 W 0.032 0.009 0.049 -0.040° 使用,对于提高判别模型对矿井水水源的判别准 0.161 -90.763-5250059.017 -302.110-76.470 确度有重要的影响.结合监测点水样的水文地质 ∥ -110.825-64.88271.692-376.573-92.475 条件与不同监测点的水样的水化学成分分析,选 总计 -164.246-94.746102.085-534.464-141.437 取判别含水层水源的Kt+Na、Ca2+、Mg2、CI、 -34.523-21.56237.264°-163.988°-23.464 SO,2、HCO3这6项指标,通过基于MCMC的贝 注:除非另行说明,否则自助抽样结果基于1000个自助抽样样本: 叶斯方法,获得矿井水水源参数的先验分布和后 b表示基于985个样本:c表示基于993个样本. 验分布,结合SPSS统计建立基于MCMC的贝叶 参考文献 斯判别模型,获得水源判别指标的置信区间及其 [1]Li K P,Ma Fe S,Zhang H X,et al.Recharge source identification 上限、下限值.通过对判别因子的各类分类函数 and evolution of inflowing water in a seabed gold mine.J Eng 系数、经过MCMC抽样得出的偏差及标准差、以 Geol,2017,25(1:180 及在95%置信区间的上下限值的分析验证了该方 (李克蓬,马凤山,张洪训,等.海底金矿矿坑涌水水源判识及演 法对于矿井水水源的判别结果的准确性和合理 化研究.工程地质学报,2017,25(1):180) 性,为水源类型判别提供了新途径 [2]Li C H,Bu L,Wei X M,et al.Current status and future trends of 因此,研究结果可以表明,采用基于MCMC的 deep mining safety mechanism and disaster prevention and control. Chin J Eng,2017,39(8):1129 贝叶斯方法对矿山突水水样进行水源判别,其模 (李长洪,卜磊,魏晓明,等.深部开采安全机理及灾害防控现状 拟结果准确率高,贝叶斯判别模型具有较好的适 与态势分析.工程科学学报,2017,39(8):1129) 用性和判别能力. [3]Chai J F,Jin A B,Gao Y T,et al.Water inrush inoculation process
代表性强的判别离子的选取及贝叶斯方法的 使用,对于提高判别模型对矿井水水源的判别准 确度有重要的影响. 结合监测点水样的水文地质 条件与不同监测点的水样的水化学成分分析,选 取判别含水层水源 的 K ++Na+、 Ca2+、 Mg2+、 Cl−、 SO4 2−、HCO3 −这 6 项指标,通过基于 MCMC 的贝 叶斯方法,获得矿井水水源参数的先验分布和后 验分布,结合 SPSS 统计建立基于 MCMC 的贝叶 斯判别模型,获得水源判别指标的置信区间及其 上限、下限值. 通过对判别因子的各类分类函数 系数、经过 MCMC 抽样得出的偏差及标准差、以 及在 95% 置信区间的上下限值的分析验证了该方 法对于矿井水水源的判别结果的准确性和合理 性,为水源类型判别提供了新途径. 因此,研究结果可以表明,采用基于 MCMC 的 贝叶斯方法对矿山突水水样进行水源判别,其模 拟结果准确率高,贝叶斯判别模型具有较好的适 用性和判别能力. 参 考 文 献 Li K P, Ma Fe S, Zhang H X, et al. Recharge source identification and evolution of inflowing water in a seabed gold mine. J Eng Geol, 2017, 25(1): 180 (李克蓬, 马凤山, 张洪训, 等. 海底金矿矿坑涌水水源判识及演 化研究. 工程地质学报, 2017, 25(1):180 ) [1] Li C H, Bu L, Wei X M, et al. Current status and future trends of deep mining safety mechanism and disaster prevention and control. Chin J Eng, 2017, 39(8): 1129 (李长洪, 卜磊, 魏晓明, 等. 深部开采安全机理及灾害防控现状 与态势分析. 工程科学学报, 2017, 39(8):1129 ) [2] [3] Chai J F, Jin A B, Gao Y T, et al. Water inrush inoculation process 表 7 结构矩阵 Table 7 Structured matrix 变量 贝叶斯线性判别函数 1 2 3 Cl− 0.708 0.451 −0.005 SO4 2− 0.698 0.241 −0.215 Mg2+ 0.579 0.580 −0.300 Ca2+ 0.304 0.502 −0.002 HCO3 − 0.116 0.162 0.607 K ++Na+ 0.146 −0.228 −0.457 表 8 特征值 Table 8 Eigenvalue 判别函数 特征值 方差百分数/% 累计方差百分数/% 典型相关性 1 21.018a 94.5 94.5 0.977 2 1.139a 5.1 99.6 0.730 3 0.091a 0.4 100.0 0.289 注:a表示在分析中使用了贝叶斯抽样中涉及的前3个典则判别 函数. 表 9 Wilks’ lambda 值统计 Table 9 Wilks’ lambda statistics 检验函数 Wilks’ Lambda值 卡方 自由度 显著性 1, 2, 3 0.019 133.938 18 0 2, 3 0.428 28.815 10 0.001 3 0.917 2.961 4 0.564 表 10 分类函数系数 Table 10 Coefficient of classification function 贝叶斯判别指标 系数 MCMC抽样a 因子 类别 偏差 标准误差 95%置信区间 下限 上限 HCO3 − Ⅰ 0.141 0.115 0.235 −0.108 0.819 Ⅱ 0.174 0.129b 0.255b −0.083b 0.924b Ⅲ 0.167 0.140 0.303 −0.186 1.022 Ⅳ 0.259 0.142c 0.202c 0.194c 0.957c Cl− Ⅰ 0.006 0.003 0.006 0.000 0.024 Ⅱ 0.007 0.004b 0.007b 0.000b 0.028b Ⅲ 0.008 0.004 0.008 0.000 0.032 Ⅳ −0.002 0.000c 0.004c −0.012c 0.006c SO4 2− Ⅰ 0.007 −0.002 0.045 −0.081 0.096 Ⅱ 0.003 −0.004b 0.050b −0.091b 0.101b Ⅲ 0.007 −0.003 0.062 −0.117 0.128 Ⅳ −0.015 −0.010c 0.022c −0.083c 0.002c K ++Na+ Ⅰ 0.274 0.171 0.243 0.145 1.105 Ⅱ 0.292 0.186b 0.266b 0.147b 1.200b Ⅲ 0.350 0.217 0.308 0.195 1.400 Ⅳ 0.114 0.088c 0.166c 0.035c 0.696c Ca2+ Ⅰ 0.052 0.030 0.061 −0.007 0.239 Ⅱ 0.055 0.033b 0.068b −0.007b 0.258b Ⅲ 0.065 0.035 0.081 −0.027 0.314 Ⅳ 0.023 0.020c 0.041c 0.005c 0.151c Mg2+ Ⅰ −0.073 −0.034 0.085 −0.321 0.012 Ⅱ −0.075 −0.036b 0.094b −0.377b 0.025b Ⅲ −0.088 −0.038 0.119 −0.422 0.048 Ⅳ 0.032 0.009c 0.049c −0.040c 0.161c 总计 Ⅰ −90.763 −52.500 59.017 −302.110 −76.470 Ⅱ −110.825 −64.882b 71.692b −376.573b −92.475b Ⅲ −164.246 −94.746 102.085 −534.464 −141.437 Ⅳ −34.523 −21.562c 37.264c −163.988c −23.464c 注:除非另行说明,否则自助抽样结果基于1000个自助抽样样本; b表示基于985个样本;c表示基于993个样本. · 1420 · 工程科学学报,第 41 卷,第 11 期
颜丙乾等:基于PCA和MCMC的贝叶斯方法的海下矿山水害源识别分析 1421 in mines based on moment tensor inversion.Chin J Eng,2015 for disaster management.Int J Inf Technol Decis Mak,2018 37(3):267 17(5):1469 (柴金飞,金爱兵,高永涛,等.基于矩张量反演的矿山突水孕育 [18]Zhao P,Xiong L.Inverse problem for the identification of the 过程.工程科学学报,2015,37(3):267) source term in chlorine pipeline leak.Sci Technol Rev,2013, [4]Li L P,Lei T,Li S C,et al.Risk assessment of water inrush in 31(26):48 karst tunnels and software development.Arabian J Geosci,2015, (赵培,熊亮.氯气管道泄漏源项识别反演问题.科技导报,2013, 8(4):1843 31(26):48) [5] Xu X.Tian K Y,Zheng JY.Discrimination of mine water inrush [19]Chen H Y,Teng Y G,Wang J S,et al.Event source identification source based on genetic BP neural network model.Ind Saf Environ of water pollution based on Bayesian-MCMC.J Hunan Univ Nat Prot,2017,43(11):21 Sc1,2012,39(6):74 (徐星,田坤云,郑吉玉.基于遗传BP神经网络模型的矿井突水 (陈海洋,膝彦国,王金生,等.基于Bayesian-MCMC方法的水体 水源判别.工业安全与环保,2017,43(11):21) 污染识别反问题.湖南大学学报(自然科学版),2012,39(6):74) [6]Chen H J,Li X B,Liu A H.Studies of water source determination [20]Yan X S,Sun J,Hu C Y.Research on contaminant sources method of mine water inrush based on Bayes'multi-group step- identification of uncertainty water demand using genetic wise discriminant analysis theory.Rock Soil Mech,2009.30(12): algorithm.Cluster Computing,2017,20(2):1007 3655 [21]Kruschke J K,Liddell T M.The Bayesian New Statistics: (陈红江,李夕兵,刘爱华.矿井突水水源判别的多组逐步 Hypothesis testing,estimation,meta-analysis,and power analysis Bayes判别方法研究.岩土力学,2009,30(12):3655) from a Bayesian perspective.Psychonomic Bull Rev,2018,25(1): [7]Chen HJ.Li X B.Liu A H.et al.Forecast method of water inrush 178 quantity from coal floor based on distance discriminant analysis [22]Lu F,Yan D H.Bayesian MCMC flood frequency analysis method theory.J China Coal Soc,2009,34(4):487 based on generalized extreme value distribution and Metropolis. (陈红江,李夕兵,刘爱华,等.煤层底板突水量的距离判别分析 Hastings sampling algorithm./Hydrau/Eng,2013,44(8):942 预测方法.煤炭学报,2009,34(4):487) (鲁帆,严登华.基于广义极值分布和Metropolis-Hastings抽样算 [8]Liu Z X,Dang W G,He X Q.Undersea safety mining of the large 法的贝叶斯MCMC洪水频率分析方法.水利学报,2013,44(8): gold deposit in Xinli District of Sanshandao Gold Mine.IntJ 942) Miner Metall Mater,2012,19(7):574 [9]Li X,Wang B,Liu Y,et al.Stochastic feature mapping for pac- [23]Yang X T.Wang L B.Zhang Z W.The application of fisher bayes classification.Mach Learning,2015,101(1-3):5 approach to discrimination of mine water-inrush source.Sci Technol Inf,2014(11):97 [10]Yan H X,Moradkhani H.Toward more robust extreme flood (杨晓彤,王来斌,张忠文.Fisher方法在矿井突水水源判别中的 prediction by Bayesian hierarchical and multimodeling.Nat 应用.科技信息.2014(11):97) Hazards,2016,81(1):203 [11]Zhou F,Bai X R.High-resolution sparse subband imaging based [24]Liu A H,Liu Y P,Cheng L.Application of terary mixture model on Bayesian learning with hierarchical priors.IEEE Trans Geosc in discrimination of underground mine water in rush.Central S Remote Sensing,2018,56(8):4568 Univ Sci Technol,2014,45(8):2768 [12]Ruijters E,Stoelinga M.Fault tree analysis:A survey of the state- (刘爱华,刘银朋,程力.三元混合模型在地下矿山涌水水源计 算分析中的应用.中南大学学报(自然科学版),2014,45(8): of-the-art in modeling,analysis and tools.Comput Sci Rev, 2015(15-16):29 2768) [13]Fisher R A.Inverse probability and the use of likelihood. [25]Yang BB,Sui W H,Duan L H.Risk assessment of water inrush in Mathematical Proceed Cambridge Philosophical Soc,1932. an underground coal mine based on GIS and fuzzy set theory. 28(3:257 Mine Water Emviron,2017,36(4):617 [14]Duan G L,Hu W X,Wang J R.Research on the natural image [26]Li G Q,Ma F S,Meng Z P.Analysis of connectivity between super-resolution reconstruction algorithm based on compressive undersea metal mine and overlying seawater in Xinli mine area.J perception theory and deep learning model.Neurocomputing. Central S Uniy Sci Technol,2012,43(10):3938 2016,208:117 (李国庆,马凤山,孟召平,新立矿区海底金属矿坑与上覆海水 [15]Unesi M,Noaparast M,Shafaei S Z,et al.Modeling the effects of 的连通性分析.中南大学学报(自然科学版),2012,43(10):3938) ore properties on water recovery in the thickening process.n [27]Li G Q,Wang X Q,Yin G M.Application of principal component Miner Metall Mater,2014,21(9):851 analysis in identifying the seepage of seawater into Xinli mine pit. [16]Huang Y X,Li G F,Bie Z H,et al.Reliability evaluation of Chin J Geol Hazard Control,2014,25(3):83 distributed integrated energy system.Smart Power,2017,45(7):43 (李国庆,汪新庆,尹改梅.主成分分析法在判定新立矿井海水 (黄玉雄,李更丰,别朝红,等.分布式综合能源系统可靠性评估 海入中的应用.中国地质灾害与防治学报,2014,25(3):83) 智慧电力,2017,45(7):43) [28]Sun W J,Zhou W F,Jiao J.Hydrogeological classification and [17]Caroleo B,Palumbo E,Osella M,et al.A knowledge-based multi- water inrush accidents in China's coal mines.Mine Water Environ, criteria decision support system encompassing cascading effects 2016.35(2):214
in mines based on moment tensor inversion. Chin J Eng, 2015, 37(3): 267 (柴金飞, 金爱兵, 高永涛, 等. 基于矩张量反演的矿山突水孕育 过程. 工程科学学报, 2015, 37(3):267 ) Li L P, Lei T, Li S C, et al. Risk assessment of water inrush in karst tunnels and software development. Arabian J Geosci, 2015, 8(4): 1843 [4] Xu X, Tian K Y, Zheng J Y. Discrimination of mine water inrush source based on genetic BP neural network model. Ind Saf Environ Prot, 2017, 43(11): 21 (徐星, 田坤云, 郑吉玉. 基于遗传BP神经网络模型的矿井突水 水源判别. 工业安全与环保, 2017, 43(11):21 ) [5] Chen H J, Li X B, Liu A H. Studies of water source determination method of mine water inrush based on Bayes ’ multi-group stepwise discriminant analysis theory. Rock Soil Mech, 2009, 30(12): 3655 (陈红江, 李夕兵, 刘爱华. 矿井突水水源判别的多组逐步 Bayes判别方法研究. 岩土力学, 2009, 30(12):3655 ) [6] Chen H J, Li X B, Liu A H, et al. Forecast method of water inrush quantity from coal floor based on distance discriminant analysis theory. J China Coal Soc, 2009, 34(4): 487 (陈红江, 李夕兵, 刘爱华, 等. 煤层底板突水量的距离判别分析 预测方法. 煤炭学报, 2009, 34(4):487 ) [7] Liu Z X, Dang W G, He X Q. Undersea safety mining of the large gold deposit in Xinli District of Sanshandao Gold Mine. Int J Miner Metall Mater, 2012, 19(7): 574 [8] Li X, Wang B, Liu Y, et al. Stochastic feature mapping for pacbayes classification. Mach Learning, 2015, 101(1-3): 5 [9] Yan H X, Moradkhani H. Toward more robust extreme flood prediction by Bayesian hierarchical and multimodeling. Nat Hazards, 2016, 81(1): 203 [10] Zhou F, Bai X R. High-resolution sparse subband imaging based on Bayesian learning with hierarchical priors. IEEE Trans Geosci Remote Sensing, 2018, 56(8): 4568 [11] Ruijters E, Stoelinga M. Fault tree analysis: A survey of the stateof-the-art in modeling, analysis and tools. Comput Sci Rev, 2015(15-16): 29 [12] Fisher R A. Inverse probability and the use of likelihood. Mathematical Proceed Cambridge Philosophical Soc, 1932, 28(3): 257 [13] Duan G L, Hu W X, Wang J R. Research on the natural image super-resolution reconstruction algorithm based on compressive perception theory and deep learning model. Neurocomputing, 2016, 208: 117 [14] Unesi M, Noaparast M, Shafaei S Z, et al. Modeling the effects of ore properties on water recovery in the thickening process. Int J Miner Metall Mater, 2014, 21(9): 851 [15] Huang Y X, Li G F, Bie Z H, et al. Reliability evaluation of distributed integrated energy system. Smart Power, 2017, 45(7): 43 (黄玉雄, 李更丰, 别朝红, 等. 分布式综合能源系统可靠性评估. 智慧电力, 2017, 45(7):43 ) [16] Caroleo B, Palumbo E, Osella M, et al. A knowledge-based multicriteria decision support system encompassing cascading effects [17] for disaster management. Int J Inf Technol Decis Mak, 2018, 17(5): 1469 Zhao P, Xiong L. Inverse problem for the identification of the source term in chlorine pipeline leak. Sci Technol Rev, 2013, 31(26): 48 (赵培, 熊亮. 氯气管道泄漏源项识别反演问题. 科技导报, 2013, 31(26):48 ) [18] Chen H Y, Teng Y G, Wang J S, et al. Event source identification of water pollution based on Bayesian-MCMC. J Hunan Univ Nat Sci, 2012, 39(6): 74 (陈海洋, 滕彦国, 王金生, 等. 基于Bayesian-MCMC方法的水体 污染识别反问题. 湖南大学学报(自然科学版), 2012, 39(6):74 ) [19] Yan X S, Sun J, Hu C Y. Research on contaminant sources identification of uncertainty water demand using genetic algorithm. Cluster Computing, 2017, 20(2): 1007 [20] Kruschke J K, Liddell T M. The Bayesian New Statistics: Hypothesis testing, estimation, meta-analysis, and power analysis from a Bayesian perspective. Psychonomic Bull Rev, 2018, 25(1): 178 [21] Lu F, Yan D H. Bayesian MCMC flood frequency analysis method based on generalized extreme value distribution and MetropolisHastings sampling algorithm. J Hydraul Eng, 2013, 44(8): 942 (鲁帆, 严登华. 基于广义极值分布和Metropolis-Hastings抽样算 法的贝叶斯MCMC洪水频率分析方法. 水利学报, 2013, 44(8): 942 ) [22] Yang X T, Wang L B, Zhang Z W. The application of fisher approach to discrimination of mine water-inrush source. Sci Technol Inf, 2014(11): 97 (杨晓彤, 王来斌, 张忠文. Fisher方法在矿井突水水源判别中的 应用. 科技信息, 2014(11):97 ) [23] Liu A H, Liu Y P, Cheng L. Application of ternary mixture model in discrimination of underground mine water in rush. J Central S Univ Sci Technol, 2014, 45(8): 2768 (刘爱华, 刘银朋, 程力. 三元混合模型在地下矿山涌水水源计 算分析中的应用. 中南大学学报(自然科学版), 2014, 45(8): 2768 ) [24] Yang B B, Sui W H, Duan L H. Risk assessment of water inrush in an underground coal mine based on GIS and fuzzy set theory. Mine Water Environ, 2017, 36(4): 617 [25] Li G Q, Ma F S, Meng Z P. Analysis of connectivity between undersea metal mine and overlying seawater in Xinli mine area. J Central S Univ Sci Technol, 2012, 43(10): 3938 (李国庆, 马凤山, 孟召平. 新立矿区海底金属矿坑与上覆海水 的连通性分析. 中南大学学报(自然科学版), 2012, 43(10):3938 ) [26] Li G Q, Wang X Q, Yin G M. Application of principal component analysis in identifying the seepage of seawater into Xinli mine pit. Chin J Geol Hazard Control, 2014, 25(3): 83 (李国庆, 汪新庆, 尹改梅. 主成分分析法在判定新立矿井海水 渗入中的应用. 中国地质灾害与防治学报, 2014, 25(3):83 ) [27] Sun W J, Zhou W F, Jiao J. Hydrogeological classification and water inrush accidents in China’s coal mines. Mine Water Environ, 2016, 35(2): 214 [28] 颜丙乾等: 基于 PCA 和 MCMC 的贝叶斯方法的海下矿山水害源识别分析 · 1421 ·