D0I:10.13374/1.issnl00103.2009.04.002 第31卷第4期 北京科技大学学报 Vol.31 No.4 2009年4月 Journal of University of Science and Technology Beijing Apr.2009 区域化变量非正态分布的稳健性 陈道贵胡乃联李国清 北京科技大学金属矿山高效开采与安全教育部重点实验室,北京100083 摘要从区域化变量分布的稳健性角度,借鉴产品加工质量精度控制的理论,基于Johnson分布曲线族提出了一套非正态 数据转换方法,并设计了转换流程.以SPSS和Surpac矿旷业软件为工具,通过实际案例分析了传统数据转换方法和Johnson转 换方法的应用效果.实践证明,采用上述方法转化后的数据开展统计分析、变异函数模型的拟合及验证、克立格估计等工作, 更容易满足稳健性要求,并能从本质上减小估计误差,提高估计精度 关键词克立格估计;非正态分布:稳健性分析:Johnson转换 分类号P628+.2 Stationarity for the non-normal distribution of regionalized variables CHEN Dao-gui.HU Nai-lian.LI Guo-qing Key Laboratory of the Ministry of Education of China for Efficient Mining and Safety of Metal Mines.University of Science and Technology Beijing. Beijing 100083.China ABSTRACI Based on Johnson distribution curves and the theory of product process quality accuracy control,a method to transform non"normal distribution data was proposed from the view of regionalized variable distribution,and the transformation flow was also designed.With SPSS and Surpac mining software as tools,the applied efficiency of traditional data and Johnson transform methods was analyzed through several cases.It is proved that by using the transformed data of the proposed method,the statistical analysis, fitting and validation of the variation function model,and Kriging estimation could meet the need of stationary,the estimation error can be minimized,and the precision of prediction can be improved. KEY WORDS Kriging estimation:non-normal distribution:stationarity analysis:Johnson transform 地质统计学作为数学地质领域中一门发展迅速 值、变异函数、块体大小和估值搜索参数选择等很多 且有着广泛应用前景的学科,在异常评价、环境研 因素,在此仅从区域化变量分布的稳健性着手②]. 究、找矿勘探、矿体圈定、储量计算、采矿设计、矿山 目前,克立格法因其分布的稳健性问题而衍生 生产及地学科研等方面体现了明显的优越性,通常 了对数正态克立格法、指示克立格法等多种估计方 情况下根据数据的不同分布类型,采用不同的克立 法).在实践中,不管采用何种方法,分布假设一 格方法,其基本前提都是区域化变量需满足平稳(或 般很难得到满足,因此,如何解决区域化变量的分 内蕴)假设,而实质含义是:当实际区域化变量的空 布问题,以减小估计误差、提高估计精度和克立格估 间分布偏离某一假设分布很大时,用某估计方法仍 计的稳健性,是本文研究的问题, 能得到较为满意的效果,即要求在无偏条件约束下 由于正态分布是应用最为广泛的一种随机分 使估计方差为最小. 布,因此许多学者和工程师纷纷提出将非正态数据 影响克立格估计方差(克里格法估计误差的方 转变成正态数据,本文在对几种常见的数据转换方 差)的因素除了区域化变量的偏差分布外,还有特异 法进行简要分析的基础上,借鉴产品加工质量精度 收稿日期:2008-06-19 基金项目:国家自然科学基金资助项目(N。,50604003) 作者简介:陈道贵(1979一),男,博士研究生;胡乃联(1955一),男,教授,博士生导师,E-mail:hnl@ces-ustb.edu-en
区域化变量非正态分布的稳健性 陈道贵 胡乃联 李国清 北京科技大学金属矿山高效开采与安全教育部重点实验室北京100083 摘 要 从区域化变量分布的稳健性角度借鉴产品加工质量精度控制的理论基于 Johnson 分布曲线族提出了一套非正态 数据转换方法并设计了转换流程.以 SPSS 和 Surpac 矿业软件为工具通过实际案例分析了传统数据转换方法和 Johnson 转 换方法的应用效果.实践证明采用上述方法转化后的数据开展统计分析、变异函数模型的拟合及验证、克立格估计等工作 更容易满足稳健性要求并能从本质上减小估计误差提高估计精度. 关键词 克立格估计;非正态分布;稳健性分析;Johnson 转换 分类号 P628+∙2 Stationarity for the non-normal distribution of regionalized variables CHEN Dao-guiHU Na-i lianLI Guo-qing Key Laboratory of the Ministry of Education of China for Efficient Mining and Safety of Metal MinesUniversity of Science and Technology Beijing Beijing100083China ABSTRACT Based on Johnson distribution curves and the theory of product process quality accuracy controla method to transform non-normal distribution data was proposed from the view of regionalized variable distributionand the transformation flow was also designed.With SPSS and Surpac mining software as toolsthe applied efficiency of traditional data and Johnson transform methods was analyzed through several cases.It is proved that by using the transformed data of the proposed methodthe statistical analysis fitting and validation of the variation function modeland Kriging estimation could meet the need of stationarythe estimation error can be minimizedand the precision of prediction can be improved. KEY WORDS Kriging estimation;non-normal distribution;stationarity analysis;Johnson transform 收稿日期:2008-06-19 基金项目:国家自然科学基金资助项目(No.50604003) 作者简介:陈道贵(1979—)男博士研究生;胡乃联(1955—)男教授博士生导师E-mail:hnl@ces.ustb.edu.cn 地质统计学作为数学地质领域中一门发展迅速 且有着广泛应用前景的学科在异常评价、环境研 究、找矿勘探、矿体圈定、储量计算、采矿设计、矿山 生产及地学科研等方面体现了明显的优越性.通常 情况下根据数据的不同分布类型采用不同的克立 格方法其基本前提都是区域化变量需满足平稳(或 内蕴)假设而实质含义是:当实际区域化变量的空 间分布偏离某一假设分布很大时用某估计方法仍 能得到较为满意的效果即要求在无偏条件约束下 使估计方差为最小. 影响克立格估计方差(克里格法估计误差的方 差)的因素除了区域化变量的偏差分布外还有特异 值、变异函数、块体大小和估值搜索参数选择等很多 因素在此仅从区域化变量分布的稳健性着手[1—2]. 目前克立格法因其分布的稳健性问题而衍生 了对数正态克立格法、指示克立格法等多种估计方 法[3—4].在实践中不管采用何种方法分布假设一 般很难得到满足.因此如何解决区域化变量的分 布问题以减小估计误差、提高估计精度和克立格估 计的稳健性是本文研究的问题. 由于正态分布是应用最为广泛的一种随机分 布因此许多学者和工程师纷纷提出将非正态数据 转变成正态数据.本文在对几种常见的数据转换方 法进行简要分析的基础上借鉴产品加工质量精度 第31卷 第4期 2009年 4月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.31No.4 Apr.2009 DOI:10.13374/j.issn1001-053x.2009.04.002
第4期 陈道贵等:区域化变量非正态分布的稳健性 .413 控制的方法,引入了一套非正态数据转换方法,并以 x。ff SPSS和矿业软件为工具,通过实际案例研究验证了 2x,一f1一f2和2为对应于累加概率p和1- 该方法在矿业领域进行数据转换的有效性和实用 p的取样值,p取5%与20%之间的值.若为右偏, 性 采用y:=ln(c一x),大多数内生有色、稀有及贵金 1区域化变量转换方法 属矿床中的有用组分,以及岩石矿石中微量元素,均 非正态分布的原始数据转化为正态或近似正态 具有对数正态分布特征6]. 分布的变换,目前相对有效的主要有两类方法:一是 上述几种数据转换方式的实质是通过对数据分 直接数据转换方法,该方法通过各种数据转换函数 布的峰度和偏度进行调整,使其逼近正态性,因此 只有当数据分布接近正态时,才有可能顺利实现;当 将非正态数据转变为正态;二是曲线拟合转换方法, 数据分布特征不明显,或呈现其他随机分布特征时, 该方法主要利用Pearson曲线族和Johnson分布曲 线族对实际数据的频率分布进行拟合 数据转换效果不明显, 1.1数据转换法 1.2曲线拟合法 目前常用的主要方法是把原始数据的第i样品 这种估计方法主要是利用Pearson曲线族和 对应变量设为x:,转换后的对应值设为y, Johnson分布曲线族对非正态数据分布进行拟合. 两种曲线族都覆盖了一个范围很广的分布,其实质 (1)平方根转换y:=Nx:十c,主要用于具有泊 也是一类函数转换方法. 松分布的离散型分布; 应用Pearson曲线族拟合非正态分布主要出现 (2)倒数转换y:=1/xi,或进行组合变化,平方 在早期的研究中,大多根据Pearson分位表来计算 根后取倒数y:=1/x; 分位数,尽管计算上比较简单,但只提供了在有限的 (3)平方根后再取反正弦=arcsin(Jx:/10") 偏度和峰度范围内的百分位数估计值,而且难以获 (右偏)或反余弦y:=are cos(Jx/I0")(左偏): 得任何关于拟合良好性的信息[)] 因帮转换一其中为变量,均 Johnson提出了关于随机变量的三个分布曲线 族,都可以很容易地转化为标准正态分布,这些分 值,参数∈[-1.5,1.0]向: 布分别表示为SB、SL和Su三种转换类型,三种类型 (5)三参数对数正态转换y:=n(x; 的参数约束及变量取值范围如表1所示,Nicholas 利用约翰逊曲线对非正态数据进行拟合,不仅能描 2xa,一xan一tmm0为中位数,xn为大于0的 述Pearson系统各类曲线的通用范围,而且计算过 程比Pearson更简便可靠-],因此,本文直接采用 最小值,xm为比样品中最大值更大的值;或者,c= Johnson曲线族用于研究. 表1 Johnson三个分布曲线族 Table 1 Three Johnson distribution curve groups 类型 Johnson曲线 正态转换 参数约束 约束 x一E =什叫中-刻 x二e 7,>0,-∞0,-0<y,E<oo -00<Koo 注:arsinh=n +(2+1) = 针对一个具体的非正态数据应用场合,如何根 于{一z,一z,2,z{的分布概率p-e’p-:,p, 据样本选择合适的Johnson曲线类型是首要的问 p一={,并在实际样本数据中找出上述分布概率所 题,其步骤如下 对应分位数x-e,x-:,x:,x-e{,计算m=xe一 选择一个合适的z,通过标准正态表找出对应 x:,n=x-:一x-3:'p=x:一x-:,求出分位数比率
控制的方法引入了一套非正态数据转换方法并以 SPSS 和矿业软件为工具通过实际案例研究验证了 该方法在矿业领域进行数据转换的有效性和实用 性. 1 区域化变量转换方法 非正态分布的原始数据转化为正态或近似正态 分布的变换目前相对有效的主要有两类方法:一是 直接数据转换方法该方法通过各种数据转换函数 将非正态数据转变为正态;二是曲线拟合转换方法 该方法主要利用 Pearson 曲线族和 Johnson 分布曲 线族对实际数据的频率分布进行拟合. 1∙1 数据转换法 目前常用的主要方法是把原始数据的第 i 样品 对应变量设为 xi转换后的对应值设为 yi. (1) 平方根转换 yi= xi+c主要用于具有泊 松分布的离散型分布; (2) 倒数转换 yi=1/xi或进行组合变化平方 根后取倒数 yi=1/ xi; (3) 平方根后再取反正弦 yi=arcsin( x/i 10n ) (右偏)或反余弦 yi=arc cos( xi/10n )(左偏); (4) 幂转换 yi= x λ i—1 λx λ—1其中 x 为变量 xi 均 值参数 λ∈[—1∙51∙0] [5]; (5) 三参数对数正态转换 yi=ln( xi—c) c= x 2 m0— xmin xmax 2xm0— xmin— xmax m0 为中位数xmin为大于0的 最小值xmax为比样品中最大值更大的值;或者c= x 2 m0— f1f2 2xm0— f1— f2 f1 和 f2 为对应于累加概率 p 和1— p 的取样值p 取5%与20%之间的值.若为右偏 采用 yi=ln( c— xi) 大多数内生有色、稀有及贵金 属矿床中的有用组分以及岩石矿石中微量元素均 具有对数正态分布特征[6]. 上述几种数据转换方式的实质是通过对数据分 布的峰度和偏度进行调整使其逼近正态性.因此 只有当数据分布接近正态时才有可能顺利实现;当 数据分布特征不明显或呈现其他随机分布特征时 数据转换效果不明显. 1∙2 曲线拟合法 这种估计方法主要是利用 Pearson 曲线族和 Johnson 分布曲线族对非正态数据分布进行拟合. 两种曲线族都覆盖了一个范围很广的分布其实质 也是一类函数转换方法. 应用 Pearson 曲线族拟合非正态分布主要出现 在早期的研究中大多根据 Pearson 分位表来计算 分位数尽管计算上比较简单但只提供了在有限的 偏度和峰度范围内的百分位数估计值而且难以获 得任何关于拟合良好性的信息[7—8]. Johnson 提出了关于随机变量的三个分布曲线 族都可以很容易地转化为标准正态分布.这些分 布分别表示为 SB、SL 和 SU 三种转换类型三种类型 的参数约束及变量取值范围如表1所示.Nicholas 利用约翰逊曲线对非正态数据进行拟合不仅能描 述 Pearson 系统各类曲线的通用范围而且计算过 程比 Pearson 更简便可靠[9—11].因此本文直接采用 Johnson 曲线族用于研究. 表1 Johnson 三个分布曲线族 Table1 Three Johnson distribution curve groups 类型 Johnson 曲线 正态转换 参数约束 xi 约束 SB k1=ln xi—ε λ+ε— xi yi=γ+ηln xi—ε λ+ε— xi ηλ>0—∞<γε<∞ ε< xi<ε+λ SL k2=ln( xi—ε) yi=γ+ηln( xi—ε) η>0—∞<γε<∞ xi>ε SU k3=arsinh xi—ε λ yi=γ+ηarsinh xi—ε λ ηλ>0—∞<γε<∞ —∞< xi<∞ 注:arsinhμ=ln μ+(μ2+1) 1 2 μ= xi—ε λ . 针对一个具体的非正态数据应用场合如何根 据样本选择合适的 Johnson 曲线类型是首要的问 题其步骤如下. 选择一个合适的 z 通过标准正态表找出对应 于{— sz — z z sz}的分布概率{p—szp—zpz p—sz}并在实际样本数据中找出上述分布概率所 对应分位数{x—szx—zxzx—sz}计算 m= xsz — xzn= x—z— x—3zp= xz— x—z求出分位数比率 第4期 陈道贵等: 区域化变量非正态分布的稳健性 ·413·
.414 北京科技大学学报 第31卷 QR=mn/p2.一般通过标准正态分布确定s=3 果通过检验则结束,否则以转换后的结果再进行第 时,只要确定合适的z值就可以确定需要拟合数据 2次转换或考虑进行设置分区拟合,直至达到要求, 类型,从而计算出相应的参数,其中,各参数可以通 基础数据库 过以下公式求得]. 对于SB曲线: 、经典统计分析) ++》 拟合优度检验判定 y=in&-为[1+1+为 否 Johnson拟合 以E+入 皮 曲线计算QR 常用转换法 为基准分区 QR1 QR=1 =+ 选择S 选择S 选择Su 1 计算参数 计算参数 计算参数 eE 对于SL曲线: (正态转换计算 2 拟合优度检验判定 结束 对于Su曲线: 图1非正态分布数据转换流程 Fig.I Transform flow of non normal distribution data =mm;{的} 3实例研究 =-〔+ 本文针对某矿320个钴孔7730个金(区域化变 量)的有效化验样品为依据,经细致检查,并在进行 +-2 特异品位处理后的数据基础上开展研究工作. 采用SPSS完成经典统计分析,其均值、中值、 2 非正态分布变量处理流程 最小值、最大值和方差等如图2所示,对其进行正 态概率图检验如图3所示,表明数据呈非正态分布, 本文针对上述数据转换方法提出了如图1所示 的非正态数据的转换流程.。下面对实施步骤简要描 对其进行对数正态分布检验如图4所示,表明区域 化变量金的数据分布趋于对数正态分布,但存在一 述 1200 (1)先对数据进行处理,进行经典统计分析,然 后用拟合优度进行检验,看其是否符合某一特殊分 1000F 均值=3.675 标准差=3.788 布(这里的特殊分布是指正态、对数正态、均匀、指数 样品数=7730 800 中位数=2.227 和威布尔分布),如果符合则可以直接用常用转换法 最小值=01 600 最大值=18.1 进行正态转换. 偏度=1.835 峰度=2.93 (2)如果不符合上述特殊分布,就尝试用 400 Johnson拟合方法,先计算分位数比率QR,然后对 200 Johnson分布的三种情况予以考虑,并考虑其约束条 NNRBNNRSSRKS9KO4 件,如果满足相应的约束条件,就可以进行数据正态 6 9 12 金品位(gt) 转换 (③)正态转换计算后,同样对其进行统计分析, 图2金原始样统计直方图 用拟合优度进行检验,看其转换后的分布及效果,如 Fig.2 Statistics histogram of Au original samples
QR= mn/p 2.一般通过标准正态分布确定 s=3 时只要确定合适的 z 值就可以确定需要拟合数据 类型从而计算出相应的参数.其中各参数可以通 过以下公式求得[9—11]. 对于 SB 曲线: η=z arcosh 1 2 1+ p m 1+ p n 1 2 —1 γ=ηarsinh p n — p m 1+ p m 1+ p n — 4 1 2 2 p 2 mn —1 —1 λ= p 1+ p m 1+ p n —2 2 —4 1 2 p 2 mn —1 —1 ε= xz+ x—z 2 — λ 2 + p p n — p m 2 p 2 mn —1 —1 . 对于 SL 曲线: η= 2z ln( m/p) γ=ηln m/p—1 p( m/p) 1/2 ε= xz— x—z 2 — p 2 m/p+1 m/p—1 . 对于 SU 曲线: η=2z arcosh 1 2 m p + n p —1 γ=ηarsinh n p — m p 2 mn p 2 —1 1 2 —1 λ=2p mn p —1 1 2 m p + n p —2 m p + n p +2 1 2 ε= xz+ x—z 2 + p n p — m p 2 m p + n p —2 —1 . 2 非正态分布变量处理流程 本文针对上述数据转换方法提出了如图1所示 的非正态数据的转换流程.下面对实施步骤简要描 述. (1) 先对数据进行处理进行经典统计分析然 后用拟合优度进行检验看其是否符合某一特殊分 布(这里的特殊分布是指正态、对数正态、均匀、指数 和威布尔分布)如果符合则可以直接用常用转换法 进行正态转换. (2) 如 果 不 符 合 上 述 特 殊 分 布就 尝 试 用 Johnson拟合方法先计算分位数比率 QR然后对 Johnson 分布的三种情况予以考虑并考虑其约束条 件如果满足相应的约束条件就可以进行数据正态 转换. (3) 正态转换计算后同样对其进行统计分析 用拟合优度进行检验看其转换后的分布及效果如 果通过检验则结束否则以转换后的结果再进行第 2次转换或考虑进行设置分区拟合直至达到要求. 图1 非正态分布数据转换流程 Fig.1 Transform flow of non-normal distribution data 图2 金原始样统计直方图 Fig.2 Statistics histogram of Au original samples 3 实例研究 本文针对某矿320个钻孔7730个金(区域化变 量)的有效化验样品为依据.经细致检查并在进行 特异品位处理后的数据基础上开展研究工作. 采用 SPSS 完成经典统计分析其均值、中值、 最小值、最大值和方差等如图2所示.对其进行正 态概率图检验如图3所示表明数据呈非正态分布. 对其进行对数正态分布检验如图4所示表明区域 化变量金的数据分布趋于对数正态分布但存在一 ·414· 北 京 科 技 大 学 学 报 第31卷
第4期 陈道贵等:区域化变量非正态分布的稳健性 .415. 定偏差 各参数:7=0.946,Y=3.376,入=83.824,e= 1.0 0.034.由图2的统计结果可知,xmim=0.1,xmm= 0.81 18.2,满足e<x:<e十入条件,把上述对应参数代 入下式正态转换方程并进行计算: 蒸 0.6 x-0.034 y:=3.376+0.946183.824+0.034-x 0.4 最后对计算结果y:进行统计分析和采用正态概率 0.2 图进行分布检验,如图5所示,均值、标准差、峰度和 偏度均相对较小.如图6所示,实测值的累计概率 0.2 0.40.60.8 1.0 实测值的累计概率 与期望值的累计概率基本相等(呈直线),且与图4 相比有明显改善 图3金原始样正态概率图检验 1000 Fig.3 Normal probability plot test of Au original samples 均值=0.0028 800 标准差=0.7619 1.0 样品数=7730 偏度=1.835 峰度=2.93 08 600 警 0.6 400 0.4 200 0.2 -3 -2 -1 0 金品位g) 0 0.2 0.40.60.8 1.0 实测值的累计概率 图5 Johnson转换后的统计直方图 Fig.5 Statistics histogram after Johnson transform 图4金原始样对数正态概率图检验 1.0 Fig.4 Lognormal probability plot test of Au original samples 0.8 按照本次设计的数据处理流程及统计分析结 果,此数据可以采用三参数对数正态转换法及 0.6 Johnson分布曲线拟合法,在此仅对Johnson曲线拟 0.4 合法步骤进行详细说明, 首先进行Johnson曲线的确定,选定一个合适 0.2 的z为0.68,通过标准正态表找出对应于{一3z, 一z,z,3z{的分布概率为{0.0207,0.2483, 0.20.40.60.81.0 实测值的累计概率 0.7517,0.9793},并在实际样本数据中找出上述分 布概率所对应分位数,因实际数据样品非常大,在 图6转换后正态概率图检验 此直接取样品累计概率{2.7%,24.83%,75.17%, Fig.6 Normal probability plot test after Johnson transform 97.93%}所对应的值{0.3062,1.1689,4.6147, 另对计算结果进行拟合优度检验.如表2所 16.4464.计算m=11.832,n=0.863,p= 示,双尾渐近显著性水平为0.749,表明与检验样本 3.446,求出分位数比率QR=0.8<1. 无显著差异,因此可以认为通过Johnson的SB曲线 选择Sg曲线来拟合数据.计算对应SB曲线 转化后的数据服从正态分布 表2单变量方差及均值正态检验 Table 2 Univariate normal test of variance and mean Johnson 单变量方差分析 单变量均值分析 转换 平方总和 自由度 均方 F检验 显著水平 平均差 自由度 t检验 显著水平 截距 0.059 1 0.059 0.102 0.749 0.0028 7728 0.319 0.749 合计 4485.17 7728 0.58
定偏差. 图3 金原始样正态概率图检验 Fig.3 Normal probability plot test of Au original samples 图4 金原始样对数正态概率图检验 Fig.4 Lognormal probability plot test of Au original samples 按照本次设计的数据处理流程及统计分析结 果此数据可以采用三参数对数正态转换法及 Johnson 分布曲线拟合法在此仅对 Johnson 曲线拟 合法步骤进行详细说明. 首先进行 Johnson 曲线的确定.选定一个合适 的 z 为0∙68通过标准正态表找出对应于{—3z —z z 3z}的 分 布 概 率 为{0∙02070∙2483 0∙75170∙9793}并在实际样本数据中找出上述分 布概率所对应分位数.因实际数据样品非常大在 此直接取样品累计概率{2∙7%24∙83%75∙17% 97∙93%}所对应的值{0∙30621∙16894∙6147 16∙4464}.计 算 m =11∙832n =0∙863p = 3∙446求出分位数比率 QR=0∙8<1. 选 择SB 曲线来拟合数据.计算对应SB 曲线 各参数:η=0∙946γ=3∙376λ=83∙824ε= 0∙034.由图2的统计结果可知xmin=0∙1xmax= 18∙2满足ε< xi<ε+λ条件.把上述对应参数代 入下式正态转换方程并进行计算: yi=3∙376+0∙946ln xi—0∙034 83∙824+0∙034— xi . 最后对计算结果 yi 进行统计分析和采用正态概率 图进行分布检验如图5所示均值、标准差、峰度和 偏度均相对较小.如图6所示实测值的累计概率 与期望值的累计概率基本相等(呈直线)且与图4 相比有明显改善. 图5 Johnson 转换后的统计直方图 Fig.5 Statistics histogram after Johnson transform 图6 转换后正态概率图检验 Fig.6 Normal probability plot test after Johnson transform 另对计算结果进行拟合优度检验.如表2所 示双尾渐近显著性水平为0∙749表明与检验样本 无显著差异因此可以认为通过 Johnson 的 SB 曲线 转化后的数据服从正态分布. 表2 单变量方差及均值正态检验 Table2 Univariate normal test of variance and mean Johnson 转换 单变量方差分析 单变量均值分析 平方总和 自由度 均方 F 检验 显著水平 平均差 自由度 t 检验 显著水平 截距 0∙059 1 0∙059 0∙102 0∙749 0∙0028 7728 0∙319 0∙749 合计 4485∙17 7728 0∙58 第4期 陈道贵等: 区域化变量非正态分布的稳健性 ·415·
.416 北京科技大学学报 第31卷 在上述计算中,在矿业领域一般可以考虑采用 1.0p 90%的置信度进行检验,若不满足则需要以上述转 0.9 换结果作为区域化变量进行二次迭代,直至转换后 0.8 的数据基本服从正态分布 0.7 方位45.00 0.6 4应用效果分析 倾伏角0.000 变差模型:球形 倾角40.00 0.5 块金值 变程 块金值0.5544663 各向异性系数 在克立格估计方法使用中,因实际化验样品位 0.4 结构10.2735221 51.193 主轴/半主轴2.023 结构201135141149212 主轴/次轴2.521 均为正值,需对Johnson转换的最终结果进行相应 0.3 平移,再以平移后的数据项为区域化变量,完成相 02 应操作后,需再把估计值按下式再反算回实际的金 品位: 100 150 200 250 距离m X结果=e十exp 之估计值一Y一C 图8 Johnson转换后变异函数模型及交叉验证参数 1+exp 之估计值一Y一C Fig.8 Variogram model and point validation parameters of Johnson transformed data 其中,C为平移的常数值 表3克里格估计误差的统计分析 在此,为检验进行转化后方差的变化效果,分别 Table 3 Statistics and analysis of Kriging error 以常用方法中取对数转换后的数据和采用Johnson 项目 常用对数法 Johnson法 法转换后的数据全部加上常数3为基础,采用 误差均值 0.0058 -0.0002 Gemcom Surpac业软件进行实验半变异函数模 样品理论方差 0.842 0.762 型的建立、分析及验证工作,分析对应理论方差、克 标准差 0.9178 0.8729 立格方差及估计误差的变化,实验半变异函数模型 偏度 -0.429 0.123 拟合参数及交叉验证参数如图7和图8所示,交叉 峰度 4.004 0.872 验证结果如表3所示,克立格估计误差分布如图9 有效样品数/个 7725 7725 和图10. 克里格估计方差 0.867 0.773 1.0 置信度/% 95.42 96.87 ■ 0.9 0.8 5000 0.7 4000 均值=-0.0058 0.6 方位43.00 标准差=0.9178 领伏角0.000° 样品数=7730 0.5 变差模型:球形 倾角38.00° 3000 块金值 变程 0.4 警 块金值 0.552606 各向异性系数 0.3 结构1 0.225148 50.392 主轴/半主轴1983 2000 结构2 0.163749 142.392 主轴/次轴2.349 02 1000F 0.1 0 50 100150200250 300 5 -3 -101 3 距离m 误差 图7对数转换后变异函数模型及交叉验证参数 图9对数法交叉验证误差统计直方图 Fig.7 Variogram model and point validation parameters of loga Fig.9 Error statistics histogram of point validation thought a log rithm transformed data normal logarithm 经上述统计分析可知,转换前区域化变量的标 叉验证,其中,误差均值均趋于0;克立格估计方差 准差为3.787,采用直接对数转换法后区域化变量 分别为0.867、0.773,减小10.8%,与理论方差比值 的标准方差为0.918,而采用Johnson法转换后,标 分别为1.029、1.023,趋于1;且置信区间范围均大 准方差为0.873;分别按图7、图8所示参数进行交 于95%,具体如表3所示.验证结果对应相应数据
在上述计算中在矿业领域一般可以考虑采用 90%的置信度进行检验若不满足则需要以上述转 换结果作为区域化变量进行二次迭代直至转换后 的数据基本服从正态分布. 4 应用效果分析 在克立格估计方法使用中因实际化验样品位 均为正值需对 Johnson 转换的最终结果进行相应 平移再以平移后的数据项为区域化变量.完成相 应操作后需再把估计值按下式再反算回实际的金 品位: X结果=ε+λexp z 估计值—γ—C η × 1+exp z 估计值—γ—C η —1 其中C 为平移的常数值. 在此为检验进行转化后方差的变化效果分别 以常用方法中取对数转换后的数据和采用Johnson 法转换后的数据全部加上常数 3 为基础采用 Gemcom Surpac ○R矿业软件进行实验半变异函数模 型的建立、分析及验证工作分析对应理论方差、克 立格方差及估计误差的变化.实验半变异函数模型 拟合参数及交叉验证参数如图7和图8所示交叉 验证结果如表3所示克立格估计误差分布如图9 和图10. 图7 对数转换后变异函数模型及交叉验证参数 Fig.7 Variogram model and point validation parameters of logarithm-transformed data 经上述统计分析可知转换前区域化变量的标 准差为3∙787采用直接对数转换法后区域化变量 的标准方差为0∙918而采用 Johnson 法转换后标 准 方差为0∙873;分别按图7、图8所示参数进行交 图8 Johnson 转换后变异函数模型及交叉验证参数 Fig.8 Variogram model and point validation parameters of Johnson transformed data 表3 克里格估计误差的统计分析 Table3 Statistics and analysis of Kriging error 项目 常用对数法 Johnson 法 误差均值 0∙0058 —0∙0002 样品理论方差 0∙842 0∙762 标准差 0∙9178 0∙8729 偏度 —0∙429 0∙123 峰度 4∙004 0∙872 有效样品数/个 7725 7725 克里格估计方差 0∙867 0∙773 置信度/% 95∙42 96∙87 图9 对数法交叉验证误差统计直方图 Fig.9 Error statistics histogram of point validation thought a lognormal logarithm 叉验证其中误差均值均趋于0;克立格估计方差 分别为0∙867、0∙773减小10∙8%与理论方差比值 分别为1∙029、1∙023趋于1;且置信区间范围均大 于95%具体如表3所示.验证结果对应相应数据 ·416· 北 京 科 技 大 学 学 报 第31卷
第4期 陈道贵等:区域化变量非正态分布的稳健性 417. (於崇文.数学地质的方法与应用:地质与化探工作中的多元分 1000 均值=-0.0002 析.北京:冶金工业出版社,1980) 800 标准差-0.8729 [3]Hou J R,Huang J X.Theoritical Analysis of Nonparametric 样品数=7730 and Multivariate Geostatistics and its Application.Beijing: 600 Metallurgical Industry Press,1994 (侯景儒,黄竞先·非参数及多元地质统计学的理论分析及其应 400 用.北京:治金工业出版社,1994) 200 [A]Simon W H.Practical Geostatistics:Modeling and Spatial Analysis.Berlin:Springer Verlag.2002 0 2 [5]Hou JR.Guo GY.Theory and Apply of Statistical Prediction 误兼 of Deposits and Geostatistics.Beijing:Metallurgical Industry Press,1994:74 图10 Johnson法交叉验证误差统计直方图 (侯景儒,郭光裕,矿床统计预测及地质统计学的理论与应用 Fig-10 Error statistics histogram of point validation thought John- 北京:冶金工业出版社,1993.74) son transform method [6]Liu D R.Liu G.Discussion on optimal estimation method of the 均认为变异函数拟合结果满足克立格估计要求,能 third parameter c when fitting a lognormal distribution with three parameters.Geol Prospect.1995.31(3):43 用于后期的克立格法估计·针对此矿床数据,各项 (刘甸瑞,刘刚.拟合三参数对数正态分布时第三参数c的优 指标表明,采用Johnson法均优于直接进行对数转换 选方法探讨.地质与勘探,1995,31(3):43 法,认为经过转换后区域化变量能满足稳健性要求, [7]Famum N R.Using Johnson curve to describe non-normal process data.Qual Eng.1996.9(2):329 5结论 [8]Sergio B.Marco L,Luca M.Application of non normal process capability indices to semiconductor quality control.IEEE Trans 多个矿山的资源/储量的普通克立格估计表明, Semicond Manuf.1998.11(2):296 当数据分布不服从标准分布或难以进行变异函数拟 [9]Zhuo D B.Liu X F.Using Johnson curves to control non normal 合且估计不好时,需考虑对原始数据按上述方法进 process.Syst Eng Theory Pract,1999.11:97 行非正态数据转换,采用本文所述方法转化后的数 (卓德保,刘晓芬,用约翰逊曲线拟合非正态过程数据的质量 据开展变异函数模型的拟合及验证、估计等工作,能 控制.系统工程理论与实践,1999,11,97) [10]Zheng X L.Zheng X J.YuZ H.Estimation of non normal pro- 方便得到相应结果,并能从本质上减小估计误差、提 cess capability indices using Johnson curve fitting.Mech Sci 高估计精度, Tecknol,2002,21(6):878 (郑小林,郑希俊,余中华.基于约翰逊曲线拟合的非正态工 参考文献 序能力指数估算方法,机械科学与技术,2002.21(6):878) [1]Michel D.Geostatistical Ore Reserve Estimation-New York: [11]He Z.Wu J.Kong X F.A study of non normal process capabili- Elsevier Scientific Publishing Company.1977 ty using Johnson transformation system-Manage Technol. [2]YuC W.Methods and Application of Mathematical Geology: 2007,8:104 Multivariate Analysis in Geological and Geochemical Work.Bei- (何桢,吴静,孔祥芬.基于Johnson转换的非正态过程能力研 jing:Metallurgical Industry Press,1980 究.管理技术,2007,8:104)
图10 Johnson 法交叉验证误差统计直方图 Fig.10 Error statistics histogram of point validation thought Johnson transform method 均认为变异函数拟合结果满足克立格估计要求能 用于后期的克立格法估计.针对此矿床数据各项 指标表明采用 Johnson 法均优于直接进行对数转换 法认为经过转换后区域化变量能满足稳健性要求. 5 结论 多个矿山的资源/储量的普通克立格估计表明 当数据分布不服从标准分布或难以进行变异函数拟 合且估计不好时需考虑对原始数据按上述方法进 行非正态数据转换.采用本文所述方法转化后的数 据开展变异函数模型的拟合及验证、估计等工作能 方便得到相应结果并能从本质上减小估计误差、提 高估计精度. 参 考 文 献 [1] Michel D. Geostatistical Ore Reserve Estimation.New York: Elsevier Scientific Publishing Company1977 [2] Yu C W. Methods and Application of Mathematical Geology: Multiv ariate A nalysis in Geological and Geochemical Work.Beijing:Metallurgical Industry Press1980 (於崇文.数学地质的方法与应用:地质与化探工作中的多元分 析.北京:冶金工业出版社1980) [3] Hou J RHuang J X.Theoritical A nalysis of Nonparametric and Multiv ariate Geostatistics and its Application.Beijing: Metallurgical Industry Press1994 (侯景儒黄竞先.非参数及多元地质统计学的理论分析及其应 用.北京:冶金工业出版社1994) [4] Simon W H. Practical Geostatistics: Modeling and Spatial A nalysis.Berlin:Springer Verlag2002 [5] Hou J RGuo G Y.Theory and Apply of Statistical Prediction of Deposits and Geostatistics.Beijing: Metallurgical Industry Press1994:74 (侯景儒郭光裕.矿床统计预测及地质统计学的理论与应用. 北京:冶金工业出版社1993:74) [6] Liu D RLiu G.Discussion on optimal estimation method of the third parameter c when fitting a lognormal distribution with three parameters.Geol Prospect199531(3):43 (刘甸瑞刘刚.拟合三参数对数正态分布时第三参数 c 的优 选方法探讨.地质与勘探199531(3):43 [7] Famum N R.Using Johnson curve to describe non-normal process data.Qual Eng19969(2):329 [8] Sergio BMarco LLuca M.Application of non-normal process capability indices to semiconductor quality control.IEEE T rans Semicond Manuf199811(2):296 [9] Zhuo D BLiu X F.Using Johnson curves to control non-normal process.Syst Eng Theory Pract199911:97 (卓德保刘晓芬.用约翰逊曲线拟合非正态过程数据的质量 控制.系统工程理论与实践199911:97) [10] Zheng X LZheng X JYu Z H.Estimation of non-normal process capability indices using Johnson curve-fitting. Mech Sci Technol200221(6):878 (郑小林郑希俊余中华.基于约翰逊曲线拟合的非正态工 序能力指数估算方法.机械科学与技术200221(6):878) [11] He ZWu JKong X F.A study of non-normal process capability using Johnson transformation system. Manage Technol 20078:104 (何桢吴静孔祥芬.基于 Johnson 转换的非正态过程能力研 究.管理技术20078:104) 第4期 陈道贵等: 区域化变量非正态分布的稳健性 ·417·