D0:10.13374/.issn1001-053x.2013.07.006 第35卷第7期 北京科技大学学报 Vol.35 No.7 2013年7月 Journal of University of Science and Technology Beijing Jul.2013 基于遗传算法优化的支持向量机品位插值模型 李翠平☒,郑瑶瑕,张佳,侯定勇 北京科技大学金属矿山高效开采与安全教育部重点实验室,北京100083 ☒通信作者,E-mail:cpli@ustb.cdu.cn 摘要将支持向量机(SVM)和遗传算法(GA)集成应用到矿体品位插值问题中,利用遗传算法全局搜索的优势对 支持向量机的三个关键参数一惩罚系数C、不敏感系数€和核函数参数。进行寻优,克服单纯支持向量机法中依 靠经验确定参数的局限性.将优化参数代入到支持向量机中进行迭代训练,得到基于遗传算法参数优化的支持向量机 (GA-SVM)刊矿体品位插值模型.以国内典型矿山的实际勘探数据为例,通过该品位插值模型计算结果与传统插值方法计 算结果和矿山生产实际数据的对比分析,验证了其可行性和有效性 关键词采矿:矿石品位:插值:支持向量机:遗传算法:优化 分类号TD-05 Ore grade interpolation model based on support vector machines optimized by genetic algorithms LI Cui-ping ZHENG Yao-ria,ZHANG Jia,HOU Ding-yong Key Laboratory of High Efficiency Mining and Safety for Metal Mines(Ministry of Education),University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:cpli@ustb.edu.cn ABSTRACT An approach which integrates support vector machines(SVM)and genetic algorithms(GA)was pro- posed to do ore grade interpolation.With the global searching characteristics,GA was used to select the optimal parameters of SVM,including the penalty parameter C,the insensitive coefficient e and the kernel function parameter o,so this approach can overcome the limitation of a pure SVM method in determining parameters by experience.The optimal parameters were substituted into SVM iterative training,and then an ore grade interpolation model based on SVM optimized by GA was established.Taking an underground mine in China as an example,the feasibility and validity of the ore grade interpolation model were verified by comparing the model calculation results with the actual data of mine production and the calculation results of traditional interpolation methods. KEY WORDS mining;ore grade;interpolation;support vector machines;genetic algorithms;optimization 由于采矿工程及矿业生产对象所涉及的空间 开采价值的依据,更作为后续矿山开采设计和开采 尺度宏大和空间关系复杂,导致采矿工程及矿业生 进度计划编制的基础.但是,因为勘探采样数据的 产过程信息不完备,设计规划及生产管理手段经验 品位信息存在空间性、各向异性、不连续性和非线 性不足,人们对于矿业生产对象及其相关事物认知 性等特点,探索切实有效的矿旷体品位插值方法显得 能力存在局限性.矿山建设项目凭借有限、离散的 十分重要-) 勘探采样进行矿体品位估值作为判断矿床是否具有 支持向量机(support vector machines,.SVM), 收稿日期:2012-10-10 基金项目:国家自然科学基金资助项目(51174032):教育部新世纪优秀人才支持计划资助项目(NCET-10-0225):中央高校基本科 研业务费专项(FRF-TP-09-001A)
第 35 卷 第 7 期 北 京 科 技 大 学 学 报 Vol. 35 No. 7 2013 年 7 月 Journal of University of Science and Technology Beijing Jul. 2013 基于遗传算法优化的支持向量机品位插值模型 李翠平 ,郑瑶瑕,张 佳,侯定勇 北京科技大学金属矿山高效开采与安全教育部重点实验室,北京 100083 通信作者,E-mail: cpli@ustb.edu.cn 摘 要 将支持向量机 (SVM) 和遗传算法 (GA) 集成应用到矿体品位插值问题中,利用遗传算法全局搜索的优势对 支持向量机的三个关键参数 —— 惩罚系数 C、不敏感系数 ε 和核函数参数 σ 进行寻优,克服单纯支持向量机法中依 靠经验确定参数的局限性. 将优化参数代入到支持向量机中进行迭代训练,得到基于遗传算法参数优化的支持向量机 (GA-SVM) 矿体品位插值模型. 以国内典型矿山的实际勘探数据为例,通过该品位插值模型计算结果与传统插值方法计 算结果和矿山生产实际数据的对比分析,验证了其可行性和有效性. 关键词 采矿;矿石品位;插值;支持向量机;遗传算法;优化 分类号 TD-05 Ore grade interpolation model based on support vector machines optimized by genetic algorithms LI Cui-ping , ZHENG Yao-xia, ZHANG Jia, HOU Ding-yong Key Laboratory of High Efficiency Mining and Safety for Metal Mines (Ministry of Education), University of Science and Technology Beijing, Beijing 100083, China Corresponding author, E-mail: cpli@ustb.edu.cn ABSTRACT An approach which integrates support vector machines (SVM) and genetic algorithms (GA) was proposed to do ore grade interpolation. With the global searching characteristics, GA was used to select the optimal parameters of SVM, including the penalty parameter C, the insensitive coefficient ε and the kernel function parameter σ, so this approach can overcome the limitation of a pure SVM method in determining parameters by experience. The optimal parameters were substituted into SVM iterative training, and then an ore grade interpolation model based on SVM optimized by GA was established. Taking an underground mine in China as an example, the feasibility and validity of the ore grade interpolation model were verified by comparing the model calculation results with the actual data of mine production and the calculation results of traditional interpolation methods. KEY WORDS mining; ore grade; interpolation; support vector machines; genetic algorithms; optimization 由于采矿工程及矿业生产对象所涉及的空间 尺度宏大和空间关系复杂,导致采矿工程及矿业生 产过程信息不完备,设计规划及生产管理手段经验 性不足,人们对于矿业生产对象及其相关事物认知 能力存在局限性. 矿山建设项目凭借有限、离散的 勘探采样进行矿体品位估值作为判断矿床是否具有 开采价值的依据,更作为后续矿山开采设计和开采 进度计划编制的基础. 但是,因为勘探采样数据的 品位信息存在空间性、各向异性、不连续性和非线 性等特点,探索切实有效的矿体品位插值方法显得 十分重要[1−3] . 支持向量机 (support vector machines, SVM), 收稿日期:2012–10–10 基金项目:国家自然科学基金资助项目 (51174032); 教育部新世纪优秀人才支持计划资助项目 (NCET-10-0225); 中央高校基本科 研业务费专项 (FRF-TP-09-001A) DOI:10.13374/j.issn1001-053x.2013.07.006
·838 北京科技大学学报 第35卷 是近年发展起来的一种新的数据挖掘方法,并且 约束条件为: 被认为是针对小样本的分类、回归问题的最佳方 -f(x)≤e+5, 法4-司.矿体品位空间插值问题可看作是对采样品 f(r)-≤e+, (4) 位数据及其各个影响属性间复杂的非线性函数关系 E,5≥0. 的逼近问题,因此可考虑将支持向量机方法应用到 矿体品位空间插值问题的研究中6-). 式(3)中,e为一正常数,f(x)-le时误差计为f(x)-hl-e. 参数的选取问题目前主要是靠经验或者反复试验, 通过采用拉格朗日乘数法,引入核函数 其选取具有一定的主观性和随意性,一定程度上影 K(z,x)及拉格朗日乘子a:和aj,得到优化问 响了支持向量机模型的推广能力,因此有必要探寻 题的对偶形式: 一种较为合理的参数寻优方法.本文在分析支持向 量机各参数对其性能影响的基础上,采用遗传算法 max W(a,a)=-1 ∑(a-a)(a-a)K(c,x)- i,=1 (genetic algorithm,GA)对支持向量机进行参数寻 优.利用遗传算法的全局搜索能力,将支持向量 (5) 机参数选取进行自动优化确定,为解决支持向量机 (+i)+(-oi). i=1 参数选取问题提供了有效途径.因此本文主要研究 其中: 基于遗传算法参数优化的支持向量机(以下简称为 w=∑ai-a4)(r), (6) GA-SVM矿体品位插值问题. i=1 0≤ai,a≤C,i=1,2,…,l. (7) 1支持向量机 且对于任何i=1,2,…,l,a×a=0. 1.1支持向量机回归模型 从而,构造的决策函数为 支持向量机是Vapnik等提出的统计学习方 法倒.与传统统计学方法相比,统计学习着重研究 fx)=∑ai-a)K(z,x)+b. (8) i=l 有限样本情况下的统计规律和学习方法.支持向量 机的核心是支持向量,其基本思想是升维和线性化. 其中b按下式计算: 通过非线性映射,把样本空间映射到一个高维特征 b=-e- 空间,然后求取最优线性分类面,寻求最优回归超 ∑a-aK(e,,a∈(0,C):(⑨ i= 平面问题转化为求解一个二次凸规划问题,来求得 全局最优解9-10. b=h+e-∑(a-a)K(z,x),a∈(0,C).(10) 由于本文的矿体品位空间插值是回归问题,可 i=1 采用e-SVR(support vector regression,SVR)算法来 式(8)便是采用支持向量机回归方法最终确定 实现.e-SVR回归原理为如下. 的非线性回归函数.通过支持向量或采用平均值方 给定训练集x1=z,x,xT∈R3,∈R,其 法计算出b值,便可将其应用到矿体品位插值问题 中i=1,2,…,l,构造回归函数为 中 1.2支持向量机参数对模型性能的影响 f(x)=wo(x)+b. (1) 在支持向量机回归方法中,有三个关键的参 支持向量机求解问题的关键是寻找最小,等价于 数,即惩罚系数C、不敏感系数ε和核函数参数 σ.这三个参数的选择效果直接影响支持向量机性 求最小化,因此可以将求解最小w的问题表 示成凸优化问题: 能,因此需要寻找合适的参数值,以使支持向量机 具有更好的推广能力叫. min: (2) (1)惩罚参数C可使模型复杂度和训练误差之 间达到一种折中.参数C的选取一般视具体问题而 考虑到拟合误差情况,引入惩罚因子C以及松弛因 定.当参数C取值趋小时,对样本数据中超出不敏 子、,此凸优化问题即为最小化: 感带的样本惩罚也趋小,同时训练误差变大,系统 1 的推广能力变差,出现“欠学习”现象;当C取值 Ru,)=2“w+C∑&+). (3) 趋大时,则出现“过学习”现象
· 838 · 北 京 科 技 大 学 学 报 第 35 卷 是近年发展起来的一种新的数据挖掘方法,并且 被认为是针对小样本的分类、回归问题的最佳方 法[4−5] . 矿体品位空间插值问题可看作是对采样品 位数据及其各个影响属性间复杂的非线性函数关系 的逼近问题,因此可考虑将支持向量机方法应用到 矿体品位空间插值问题的研究中[6−7] . 然而,在支持向量机方法的实际应用中,关于 参数的选取问题目前主要是靠经验或者反复试验, 其选取具有一定的主观性和随意性,一定程度上影 响了支持向量机模型的推广能力,因此有必要探寻 一种较为合理的参数寻优方法. 本文在分析支持向 量机各参数对其性能影响的基础上,采用遗传算法 (genetic algorithm, GA) 对支持向量机进行参数寻 优. 利用遗传算法的全局搜索能力,将支持向量 机参数选取进行自动优化确定,为解决支持向量机 参数选取问题提供了有效途径. 因此本文主要研究 基于遗传算法参数优化的支持向量机 (以下简称为 GA-SVM) 矿体品位插值问题. 1 支持向量机 1.1 支持向量机回归模型 支持向量机是 Vapnik 等提出的统计学习方 法[8] . 与传统统计学方法相比,统计学习着重研究 有限样本情况下的统计规律和学习方法. 支持向量 机的核心是支持向量,其基本思想是升维和线性化. 通过非线性映射,把样本空间映射到一个高维特征 空间,然后求取最优线性分类面,寻求最优回归超 平面问题转化为求解一个二次凸规划问题,来求得 全局最优解[9−10] . 由于本文的矿体品位空间插值是回归问题,可 采用 ε-SVR (support vector regression, SVR) 算法来 实现. ε- SVR 回归原理为如下. 给定训练集 xi = [x 1 i , x2 i , x3 i ] T ∈ R3 , yi ∈ R,其 中 i = 1, 2, · · · , l,构造回归函数为 f(x) = ωφ(x) + b. (1) 支持向量机求解问题的关键是寻找最小 ω,等价于 求最小化 kωk 2,因此可以将求解最小 ω 的问题表 示成凸优化问题: min : 1 2 kωk 2 . (2) 考虑到拟合误差情况,引入惩罚因子 C 以及松弛因 子 ξi、ξ ∗ i ,此凸优化问题即为最小化: R(ω, ξ, ξ∗ ) = 1 2 ω · ω + C X l i=1 (ξi + ξ ∗ i ). (3) 约束条件为: yi − f(xi) 6 ε + ξi , f(xi) − yi 6 ε + ξ ∗ i , ξi , ξ∗ i > 0. (4) 式 (3) 中,ε 为一正常数,|f(xi) − yi | ε 时误差计为 |f(xi) − yi | − ε. 通 过 采 用 拉 格 朗 日 乘 数 法 , 引 入 核 函 数 K(xi , xj ) 及拉格朗日乘子 αi 和 αj,得到优化问 题的对偶形式: max : W(α, α∗ ) = − 1 2 X l i,j=1 (αi − α ∗ i )(αj−α ∗ j )K(xi , xj )− ε X l i=1 (αi + α ∗ i ) +X l i=1 yi(αi − α ∗ i ). (5) 其中: ω = X l i=1 (αi − α ∗ i )φ(xi), (6) 0 6 αi , α∗ i 6 C, i = 1, 2, · · · , l. (7) 且对于任何 i=1,2,· · ·,l, αi × α ∗ i = 0. 从而,构造的决策函数为 f(x) = X l i=1 (αi − α ∗ i )K(x, xi) + b. (8) 其中 b 按下式计算: b = yi − ε − X l i=1 (αi − α ∗ i )K(x, xi), αi ∈ (0, C); (9) b = yi + ε − X l i=1 (αi − α ∗ i )K(x, xi), αi ∈ (0, C). (10) 式 (8) 便是采用支持向量机回归方法最终确定 的非线性回归函数. 通过支持向量或采用平均值方 法计算出 b 值,便可将其应用到矿体品位插值问题 中. 1.2 支持向量机参数对模型性能的影响 在支持向量机回归方法中,有三个关键的参 数,即惩罚系数 C、不敏感系数 ε 和核函数参数 σ. 这三个参数的选择效果直接影响支持向量机性 能,因此需要寻找合适的参数值,以使支持向量机 具有更好的推广能力[11] . (1) 惩罚参数 C 可使模型复杂度和训练误差之 间达到一种折中. 参数 C 的选取一般视具体问题而 定. 当参数 C 取值趋小时,对样本数据中超出不敏 感带的样本惩罚也趋小,同时训练误差变大,系统 的推广能力变差,出现 “欠学习” 现象;当 C 取值 趋大时,则出现 “过学习” 现象
第7期 李翠平等:基于遗传算法优化的支持向量机品位插值模型 .839· (2)不敏感系数ε控制着对样本数据的不敏感 2.1支持向量机参数编码方式设计 带宽度,直接影响支持向量的数日.当参数ε取值 从图1可以看出,利用遗传算法进行参数寻优 偏小时,预测精度高,但相应的支持向量的个数也 的首要工作是确定编码方式.编码是将实际问题的 偏多,易出现“过学习”现象.反之若值过大,则 解决方案表示为遗传算法的染色体位串的规则和方 支持向量的个数偏少,预测精度降低,易出现“欠 法,编码应满足完备性、健全性和非冗余性1).通 学习”现象 过将问题的解用编码来表示,从而将问题的状态空 (3)核函数参数σ主要反映训练样本数据的范 间与遗传算法的码空间相对应 围特性,直接影响支持向量机模型的学习能力.当 针对本文的参数寻优问题,在初始化支持向量 核函数参数σ取值偏小时易出现“过学习”:当核函 机参数后,采用二进制码对参数C、σ和ε进行编 数参数σ取值偏大时易出现“欠学习” 码,二进制编码将问题空间的参数用字符集构成染 由此可见,合理确定上述参数的值很重要.但 色体位串,符合最小字符集原则.将三个参数C、σ 是,目前对于上述参数值的选取往往靠经验或通过 和e分别以n1、n2和n3位二进制进行编码,这样 反复试验来给定,故此如何探寻更有效的参数寻优 每组参数就是一个基因长度为n1+n2+n3的染色 方法显得非常必要 体,如图2所示 2遗传算法优化支持向量机参数 4凸▣☑baGa6 C的编码 σ的编码 e的编码 遗传算法最早由美国密执安大学的Holland教 图2参数C、g和e的编码方式 授提出,根据达尔文进化论中的“生存竞争”和“优 Fig.2 Encoding method for the parameters of C,o and e 胜劣汰”原则,借助复制、杂交、变异等操作,不断 迭代计算,经过若干代的演化后,群体中的最优值 假设每个参数的编码区间是[Umin,Uma小,则可 逐步逼近最优解,直至最后达到全局最优1②.遗传 产生共2”种不同的编码,各参数编码对应的解码 算法具有较强的全局搜索能力.利用这一优点,对 公式为(以参数C为例) 支持向量机中的参数C、ε和σ进行优化选择,构造 C= Umax -Umin GA-SVM矿体品位插值模型,不仅使支持向量机参 ×2 2n1-1 .(11) 数的选择更具理论性,而且可以保证模型的最优化. 采用二进制编码方式,从参数C、σ和e解码 采用遗传算法对支持向量机进行参数优化的 后组成的集合中随机选取m个数,组成一条表示 算法流程图如图1所示 支持向量机参数值的染色体S,即S=S1,S2,·, 开始 Sm,其中1≤S:≤n,i=1,2,…,m.重复以上步骤 N次,可生成N个个体,形成第一代种群 对SVM参数进行编码 2.2适应度函数与算法停止准则 适应度函数是遗传算法用于支持向量机参数 设置GA参数,并随机产生初始种群 寻优的接口,用于衡量个体的优劣,其对遗传算法 训练SVM 的选择、交叉和变异操作具有重要影响,从而也会 影响参数寻优的优化时间和优化效率. 计算适应度函数值 本文的参数寻优中,适应度函数采用支持向量 机的均方根误差(MSE),即 是 收敛条件 解码 否I (-f)2 进行选择、变 获得优化的 fitMSE= (12) 异、交叉操作 SVM组合参数 式中:为训练样本真实值:为支持向量机预测 生一组新种群 结束 值:n为样本的个数:t为适应度函数 适应度函数值为训练支持向量机模型时预测 图1引进遗传算法的支持向量机参数寻优流程图 值与真实值的均方根误差大小,误差越小选择进 Fig.1 Flow chart of SVM parameter optimization by intro- ducing GA 化的概率越大,即最终的结果为支持向量机模型
第 7 期 李翠平等:基于遗传算法优化的支持向量机品位插值模型 839 ·· (2) 不敏感系数 ε 控制着对样本数据的不敏感 带宽度,直接影响支持向量的数目. 当参数 ε 取值 偏小时,预测精度高,但相应的支持向量的个数也 偏多,易出现 “过学习” 现象. 反之若 ε 值过大,则 支持向量的个数偏少,预测精度降低,易出现 “欠 学习” 现象. (3) 核函数参数 σ 主要反映训练样本数据的范 围特性,直接影响支持向量机模型的学习能力. 当 核函数参数 σ 取值偏小时易出现 “过学习”;当核函 数参数 σ 取值偏大时易出现 “欠学习”. 由此可见,合理确定上述参数的值很重要. 但 是,目前对于上述参数值的选取往往靠经验或通过 反复试验来给定,故此如何探寻更有效的参数寻优 方法显得非常必要. 2 遗传算法优化支持向量机参数 遗传算法最早由美国密执安大学的 Holland 教 授提出,根据达尔文进化论中的 “生存竞争” 和 “优 胜劣汰” 原则,借助复制、杂交、变异等操作,不断 迭代计算,经过若干代的演化后,群体中的最优值 逐步逼近最优解,直至最后达到全局最优[12] . 遗传 算法具有较强的全局搜索能力. 利用这一优点,对 支持向量机中的参数 C、ε 和 σ 进行优化选择,构造 GA-SVM 矿体品位插值模型,不仅使支持向量机参 数的选择更具理论性,而且可以保证模型的最优化. 采用遗传算法对支持向量机进行参数优化的 算法流程图如图 1 所示. 图 1 引进遗传算法的支持向量机参数寻优流程图 Fig.1 Flow chart of SVM parameter optimization by introducing GA 2.1 支持向量机参数编码方式设计 从图 1 可以看出,利用遗传算法进行参数寻优 的首要工作是确定编码方式. 编码是将实际问题的 解决方案表示为遗传算法的染色体位串的规则和方 法,编码应满足完备性、健全性和非冗余性[13] . 通 过将问题的解用编码来表示,从而将问题的状态空 间与遗传算法的码空间相对应. 针对本文的参数寻优问题,在初始化支持向量 机参数后,采用二进制码对参数 C、σ 和 ε 进行编 码,二进制编码将问题空间的参数用字符集构成染 色体位串,符合最小字符集原则. 将三个参数 C、σ 和 ε 分别以 n1、n2 和 n3 位二进制进行编码,这样 每组参数就是一个基因长度为 n1 + n2+ n3 的染色 体,如图 2 所示. 图 2 参数 C、σ 和 ε 的编码方式 Fig.2 Encoding method for the parameters of C, σ and ε 假设每个参数的编码区间是 [Umin,Umax],则可 产生共 2 n 种不同的编码,各参数编码对应的解码 公式为 (以参数 C 为例) Cx = Umin + ÃXn1 i=1 ai × 2 i−1 ! × Umax − Umin 2 n1 − 1 . (11) 采用二进制编码方式,从参数 C、σ 和 ε 解码 后组成的集合中随机选取 m 个数,组成一条表示 支持向量机参数值的染色体 S,即 S = S1,S2, · · · , Sm,其中 16 Si 6 n,i=1, 2, · · · , m. 重复以上步骤 N 次,可生成 N 个个体,形成第一代种群. 2.2 适应度函数与算法停止准则 适应度函数是遗传算法用于支持向量机参数 寻优的接口,用于衡量个体的优劣,其对遗传算法 的选择、交叉和变异操作具有重要影响,从而也会 影响参数寻优的优化时间和优化效率. 本文的参数寻优中,适应度函数采用支持向量 机的均方根误差 (MSE),即 fitMSE = vuut Pn i=1 (yi − fi) 2 n . (12) 式中:yi 为训练样本真实值;fi 为支持向量机预测 值;n 为样本的个数;fit 为适应度函数. 适应度函数值为训练支持向量机模型时预测 值与真实值的均方根误差大小,误差越小选择进 化的概率越大,即最终的结果为支持向量机模型
.840 北京科技大学学报 第35卷 训练出的预测值最接近真实值时对应的支持向量机3 GA-SVM矿体品位插值模型构建 参数. 基于上述遗传算法参数寻优的支持向量机算 2.3遗传算子 法,进行矿体品位插值GA-SVM模型的构建流程 遗传算法对支持向量机参数进行寻优的关键 如下: 在于确定遗传算子,包括复制算子、交叉算子和变 (1)采集矿山的实际矿体勘探数据,对原始数 异算子,这些遗传算子的选取控制着整个群体的优 据进行坐标转换和离散化处理,建立训练样本和预 劣14-15j 测体素样本,并对样本数据进行归一化处理,构成 (1)复制算子控制着优势个体的选择,即在群 模型样本集: 体规模不变的前提下复制最优个体和淘汰劣势个 (②)基于设计的模型样本集,通过实验进行核 体.方法有比例选择、随机联赛选择、排序选择等. 函数形式的选择: 本文采用排序选择法进行,首先根据适应度值将群 (3)运用遗传算法对支持向量机参数进行寻优, 中所有个体进行排序,然后结合个体被选中概率来 得出最优参数组合: 确定优势个体. (4)根据选择的核函数及相关参数,构造支持 (2)交叉算子决定着新个体的产生,即按照一 向量机决策函数,建立GA-SVM品位插值模型,并 定交叉概率对两配对个体经交换基因进化产生新个 利用模型进行矿体空间插值,得到插值结果 体.交叉概率控制着交叉算子的应用频率,本文选 3.1建立模型样本集 用第一代交叉后自适应的交叉概率,即 本文采集的数据源自国内某典型矿山E0-E17 R(G+1)=R.(G-B()-0.6 (13) 勘探线间介于-288~-358m水平的矿体勘探钻孔 Gmax 数据.通过对矿体勘探数据进行坐标转换及离散化 式中,G为遗传代数,Gmax为最大遗传代数,P(1) 处理,共获得3592组具有品位值的空间点数据,形 为第1代交叉概率,P(G)为第G代交叉概率. 成训练样本集. 一般交叉概率取值范围为0.400.99,文中设定 对插值空间区域进行规则化空间网格的构造, 初始交叉概率P(1)取为0.7,代入式(13)可得 共获取了25214组数据,形成预测体素样本集 P:(G+1)=Pe(G)-Gmx 同时为消除量纲和变化幅度不同带来的影响, (14) 需对获取的训练样本集和预测体素样本集数据进行 (3)变异算子控制着新产生个体的优势性,即 规范化处理.文中采用最大-最小规范化方法,按下 按照一定的变异概率对选中个体染色体的等位基因 式进行归一化处理: 发生改变,来增强群体多样性.其变异概率控制着 优势基因的质量,本文选用第一代变异后自适应的 -2(mx-min) Ti=- (17) 变异概率,即 2(max-imin) Pm(G+)-Pm(g-0.08-Pa】 (15) Gmax 式中,金max和min分别为样本集合中对应属性的 最大值与最小值,:和x分别为归一化前后的属 式中,Pm(1)为第1代变异概率,Pm(G)为第G代 性值 变异概率. 经归一化处理后可生成直接输入模型中的样 般变异概率取值范围为0.0010.100,文中设 本集(z,),x=[z,z,x]T∈R3,∈R,且 定初始变异概率Pm(1)取为0.01,代入式(15)可得 x、x和x的属性值位于0,1区间. Pm(G+1)=Pm(G)-0.07 (16) 3.2核函数选取 Gmax 支持向量机中目前应用较多的核函数有三 故此,在遗传算法参数寻优过程中,交叉算子控制 种6-17:(1)多项式函数,K(x,x)=[(x,c)+1: 着遗传算法的全局搜索能力,而变异算子决定着遗 (2)径向基函数(RBF),K(x,)=exp(-|z-x/ 传算法的局部搜索性能.两者的配合使交叉与变异 a):(3)Sigmoid函数,K(x,c)=tanh(v(x,xi)+c). 的个体具有良好的适应度,保证以良好的搜索性能 故本文对这三种核函数分别对建立的样本集进行训 在搜索空间中完成参数的寻优,即获得最优的C、σ 练校验.通过比较各种核函数的训练结果,根据预 和e参数值. 测方差与相关系数的值确定相对理想的核函数.三
· 840 · 北 京 科 技 大 学 学 报 第 35 卷 训练出的预测值最接近真实值时对应的支持向量机 参数. 2.3 遗传算子 遗传算法对支持向量机参数进行寻优的关键 在于确定遗传算子,包括复制算子、交叉算子和变 异算子,这些遗传算子的选取控制着整个群体的优 劣[14−15] . (1) 复制算子控制着优势个体的选择,即在群 体规模不变的前提下复制最优个体和淘汰劣势个 体. 方法有比例选择、随机联赛选择、排序选择等. 本文采用排序选择法进行,首先根据适应度值将群 中所有个体进行排序,然后结合个体被选中概率来 确定优势个体. (2) 交叉算子决定着新个体的产生,即按照一 定交叉概率对两配对个体经交换基因进化产生新个 体. 交叉概率控制着交叉算子的应用频率,本文选 用第一代交叉后自适应的交叉概率,即 Pc(G + 1) = Pc(G) − [Pc(1) − 0.6] Gmax . (13) 式中,G 为遗传代数,Gmax 为最大遗传代数,Pc(1) 为第 1 代交叉概率,Pc(G) 为第 G 代交叉概率. 一般交叉概率取值范围为 0.40∼0.99,文中设定 初始交叉概率 Pc(1) 取为 0.7,代入式 (13) 可得 Pc(G + 1) = Pc(G) − 0.1 Gmax . (14) (3) 变异算子控制着新产生个体的优势性,即 按照一定的变异概率对选中个体染色体的等位基因 发生改变,来增强群体多样性. 其变异概率控制着 优势基因的质量,本文选用第一代变异后自适应的 变异概率,即 Pm(G + 1) = Pm(G) − [0.08 − Pm(1)] Gmax . (15) 式中, Pm(1) 为第 1 代变异概率,Pm(G) 为第 G 代 变异概率. 一般变异概率取值范围为 0.001∼0.100,文中设 定初始变异概率 Pm(1) 取为 0.01,代入式 (15) 可得 Pm(G + 1) = Pm(G) − 0.07 Gmax . (16) 故此,在遗传算法参数寻优过程中,交叉算子控制 着遗传算法的全局搜索能力,而变异算子决定着遗 传算法的局部搜索性能. 两者的配合使交叉与变异 的个体具有良好的适应度,保证以良好的搜索性能 在搜索空间中完成参数的寻优,即获得最优的 C、σ 和 ε 参数值. 3 GA-SVM 矿体品位插值模型构建 基于上述遗传算法参数寻优的支持向量机算 法,进行矿体品位插值 GA-SVM 模型的构建流程 如下: (1) 采集矿山的实际矿体勘探数据,对原始数 据进行坐标转换和离散化处理,建立训练样本和预 测体素样本,并对样本数据进行归一化处理,构成 模型样本集; (2) 基于设计的模型样本集,通过实验进行核 函数形式的选择; (3) 运用遗传算法对支持向量机参数进行寻优, 得出最优参数组合; (4) 根据选择的核函数及相关参数,构造支持 向量机决策函数,建立 GA-SVM 品位插值模型,并 利用模型进行矿体空间插值,得到插值结果. 3.1 建立模型样本集 本文采集的数据源自国内某典型矿山 E0-E17 勘探线间介于 −288∼ −358 m 水平的矿体勘探钻孔 数据. 通过对矿体勘探数据进行坐标转换及离散化 处理,共获得 3592 组具有品位值的空间点数据,形 成训练样本集. 对插值空间区域进行规则化空间网格的构造, 共获取了 25214 组数据,形成预测体素样本集. 同时为消除量纲和变化幅度不同带来的影响, 需对获取的训练样本集和预测体素样本集数据进行 规范化处理. 文中采用最大–最小规范化方法,按下 式进行归一化处理: xi = xˆi − 1 2 (ˆxmax − xˆmin) 1 2 (ˆxmax − xˆmin) . (17) 式中,xˆmax 和 xˆmin 分别为样本集合中对应属性的 最大值与最小值,xˆi 和 xi 分别为归一化前后的属 性值. 经归一化处理后可生成直接输入模型中的样 本集 (xi,yi),xi = [x 1 , x2 i , x3 i ] T ∈ R3 , yi ∈ R,且 x 1 i 、x 2 i 和 x 3 i 的属性值位于 [0,1] 区间. 3.2 核函数选取 支持向量机中目前应用较多的核函数有三 种[16−17]:(1) 多项式函数,K(x, xi) = [(x, xi)+ 1]q; (2) 径向基函数 (RBF),K(x, xi) = exp(− |x − xi | 2 / σ 2 );(3) Sigmoid 函数,K(x, xi) = tanh (v(x, xi)+c). 故本文对这三种核函数分别对建立的样本集进行训 练校验. 通过比较各种核函数的训练结果,根据预 测方差与相关系数的值确定相对理想的核函数. 三
第7期 李翠平等:基于遗传算法优化的支持向量机品位插值模型 .841. 种核函数的训练结果如表1所示.由表1中数据可 178 178 以看出:径向基函数(RBF)的均方差小,且相关系 3.0572(a+a)-(a-a) (18) i=l i=1 数更接近1,说明选其作为模型的核函数回归效果 经学习训练可得决策函数的偏置项b=48.713, 较为理想;且其核函数能够实现非线性映射,相对 则构造的最优决策函数为 于其他函数而言,参数较少,易于进行参数寻优 178 f(x)= 表1不同核函数的回归效果 (a-a)exp(-93.0304z-x,2)+48.713. i=1 Table 1 Regression results of different kernel functions (19) 核函数 迭代次数均方差 相关系数 根据所构造的最优决策函数,对矿体空间区域 多项式 29 36.2993 0.00654 内的待插值样本进行品位插值,获得了25214组具 径向基函数 29 15.7546 0.81280 Sigmoid函数 有品位值的数据 29 17.8681 0.28750 3.3GA-SVM参数寻优过程 4模型验证与对比分析 基于上述研究,引入遗传算法进行支持向量机 4.1品位验证 参数寻优的过程可描述为如下步骤 首先对预测的25214组体素样本进行空间分布 (1)产生遗传算法的初始种群.支持向量机需 分析,建立品位值的频率统计分布图.对这些数据 要优化的参数为C、σ和e,三个参数的范围设定 点按品位间隔4%,从16%到72%进行分组,划分为 为0≤C≤100,0≤o≤100,0.1≤e≤10.对三个参数 16%~20%,20%~24%,·,68%72%共14个区段, 进行二进制编码,编码码串的长度为20. 通过matlab中hist函数进行直方图绘制,如图3 (2)设定遗传算法的参数.初始进化代数 所示.由图3可见,品位值空间分布基本服从正态 gen=1,最大进化代数maxgen=l00,种群最大数量 分布.通过利用matlab中t检验法对空间品位数据 sizepop=20. 进行均值、方差和置信区间的检验,得到品位均值 (3)将初始群体解码后送入支持向量机进行训 muhat=51.3391、品位方差sigmahat=6.4479、品位 练并计算个体的适应度函数值 均值的0.95置信区间muci=[51.2595,51.4187]、品 (4)计算最优个体的适应度值.通过计算式(12) 位方差0.95置信区间sigmaci=[6.3921.6.50461,并 中支持向量机的均方差值来判断选取参数的优劣, 且布尔变量h=0、假设均值成立的概率sig=l,证 若均方差值满足要求或者达到设定的最大遗传代 实体的品位数据的空间特征服从正态分布. 数,则自动终止算法并转至步骤(6):否则进入步 哈 骤(5): 30 (⑤)进行遗传操作.将选择、交叉和变异作用于 子 群体中,产生下一代群体,再转至步骤(3)继续迭 中 20 代: 15 (⑥)给出最优参数组合C、σ和e. 9 经过遗传算法100代进化后,得到支持向量机 模型的最佳参数为C=35.1672,0=93.0403,e=3.0572. 0 3.4GA-SVM品位插值模型实现 10 20304050607080 基于上述的研究结果,获得了GA-SVM品位 品位/% 插值模型,即采用核函数为径向基函数,模型参数 图3预测样本品位频率统计直方图 C=35.1672,σ=93.0403,e=3.0572 Fig.3 Histogram of the grade frequency statistics of forecast samples 将品位插值模型的各参数代入式(⑤),可得原 经GA-SVM集成模型进行品位空间插值后,可 问题的对偶问题为 进一步求得平均品位.因该矿山的矿石形态主要以 1 178 Fe1和Fe3存在.Fe1指边界品位TFe>40%、平均品 max : 2 [(a-a)(a-a)× ,=1 位TFe≥45%的块状磁铁矿石,属于富矿石:Fe3则 指边界品位TFe≥25%、平均品位T℉e≥30%的块状 exp(-93.0403|z-c2)]+ 磁铁矿石,属于贫矿石.为证实GA-SVM集成模型
第 7 期 李翠平等:基于遗传算法优化的支持向量机品位插值模型 841 ·· 种核函数的训练结果如表 1 所示. 由表 1 中数据可 以看出:径向基函数 (RBF) 的均方差小,且相关系 数更接近 1,说明选其作为模型的核函数回归效果 较为理想;且其核函数能够实现非线性映射,相对 于其他函数而言,参数较少,易于进行参数寻优. 表 1 不同核函数的回归效果 Table 1 Regression results of different kernel functions 核函数 迭代次数 均方差 相关系数 多项式 29 36.2993 0.00654 径向基函数 29 15.7546 0.81280 Sigmoid 函数 29 17.8681 0.28750 3.3 GA-SVM 参数寻优过程 基于上述研究,引入遗传算法进行支持向量机 参数寻优的过程可描述为如下步骤. (1) 产生遗传算法的初始种群. 支持向量机需 要优化的参数为 C、σ 和 ε,三个参数的范围设定 为 06 C 6100,06σ 6100,0.16 ε 610. 对三个参数 进行二进制编码,编码码串的长度为 20. (2) 设定遗传算法的参数. 初始进化代数 gen=1,最大进化代数 maxgen=100,种群最大数量 sizepop=20. (3) 将初始群体解码后送入支持向量机进行训 练并计算个体的适应度函数值. (4) 计算最优个体的适应度值. 通过计算式 (12) 中支持向量机的均方差值来判断选取参数的优劣, 若均方差值满足要求或者达到设定的最大遗传代 数,则自动终止算法并转至步骤 (6);否则进入步 骤 (5); (5) 进行遗传操作. 将选择、交叉和变异作用于 群体中,产生下一代群体,再转至步骤 (3) 继续迭 代; (6) 给出最优参数组合 C、σ 和 ε. 经过遗传算法 100 代进化后,得到支持向量机 模型的最佳参数为 C=35.1672,σ=93.0403,ε=3.0572. 3.4 GA-SVM 品位插值模型实现 基于上述的研究结果,获得了 GA-SVM 品位 插值模型,即采用核函数为径向基函数,模型参数 C=35.1672,σ=93.0403,ε=3.0572. 将品位插值模型的各参数代入式 (5),可得原 问题的对偶问题为 max : − 1 2 X 178 i,j=1 [(α ∗ i − αi)(α ∗ j − αj )× exp(−93.0403 |x − xi | 2 )]+ 3.0572X 178 i=1 (α ∗ i + αi) − X 178 i=1 yi(α ∗ i − αi). (18) 经学习训练可得决策函数的偏置项 b=48.713, 则构造的最优决策函数为 f(x) = X 178 i=1 (αi − α ∗ i ) exp(−93.0304 |x − xi | 2 )+48.713. (19) 根据所构造的最优决策函数,对矿体空间区域 内的待插值样本进行品位插值,获得了 25214 组具 有品位值的数据. 4 模型验证与对比分析 4.1 品位验证 首先对预测的 25214 组体素样本进行空间分布 分析,建立品位值的频率统计分布图. 对这些数据 点按品位间隔 4%,从 16%到 72%进行分组,划分为 16%∼20%, 20%∼24%, · · · , 68%∼72%共 14 个区段, 通过 matlab 中 hist 函数进行直方图绘制,如图 3 所示. 由图 3 可见,品位值空间分布基本服从正态 分布. 通过利用 matlab 中 t 检验法对空间品位数据 进行均值、方差和置信区间的检验,得到品位均值 muhat =51.3391、品位方差 sigmahat =6.4479、品位 均值的 0.95 置信区间 muci =[51.2595, 51.4187]、品 位方差 0.95 置信区间 sigmaci =[6.3921, 6.5046],并 且布尔变量 h=0、假设均值成立的概率 sig=1,证 实矿体的品位数据的空间特征服从正态分布. 图 3 预测样本品位频率统计直方图 Fig.3 Histogram of the grade frequency statistics of forecast samples 经 GA-SVM 集成模型进行品位空间插值后,可 进一步求得平均品位. 因该矿山的矿石形态主要以 Fe1 和 Fe3 存在. Fe1 指边界品位 TFe>40%、平均品 位 TFe>45%的块状磁铁矿石,属于富矿石;Fe3 则 指边界品位 TFe>25%、平均品位 TFe>30%的块状 磁铁矿石,属于贫矿石. 为证实 GA-SVM 集成模型
.842 北京科技大学学报 第35卷 的品位插值效果,本文将该方法与三种常规的品位 析,如表2所示.由表2中不同计算方法下得出的 插值方法(泰森多边形法、距离幂次反比法和克里 结果可知,GA-SVM方法具有较好的学习效果,其 格法)、单纯的支持向量机品位插值方法及矿山生产 计算的平均品位值与生产实际数据相差不大,通过 实际进行了Fe1和Fe3平均品位计算结果的比对分 平均品位计算验证了GA-SVM集成模型的可行性. 表2使用不同方法计算的平均品位值 Table 2 Average grade values calculated by different methods Fel Fe3 计算方法 平均品位/% 相对误差/% 平均品位/% 相对误差/% 生产实际 51.770 36.710 泰森多边形法 52.501 1.41 33.674 8.27 距离幂次反比法 49.902 3.61 32.290 12.00 克里格法 51.352 0.80 32.565 11.29 单纯支持向量机法 51.995 0.43 33.945 7.53 GA-SVM法 51.950 0.34 34.845 5.35 4.2储量验证 人为选取的主观性和随意性,提高了模型的插值精 为进一步验证GA-SVM模型插值的可行性,通 度.而且利用支持向量机的高度非线性性能,从采 过储量计算结果与常规方法、单纯支持向量机方法 样品位数据及其各个影响属性间关系建立的GA 和矿山生产现场实际储量进行对比分析,得出计算 SVM矿体品位插值模型,具有更强的学习性和适 结果如表3所示.由表3储量对比结果可见,GA- 应性.由此可见,经过遗传算法优化的支持向量机 SVM模型较其他几种插值方法更具优势.尤其针 在参数的选择上更加合理,在学习能力和泛化能力 对GA-SVM和单纯支持向量机的对比结果,说明 之间取得了平衡,从而使得矿体品位空间的插值更 通过引入遗传算法,解决了单纯支持向量机法参数 具可靠性和真实性 表3使用不同方法计算的储量值 Table 3 Reserve values calculated by different methods Fel Fe1+Fe3 计算方法 储量/万t 相对误差/% 储量/万t 相对误差/% 生产实际储量 1026.41 1155.20 泰森多边形法 1296.85 26.35 1341.02 16.09 距离幂次反比法 948.09 7.63 1078.16 6.67 克里格法 1014.52 1.16 1120.37 3.02 单纯支持向量机法 1044.99 1.81 1171.98 1.45 GA-SVM法 1036.89 1.02 1145.49 0.84 5 结论 开繁琐且不易求解的理论分析,将非线性问题转化 本文将集成了遗传算法的支持向量机算法应 为线性问题来求解,降低了计算难度 用到矿体品位的插值计算中,一方面拓宽了支持向 (②)提出的集成算法发挥了遗传算法的全局寻 量机和遗传算法的应用范围,更好地发挥其理论优 优特点,有效地优化了品位插值支持向量机的参数. 势,另一方面通过理论与应用领域的结合,形成了 通过分析支持向量机各参数的影响性能,利用遗传 可靠性更好、适应性更强的插值方法.本研究得出 算法的全局寻优能力搜索到最优惩罚参数C、不敏 的结论,主要体现在以下几个方面: 感系数ε和核函数参数σ,克服单纯支持向量机法 (1)支持向量机法具有全局最优、良好的推广 依靠经验确定参数的局限性,使模型参数的选择更 能力,发挥了支持向量机的小样本数据学习优势, 具可靠性.同时利用遗传算法寻优提高了模型的训 解决了矿体品位变异性强的问题.因地矿工程矿体 练速度 形态多样,矿体品位变化规律复杂,故模型样本的 (③)提出的集成算法能够保证品位插值解的唯 设计对模型性能产生一定影响,而通过学习方式避 一性.矿体空间数据的插值问题是对采样数据及
· 842 · 北 京 科 技 大 学 学 报 第 35 卷 的品位插值效果,本文将该方法与三种常规的品位 插值方法 (泰森多边形法、距离幂次反比法和克里 格法)、单纯的支持向量机品位插值方法及矿山生产 实际进行了 Fe1 和 Fe3 平均品位计算结果的比对分 析,如表 2 所示. 由表 2 中不同计算方法下得出的 结果可知,GA-SVM 方法具有较好的学习效果,其 计算的平均品位值与生产实际数据相差不大,通过 平均品位计算验证了 GA-SVM 集成模型的可行性. 表 2 使用不同方法计算的平均品位值 Table 2 Average grade values calculated by different methods 计算方法 Fe1 Fe3 平均品位/% 相对误差/% 平均品位/% 相对误差/% 生产实际 51.770 — 36.710 — 泰森多边形法 52.501 1.41 33.674 8.27 距离幂次反比法 49.902 3.61 32.290 12.00 克里格法 51.352 0.80 32.565 11.29 单纯支持向量机法 51.995 0.43 33.945 7.53 GA-SVM 法 51.950 0.34 34.845 5.35 4.2 储量验证 为进一步验证 GA-SVM 模型插值的可行性,通 过储量计算结果与常规方法、单纯支持向量机方法 和矿山生产现场实际储量进行对比分析,得出计算 结果如表 3 所示. 由表 3 储量对比结果可见,GASVM 模型较其他几种插值方法更具优势. 尤其针 对 GA-SVM 和单纯支持向量机的对比结果,说明 通过引入遗传算法,解决了单纯支持向量机法参数 人为选取的主观性和随意性,提高了模型的插值精 度. 而且利用支持向量机的高度非线性性能,从采 样品位数据及其各个影响属性间关系建立的 GASVM 矿体品位插值模型,具有更强的学习性和适 应性. 由此可见,经过遗传算法优化的支持向量机 在参数的选择上更加合理,在学习能力和泛化能力 之间取得了平衡,从而使得矿体品位空间的插值更 具可靠性和真实性. 表 3 使用不同方法计算的储量值 Table 3 Reserve values calculated by different methods 计算方法 Fe1 Fe1+Fe3 储量/万 t 相对误差/% 储量/万 t 相对误差/% 生产实际储量 1026.41 — 1155.20 — 泰森多边形法 1296.85 26.35 1341.02 16.09 距离幂次反比法 948.09 7.63 1078.16 6.67 克里格法 1014.52 1.16 1120.37 3.02 单纯支持向量机法 1044.99 1.81 1171.98 1.45 GA-SVM 法 1036.89 1.02 1145.49 0.84 5 结论 本文将集成了遗传算法的支持向量机算法应 用到矿体品位的插值计算中,一方面拓宽了支持向 量机和遗传算法的应用范围,更好地发挥其理论优 势,另一方面通过理论与应用领域的结合,形成了 可靠性更好、适应性更强的插值方法. 本研究得出 的结论,主要体现在以下几个方面: (1) 支持向量机法具有全局最优、良好的推广 能力,发挥了支持向量机的小样本数据学习优势, 解决了矿体品位变异性强的问题. 因地矿工程矿体 形态多样,矿体品位变化规律复杂,故模型样本的 设计对模型性能产生一定影响,而通过学习方式避 开繁琐且不易求解的理论分析,将非线性问题转化 为线性问题来求解,降低了计算难度. (2) 提出的集成算法发挥了遗传算法的全局寻 优特点,有效地优化了品位插值支持向量机的参数. 通过分析支持向量机各参数的影响性能,利用遗传 算法的全局寻优能力搜索到最优惩罚参数 C、不敏 感系数 ε 和核函数参数 σ,克服单纯支持向量机法 依靠经验确定参数的局限性,使模型参数的选择更 具可靠性. 同时利用遗传算法寻优提高了模型的训 练速度. (3) 提出的集成算法能够保证品位插值解的唯 一性. 矿体空间数据的插值问题是对采样数据及
第7期 李翠平等:基于遗传算法优化的支持向量机品位插值模型 .843… 其各个影响因子间复杂的非线性函数关系的逼近问 [7]Li J.SVM Based Ore Grade Valuation [Dissertation]. 题,支持向量机法把这种原始问题利用对偶法转化 Beijing:University of Science and Technology Beijing, 为凸二次优化问题,保证了求解对象解的唯一性 2009 (④)提出的集成算法较现有的常规品位估值方 (李娟.基于支持向量机的矿体空间品位估值研究学位论 文].北京:北京科技大学,2009) 法具有更好的通用性和更高的精度.GA-SVM模型 [8 Sebald D J,Bucklew J A.Support vector machine tech- 计算的结果通过与生产实际值以及其他常规插值方 niques for nonlinear equalization.IEEE Trans Signal Pro- 法的对比分析,验证了模型的有效性.说明应用遗 cess,2000,48(11):3217 传算法和支持向量机集成方法进行插值具有更好的 [9]Fan Q F,Chen Y T.Application study of support vector 预测精度和更高的推广性能,具有良好的应用前景. machines.Sci Technol Inf,2009(29):105 (范秋凤,陈彦涛。支持向量机及其应用研究.科技信息 2009(29):105) 参考文献 [10 Mammone A,Turchi M,Cristianini N.Support vector ma- chines.Wiley Interdiscip Rev Comput Stat,2009,1(3): [1]Li C P,Li Z X,Yu D M.Ore grade interpolation based on 283 Thiessen polygon method.J Liaoning Tech Univ,2007, [11]Wahba G,Lin Y.Zhang H.Margin-like quantities and 26(4):488 (李翠平,李仲学,余东明.基于泰森多边形法的空间品位 generalized approximate cross validation for support vec- tor machines /Proceedings of the 1999 IEEE Signal Pro- 插值.辽宁工程技术大学学报,2007,26(4):488) cessing Society Workshop on Neural for Signal Processing [2]Li C P,Li Z X,Hao X Q,et al.Grade and reserve cal- IX.New York,1999:12 culation in a visual simulation system for geological and [12 Gallagher K,Sambridge M.Genetic algorithms:a pow- mining engineering.J Univ Sci Technol Beijing,2007, erful tool for large-scale nonlinear optimization problems. 29(9):859 Comput Geosci,1994,20(7/8):1229 (李翠平,李仲学,郝秀强,等.地矿工程可视化仿真中品位 [13]Deb K.An efficient constraint handling method for ge- 与储量的计算实现.北京科技大学学报,2007,29(9):859) netic algorithms.Comput Methods Appl Mech Eng,2000. [3]Li C P,Li Z X,Hu N L.A comparison of some inter- 186(2-4):311 polation methods oriented toward volume visualization of [14]Huang J T.Research on Parameter Selection of Support mineral deposits.China Min Mag,2003,12(10):57 Vector Machine and its Application in Boiler Unit [Dis- (李翠平,李仲学,胡乃联.面向地矿工程体视化的三种空 sertation].Hangzhou:Zhejiang University,2005 间插值方法之对比分析.中国矿业,2003,12(10少:57) (黄景涛.支持向量机算法参数选择及其在电站锅炉系统 [4]Hu G S.An overview of support vector machines algo- 中的应用研究学位论文].杭州:浙江大学,2005) rithms and its application.Mod Electron Tech,2005(3): [15 Zhou L.The Study on Selecting Parameters of SVM Us- 106 ing Genetic Algorithm [Dissertation].Kunming:Yunnan (胡国胜.支持向量机算法及应用.现代电子技术,2005(3): University,2010 106) (周丽.用遗传算法选择支持向量机参数的研究[学位论 [5]Farquad M A H,Ravi V,Bapi Raju S.Support vector 文].昆明:云南大学,2010) regression based hybrid rule extraction methods for fore- [16 Deng N Y,Tian Y J.Support Vector Machines:Theory, casting.Erpert Syst Appl,2010,37(8):5577 Algorithms and Erpansion.Beijing:Science Press,2009 [6]Li J,Li C P,LiZ X.Grade interpolation in orebody based (邓乃扬,田英杰.支持向量机:理论、算法与拓展.北京: on support vector regression.J Univ Sci Technol Beijing, 科学出版社,2009) 2009,31(12):1498 [17]Cristianini N,Shawe-Taylor J.An Introduction to Sup- (李娟,李翠平,李仲学.基于支持向量回归机的矿体品位 port Vector Machines and Other Kernel-based Learning 插值.北京科技大学学报,2009,31(12):1498) Methods.London:Cambridge University Press,2000
第 7 期 李翠平等:基于遗传算法优化的支持向量机品位插值模型 843 ·· 其各个影响因子间复杂的非线性函数关系的逼近问 题,支持向量机法把这种原始问题利用对偶法转化 为凸二次优化问题,保证了求解对象解的唯一性. (4) 提出的集成算法较现有的常规品位估值方 法具有更好的通用性和更高的精度. GA-SVM 模型 计算的结果通过与生产实际值以及其他常规插值方 法的对比分析,验证了模型的有效性. 说明应用遗 传算法和支持向量机集成方法进行插值具有更好的 预测精度和更高的推广性能,具有良好的应用前景. 参 考 文 献 [1] Li C P, Li Z X, Yu D M. Ore grade interpolation based on Thiessen polygon method. J Liaoning Tech Univ, 2007, 26(4): 488 (李翠平, 李仲学, 余东明. 基于泰森多边形法的空间品位 插值. 辽宁工程技术大学学报, 2007, 26(4): 488) [2] Li C P, Li Z X, Hao X Q, et al. Grade and reserve calculation in a visual simulation system for geological and mining engineering. J Univ Sci Technol Beijing, 2007, 29(9): 859 (李翠平, 李仲学, 郝秀强, 等. 地矿工程可视化仿真中品位 与储量的计算实现. 北京科技大学学报, 2007, 29(9): 859) [3] Li C P, Li Z X, Hu N L. A comparison of some interpolation methods oriented toward volume visualization of mineral deposits. China Min Mag, 2003, 12(10): 57 (李翠平, 李仲学, 胡乃联. 面向地矿工程体视化的三种空 间插值方法之对比分析. 中国矿业, 2003, 12(10): 57) [4] Hu G S. An overview of support vector machines algorithms and its application. Mod Electron Tech, 2005(3): 106 (胡国胜. 支持向量机算法及应用. 现代电子技术, 2005(3): 106) [5] Farquad M A H, Ravi V, Bapi Raju S. Support vector regression based hybrid rule extraction methods for forecasting. Expert Syst Appl, 2010, 37(8): 5577 [6] Li J, Li C P, Li Z X. Grade interpolation in orebody based on support vector regression. J Univ Sci Technol Beijing, 2009, 31(12): 1498 (李娟, 李翠平, 李仲学. 基于支持向量回归机的矿体品位 插值. 北京科技大学学报, 2009, 31(12): 1498) [7] Li J. SVM Based Ore Grade Valuation [Dissertation]. Beijing: University of Science and Technology Beijing, 2009 (李娟. 基于支持向量机的矿体空间品位估值研究 [学位论 文]. 北京:北京科技大学,2009) [8] Sebald D J, Bucklew J A. Support vector machine techniques for nonlinear equalization. IEEE Trans Signal Process, 2000, 48(11): 3217 [9] Fan Q F, Chen Y T. Application study of support vector machines. Sci Technol Inf, 2009(29): 105 (范秋凤, 陈彦涛. 支持向量机及其应用研究. 科技信息, 2009(29): 105) [10] Mammone A, Turchi M, Cristianini N. Support vector machines. Wiley Interdiscip Rev Comput Stat, 2009, 1(3): 283 [11] Wahba G, Lin Y, Zhang H. Margin-like quantities and generalized approximate cross validation for support vector machines // Proceedings of the 1999 IEEE Signal Processing Society Workshop on Neural for Signal Processing IX. New York, 1999: 12 [12] Gallagher K, Sambridge M. Genetic algorithms: a powerful tool for large-scale nonlinear optimization problems. Comput Geosci, 1994, 20(7/8): 1229 [13] Deb K. An efficient constraint handling method for genetic algorithms. Comput Methods Appl Mech Eng, 2000, 186(2-4): 311 [14] Huang J T. Research on Parameter Selection of Support Vector Machine and its Application in Boiler Unit [Dissertation]. Hangzhou: Zhejiang University, 2005 (黄景涛. 支持向量机算法参数选择及其在电站锅炉系统 中的应用研究 [学位论文]. 杭州:浙江大学, 2005) [15] Zhou L. The Study on Selecting Parameters of SVM Using Genetic Algorithm [Dissertation]. Kunming: Yunnan University, 2010 (周丽. 用遗传算法选择支持向量机参数的研究 [学位论 文]. 昆明: 云南大学, 2010) [16] Deng N Y, Tian Y J. Support Vector Machines: Theory, Algorithms and Expansion. Beijing: Science Press, 2009 (邓乃扬, 田英杰. 支持向量机: 理论、算法与拓展. 北京: 科学出版社,2009) [17] Cristianini N, Shawe-Taylor J. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods. London: Cambridge University Press, 2000