工程科学学报 Chinese Journal of Engineering 卷积神经网络在矿区预测中的研究与应用 袁传新贾东宁周生辉 Research and application of convolutional neural network in mining area prediction YUAN Chuan-xin,JIA Dong-ning.ZHOU Sheng-hui 引用本文: 袁传新,贾东宁,周生辉.卷积神经网络在矿区预测中的研究与应用.工程科学学报,2020,42(12):1597-1604.doi: 10.13374j.issn2095-9389.2020.01.02.001 YUAN Chuan-xin,JIA Dong-ning,ZHOU Sheng-hui.Research and application of convolutional neural network in mining area prediction[J].Chinese Journal of Engineering,2020,42(12):1597-1604.doi:10.13374/j.issn2095-9389.2020.01.02.001 在线阅读View online::htps:/ldoi.org10.13374.issn2095-9389.2020.01.02.001 您可能感兴趣的其他文章 Articles you may be interested in 基于卷积神经网络的反无人机系统声音识别方法 Sound recognition method of an anti-UAV system based on a convolutional neural network 工程科学学报.2020.42(11):1516 https:/doi.org10.13374.issn2095-9389.2020.06.30.008 基于深度卷积神经网络的地磁导航方向适配性分析 Direction-matching-suitability analysis for geomagnetic navigation based on convolutional neural networks 工程科学学报.2017,3910:1584htps:ldoi.org10.13374.issn2095-9389.2017.10.018 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报.2020,42(10:1372htps:1doi.org/10.13374.issn2095-9389.2019.10.10.005 BP神经网络F钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报.2017,394:511 https:oi.org10.13374j.issn2095-9389.2017.04.005 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019.41(10:1229 https:/doi.org10.13374.issn2095-9389.2019.03.27.002 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报.2019,41(8:1085htps:/1doi.org/10.13374issn2095-9389.2019.08.014
卷积神经网络在矿区预测中的研究与应用 袁传新 贾东宁 周生辉 Research and application of convolutional neural network in mining area prediction YUAN Chuan-xin, JIA Dong-ning, ZHOU Sheng-hui 引用本文: 袁传新, 贾东宁, 周生辉. 卷积神经网络在矿区预测中的研究与应用[J]. 工程科学学报, 2020, 42(12): 1597-1604. doi: 10.13374/j.issn2095-9389.2020.01.02.001 YUAN Chuan-xin, JIA Dong-ning, ZHOU Sheng-hui. Research and application of convolutional neural network in mining area prediction[J]. Chinese Journal of Engineering, 2020, 42(12): 1597-1604. doi: 10.13374/j.issn2095-9389.2020.01.02.001 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.01.02.001 您可能感兴趣的其他文章 Articles you may be interested in 基于卷积神经网络的反无人机系统声音识别方法 Sound recognition method of an anti-UAV system based on a convolutional neural network 工程科学学报. 2020, 42(11): 1516 https://doi.org/10.13374/j.issn2095-9389.2020.06.30.008 基于深度卷积神经网络的地磁导航方向适配性分析 Direction-matching-suitability analysis for geomagnetic navigation based on convolutional neural networks 工程科学学报. 2017, 39(10): 1584 https://doi.org/10.13374/j.issn2095-9389.2017.10.018 基于集成神经网络的剩余寿命预测 Remaining useful life prediction based on an integrated neural network 工程科学学报. 2020, 42(10): 1372 https://doi.org/10.13374/j.issn2095-9389.2019.10.10.005 BP神经网络IF钢铝耗的预测模型 Prediction model of aluminum consumption with BP neural networks in IF steel production 工程科学学报. 2017, 39(4): 511 https://doi.org/10.13374/j.issn2095-9389.2017.04.005 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 基于BP神经网络的机器人波动摩擦力矩修正方法 Wave friction correction method for a robot based on BP neural network 工程科学学报. 2019, 41(8): 1085 https://doi.org/10.13374/j.issn2095-9389.2019.08.014
工程科学学报.第42卷,第12期:1597-1604.2020年12月 Chinese Journal of Engineering,Vol.42,No.12:1597-1604,December 2020 https://doi.org/10.13374/j.issn2095-9389.2020.01.02.001;http://cje.ustb.edu.cn 卷积神经网络在矿区预测中的研究与应用 袁传新12,贾东宁12)四,周生辉) 1)中国海洋大学信息科学与工程学院,青岛2660002)青岛海洋科学与技术试点国家实验室高性能科学计算与系统仿真平台,青岛 266000 ☒通信作者,E-mail:jiadn@ouc.edu.cn 摘要在研究富钴结壳高产区地形特征基础上,以富钴结壳站点地理坐标为中心,获得了一平方公里的海拔高度数值矩阵 作为地形特征.使用卷积神经网络的分析方法对数值矩阵进行训练,学习坡度和平整度等区域特征,将富钴结壳站点地形和 其他海底地形进行区分.依据训练后获得的模型,对富钴结壳高产区进行预测,取得了较好的预测效果,结合其他因素的影 响,可以提高结壳靶区选取的精准度 关键词富钴结壳:海底地形:数值矩阵:卷积神经网络:矿区预测 分类号P744.3:TP183 Research and application of convolutional neural network in mining area prediction YUAN Chuan-xin2),JIA Dong-ning2,ZHOU Sheng-hu 1)College of Information Science and Engineering,Ocean University of China,Qingdao 266000,China 2)High-performance Scientific Computing and System Simulation Platform,Pilot National Laboratory for Marine Science and Technology (QingDao), Qingdao 266000,China Corresponding author,E-mail:jiadn@ouc.edu.cn ABSTRACT Cobalt-rich crusted deposits are found all over the world's oceans,and their distribution is closely related to the submarine topography.The determination of crusting area is the basic work for the exploration and mining of these deposits.Many factors affect the accumulation of crusts,and topography is a crucial factor.Mineralization forecast requires comprehensive consideration of geological background and experts'views and opinions,the prior knowledge of prospectors is the biggest factor affecting the results.In the course of ocean research,especially with the rapid development of space information technology,a huge amount of ocean data that cover about 70%of the total surface area have been accumulated rapidly;how to extract valuable information from large,fast,complex,and multisource data has become a hot topic in current ocean research.Machine learning-and deep learning- related research methods can read feature signs from mineral data to obtain existing mineral knowledge to further serve mine prediction work.Based on the study of terrain features of cobalt-rich crust in high-producing areas,the numerical matrix of altitude of 1 km2ocean surface was obtained,with the geographical coordinates of cobalt-rich crust sites as the center.Using the analysis method of convolutional neural network,the numerical matrix is trained to learn regional features such as slope and flatness and to distinguish the cobalt-rich crust-crust site topography from other submarine topography.According to the training model,the high-producing cobalt- rich crusting area was predicted and better forecasting value is obtained.Meanwhile,the accuracy of the selection of crusting target area was improved by combining the influence of other factors. KEY WORDS cobalt-rich crust;seafloor terrain;numerical matrix;convolutional neural network;mining area forecast 收稿日期:2020-01-02 基金项目:海洋大数据中心资助项目(2018SDPT01)
卷积神经网络在矿区预测中的研究与应用 袁传新1,2),贾东宁1,2) 苣,周生辉2) 1) 中国海洋大学信息科学与工程学院,青岛 266000 2) 青岛海洋科学与技术试点国家实验室高性能科学计算与系统仿真平台,青岛 266000 苣通信作者,E-mail:jiadn@ouc.edu.cn 摘 要 在研究富钴结壳高产区地形特征基础上,以富钴结壳站点地理坐标为中心,获得了一平方公里的海拔高度数值矩阵 作为地形特征. 使用卷积神经网络的分析方法对数值矩阵进行训练,学习坡度和平整度等区域特征,将富钴结壳站点地形和 其他海底地形进行区分. 依据训练后获得的模型,对富钴结壳高产区进行预测,取得了较好的预测效果,结合其他因素的影 响,可以提高结壳靶区选取的精准度. 关键词 富钴结壳;海底地形;数值矩阵;卷积神经网络;矿区预测 分类号 P744.3; TP183 Research and application of convolutional neural network in mining area prediction YUAN Chuan-xin1,2) ,JIA Dong-ning1,2) 苣 ,ZHOU Sheng-hui2) 1) College of Information Science and Engineering, Ocean University of China, Qingdao 266000, China 2) High-performance Scientific Computing and System Simulation Platform, Pilot National Laboratory for Marine Science and Technology (QingDao), Qingdao 266000, China 苣 Corresponding author, E-mail: jiadn@ouc.edu.cn ABSTRACT Cobalt-rich crusted deposits are found all over the world ’s oceans, and their distribution is closely related to the submarine topography. The determination of crusting area is the basic work for the exploration and mining of these deposits. Many factors affect the accumulation of crusts, and topography is a crucial factor. Mineralization forecast requires comprehensive consideration of geological background and experts ’ views and opinions, the prior knowledge of prospectors is the biggest factor affecting the results. In the course of ocean research, especially with the rapid development of space information technology, a huge amount of ocean data that cover about 70% of the total surface area have been accumulated rapidly; how to extract valuable information from large, fast, complex, and multisource data has become a hot topic in current ocean research. Machine learning- and deep learningrelated research methods can read feature signs from mineral data to obtain existing mineral knowledge to further serve mine prediction work. Based on the study of terrain features of cobalt-rich crust in high-producing areas, the numerical matrix of altitude of 1 km2 ocean surface was obtained, with the geographical coordinates of cobalt-rich crust sites as the center. Using the analysis method of convolutional neural network, the numerical matrix is trained to learn regional features such as slope and flatness and to distinguish the cobalt-rich crust–crust site topography from other submarine topography. According to the training model, the high-producing cobaltrich crusting area was predicted and better forecasting value is obtained. Meanwhile, the accuracy of the selection of crusting target area was improved by combining the influence of other factors. KEY WORDS cobalt-rich crust;seafloor terrain;numerical matrix;convolutional neural network;mining area forecast 收稿日期: 2020−01−02 基金项目: 海洋大数据中心资助项目(2018SDPT01) 工程科学学报,第 42 卷,第 12 期:1597−1604,2020 年 12 月 Chinese Journal of Engineering, Vol. 42, No. 12: 1597−1604, December 2020 https://doi.org/10.13374/j.issn2095-9389.2020.01.02.001; http://cje.ustb.edu.cn
1598 工程科学学报,第42卷,第12期 富钴结壳是继大洋多金属结核之后发现的又 用大量的输人和输出得出映射关系⑧,其中卷积神 一深海固体矿产资源,堆积在海底岩石和岩屑表 经网络从复杂数据中提取特征表现突出,在诸多 面,主要由氢氧化物和铁锰氧化物组成.结壳除了 领域被广泛应用,特别是图像分类领域取得了非 钴元素外,还富含稀土元素和其他的许多金属,例 常好的效果四.卷积神经网络结构与数值矩阵能够 如铁、镁、镍、铜、锌等,具有非常高的开采价值四 更好吻合,自动完成特征提取,其权重共享机制可 富钴结壳的形成和其他矿产资源一样,是非常缓 以降低网络复杂性,适合本文基于数值矩阵的地 慢的自然生成过程,每100万年只能产生1至6mm 形特征区分类找矿任务 的结壳.矿床主要分布于碳酸盐补偿深度(CCD) 本文从结壳矿区的地形特征出发,利用卷积 以上、最低含氧层以下水深500~3500m的平顶 神经网络对大量的数值矩阵训练学习得到预测模 海山、海台顶部和斜坡的表面2-海洋里有诸多 型,对矿区靶点进行预测.另外,对本文方法的应 海山,仅仅在太平洋区域广义海山有约50000多 用及后序研究工作进行了展望 座,高度大于1000m的海山就有约8000多座阿 1研究现状 富钴结壳矿床有非常高的经济价值,估计潜在资 源量达10亿吨阿.富钴结壳是海洋中典型的水成 自1959年国内就开始出现了找矿靶区的相关 成因的矿产资源,由于形成于古海洋和古沉积环 研究,随着研究的深入,出现越来越多与“找矿靶 境,除了资源本身的经济价值,富钴结壳还记录了 区”相关的关键词©.找矿使用的方法一般有经验 海洋和气候的演化历史,具有非常高的环境研究 类比法、综合信息法和数学模型法等,逐渐从经验 价值可.正是由于具有巨大的经济价值和环境价 找矿向理论和科学找矿过渡.如.刘泉清等提出利 值,钴结壳资源一直是海洋调查的重点.我国富钴 用经验法和化学普查相结合的方法杨恒书等 结壳资源的调查开展的比较晚,90年代末才系统 创用浓度级次值特征对比模型和相近率线性模 的开展起来,投入巨资开展了若干综合航次调查, 型,中国科学院地质与地球物理研究所总结提 至今20多年的时间也仅仅调查了几十座海山 出“三场异常互相约束”预测新理论),张庆华等 1997~2002年的航次主要是选择靶区的侦察性调 提出物探、化探与遥感相结合的方法.随着科学 查,使用多波束、浅剖、重磁、海底摄像和温盐探 技术的发展与研究的不断深人,诸多新技术、新方 仪(CTD)等的环境勘测和使用抓斗、拖网等的地 法被应用到找矿中来.智能找矿方法是在地质类 质取样调查.2002年以后的航次对部分调查过的 比法和模型法应用的基础上,结合计算机技术,将 海山进行加密采样,调查方法增加了可视抓斗、可 已有的专家经验和一定的矿床模型输入计算机, 视浅剖等?无论是初始侦察点的选择还是之后对 建立起预测模型系统,将研究区的有关资料输入, 整个矿区的圈定,都需要对大范围的诸多海域进 在此基础上进行评判.如,王世称主导的综合信息 行大规模的海山结壳资源调查.科考船需要对未 矿产预测系统),赵鹏大的大比例尺矿床统计预 知的区域进行随机靶点调查,且对于确定的结壳 测专家系统6等.深度学习和机器学习迅猛发展, 矿区的边界的界定还需要进行大量的勘察工作, 硬件技术的进步,简洁的python语言、完善的深度 这些都将耗费大量的人力、物力和时间 学习框架Tensorflow以及基于Theano/Tensorflow 科考船对不同海域多年的普查工作积累了大 更简单易上手的高阶框架Keras,.推动了智能找矿 量的宝贵资料和数据,并且这些数据正在以指数 发展.已有许多学者投入到机器学习与找矿以及 级的形式增长.如何把这些数据合理的运用起来, 成矿预测的研究中来,如徐述腾和周永章以吉林 促进海洋地质的研究进展,成为了科研工作者关 夹皮沟金矿和河北石湖金矿的黄铁矿、黄铜矿等 注的热点问题.作为大数据分析和处理的重要技 为例,设计了Unet卷积神经网络模型,实现了镜下 术手段,机器学习方法在找矿领域也得到了广泛 矿石矿物识别分类叨:刘艳鹏等通过卷积神经网 应用.研究发现,地形是结壳富集的一个重要因 络算法挖掘Pb分布特征与矿体地下就位空间的 素,富钴结壳富集区具有坡度、平整度等明显的地 耦合相关性进行矿产资源预测,肖壮等提出基 形特征.随着遥感等技术的进步,海拔高度的获取 于深度学习的矿区韧性剪切带找矿研究等.然 更加精确,利用密集采点的海拔高度矩阵作为区 而,大部分研究是以陆地矿为基础的,海洋底部矿 域地形特征,具有较高的区分度.机器学习的分支 区的找矿工作要复杂许多,迫切需要在找矿靶区 深度学习善于处理多维数据错综复杂的关系,运 的选取方面进行改进,增加成功找到矿区的可能
富钴结壳是继大洋多金属结核之后发现的又 一深海固体矿产资源,堆积在海底岩石和岩屑表 面,主要由氢氧化物和铁锰氧化物组成. 结壳除了 钴元素外,还富含稀土元素和其他的许多金属,例 如铁、镁、镍、铜、锌等,具有非常高的开采价值[1] . 富钴结壳的形成和其他矿产资源一样,是非常缓 慢的自然生成过程,每 100 万年只能产生 1 至 6 mm 的结壳. 矿床主要分布于碳酸盐补偿深度(CCD) 以上、最低含氧层以下水深 500~3500 m 的平顶 海山、海台顶部和斜坡的表面[2−4] . 海洋里有诸多 海山,仅仅在太平洋区域广义海山有约 50000 多 座,高度大于 1000 m 的海山就有约 8000 多座[5] . 富钴结壳矿床有非常高的经济价值,估计潜在资 源量达 10 亿吨[6] . 富钴结壳是海洋中典型的水成 成因的矿产资源,由于形成于古海洋和古沉积环 境,除了资源本身的经济价值,富钴结壳还记录了 海洋和气候的演化历史,具有非常高的环境研究 价值[7] . 正是由于具有巨大的经济价值和环境价 值,钴结壳资源一直是海洋调查的重点. 我国富钴 结壳资源的调查开展的比较晚,90 年代末才系统 的开展起来,投入巨资开展了若干综合航次调查, 至今 20 多年的时间也仅仅调查了几十座海山. 1997~2002 年的航次主要是选择靶区的侦察性调 查,使用多波束、浅剖、重磁、海底摄像和温盐探 仪(CTD)等的环境勘测和使用抓斗、拖网等的地 质取样调查. 2002 年以后的航次对部分调查过的 海山进行加密采样,调查方法增加了可视抓斗、可 视浅剖等[7] . 无论是初始侦察点的选择还是之后对 整个矿区的圈定,都需要对大范围的诸多海域进 行大规模的海山结壳资源调查. 科考船需要对未 知的区域进行随机靶点调查,且对于确定的结壳 矿区的边界的界定还需要进行大量的勘察工作, 这些都将耗费大量的人力、物力和时间. 科考船对不同海域多年的普查工作积累了大 量的宝贵资料和数据,并且这些数据正在以指数 级的形式增长. 如何把这些数据合理的运用起来, 促进海洋地质的研究进展,成为了科研工作者关 注的热点问题. 作为大数据分析和处理的重要技 术手段,机器学习方法在找矿领域也得到了广泛 应用. 研究发现,地形是结壳富集的一个重要因 素,富钴结壳富集区具有坡度、平整度等明显的地 形特征. 随着遥感等技术的进步,海拔高度的获取 更加精确,利用密集采点的海拔高度矩阵作为区 域地形特征,具有较高的区分度. 机器学习的分支 深度学习善于处理多维数据错综复杂的关系,运 用大量的输入和输出得出映射关系[8] . 其中卷积神 经网络从复杂数据中提取特征表现突出,在诸多 领域被广泛应用,特别是图像分类领域取得了非 常好的效果[9] . 卷积神经网络结构与数值矩阵能够 更好吻合,自动完成特征提取,其权重共享机制可 以降低网络复杂性,适合本文基于数值矩阵的地 形特征区分类找矿任务. 本文从结壳矿区的地形特征出发,利用卷积 神经网络对大量的数值矩阵训练学习得到预测模 型,对矿区靶点进行预测. 另外,对本文方法的应 用及后序研究工作进行了展望. 1 研究现状 自 1959 年国内就开始出现了找矿靶区的相关 研究,随着研究的深入,出现越来越多与“找矿靶 区”相关的关键词[10] . 找矿使用的方法一般有经验 类比法、综合信息法和数学模型法等,逐渐从经验 找矿向理论和科学找矿过渡. 如,刘泉清等提出利 用经验法和化学普查相结合的方法[11] ,杨恒书等 创用浓度级次值特征对比模型和相近率线性模 型[12] ,中国科学院地质与地球物理研究所总结提 出“三场异常互相约束”预测新理论[13] ,张庆华等 提出物探、化探与遥感相结合的方法[14] . 随着科学 技术的发展与研究的不断深入,诸多新技术、新方 法被应用到找矿中来. 智能找矿方法是在地质类 比法和模型法应用的基础上,结合计算机技术,将 已有的专家经验和一定的矿床模型输入计算机, 建立起预测模型系统,将研究区的有关资料输入, 在此基础上进行评判. 如,王世称主导的综合信息 矿产预测系统[15] ,赵鹏大的大比例尺矿床统计预 测专家系统[16] 等. 深度学习和机器学习迅猛发展, 硬件技术的进步,简洁的 python 语言、完善的深度 学习框架 Tensorflow 以及基于 Theano/Tensorflow 更简单易上手的高阶框架 Keras,推动了智能找矿 发展. 已有许多学者投入到机器学习与找矿以及 成矿预测的研究中来,如徐述腾和周永章以吉林 夹皮沟金矿和河北石湖金矿的黄铁矿、黄铜矿等 为例,设计了 Unet 卷积神经网络模型,实现了镜下 矿石矿物识别分类[17] ;刘艳鹏等通过卷积神经网 络算法挖掘 Pb 分布特征与矿体地下就位空间的 耦合相关性进行矿产资源预测[18] ,肖壮等提出基 于深度学习的矿区韧性剪切带找矿研究[19] 等. 然 而,大部分研究是以陆地矿为基础的,海洋底部矿 区的找矿工作要复杂许多,迫切需要在找矿靶区 的选取方面进行改进,增加成功找到矿区的可能 · 1598 · 工程科学学报,第 42 卷,第 12 期
袁传新等:卷积神经网络在矿区预测中的研究与应用 1599· 性,减少时间和人力、物力成本 裸露岩石成为结壳生长有利位置.对本文获得的 2地形特征与理论方法 数值矩阵计算坡度值得表1,坡度大部分处在 8°~12°范围内,坡度较陡的地形较少 2.1海山富钴结壳矿区地形特征 结壳的形成及其丰度变化受控于诸多因素, 表1地形坡度统计 经纬度、区域地质构造、水深、地形和水文等都会 Table 1 Topographic slope statistics 对结壳的生长产生重要影响0例如,海山经纬度 Slope/() Ratio/% 位置决定了海山洋流速度以及流向,进而决定了 12 21.43 结壳大部分分布在水深1000~3000m范围内:结 分析认为,富钴结壳在一定范围内的坡度和 壳的产生来源于海水中的微生物和钙质粒子,水 平整度的海山区域容易生长富集,具备明显的分 文环境也是一个重要因素.研究认为,结壳分布与 类特征,可以作为找矿靶点的依据.运用容易获得 海山的地形特征具有一定的关系,控制作用效果 也比较明显四.结壳产生于各大洋区的水下高地, 的海拔高度矩阵作为地形特征,并采集大量的正 海山和岛屿斜坡是主要富集区,海山对结壳成矿 负样本,使用在分类问题上表现优异的卷积神经 网络进行二分类,进而成为富钴结壳矿区和结壳 具有重要意义,三大洋中,太平洋海山富钴结壳矿 富集海山选定的参考依据,具有现实意义 点的分布比例占到了73.3%.在空间上,海山山顶 2.2数据处理方法 区一般为微结核发育区,在海山的局部高地会有 2.2.1数据标准化 结壳生长成矿四海山分为尖顶海山和平顶海山 数据标准化(归一化)的目标是突出主要特征 两大类,尖顶海山山顶、边缘、上部斜坡及中部斜 的作用.弱化次要特征的影响.富钴结壳在不同海 坡区山脊部位最容易成矿,平顶海山边缘和除陡 崖外的上部斜坡区成矿率也较高P] 拔高度位置均有站点,地形矩阵数值分布在 图1表征了本文数值矩阵反应的地形特征,横 -4000~-800m之间,跟前文提及富钴结壳主要分 纵坐标表示各海拔取值点相对于第一个点的水平 布在1000~3000m范围内基本一致.不同的矩阵 数值的平均高度差别很大,而需要考虑的主要因 方向距离d,和d,竖坐标轴表示各取点海拔高度 素是整个矩阵反应的地形特征,高度数值的大小 h,均以米为单位.从形态学上讲,海山的形态要素 属于次要因素,因此要处理高度之间的差别 主要包括海山坡度、海山表面平整度2,因此要考 常用的两种数据标准化的方法是min-max和 虑的因素主要有坡度和海山微地貌特征.地形坡 度太小,海水中的物质不容易沉积:在地形坡度较 Z-cores.min-max标准化对原始数据进行变换,把 大的地方,结壳生长过程中容易塌落2阿坡度较大 结果值范围映射到0~1之间,函数为(1),min和 max分别为最小值和最大值.Z-cores标准化处理 和坡度较小都不利于结壳的形成.根据矿物质沉 数据使之符合标准正态分布,函数为公式(2), 积理论,颗粒最容易在凸起的部分聚集,山坡上的 u和o分别为样本均值和方差.本文对min-max 标准化方法做了改变,首先计算所有矩阵的max与min -2050 之差,取差值的最大值MAX,然后将公式(1)中分 -2100 母部分替换为MAX,函数为公式(3),目的在于防 -2150是 止崎岖地形与平缓地形混淆 -2200 x=(x-min)/(max-min) (1) -2250 (2) 50 x=(x-M)/o x=(x-min)/MAX (3) 0 30 10 20 0 dm 2.2.2插值算法 30 d/m 40 50 0 双线性插值算法根据插值点最接近的4个点 图1局部海山地形 的像素值进行计算.设(什山,什)为坐标变换后浮 Fig.I Local seamount terrain 点坐标,i,)为坐标(位,)位置的像素值,什山
性,减少时间和人力、物力成本. 2 地形特征与理论方法 2.1 海山富钴结壳矿区地形特征 结壳的形成及其丰度变化受控于诸多因素, 经纬度、区域地质构造、水深、地形和水文等都会 对结壳的生长产生重要影响[20] . 例如,海山经纬度 位置决定了海山洋流速度以及流向,进而决定了 结壳的附着程度、丰度以及类型;大量的研究成果 以及统计数据表明,水深影响结壳的生长和富集, 结壳大部分分布在水深 1000~3000 m 范围内;结 壳的产生来源于海水中的微生物和钙质粒子,水 文环境也是一个重要因素. 研究认为,结壳分布与 海山的地形特征具有一定的关系,控制作用效果 也比较明显[21] . 结壳产生于各大洋区的水下高地, 海山和岛屿斜坡是主要富集区,海山对结壳成矿 具有重要意义. 三大洋中,太平洋海山富钴结壳矿 点的分布比例占到了 73.3%. 在空间上,海山山顶 区一般为微结核发育区,在海山的局部高地会有 结壳生长成矿[22] . 海山分为尖顶海山和平顶海山 两大类,尖顶海山山顶、边缘、上部斜坡及中部斜 坡区山脊部位最容易成矿,平顶海山边缘和除陡 崖外的上部斜坡区成矿率也较高[23] . 图 1 表征了本文数值矩阵反应的地形特征,横 纵坐标表示各海拔取值点相对于第一个点的水平 方向距离 d1 和 d2,竖坐标轴表示各取点海拔高度 h,均以米为单位. 从形态学上讲,海山的形态要素 主要包括海山坡度、海山表面平整度[24] ,因此要考 虑的因素主要有坡度和海山微地貌特征. 地形坡 度太小,海水中的物质不容易沉积;在地形坡度较 大的地方,结壳生长过程中容易塌落[25] . 坡度较大 和坡度较小都不利于结壳的形成. 根据矿物质沉 积理论,颗粒最容易在凸起的部分聚集,山坡上的 裸露岩石成为结壳生长有利位置. 对本文获得的 数值矩阵计算坡度值得 表 1,坡度大部分处 在 8º~12º范围内,坡度较陡的地形较少. 分析认为,富钴结壳在一定范围内的坡度和 平整度的海山区域容易生长富集,具备明显的分 类特征,可以作为找矿靶点的依据. 运用容易获得 的海拔高度矩阵作为地形特征,并采集大量的正 负样本,使用在分类问题上表现优异的卷积神经 网络进行二分类,进而成为富钴结壳矿区和结壳 富集海山选定的参考依据,具有现实意义. 2.2 数据处理方法 2.2.1 数据标准化 数据标准化(归一化)的目标是突出主要特征 的作用,弱化次要特征的影响. 富钴结壳在不同海 拔高度位置均有站点 ,地形矩阵数值分布在 −4000~−800 m 之间,跟前文提及富钴结壳主要分 布在 1000~3000 m 范围内基本一致. 不同的矩阵 数值的平均高度差别很大,而需要考虑的主要因 素是整个矩阵反应的地形特征,高度数值的大小 属于次要因素,因此要处理高度之间的差别. 常用的两种数据标准化的方法是 min−max 和 Z-cores. min−max 标准化对原始数据进行变换,把 结果值范围映射到 0~1 之间,函数为(1),min 和 max 分别为最小值和最大值. Z-cores 标准化处理 数据使之符合标准正态分布 ,函数为公式( 2) , μ 和 σ 分别为样本均值和方差. 本文对 min−max 标准化方法做了改变,首先计算所有矩阵的max 与min 之差,取差值的最大值 MAX,然后将公式(1)中分 母部分替换为 MAX,函数为公式(3),目的在于防 止崎岖地形与平缓地形混淆. x= (x−min)/(max−min) (1) x = (x−µ)/σ (2) x= (x−min)/MAX (3) 2.2.2 插值算法 双线性插值算法根据插值点最接近的 4 个点 的像素值进行计算. 设 (i+u, j+v) 为坐标变换后浮 点坐标 , f(i, j) 为 坐 标 (i, j) 位置的像素值 , f(i+u, 表 1 地形坡度统计 Table 1 Topographic slope statistics Slope/(°) Ratio/% 12 21.43 0 10 20 30 d1 /m d2 /m h/m 40 50 0 10 20 30 40 50 −2250 −2200 −2150 −2100 −2050 图 1 局部海山地形 Fig.1 Local seamount terrain 袁传新等: 卷积神经网络在矿区预测中的研究与应用 · 1599 ·
·1600 工程科学学报,第42卷,第12期 什)即为坐标变换后的像素值,其中i、j为整数部 区域坐标数据提取了网格型数值矩阵,对数据进 分,u、v为小数部分2)则这个像素值可由公式(4) 行调整后,分别使用Conv-3、VGGNet 16和两个修 得出.该算法保证了插值曲线的平滑性,弥补了最 改后的VGGNet 16结构进行对比实验 近邻算法的不足,是插值效果和运算速度相对较 3.1数据来源 优的算法,也是使用最广泛的 正样本原始数据来源于国际海底管理局 f(i+w,j+v)=(1-u)×(1-v)+(1-w)×v×f(i,i+1)+ (ISA)的富钴结壳主量元素标准数据集,由国家海 u×(1-v)×fi+1,)+u×v×fi+1,i+1) 洋科学数据共享服务平台提供.数据量共计 (4) 1203站,3286个样品,空间范围覆盖全球大部分海 2.3模型结构 域(-180°~180E,-64.18°~56.17N).剔除一些坐 本文的数值矩阵代表的是矿区地形,每一个 标分布较密集区域的坐标,实际使用1100个站点 数值都有空间位置关系,相当于图像中的像素点 用来作为提取数值矩阵正样本的基准数据.调用 因此,与特征提取和支持向量机(SVM)、随机森林 Google Earth软件的APL,在全球以100km为步长 等传统统计方法结合相比,使用更适合图像处理 提取共计12万坐标以及海拔高度信息,从中随机 的卷积神经网络.卷积神经网络与传统深层神经 均匀选取15200个海拔高度在-4000~-800m之 网络相比,可以明显降低模型规模.并且识别性能 间的坐标信息作为原始数据的负样本的基准坐标 最好,泛化能力最强2 数据.在负样本中有一定的存在噪声的可能性(即 针对数据集特性,搭建了适合本文区分类找 可能为富钴结壳矿区),因为可能性非常小,可以 矿研究的Conv-3模型.图2给出了Conv-3模型的 认为有较高的可信度 结构图,该卷积神经网络网络共包含7层:一个输 正负样本基准地理坐标信息被存储为26份文 入层,三个卷积层C1、C2和C3,两个全连接层 本,分布于26台计算机上.在每一台电脑上运行 F4和F5,一个输出层.在该模型中,输入层的输入 Google Earth和在Visual Studio上基于C++的数据 为50×50的数值矩阵,卷积层均使用16个5×5的 提取程序.程序自动读取文本文件的每一个坐标 卷积核,全连接层分别使用2048和128个神经元. (A,B),以(A,B)为中心点,以C为步长的度数表示, 输出层使用softmax函数进行分类 在0.8~1km范围内从经度A-25×C到A+25×C、 VGGNet16是一种深度卷积神经网络结构,通 纬度B-25×C到B+25×C调用Google Earth软件的 过不断深化网络结构提高性能2,在此结构中卷 API提取50×50的海拔高度数值矩阵 积层均使用3×3的卷积核,池化层使用的是Max- 本文最终获得了共计16200个存储海拔高度 pooling.为了满足实验要求,本文使用插值算法对 数值矩阵的文本,其中正样本1100个,负样本 输入的数值矩阵进行扩充,修改两层全连接层神 15200个.因为正样本数据量过小,而地型特征具 经元个数为2048、512,又分别采用(1)更改池化层 有旋转、翻转的不变性,利用这些特性将正样本的 为Max-pooling和(2)更改卷积层卷积核为3×3进 数据扩充为原来的8倍,得到8000个正样本,最终 行对比实验 使用正负样本共计24000个地形数据 3.2 3 实验过程 数据处理及算法实现 对于正负样本的数据,使用文件名作为标签 本文使用已知的富钴结壳站点的坐标和未知 的标注,在程序中使用OS模块读取文件名,将正 Feature Feature Feature Hidden Hidden maps maps units Outputs 1@50x50 16@48×48 16@48×48 16@48×48 2048 Max-pooling Max-pooling Max-pooling Flatten Fully Fully 5x5 kemel 5x5 kernel 5x5 kernel connected connected 图2Conv-3结构图 Fig.2 Conv-3 schematic
j+v) 即为坐标变换后的像素值,其中 i、j 为整数部 分,u、v 为小数部分[25] . 则这个像素值可由公式(4) 得出. 该算法保证了插值曲线的平滑性,弥补了最 近邻算法的不足,是插值效果和运算速度相对较 优的算法,也是使用最广泛的. f (i+u, j+v) = (1−u)×(1−v)+(1−u)×v× f (i, j+1)+ u×(1−v)× f(i+1, j)+u×v× f(i+1, j+1) (4) 2.3 模型结构 本文的数值矩阵代表的是矿区地形,每一个 数值都有空间位置关系,相当于图像中的像素点. 因此,与特征提取和支持向量机(SVM)、随机森林 等传统统计方法结合相比,使用更适合图像处理 的卷积神经网络. 卷积神经网络与传统深层神经 网络相比,可以明显降低模型规模,并且识别性能 最好,泛化能力最强[26] . 针对数据集特性,搭建了适合本文区分类找 矿研究的 Conv-3 模型. 图 2 给出了 Conv-3 模型的 结构图,该卷积神经网络网络共包含 7 层:一个输 入层 ,三个卷积层 C1、 C2 和 C3,两个全连接层 F4 和 F5,一个输出层. 在该模型中,输入层的输入 为 50×50 的数值矩阵,卷积层均使用 16 个 5×5 的 卷积核,全连接层分别使用 2048 和 128 个神经元, 输出层使用 softmax 函数进行分类. VGGNet16 是一种深度卷积神经网络结构,通 过不断深化网络结构提高性能[27] ,在此结构中卷 积层均使用 3×3 的卷积核,池化层使用的是 Max− pooling. 为了满足实验要求,本文使用插值算法对 输入的数值矩阵进行扩充,修改两层全连接层神 经元个数为 2048、512,又分别采用(1)更改池化层 为 Max−pooling 和(2)更改卷积层卷积核为 3×3 进 行对比实验. 3 实验过程 本文使用已知的富钴结壳站点的坐标和未知 区域坐标数据提取了网格型数值矩阵,对数据进 行调整后,分别使用 Conv-3、VGGNet 16 和两个修 改后的 VGGNet 16 结构进行对比实验. 3.1 数据来源 正样本原始数据来源于国际海底管理局 (ISA)的富钴结壳主量元素标准数据集,由国家海 洋科学数据共享服务平台提供 . 数据量共 计 1203 站,3286 个样品,空间范围覆盖全球大部分海 域(−180°~180°E,−64.18°~56.17°N). 剔除一些坐 标分布较密集区域的坐标,实际使用 1100 个站点 用来作为提取数值矩阵正样本的基准数据. 调用 Google Earth 软件的 API,在全球以 100 km 为步长 提取共计 12 万坐标以及海拔高度信息,从中随机 均匀选取 15200 个海拔高度在−4000~−800 m 之 间的坐标信息作为原始数据的负样本的基准坐标 数据. 在负样本中有一定的存在噪声的可能性(即 可能为富钴结壳矿区),因为可能性非常小,可以 认为有较高的可信度. 正负样本基准地理坐标信息被存储为 26 份文 本,分布于 26 台计算机上. 在每一台电脑上运行 Google Earth 和在 Visual Studio 上基于 C++的数据 提取程序. 程序自动读取文本文件的每一个坐标 (A,B),以(A,B)为中心点,以 C 为步长的度数表示, 在 0.8~1 km2 范围内从经度 A−25×C 到 A+25×C、 纬度 B−25×C 到 B+25×C 调用 Google Earth 软件的 API 提取 50×50 的海拔高度数值矩阵. 本文最终获得了共计 16200 个存储海拔高度 数值矩阵的文本 ,其中正样 本 1100 个 ,负样 本 15200 个. 因为正样本数据量过小,而地型特征具 有旋转、翻转的不变性,利用这些特性将正样本的 数据扩充为原来的 8 倍,得到 8000 个正样本,最终 使用正负样本共计 24000 个地形数据. 3.2 数据处理及算法实现 对于正负样本的数据,使用文件名作为标签 的标注,在程序中使用 OS 模块读取文件名,将正 Inputs 1@50×50 Feature maps 16@48×48 Feature maps 16@48×48 Max-pooling 5×5 kernel Max-pooling 5×5 kernel Max-pooling 5×5 kernel Flatten Fully connected Hidden units 2048 Hidden units 128 Outputs 1 Fully connected Feature maps 16@48×48 图 2 Conv-3 结构图 Fig.2 Conv-3 schematic · 1600 · 工程科学学报,第 42 卷,第 12 期
袁传新等:卷积神经网络在矿区预测中的研究与应用 ·1601· 负样本分别标注为I和O.使用Numpy数值计算 库以矩阵的形式读取每一个文本,对矩阵的每一 11.0 个数值x1,更新数值x=(一min)/MAX,更新后的 0.8 数据如图3所示 0.6 0.4 0.2 10.8 0.7 0.6 0.5 10 20 30 dim d/m 40 0.2 50 0 0.1 图4同一陡坡矩阵的两种标淮化结果 40 Fig.4 Example of processed data 30 0 10 2 20 30 10 dm 1l2×I12,使用opencv的cvtColor函数将单通道数 d/m 40 50 0 值矩阵转换为3通道, 图3处理后的数据示例 本文算法的实现基于python语言,使用Numpy Fig.3 Example terrain of processed data 数值计算库和Opencv计算机视觉库进行数据读 此种做法针对本文实验数据存在两点优点, 入和预处理,基于深度学习高阶API Keras搭建了 一是如前文所述,计算所有矩阵最大值与最小值 4种神经网络结构,实验结果的展示使用python 差值,取最大差值MAX为分母,解决了使用原始 的Matplotlib模块 方法平地和崎岖地形分不开问题;二是取得每一 33实验结果与分析 个矩阵的最大值max1和最小值min,使用MAX 对24000个地形矩阵数值矩阵进行区分类, 和(max1min)的最大值Max为分母,防止对于新 19200个作为训练集,4800个作为测试集,其中训 数据处理后出现矩阵大于1的情况.如图4所示, 练集划分20%作为验证集.本文使用多种网络结 橙色表示使用min-max方法数据标准化的结果, 构对训练集进行训练,并对几种取得较好结果的 任何矩阵都被拉伸至范围0~1,会混淆平地和陡 模型效果图进行展示 坡,影响各矩阵相对坡度特征;蓝色表示使用统一 从图5来看,左图训练集和验证集的L0ss值逐 参数MAX标准化的结果,保留了各矩阵原有的相 渐下降,右图训练集和验证机Accuracy逐渐上升, 对坡度特征不变. 且两图曲线均呈收敛态势,说明Conv-3训练模型 另外,VGGnet16要求数值矩阵的大小至少为 对已有数据是有效的.从Loss曲线可以看出在训练 48×48,且必须为3通道.为了网络模型的要求,并 到65轮后验证集Loss开始高于训练集Loss且差 保证原始矩阵反应的地形特征不变,在进行对比 值有扩大的趋势,产生过拟合,说明在65轮时模型 实验时本文使用双线性插值将数值矩阵扩大为 取得最好效果,此时准确率为0.8246,Loss为0.415. 0.65 (a) 0.84 (b) 0.82 0.60 0.80 0.55 30.76 0.50 0.74 -Train -Train -Validation 0.72 -Validation 0.45 0.70 0.40 0.68 0 20 40 60 80 100 0 20 40 60 80 100 Epochs Epochs 图5Conv-3的损失曲线(a)和准确率(b) Fig.5 Conv-3 loss (a)and accuracy (b)
负样本分别标注为 1 和 0. 使用 Numpy 数值计算 库以矩阵的形式读取每一个文本,对矩阵的每一 个数值 x1,更新数值 x1= (x1−min)/MAX,更新后的 数据如图 3 所示. 此种做法针对本文实验数据存在两点优点, 一是如前文所述,计算所有矩阵最大值与最小值 差值,取最大差值 MAX 为分母,解决了使用原始 方法平地和崎岖地形分不开问题;二是取得每一 个矩阵的最大值 max1 和最小值 min1,使用 MAX 和(max1−min1)的最大值 Max 为分母,防止对于新 数据处理后出现矩阵大于 1 的情况. 如图 4 所示, 橙色表示使用 min−max 方法数据标准化的结果, 任何矩阵都被拉伸至范围 0~1,会混淆平地和陡 坡,影响各矩阵相对坡度特征;蓝色表示使用统一 参数 MAX 标准化的结果,保留了各矩阵原有的相 对坡度特征不变. 另外,VGGnet 16 要求数值矩阵的大小至少为 48×48,且必须为 3 通道. 为了网络模型的要求,并 保证原始矩阵反应的地形特征不变,在进行对比 实验时本文使用双线性插值将数值矩阵扩大为 112×112,使用 opencv 的 cvtColor 函数将单通道数 值矩阵转换为 3 通道. 本文算法的实现基于 python 语言,使用 Numpy 数值计算库和 Opencv 计算机视觉库进行数据读 入和预处理,基于深度学习高阶 API Keras 搭建了 4 种神经网络结构,实验结果的展示使用 python 的 Matplotlib 模块. 3.3 实验结果与分析 对 24000 个地形矩阵数值矩阵进行区分类, 19200 个作为训练集,4800 个作为测试集,其中训 练集划分 20% 作为验证集. 本文使用多种网络结 构对训练集进行训练,并对几种取得较好结果的 模型效果图进行展示. 从图 5 来看,左图训练集和验证集的 Loss 值逐 渐下降,右图训练集和验证机 Accuracy 逐渐上升, 且两图曲线均呈收敛态势,说明 Conv-3 训练模型 对已有数据是有效的. 从 Loss 曲线可以看出在训练 到 65 轮后验证集 Loss 开始高于训练集 Loss 且差 值有扩大的趋势,产生过拟合,说明在 65 轮时模型 取得最好效果,此时准确率为 0.8246,Loss 为 0.415. 0 10 20 30 d1 /m d2 /m h/m 40 50 0 10 20 30 40 50 0.1 0 0.2 0.3 0.4 0.6 0.5 0.8 0.7 图 3 处理后的数据示例 Fig.3 Example terrain of processed data 0 10 20 30 d1 /m d2 /m h/m 40 50 0 10 20 30 40 50 0 0.2 0.4 0.6 0.8 1.0 图 4 同一陡坡矩阵的两种标准化结果 Fig.4 Example of processed data 0.65 Train Validation 0.84 0.60 0.82 0.55 0.80 0.50 0.78 0.45 0.76 0.40 0 20 40 Epochs Loss Epochs (a) (b) Accuracy 60 80 100 0.74 0.72 0.70 0.68 0 20 40 60 80 100 Train Validation 图 5 Conv-3 的损失曲线(a)和准确率(b) Fig.5 Conv-3 loss (a) and accuracy (b) 袁传新等: 卷积神经网络在矿区预测中的研究与应用 · 1601 ·
·1602 工程科学学报,第42卷,第12期 图6、图7和图8是使用VGGNet16及其变式 文的研究中图8使用的Mean-pooling和图7使用 运用控制变量法进行的对比实验.和前面的Conv- Max-pooling相比,准确率上有所提高,模型的收敛 3模型的结果一样,三种模型在训练集和验证集 和稳定性也较好 的Loss曲线和Accuracy曲线均收敛,充分证明了 使用训练得到的4种模型,在4800个测试集 本文获取的地形特征数值矩阵数据集是可训练 上进行预测,表2是预测得到的准确率的结果.可 的.另外,图6和图7可以得出,VGGNet 16使用 以得出,4种模型可靠性都比较高,使用VGGNet 5×5和使用3×3的卷积核相比在模型准确率上更 16(5×5,Mean-pooling)上的准确率为0.8346,分类 高,且收敛性更好.由图7和图8可以得出,在本 效果最好 0.52 (a) 0.80b) 0.50 0.79 0.78 0.48 046 意0nh 0.44 心心 -Train -Train -Validation 0.74 -Validation 0.42 0.73 V 0.40 0.72 0 20 40 60 80 100 0 20 40 60 80 100 Epochs Epochs 图6 VGGNet16损失曲线(a)和准确率(b) Fig.6 VGGNet 16 loss (a)and accuracy (b) 0.82 (a) (b) 0.52 0.50 0.80 0.46 -Train 0.76 -Train 0.44 Validation -Validation 0.42 0.74 0 20 40 60 80 100 0 20 40 60 80 100 Epochs Epochs 图7 VGGNet 16(5×5,Max-pooling)损失曲线(a)和准确率(b) Fig.7 VGGNet 16(5x5,Max-pooling)loss(a)and accuracy (b) 0.84r (a) (b) 0.52 0.82 0.50 0.48 0.46 -Train 0.78 0.44 -Train 0.42 WN人 -Validation -Validation 0.76 0.40 20 40 60 80 100 0 20 40 60 80 100 Epochs Epochs 图8 VGGNet16(Sx5,Mean-pooling)损失曲线(a)和准确率(b) Fig.8 VGGNet 16(5x5,Mean-pooling)loss (a)and accuracy (b)
图 6、图 7 和图 8 是使用 VGGNet 16 及其变式 运用控制变量法进行的对比实验. 和前面的 Conv- 3 模型的结果一样,三种模型在训练集和验证集 的 Loss 曲线和 Accuracy 曲线均收敛,充分证明了 本文获取的地形特征数值矩阵数据集是可训练 的. 另外,图 6 和图 7 可以得出,VGGNet 16 使用 5×5 和使用 3×3 的卷积核相比在模型准确率上更 高,且收敛性更好. 由图 7 和图 8 可以得出,在本 文的研究中图 8 使用的 Mean-pooling 和图 7 使用 Max-pooling 相比,准确率上有所提高,模型的收敛 和稳定性也较好. 使用训练得到的 4 种模型,在 4800 个测试集 上进行预测,表 2 是预测得到的准确率的结果. 可 以得出,4 种模型可靠性都比较高,使用 VGGNet 16(5×5,Mean-pooling) 上的准确率为 0.8346,分类 效果最好. 0.52 Train Validation 0.50 0.48 0.80 0.46 0.79 0.44 0.78 0.40 0.42 0 20 40 Epochs Loss Epochs Accuracy 60 80 100 0.77 0.76 0.75 0.74 0.73 0.72 0 20 40 60 80 100 Train Validation (a) (b) 图 6 VGGNet 16 损失曲线(a)和准确率(b) Fig.6 VGGNet 16 loss (a) and accuracy (b) 0.52 Train Validation 0.50 0.48 0.82 0.46 0.80 0.44 0.78 0.42 0 20 40 Epochs Loss Epochs Accuracy 60 80 100 0.76 0.74 0 20 40 60 80 100 Train Validation (a) (b) 图 7 VGGNet 16(5×5,Max-pooling)损失曲线(a)和准确率(b) Fig.7 VGGNet 16 (5×5, Max-pooling) loss (a) and accuracy (b) 0.52 Train Validation 0.50 0.48 0.82 0.46 0.80 0.44 0.78 0.42 0.40 0 20 40 Epochs Loss Epochs Accuracy 60 80 100 0.76 0.84 0 20 40 60 80 100 Train Validation (a) (b) 图 8 VGGNet 16(5×5,Mean-pooling)损失曲线(a)和准确率(b) Fig.8 VGGNet 16 (5×5, Mean-pooling) loss (a) and accuracy (b) · 1602 · 工程科学学报,第 42 卷,第 12 期
袁传新等:卷积神经网络在矿区预测中的研究与应用 ·1603· 表2实验结果 rate on the growth and composition of Co-rich ferromanganese crusts from Central Pacific seamount areas.Earth Planet Sci Lett, Table 2 Results of experiments 1984,68(1):73 Method Accuracy [5] Zhang W Y,Zhang F Y,Zhu K C.Fractal research on seamount Conv-3(5×5) 0.8226 topography in the West Pacific Ocean.Geoscience,2009,23(6): VGGNet 16(3x3,Max-pooling) 0.7987 1138 VGGNet 16(5x5,Max-pooling) 0.8158 (章伟艳,张富元,朱克超.西太平洋海域海山地形分形特征研 VGGNet 16(5x5,Mean-pooling) 0.8346 究.现代地质,2009,23(6):1138) VGGNet (7x7) Nonconvergence [6]Liu Y G,He G W,Yao H Q,et al.Global distribution characteristics of seafloor cobalt-rich encrustation resources.Miner 从实验结果可以得到:本文从富钴结壳矿区 Dep0sit,2013,32(6):1275 (刘永刚,何高文,姚会强,等.世界海底富钴结壳资源分布特征 地形特征出发,利用卷积神经网络对海拔数值矩 矿床地质,2013,32(6):1275) 阵训练得到预测模型.相对于已有的数据,对找矿 [7]Cheng Y S.Study of Evaluation of Co-rich Ferromanganese Crust 靶,点进行预测是可行的 Resources on Seamounts in Northwest Pacific Ocean[Dissertation]. 4结论 Qingdao:Ocean University of China,2014 (程永寿.西北太平洋海山富钴结壳资源评价和矿区圈定[学位 (1)传统的预测方法通过一定的规则集合将 论文].青岛:中国海洋大学,2014) 专家观点、地质背景、成矿类型等因素综合考虑, [8] Hubel D H,Wiesel T N.Receptive fields of single neurones in the cat's striate cortex.J Plysiol,1959,148(3):574 影响找矿预测成果的最大因素是找矿者的先验知 [9] Zhou F Y,Jin L P,Dong J.Review of convolutional neural 识.以富钴结壳矿区地形特征为出发点,运用目前 network.Chin Comput,2017,40(6):1229 非常热门的卷积神经网络模型学习特征,进行结 (周飞燕,金林鹏,董军.卷积神经网络研究综述.计算机学报, 壳矿区预测的初步研究,VGGNet 16(5×5,Mean- 2017,40(6):1229) pooling)在本文的富钴结壳地形数据集中实现较 [10] Yuan F,Zhang MM,Li X H,et al.Prospectivity modeling:from 好的预测效果 two-dimension to three-dimension.Acta Petrol Sin,2019,35(12): 3863 (2)通过实验结果可以得出,利用地形特征进 (袁峰,张明明,李晓晖,等,成矿预测:从二维到三维.岩石学报, 行富钴结壳矿区进行找矿靶点预测切实可行,在 2019,35(12):3863) 准确率方面仍有提升空间. [11]Liu QQ.Meng Q.Geochemical survey of metallogenic area (3)富钴结壳矿区分布受诸多因素影响.相信 (zone)and some problems are discussed.Geol Explor,1981(11): 在不久的将来,随着数据量和精度的增加以及更 深入的研究,可以把更多的影响因素放入深度学 (刘泉清,孟奇.成矿区(带)地球化学普查及若干问题的探讨.地 习模型当中,得到更精确的预测,可以普遍应用于 质与脚探,1981(11):59) 勘探找矿生产环境中 [12]Yang H S,Liu Y L,Wang P.Mathematical geology of gold deposits in south Gansu and north Sichuan regions-a prognostic 参考文献 neomethod study.Geol Geochem,1998(1):86 (杨恒书,刘玉玲,王萍.川北甘南地区金矿数学地质预测新方 [1]Pan J H,Liu S Q,Yang Y,et al.Types,distribution and 法研究.地质地球化学,1998(1):86) occurrence of Co-rich crusts in the Western Pacific.Miner [13]Zhang B L.The new theory and technology of "geochemical three Deposit,2002,21(Suppl):44 field anomalies mutually constrain each other"to predict the (潘家华,刘淑琴,杨忆,等.西太平洋富钻结壳的类型、分布与 location of hidden resources has been applied to quickly select the 产状.矿床地质,2002,21(增刊)44) target area for prospecting,and remarkable results have been [2]Morley N H,Burton J D,Tankere S P C,et al.Distribution and achieved.Gold Sci Technol,2004,12(5):48 behaviour of some dissolved trace metals in the western (张宝林应用“地物化三场异常互相约束“"的隐伏资源定位预 Mediterranean Sea.Deep Sea Res PartⅡ,1997,44(3-4):675 测新理论和新技术快速优选找矿靶区取得显著效果.黄金科学 [3]Wang X H,Zhou L P,Wang Y M.Paleoenvironmental 技术,2004,12(5):48) implications of high-density records in Co-rich seamount crusts [14]Zhang Q H,Pu K X,Luo H Y.Application of comprehensive from the Pacific Ocean.Sci China Ser D-Earth Sci.2008.51(10): methods in prospecting target of polymetallic ore.Miner Explor, 1460 2019,10(4):929 [4]Halbach P.Puteanus D.The influence of the carbonate dissolution (张庆华,蒲开兴,罗洪远.综合方法在多金属找矿靶区预测中
从实验结果可以得到:本文从富钴结壳矿区 地形特征出发,利用卷积神经网络对海拔数值矩 阵训练得到预测模型. 相对于已有的数据,对找矿 靶点进行预测是可行的. 4 结论 (1)传统的预测方法通过一定的规则集合将 专家观点、地质背景、成矿类型等因素综合考虑, 影响找矿预测成果的最大因素是找矿者的先验知 识. 以富钴结壳矿区地形特征为出发点,运用目前 非常热门的卷积神经网络模型学习特征,进行结 壳矿区预测的初步研究,VGGNet 16( 5×5,Meanpooling)在本文的富钴结壳地形数据集中实现较 好的预测效果. (2)通过实验结果可以得出,利用地形特征进 行富钴结壳矿区进行找矿靶点预测切实可行,在 准确率方面仍有提升空间. (3)富钴结壳矿区分布受诸多因素影响. 相信 在不久的将来,随着数据量和精度的增加以及更 深入的研究,可以把更多的影响因素放入深度学 习模型当中,得到更精确的预测,可以普遍应用于 勘探找矿生产环境中. 参 考 文 献 Pan J H, Liu S Q, Yang Y, et al. Types, distribution and occurrence of Co-rich crusts in the Western Pacific. Miner Deposit, 2002, 21(Suppl): 44 (潘家华, 刘淑琴, 杨忆, 等. 西太平洋富钴结壳的类型、分布与 产状. 矿床地质, 2002, 21(增刊): 44) [1] Morley N H, Burton J D, Tankere S P C, et al. Distribution and behaviour of some dissolved trace metals in the western Mediterranean Sea. Deep Sea Res Part Ⅱ, 1997, 44(3-4): 675 [2] Wang X H, Zhou L P, Wang Y M. Paleoenvironmental implications of high-density records in Co-rich seamount crusts from the Pacific Ocean. Sci China Ser D-Earth Sci, 2008, 51(10): 1460 [3] [4] Halbach P, Puteanus D. The influence of the carbonate dissolution rate on the growth and composition of Co-rich ferromanganese crusts from Central Pacific seamount areas. Earth Planet Sci Lett, 1984, 68(1): 73 Zhang W Y, Zhang F Y, Zhu K C. Fractal research on seamount topography in the West Pacific Ocean. Geoscience, 2009, 23(6): 1138 (章伟艳, 张富元, 朱克超. 西太平洋海域海山地形分形特征研 究. 现代地质, 2009, 23(6):1138) [5] Liu Y G, He G W, Yao H Q, et al. Global distribution characteristics of seafloor cobalt-rich encrustation resources. Miner Deposit, 2013, 32(6): 1275 (刘永刚, 何高文, 姚会强, 等. 世界海底富钴结壳资源分布特征. 矿床地质, 2013, 32(6):1275) [6] Cheng Y S. Study of Evaluation of Co-rich Ferromanganese Crust Resources on Seamounts in Northwest Pacific Ocean[Dissertation]. Qingdao: Ocean University of China, 2014 (程永寿. 西北太平洋海山富钴结壳资源评价和矿区圈定[学位 论文]. 青岛: 中国海洋大学, 2014) [7] Hubel D H, Wiesel T N. Receptive fields of single neurones in the cat's striate cortex. J Physiol, 1959, 148(3): 574 [8] Zhou F Y, Jin L P, Dong J. Review of convolutional neural network. Chin J Comput, 2017, 40(6): 1229 (周飞燕, 金林鹏, 董军. 卷积神经网络研究综述. 计算机学报, 2017, 40(6):1229) [9] Yuan F, Zhang M M, Li X H, et al. Prospectivity modeling: from two-dimension to three-dimension. Acta Petrol Sin, 2019, 35(12): 3863 (袁峰, 张明明, 李晓晖, 等. 成矿预测: 从二维到三维. 岩石学报, 2019, 35(12):3863) [10] Liu Q Q, Meng Q. Geochemical survey of metallogenic area (zone) and some problems are discussed. Geol Explor, 1981(11): 59 (刘泉清, 孟奇. 成矿区(带)地球化学普查及若干问题的探讨. 地 质与勘探, 1981(11):59) [11] Yang H S, Liu Y L, Wang P. Mathematical geology of gold deposits in south Gansu and north Sichuan regions—a prognostic neomethod study. Geol Geochem, 1998(1): 86 (杨恒书, 刘玉玲, 王萍. 川北甘南地区金矿数学地质预测新方 法研究. 地质地球化学, 1998(1):86) [12] Zhang B L. The new theory and technology of "geochemical three field anomalies mutually constrain each other" to predict the location of hidden resources has been applied to quickly select the target area for prospecting, and remarkable results have been achieved. Gold Sci Technol, 2004, 12(5): 48 (张宝林. 应用“地物化三场异常互相约束”的隐伏资源定位预 测新理论和新技术快速优选找矿靶区取得显著效果. 黄金科学 技术, 2004, 12(5):48) [13] Zhang Q H, Pu K X, Luo H Y. Application of comprehensive methods in prospecting target of polymetallic ore. Miner Explor, 2019, 10(4): 929 (张庆华, 蒲开兴, 罗洪远. 综合方法在多金属找矿靶区预测中 [14] 表 2 实验结果 Table 2 Results of experiments Method Accuracy Conv-3 (5×5) 0.8226 VGGNet 16 (3×3, Max-pooling) 0.7987 VGGNet 16 (5×5, Max-pooling) 0.8158 VGGNet 16 (5×5, Mean-pooling) 0.8346 VGGNet (7×7) Nonconvergence 袁传新等: 卷积神经网络在矿区预测中的研究与应用 · 1603 ·
·1604 工程科学学报,第42卷,第12期 的应用.矿产期查,2019,10(4):929) [21]Wei Z Q,He G W,Deng X G,et al.The progress in the study and [15]Ye SS,Zhou DD,Wang S C.Integrated mineral information survey of oceanic cobalt-rich crust resources.Geol China,2017, forecasting system//Proceedings of the 7th National Conference on 44(3):460 Mathematical Geology and Geoscience Information.Kunming, (韦振权,何高文,邓希光,等.大洋富钴结壳资源调查与研究进 2005:59 展.中国地质,2017,44(3):460) (叶水盛,周东岱,王世称.综合信息矿产预测系统第七届全国 [22]Jiao D F,Jin X L,Chu F Y,et al.Formation conditions and control 数学地质与地学信息学术会议.昆明,2005:59) factors of thick Co-rich ferromanganese crusts.Miner Deposits. [16]Li X Z.Development of an Expert System for Statistical Prediction 2007.26(3):296 of Medium and Large Scale Deposits[Dissertation].Wuhan:China (矫东风,金翔龙,初凤友,等.厚结壳的形成条件及控制因素分 University of Geosciences,2004 析.矿床地质,2007,26(3):296) (李新中,中、大比例尺矿床统计预测专家系统的研制[学位论 [23]Yan S J.Du D W.Song Q L,et al.Synergy Creg estimation of 文].武汉:中国地质大学,2004) cobalt-rich crusts and spatial distribution of regional elements in [17]Xu S T,Zhou Y Z.Artificial intelligence identification of ore Magellan Seamounts.Acta Mineral Sin,2013(Suppl 2):674 minerals under microscope based on deep learning algorithm.Acta (月仕娟,杜德文,宋庆磊,等,麦哲伦海山富钻结壳及区域要素 Petrol Sin,2018,34(11):3244 空间分布的协同克里格估计.矿物学报,2013(增刊2少674) (徐述腾,周永章.基于深度学习的镜下矿石矿物的智能识别实 [24]Chu F Y,Sun G S,Li X M,et al.The growth habit and controlling 验研究.岩石学报,2018,34(11):3244) factors of the cobalt-rich crusts in Seamount of the Central Pacific. [18]Liu Y P,Zhu L X,Zhou Y Z.Application of convolutional neural J Jilin Univ Earth Sci Ed,2005,35(3):320 network in prospecting prediction of ore deposits:taking the (初凤友,孙国胜,李晓敏,等,中太平洋海山富钴结壳生长习性 Zhaojikou Pb-Zn ore deposit in Anhui Province as a case.Acta 及控制因素.吉林大学学报:地球科学版,2005,35(3):320) Petrol Sin,2018,34(11):3217 (刘艳鹏,朱立新,周永章.卷积神经网络在矿床找矿预测中的 [25]Wang S,Yang K J.An image scaling algorithm based on bilinear 应用一以安徽省兆吉口铅锌矿床为例.石油学报,2018, interpolation with VC++.Tech Autom Appl,2008,27(7):44 34(11):3217) (王森,杨克俭.基于双线性插值的图像缩放算法的研究与实现 [19]XiaoZ,Luo B.Liu YM.Research on prospecting of ductile shear 自动化技术与应用,2008,27(7):44) zone in mining area based on deep learning.World Nonferrous [26]Zhang QQ,Liu Y,Pan J L,et al.Continuous speech recognition Me1,2019(21):46 by convolutional neural networks.Chin J Eng,2015,37(9):1212 (肖壮,罗彬,刘友明.基于深度学习的矿区韧性剪切带找矿研 (张晴晴,刘勇,潘接林,等.基于卷积神经网络的连续语音识别. 究.世界有色金属,2019(21):46) 工程科学学报,2015,37(9:1212) [20]Ma W L.Study on Relation between Seamounts Type and Crusts [27]Xie Z H,Jiang P,Yu X H,et al.Hyperspectral face recognition Mineralization[Dissertation].Hangzhou:Zhejiang University system based on VGGNet and multi-band recurrent network.J 2006 Comput.4ppl,2019,39(2):388 (马维林.海山类型与结壳成矿的关系研究学位论文】.杭州:浙 (谢志华,江鹏,余新河,等.基于VGGNet和多谱带循环网络的 江大学,2006) 高光谱人脸识别系统.计算机应用,2019,39(2):388)
的应用. 矿产勘查, 2019, 10(4):929) Ye S S, Zhou D D, Wang S C. Integrated mineral information forecasting system//Proceedings of the 7th National Conference on Mathematical Geology and Geoscience Information. Kunming, 2005: 59 (叶水盛, 周东岱, 王世称. 综合信息矿产预测系统//第七届全国 数学地质与地学信息学术会议. 昆明, 2005: 59) [15] Li X Z. Development of an Expert System for Statistical Prediction of Medium and Large Scale Deposits[Dissertation]. Wuhan: China University of Geosciences, 2004 (李新中. 中、大比例尺矿床统计预测专家系统的研制[学位论 文]. 武汉: 中国地质大学, 2004) [16] Xu S T, Zhou Y Z. Artificial intelligence identification of ore minerals under microscope based on deep learning algorithm. Acta Petrol Sin, 2018, 34(11): 3244 (徐述腾, 周永章. 基于深度学习的镜下矿石矿物的智能识别实 验研究. 岩石学报, 2018, 34(11):3244) [17] Liu Y P, Zhu L X, Zhou Y Z. Application of convolutional neural network in prospecting prediction of ore deposits: taking the Zhaojikou Pb−Zn ore deposit in Anhui Province as a case. Acta Petrol Sin, 2018, 34(11): 3217 (刘艳鹏, 朱立新, 周永章. 卷积神经网络在矿床找矿预测中的 应用——以安徽省兆吉口铅锌矿床为例. 石油学报, 2018, 34(11):3217) [18] Xiao Z, Luo B, Liu Y M. Research on prospecting of ductile shear zone in mining area based on deep learning. World Nonferrous Met, 2019(21): 46 (肖壮, 罗彬, 刘友明. 基于深度学习的矿区韧性剪切带找矿研 究. 世界有色金属, 2019(21):46) [19] Ma W L. Study on Relation between Seamounts Type and Crusts Mineralization[Dissertation]. Hangzhou: Zhejiang University, 2006 (马维林. 海山类型与结壳成矿的关系研究[学位论文]. 杭州: 浙 江大学, 2006) [20] Wei Z Q, He G W, Deng X G, et al. The progress in the study and survey of oceanic cobalt-rich crust resources. Geol China, 2017, 44(3): 460 (韦振权, 何高文, 邓希光, 等. 大洋富钴结壳资源调查与研究进 展. 中国地质, 2017, 44(3):460) [21] Jiao D F, Jin X L, Chu F Y, et al. Formation conditions and control factors of thick Co-rich ferromanganese crusts. Miner Deposits, 2007, 26(3): 296 (矫东风, 金翔龙, 初凤友, 等. 厚结壳的形成条件及控制因素分 析. 矿床地质, 2007, 26(3):296) [22] Yan S J, Du D W, Song Q L, et al. Synergy Creg estimation of cobalt-rich crusts and spatial distribution of regional elements in Magellan Seamounts. Acta Mineral Sin, 2013(Suppl 2): 674 (闫仕娟, 杜德文, 宋庆磊, 等. 麦哲伦海山富钴结壳及区域要素 空间分布的协同克里格估计. 矿物学报, 2013(增刊 2): 674) [23] Chu F Y, Sun G S, Li X M, et al. The growth habit and controlling factors of the cobalt-rich crusts in Seamount of the Central Pacific. J Jilin Univ Earth Sci Ed, 2005, 35(3): 320 (初凤友, 孙国胜, 李晓敏, 等. 中太平洋海山富钴结壳生长习性 及控制因素. 吉林大学学报: 地球科学版, 2005, 35(3):320) [24] Wang S, Yang K J. An image scaling algorithm based on bilinear interpolation with VC++. Tech Autom Appl, 2008, 27(7): 44 (王森, 杨克俭. 基于双线性插值的图像缩放算法的研究与实现. 自动化技术与应用, 2008, 27(7):44) [25] Zhang Q Q, Liu Y, Pan J L, et al. Continuous speech recognition by convolutional neural networks. Chin J Eng, 2015, 37(9): 1212 (张晴晴, 刘勇, 潘接林, 等. 基于卷积神经网络的连续语音识别. 工程科学学报, 2015, 37(9):1212) [26] Xie Z H, Jiang P, Yu X H, et al. Hyperspectral face recognition system based on VGGNet and multi-band recurrent network. J Comput Appl, 2019, 39(2): 388 (谢志华, 江鹏, 余新河, 等. 基于VGGNet和多谱带循环网络的 高光谱人脸识别系统. 计算机应用, 2019, 39(2):388) [27] · 1604 · 工程科学学报,第 42 卷,第 12 期