正在加载图片...
·1600 工程科学学报,第42卷,第12期 什)即为坐标变换后的像素值,其中i、j为整数部 区域坐标数据提取了网格型数值矩阵,对数据进 分,u、v为小数部分2)则这个像素值可由公式(4) 行调整后,分别使用Conv-3、VGGNet 16和两个修 得出.该算法保证了插值曲线的平滑性,弥补了最 改后的VGGNet 16结构进行对比实验 近邻算法的不足,是插值效果和运算速度相对较 3.1数据来源 优的算法,也是使用最广泛的 正样本原始数据来源于国际海底管理局 f(i+w,j+v)=(1-u)×(1-v)+(1-w)×v×f(i,i+1)+ (ISA)的富钴结壳主量元素标准数据集,由国家海 u×(1-v)×fi+1,)+u×v×fi+1,i+1) 洋科学数据共享服务平台提供.数据量共计 (4) 1203站,3286个样品,空间范围覆盖全球大部分海 2.3模型结构 域(-180°~180E,-64.18°~56.17N).剔除一些坐 本文的数值矩阵代表的是矿区地形,每一个 标分布较密集区域的坐标,实际使用1100个站点 数值都有空间位置关系,相当于图像中的像素点 用来作为提取数值矩阵正样本的基准数据.调用 因此,与特征提取和支持向量机(SVM)、随机森林 Google Earth软件的APL,在全球以100km为步长 等传统统计方法结合相比,使用更适合图像处理 提取共计12万坐标以及海拔高度信息,从中随机 的卷积神经网络.卷积神经网络与传统深层神经 均匀选取15200个海拔高度在-4000~-800m之 网络相比,可以明显降低模型规模.并且识别性能 间的坐标信息作为原始数据的负样本的基准坐标 最好,泛化能力最强2 数据.在负样本中有一定的存在噪声的可能性(即 针对数据集特性,搭建了适合本文区分类找 可能为富钴结壳矿区),因为可能性非常小,可以 矿研究的Conv-3模型.图2给出了Conv-3模型的 认为有较高的可信度 结构图,该卷积神经网络网络共包含7层:一个输 正负样本基准地理坐标信息被存储为26份文 入层,三个卷积层C1、C2和C3,两个全连接层 本,分布于26台计算机上.在每一台电脑上运行 F4和F5,一个输出层.在该模型中,输入层的输入 Google Earth和在Visual Studio上基于C++的数据 为50×50的数值矩阵,卷积层均使用16个5×5的 提取程序.程序自动读取文本文件的每一个坐标 卷积核,全连接层分别使用2048和128个神经元. (A,B),以(A,B)为中心点,以C为步长的度数表示, 输出层使用softmax函数进行分类 在0.8~1km范围内从经度A-25×C到A+25×C、 VGGNet16是一种深度卷积神经网络结构,通 纬度B-25×C到B+25×C调用Google Earth软件的 过不断深化网络结构提高性能2,在此结构中卷 API提取50×50的海拔高度数值矩阵 积层均使用3×3的卷积核,池化层使用的是Max- 本文最终获得了共计16200个存储海拔高度 pooling.为了满足实验要求,本文使用插值算法对 数值矩阵的文本,其中正样本1100个,负样本 输入的数值矩阵进行扩充,修改两层全连接层神 15200个.因为正样本数据量过小,而地型特征具 经元个数为2048、512,又分别采用(1)更改池化层 有旋转、翻转的不变性,利用这些特性将正样本的 为Max-pooling和(2)更改卷积层卷积核为3×3进 数据扩充为原来的8倍,得到8000个正样本,最终 行对比实验 使用正负样本共计24000个地形数据 3.2 3 实验过程 数据处理及算法实现 对于正负样本的数据,使用文件名作为标签 本文使用已知的富钴结壳站点的坐标和未知 的标注,在程序中使用OS模块读取文件名,将正 Feature Feature Feature Hidden Hidden maps maps units Outputs 1@50x50 16@48×48 16@48×48 16@48×48 2048 Max-pooling Max-pooling Max-pooling Flatten Fully Fully 5x5 kemel 5x5 kernel 5x5 kernel connected connected 图2Conv-3结构图 Fig.2 Conv-3 schematicj+v) 即为坐标变换后的像素值,其中 i、j 为整数部 分,u、v 为小数部分[25] . 则这个像素值可由公式(4) 得出. 该算法保证了插值曲线的平滑性,弥补了最 近邻算法的不足,是插值效果和运算速度相对较 优的算法,也是使用最广泛的. f (i+u, j+v) = (1−u)×(1−v)+(1−u)×v× f (i, j+1)+ u×(1−v)× f(i+1, j)+u×v× f(i+1, j+1) (4) 2.3    模型结构 本文的数值矩阵代表的是矿区地形,每一个 数值都有空间位置关系,相当于图像中的像素点. 因此,与特征提取和支持向量机(SVM)、随机森林 等传统统计方法结合相比,使用更适合图像处理 的卷积神经网络. 卷积神经网络与传统深层神经 网络相比,可以明显降低模型规模,并且识别性能 最好,泛化能力最强[26] . 针对数据集特性,搭建了适合本文区分类找 矿研究的 Conv-3 模型. 图 2 给出了 Conv-3 模型的 结构图,该卷积神经网络网络共包含 7 层:一个输 入层 ,三个卷积层 C1、 C2 和 C3,两个全连接层 F4 和 F5,一个输出层. 在该模型中,输入层的输入 为 50×50 的数值矩阵,卷积层均使用 16 个 5×5 的 卷积核,全连接层分别使用 2048 和 128 个神经元, 输出层使用 softmax 函数进行分类. VGGNet16 是一种深度卷积神经网络结构,通 过不断深化网络结构提高性能[27] ,在此结构中卷 积层均使用 3×3 的卷积核,池化层使用的是 Max− pooling. 为了满足实验要求,本文使用插值算法对 输入的数值矩阵进行扩充,修改两层全连接层神 经元个数为 2048、512,又分别采用(1)更改池化层 为 Max−pooling 和(2)更改卷积层卷积核为 3×3 进 行对比实验. 3    实验过程 本文使用已知的富钴结壳站点的坐标和未知 区域坐标数据提取了网格型数值矩阵,对数据进 行调整后,分别使用 Conv-3、VGGNet 16 和两个修 改后的 VGGNet 16 结构进行对比实验. 3.1    数据来源 正样本原始数据来源于国际海底管理局 (ISA)的富钴结壳主量元素标准数据集,由国家海 洋科学数据共享服务平台提供 . 数据量共 计 1203 站,3286 个样品,空间范围覆盖全球大部分海 域(−180°~180°E,−64.18°~56.17°N). 剔除一些坐 标分布较密集区域的坐标,实际使用 1100 个站点 用来作为提取数值矩阵正样本的基准数据. 调用 Google Earth 软件的 API,在全球以 100 km 为步长 提取共计 12 万坐标以及海拔高度信息,从中随机 均匀选取 15200 个海拔高度在−4000~−800 m 之 间的坐标信息作为原始数据的负样本的基准坐标 数据. 在负样本中有一定的存在噪声的可能性(即 可能为富钴结壳矿区),因为可能性非常小,可以 认为有较高的可信度. 正负样本基准地理坐标信息被存储为 26 份文 本,分布于 26 台计算机上. 在每一台电脑上运行 Google Earth 和在 Visual Studio 上基于 C++的数据 提取程序. 程序自动读取文本文件的每一个坐标 (A,B),以(A,B)为中心点,以 C 为步长的度数表示, 在 0.8~1 km2 范围内从经度 A−25×C 到 A+25×C、 纬度 B−25×C 到 B+25×C 调用 Google Earth 软件的 API 提取 50×50 的海拔高度数值矩阵. 本文最终获得了共计 16200 个存储海拔高度 数值矩阵的文本 ,其中正样 本 1100 个 ,负样 本 15200 个. 因为正样本数据量过小,而地型特征具 有旋转、翻转的不变性,利用这些特性将正样本的 数据扩充为原来的 8 倍,得到 8000 个正样本,最终 使用正负样本共计 24000 个地形数据. 3.2    数据处理及算法实现 对于正负样本的数据,使用文件名作为标签 的标注,在程序中使用 OS 模块读取文件名,将正 Inputs 1@50×50 Feature maps 16@48×48 Feature maps 16@48×48 Max-pooling 5×5 kernel Max-pooling 5×5 kernel Max-pooling 5×5 kernel Flatten Fully connected Hidden units 2048 Hidden units 128 Outputs 1 Fully connected Feature maps 16@48×48 图 2    Conv-3 结构图 Fig.2    Conv-3 schematic · 1600 · 工程科学学报,第 42 卷,第 12 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有