正在加载图片...
·594· 智能系统学报 第15卷 变换称为特征映射。其中,输入空间是输入向量 升模型的复杂度。最具代表性的卷积神经网络 的集合,输出空间在二维网格的自组织映射中是 (CNN)是由LeCun等提出并在计算机视觉领域得 二维的平面。通过竞争、合作与更新3个过程, 到巨大发展的神经网络模型,经过不断改进和发 SOM可以完成自组织映射⑧4。唐秋华等8s-86分 展,CNN逐渐成为深度学习的主要架构之一。 别将反向散射强度均值和灰度共生矩阵统计特征 CNN是一种深层前馈型神经网络,包含的多层感 与SOM相结合,实现了对多种类型底质分布的 知器具有强非线性逼近能力。与传统的神经网络 快速识别,分类界线基本与实测数据吻合。Zhao 相比,CNN通过逐层卷积计算构建了强大的特征 等87利用SOM对精细化处理的海底灰度图像进 提取器,层与层之间的节点随机相连。CNN的特 行识别,给出了用于海底底质分类的SOM网络 点在于它的局部感知与权值共享,在对输入图像 基本参数设置方案。 进行处理时,利用卷积滤波同时作用于一定区域 3.3深度学习在海底底质分类中的应用 的神经元,通过扫描整张图像得到全域的综合特 在声呐图像海底底质分类技术的发展过程 征信息。同一层级处理过程中共享同一卷积权 中,传统的研究思路是将声呐图像和底质类型之 值,并通过减少一定权值参数的方式降低网络的 间关系模型的建立分为两个阶段,即声呐图像特 复杂性。 征提取和分类器训练。然而由于声呐图像分辨率 卷积神经网络通常包含输入层、卷积层、池 低、干扰严重等,对于特征提取算法的设计和分 化层、全连接层和输出层,利用卷积神经网络进 类算法的最优选择,一直是声学海底底质智能分 行海底底质分类的基本架构如图1所示,其中卷 类技术争论的焦点。相比之下,深度学习可以通 积层和池化层可以有多个。各层的主要工作机制 过内部网络结构自动提取目标的内在特征,并经 如下。1)输入层。读取图像数据,原始图像保存 过低层到高层的抽象过程建立稳定的特征组合, 在该层。2)卷积层。利用卷积核进行特征提取, 弱化了人工选择特征的主观性,节省了大量的时 特点是局部感知域、权值共享和多核卷积。在每 间和工作量。深度学习方法的特征分析具有类脑 一卷积层中包含多个卷积核,使每一个卷积核都 的抽象过程,使得模型的泛化能力更好,对声呐 与本层输人图像的局部区域进行卷积运算获取不 图像的噪声干扰具有更好的兼容性,为提升海底 同种类的特征图,输入到下一层,其中卷积核的 底质智能识别技术开辟了一种新的模型架构。深 权重是经学习得到且在卷积过程中保持不变。 度学习方法在人脸识别、行人检测等光学图像处 3)池化层。将图像划分为不重叠区域并对区域内 理领域已经取得了很大的成功,而与声呐图像和 的元素进行聚合。可以利用多种池化方式对输入 水下目标识别应用的结合还有待于加强。因此, 特征图进行池化,进而降低特征维度,保证网络 本文对深度学习方法在声学海底底质分类中的应 的抗噪能力。4)全连接层。经过卷积层处理之 用前景进行了讨论,以卷积神经网络为例从深度 后,图像信息被高度抽象化,全连接层在整幅图 学习的核心算法和网络结构等方面对未来深层次 像层面进行特征组合与推断,形成利于分类的特 应用进行展望。 征。5)输出层。对全连接层的输出向量进行类别 深度学习方法具有更深的网络层数,其实现 判定。针对不同的声呐图像识别任务,CNN网络 架构主要基于多层的神经网络,通过增加隐含层 的各层结构和参数设置需要结合图像数据特点进 的数目、扩充阈值和连接权值等参数的规模,提 行单独设计。 输入层 卷积层 池化层 全连接层 输出层 声呐图像 c品】 n卷积杉 c品2 海底底质分布图 ● ReLU Softmax Class 3 采样数据 ● Class 6 图1 卷积神经网络海底底质分类基本架构 Fig.1 Basic structure of seabed sediment classification using CNN变换称为特征映射。其中,输入空间是输入向量 的集合,输出空间在二维网格的自组织映射中是 二维的平面。通过竞争、合作与更新 3 个过程, SOM 可以完成自组织映射[84]。唐秋华等[85-86] 分 别将反向散射强度均值和灰度共生矩阵统计特征 与 SOM 相结合,实现了对多种类型底质分布的 快速识别,分类界线基本与实测数据吻合。Zhao 等 [87] 利用 SOM 对精细化处理的海底灰度图像进 行识别,给出了用于海底底质分类的 SOM 网络 基本参数设置方案。 3.3 深度学习在海底底质分类中的应用 在声呐图像海底底质分类技术的发展过程 中,传统的研究思路是将声呐图像和底质类型之 间关系模型的建立分为两个阶段,即声呐图像特 征提取和分类器训练。然而由于声呐图像分辨率 低、干扰严重等,对于特征提取算法的设计和分 类算法的最优选择,一直是声学海底底质智能分 类技术争论的焦点。相比之下,深度学习可以通 过内部网络结构自动提取目标的内在特征,并经 过低层到高层的抽象过程建立稳定的特征组合, 弱化了人工选择特征的主观性,节省了大量的时 间和工作量。深度学习方法的特征分析具有类脑 的抽象过程,使得模型的泛化能力更好,对声呐 图像的噪声干扰具有更好的兼容性,为提升海底 底质智能识别技术开辟了一种新的模型架构。深 度学习方法在人脸识别、行人检测等光学图像处 理领域已经取得了很大的成功,而与声呐图像和 水下目标识别应用的结合还有待于加强。因此, 本文对深度学习方法在声学海底底质分类中的应 用前景进行了讨论,以卷积神经网络为例从深度 学习的核心算法和网络结构等方面对未来深层次 应用进行展望。 深度学习方法具有更深的网络层数,其实现 架构主要基于多层的神经网络,通过增加隐含层 的数目、扩充阈值和连接权值等参数的规模,提 升模型的复杂度。最具代表性的卷积神经网络 (CNN) 是由 LeCun 等提出并在计算机视觉领域得 到巨大发展的神经网络模型,经过不断改进和发 展 ,CNN 逐渐成为深度学习的主要架构之一。 CNN 是一种深层前馈型神经网络,包含的多层感 知器具有强非线性逼近能力。与传统的神经网络 相比,CNN 通过逐层卷积计算构建了强大的特征 提取器,层与层之间的节点随机相连。CNN 的特 点在于它的局部感知与权值共享,在对输入图像 进行处理时,利用卷积滤波同时作用于一定区域 的神经元,通过扫描整张图像得到全域的综合特 征信息。同一层级处理过程中共享同一卷积权 值,并通过减少一定权值参数的方式降低网络的 复杂性。 卷积神经网络通常包含输入层、卷积层、池 化层、全连接层和输出层,利用卷积神经网络进 行海底底质分类的基本架构如图 1 所示,其中卷 积层和池化层可以有多个。各层的主要工作机制 如下。1) 输入层。读取图像数据,原始图像保存 在该层。2) 卷积层。利用卷积核进行特征提取, 特点是局部感知域、权值共享和多核卷积。在每 一卷积层中包含多个卷积核,使每一个卷积核都 与本层输入图像的局部区域进行卷积运算获取不 同种类的特征图,输入到下一层,其中卷积核的 权重是经学习得到且在卷积过程中保持不变。 3) 池化层。将图像划分为不重叠区域并对区域内 的元素进行聚合。可以利用多种池化方式对输入 特征图进行池化,进而降低特征维度,保证网络 的抗噪能力。4) 全连接层。经过卷积层处理之 后,图像信息被高度抽象化,全连接层在整幅图 像层面进行特征组合与推断,形成利于分类的特 征。5) 输出层。对全连接层的输出向量进行类别 判定。针对不同的声呐图像识别任务,CNN 网络 的各层结构和参数设置需要结合图像数据特点进 行单独设计。 ReLU 全连接层 输出层 Softmax 输入层 采样数据 声呐图像 n卷积核 卷积层 F1 F2 Fn Fn−1 Map1 Map2 Map(n−1) Mapn 池化层 Class 1 Class 2 Class 3 Class 4 Class 5 Class 6 海底底质分布图 图 1 卷积神经网络海底底质分类基本架构 Fig. 1 Basic structure of seabed sediment classification using CNN ·594· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有