【人工智能】海底声呐图像智能底质分类技术研究综述

团购合买资源类别：文库，文档格式：PDF，文档页数：14，文件大小：3.65MB

第15卷第3期智能系统学报 Vol.15 No.3 2020年5月 CAAI Transactions on Intelligent Systems May 2020 D0L:10.11992tis.202004026 海底声呐图像智能底质分类技术研究综述赵玉新，赵廷 (哈尔滨工程大学自动化学院，黑龙江哈尔滨150001) 摘要：海底声呐图像底质分类技术是指利用多波束、侧扫声呐等设备获取海底图像进行浅表层地质属性信息的反演和预测。综合运用水声学、图像处理以及机器学习的相关理论，声学海底底质分类技术能够快速、淮确地识别海底底质类型。通过回顾国内外发展历程，对利用声学图像进行海底底质分类的关键技术进行了总结，从声学海底底质分类的关系模型、海底声呐图像的特征表达和分类模型构建三个方面介绍了领域内的研究进展和主要方法，重点分析了不同模型和方法的原理、技术特点和适用场合，并结合卷积神经网络对深度学习方法在海底底质分类中的应用进行了讨论。最后，对海底声呐图像底质分类技术的研究方向和发展趋势进行了归纳和展望。关键词：声学探测：声呐图像：底质类型：特征提取：图像分类：监督学习：无监督学习：深度学习：卷积神经网络：海底底质分类中图分类号：TP753文献标志码：A文章编号：1673-4785(2020)03-0587-14 中文引用格式：赵玉新，赵廷.海底声呐图像智能底质分类技术研究综述.智能系统学报，2020,15(3)：587-600. 英文引用格式：ZHAO Yuxin,,ZHAO Ting.Survey of the intelligent seabed sediment classification technology based on sonar im- ages[J].CAAI transactions on intelligent systems,2020,15(3):587-600. Survey of the intelligent seabed sediment classification technology based on sonar images ZHAO Yuxin,ZHAO Ting (College of Automation,Harbin Engineering University,Harbin 150001,China) Abstract:Image-based acoustic seabed sediment classification refers to the technology of inversion and prediction of the marine geological attributes of the shallow strata using seabed sonar image obtained using a multi-beam,side-scan sonar.As the multidisciplinary branch of oceanology,this technology is able to quickly identify a sediment type based on the relevant knowledge of underwater acoustics,image processing,and machine learning.Based on the review on the history and development of the technology at home and abroad,this article summarizes the key techniques in the frame- work of seabed sediment classification using sonar image and makes an introduction to the progress in research and main algorithms used in the domain,including the geoacoustic relationship model,the feature expression of the seabed sonar image,and the building of classification model.The emphasis is put on the analysis of the principles,technical features,and applications for various models and algorithms.Deep learning is also discussed for exploring proper ap- plication in the acoustic seabed classification with the case of convolutional neural network.The deep learning al- gorithms are applied on the sonar images and analyzed.Finally,acoustic image-based seabed sediment classification is completed and forecast is done. Keywords:acoustic detection;sonar image;sediment type;feature extraction;image classification;supervized learning; unsupervized learning:deep learning;convolutional neural network;seabed sediment classification 收稿日期：2020-04-24. 随着人类海上活动空间的进一步拓展，海洋基金项目：国家重点基础研究发展计划(613317)：国家自然科学基金面上项目(41676088). 矿产资源勘探、地球生命系统演化等一系列重要通信作者：赵廷.E-mail:zhaoting@hrbeu.edu.cn. 的科学问题都对海底科学的发展提出了新的要

DOI: 10.11992/tis.202004026 海底声呐图像智能底质分类技术研究综述赵玉新，赵廷（哈尔滨工程大学自动化学院，黑龙江哈尔滨 150001）摘要：海底声呐图像底质分类技术是指利用多波束、侧扫声呐等设备获取海底图像进行浅表层地质属性信息的反演和预测。综合运用水声学、图像处理以及机器学习的相关理论，声学海底底质分类技术能够快速、准确地识别海底底质类型。通过回顾国内外发展历程，对利用声学图像进行海底底质分类的关键技术进行了总结，从声学海底底质分类的关系模型、海底声呐图像的特征表达和分类模型构建三个方面介绍了领域内的研究进展和主要方法，重点分析了不同模型和方法的原理、技术特点和适用场合，并结合卷积神经网络对深度学习方法在海底底质分类中的应用进行了讨论。最后，对海底声呐图像底质分类技术的研究方向和发展趋势进行了归纳和展望。关键词：声学探测；声呐图像；底质类型；特征提取；图像分类；监督学习；无监督学习；深度学习；卷积神经网络；海底底质分类中图分类号：TP753 文献标志码：A 文章编号：1673−4785(2020)03−0587−14 中文引用格式：赵玉新, 赵廷. 海底声呐图像智能底质分类技术研究综述 [J]. 智能系统学报, 2020, 15(3): 587–600. 英文引用格式：ZHAO Yuxin, ZHAO Ting. Survey of the intelligent seabed sediment classification technology based on sonar images[J]. CAAI transactions on intelligent systems, 2020, 15(3): 587–600. Survey of the intelligent seabed sediment classification technology based on sonar images ZHAO Yuxin，ZHAO Ting (College of Automation, Harbin Engineering University, Harbin 150001, China) Abstract: Image-based acoustic seabed sediment classification refers to the technology of inversion and prediction of the marine geological attributes of the shallow strata using seabed sonar image obtained using a multi-beam, side-scan sonar. As the multidisciplinary branch of oceanology, this technology is able to quickly identify a sediment type based on the relevant knowledge of underwater acoustics, image processing, and machine learning. Based on the review on the history and development of the technology at home and abroad, this article summarizes the key techniques in the framework of seabed sediment classification using sonar image and makes an introduction to the progress in research and main algorithms used in the domain, including the geoacoustic relationship model, the feature expression of the seabed sonar image, and the building of classification model. The emphasis is put on the analysis of the principles, technical features, and applications for various models and algorithms. Deep learning is also discussed for exploring proper application in the acoustic seabed classification with the case of convolutional neural network. The deep learning algorithms are applied on the sonar images and analyzed . Finally, acoustic image-based seabed sediment classification is completed and forecast is done. Keywords: acoustic detection; sonar image; sediment type; feature extraction; image classification; supervized learning; unsupervized learning; deep learning; convolutional neural network; seabed sediment classification 随着人类海上活动空间的进一步拓展，海洋矿产资源勘探、地球生命系统演化等一系列重要的科学问题都对海底科学的发展提出了新的要收稿日期：2020−04−24. 基金项目：国家重点基础研究发展计划 (613317)；国家自然科学基金面上项目 (41676088). 通信作者：赵廷. E-mail：zhaoting@hrbeu.edu.cn. 第 15 卷第 3 期智能系统学报 Vol.15 No.3 2020 年 5 月 CAAI Transactions on Intelligent Systems May 2020

·588· 智能系统学报第15卷求，海底科学理论水平与探测技术亟需得到进海底声反射特性对海底底质类型进行识别成为海步提升。海底科学的主要研究内容包括海底形底探测的重要手段。态、组成、结构、地球物理场及其演化历史、海底声学海底底质分类以声呐系统获取的反向散各圈层间及海底与其他海洋圈层之间的相互作用四。射强度数据为基础，结合机械取样方法获得的真海底探测的目标则是利用一定的技术手段获取海实海底底质样品数据，利用多种分类算法建立底底地质的空间分布特性及其随时间的变化规律，质类型自动分析模型，进而实现高效、准确的海是一种基于连续时空系统的模式研究。由于海底底底质分类。从20世纪60年代起，以Hamilton 圈层中不同的岩层介质在密度、弹性、磁性等方为代表的国外研究学者首先从海底的力学结构特面存在差异，通过综合运用声、光、电、磁、重力性、声传播特性以及海底地声模型等多个角度开等多种技术手段来观测地球物理场的变化，能够展了相关研究与测试，奠定了声学海底底质探测有效地掌握地层的物理特性、内部构造等信息口。技术的物理学基础-20。此后，国内外研究学者声波在海水中具有非常优越的传播特性，逐渐成尝试利用多种方法构建海底反向散射强度与底质为海底探测的主要技术手段。在现代海底科学研类型之间的相关性模型，主要研究焦点可以归结究中，已经发展出多种海底声学探测技术，如海为海底物理参数反演模型川、海底回波空间分布洋地震仪、多波束测深仪、侧扫声呐、海底地关系模型22)、海底回波波形关系模型。层剖面仪、水下声学定位等m,快速发展的水下 1.1海底物理参数反演模型声学技术为探测海底浅部剖面乃至深部地层结构海底底质是具有多重物理属性、特征变化明发挥了重要的作用。显的固体层，反映力学结构特性的参量包括孔隙海底底质是海洋环境的要素之一，主要指海度、密度、粒径、饱和度等，反映声学特性的参量底表面的组成物质，包括海底岩石和水动力作用有声速、声衰减系数、声反射系数、声阻抗等，力过程中沉积下来的表层沉积物。研究海底底质物学结构参量与声学结构参量之间具有很强的相关理特性，探索高效、精确的海底底质分类方法，对性。Biot等2s-2提出了以流体饱和多孔介质为基于提升海上活动的环境信息保障能力具有十分重础的声传播模型，该模型利用分析力学的方法给要的意义。声学海底底质分类是一种高效的海底出了流体饱和多孔介质的声波方程，建立了介质探测技术，涉及海洋地质、海洋测绘、水声学、模声速、声衰减、频率和孔隙度等参数之间的关式识别等学科的庞大的知识体系，国内外研究学系。Hamilton2-2通过研究海底声波在一定频段者相继提出了许多新颖的算法和研究思路，本文上的反射和折射特性，构建了水深、沉积层密度从模式识别的角度出发对现有的声学海底底质识声速和声衰减系数等参量之间的关系，以海洋沉别方法进行梳理和归纳，对基于声呐图像的海底积层弹性和黏弹性模型为基础提出了浅海和深海底质分类技术的未来发展趋势进行分析和展望。地声模型。Jackson等Bo提出的高频海底散射模型中将反向散射强度的计算归结为粗糙界面散射 1声学海底底质探测技术和沉积物体积散射两部分，为海底反向散射的物理过程提供了合理精确的描述。经过众多研究学早期的海底底质探测主要采用直接法8)，通者的发展和完善313，海底物理结构参数与声学过站点式的机械取样获得底质样本，再经过实验参数之间的数学关系模型逐步建立。基于该关系室测定9或原位分析0)确定底质类型。常用的模型演化出的海底底质分类方法，首先利用单波取样方法包括重力取样器、冲击式取样器、原位束和多波束测深仪的回波强度数据反演底质的地采样器等，普遍存在效率低、成本高、无法在深水声参数33，如根据回声振幅计算的反射系数3可区取样、作业点离散等弊端，难以满足现代大面以及根据多层介质声学理论估计的各层沉积物的积海洋调查的需求。随着声呐信号处理技术的声阻抗等，然后依据海底底质物理特性参数的快速发展，利用声学方法探测海底底质信息展现分布区间或经验公式推断海底底质类型。以该关出巨大的潜力和优势，利用多波束、侧扫声呐、浅系模型为基础的海底底质分类方法的优点是：有地层剖面等勘测设备不仅可以获取高精度水深测确定的物理学模型，计算的模型参数具有实际的量数据，还能采集到海底反向散射强度数据，为物理意义，分类规则具有可解释性。其缺点是：精确推断海底地质结构提供了丰富的观测信息3。地声模型理论复杂，底质物理参数分布和经验计由于不同类型底质的声吸收系数、反射系数、表算公式有较强的区域性，声学参量计算存在一定面粗糙度等参数具有显著差异性，从多角度利用误差

求，海底科学理论水平与探测技术亟需得到进一步提升。海底科学的主要研究内容包括海底形态、组成、结构、地球物理场及其演化历史、海底各圈层间及海底与其他海洋圈层之间的相互作用[1]。海底探测的目标则是利用一定的技术手段获取海底地质的空间分布特性及其随时间的变化规律，是一种基于连续时空系统的模式研究。由于海底圈层中不同的岩层介质在密度、弹性、磁性等方面存在差异，通过综合运用声、光、电、磁、重力等多种技术手段来观测地球物理场的变化，能够有效地掌握地层的物理特性、内部构造等信息[2]。声波在海水中具有非常优越的传播特性，逐渐成为海底探测的主要技术手段。在现代海底科学研究中，已经发展出多种海底声学探测技术，如海洋地震仪[3] 、多波束测深仪[4] 、侧扫声呐[5] 、海底地层剖面仪[6] 、水下声学定位等[7] ，快速发展的水下声学技术为探测海底浅部剖面乃至深部地层结构发挥了重要的作用。海底底质是海洋环境的要素之一，主要指海底表面的组成物质，包括海底岩石和水动力作用过程中沉积下来的表层沉积物。研究海底底质物理特性，探索高效、精确的海底底质分类方法，对于提升海上活动的环境信息保障能力具有十分重要的意义。声学海底底质分类是一种高效的海底探测技术，涉及海洋地质、海洋测绘、水声学、模式识别等学科的庞大的知识体系，国内外研究学者相继提出了许多新颖的算法和研究思路，本文从模式识别的角度出发对现有的声学海底底质识别方法进行梳理和归纳，对基于声呐图像的海底底质分类技术的未来发展趋势进行分析和展望。 1 声学海底底质探测技术早期的海底底质探测主要采用直接法[8] ，通过站点式的机械取样获得底质样本，再经过实验室测定[9] 或原位分析[10-11] 确定底质类型。常用的取样方法包括重力取样器、冲击式取样器、原位采样器等，普遍存在效率低、成本高、无法在深水区取样、作业点离散等弊端，难以满足现代大面积海洋调查的需求[12]。随着声呐信号处理技术的快速发展，利用声学方法探测海底底质信息展现出巨大的潜力和优势，利用多波束、侧扫声呐、浅地层剖面等勘测设备不仅可以获取高精度水深测量数据，还能采集到海底反向散射强度数据，为精确推断海底地质结构提供了丰富的观测信息[13-16]。由于不同类型底质的声吸收系数、反射系数、表面粗糙度等参数具有显著差异性，从多角度利用海底声反射特性对海底底质类型进行识别成为海底探测的重要手段。声学海底底质分类以声呐系统获取的反向散射强度数据为基础，结合机械取样方法获得的真实海底底质样品数据，利用多种分类算法建立底质类型自动分析模型，进而实现高效、准确的海底底质分类。从 20 世纪 60 年代起，以 Hamilton 为代表的国外研究学者首先从海底的力学结构特性、声传播特性以及海底地声模型等多个角度开展了相关研究与测试，奠定了声学海底底质探测技术的物理学基础[17-20]。此后，国内外研究学者尝试利用多种方法构建海底反向散射强度与底质类型之间的相关性模型，主要研究焦点可以归结为海底物理参数反演模型[21] 、海底回波空间分布关系模型[22-23] 、海底回波波形关系模型[24]。 1.1 海底物理参数反演模型海底底质是具有多重物理属性、特征变化明显的固体层，反映力学结构特性的参量包括孔隙度、密度、粒径、饱和度等，反映声学特性的参量有声速、声衰减系数、声反射系数、声阻抗等，力学结构参量与声学结构参量之间具有很强的相关性。Biot 等 [25-26] 提出了以流体饱和多孔介质为基础的声传播模型，该模型利用分析力学的方法给出了流体饱和多孔介质的声波方程，建立了介质声速、声衰减、频率和孔隙度等参数之间的关系。Hamilton[27-29] 通过研究海底声波在一定频段上的反射和折射特性，构建了水深、沉积层密度、声速和声衰减系数等参量之间的关系，以海洋沉积层弹性和黏弹性模型为基础提出了浅海和深海地声模型。Jackson 等 [30] 提出的高频海底散射模型中将反向散射强度的计算归结为粗糙界面散射和沉积物体积散射两部分，为海底反向散射的物理过程提供了合理精确的描述。经过众多研究学者的发展和完善[31-32] ，海底物理结构参数与声学参数之间的数学关系模型逐步建立。基于该关系模型演化出的海底底质分类方法，首先利用单波束和多波束测深仪的回波强度数据反演底质的地声参数[33-36] ，如根据回声振幅计算的反射系数[37] 以及根据多层介质声学理论估计的各层沉积物的声阻抗[38] 等，然后依据海底底质物理特性参数的分布区间或经验公式推断海底底质类型。以该关系模型为基础的海底底质分类方法的优点是：有确定的物理学模型，计算的模型参数具有实际的物理意义，分类规则具有可解释性。其缺点是：地声模型理论复杂，底质物理参数分布和经验计算公式有较强的区域性，声学参量计算存在一定误差。 ·588· 智能系统学报第 15 卷

第3期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·589· 1.2海底回波空间分布关系模型提出的方法可以归纳为三大类：空间域方法、频海底回波空间分布特征以多波束和侧扫声呐率域方法以及其他变换域方法。为主要探测设备，通过综合分析一定空间范围内 2.1空间域特征的反向散射强度特征，判断海底底质的类型和表空间域特征是指基于声呐图像灰度空间分布层结构。Clarke等B.o提出利用反向散射强度随特性的统计量。海底声呐图像的灰度变化在局部波束入射角的变化曲线进行海底底质分类，实验区域内具有不规则性，而在整体上又呈现出一定证实不同类型的海底底质角度响应曲线的形状、的规律性，这使图像中的不同区域可以依据概率方差和幅值特征具有区分性，该方法在多波束底统计特征和纹理特征进行识别，兼顾图像的宏观质识别研究中受到广泛关注。Pace等山提出了和微观结构特征6。基于侧扫声呐图像纹理特征的海底沉积学类型自 2.1.1概率统计特征动识别方法，初步验证了图像法在海底地质特征声呐系统将接收到的回波强度转换为图像灰分析中的有效性。此后，基于声呐图像的海底表度，由于海底底质的反射系数有所差异，不同底层地质属性识别技术迅速发展，谱特征)、灰度质的声呐图像会呈现出一定的明暗变化。通常情共生矩阵4)、参数化反射概率密度模型、神经况下，声波反射能力强的底质类型回波强度值网络及其优化模型、支持向量机、决策树6个大，区域呈现亮色，声波吸收能力强的底质类型等方法被应用在海底声呐图像识别中，显著提升回波强度值小，区域呈现阴影区。为了表示海底了海底底质识别的效率和准确度。图像灰度值的平均水平和起伏情况，选取均值、 1.3海底回波波形关系模型标准差、偏度、峰度、分位数描述海底声阻抗和界海底回波波形特征以单波束测深仪和浅地层面粗糙度变化s。假设样本图像1(x,y)的分辨率剖面仪为主要的探测设备，声波到达海底后受硬为N,×Ne,则各项统计量计算如下：度、粗糙度、声阻抗等因素的影响，经过反射和散 1)均值。不同底质类型会形成起伏变化的反射回到换能器，回波信号的振幅和相位发生变向散射强度分布，可利用灰度均值表征底质对声化，不同类型底质的回波呈现出独有特征。通过波反射特性的平均水平：分析入射海底的声脉冲信号的幅值、波形特征， 1 推断海底底质的类型和结构特性7。孟金生等s0 μ=1 N. 扫1扫1 提出利用高频正入射声脉冲估测海底表层沉积物 2)标准差。受海底起伏和表面粗糙度不均匀的声衰减系数，从回波包络的形状提取声波传播衰减的指数因子。Prager等s利用回声测深仪回的影响，海底底质图像呈现出明暗变化，灰度值标准差反映了反向散射强度相对平均值的总离波的形状信息，提取直方图统计特征、能量特征、散度：谱特征和小波系数特征共166维的全特征向量，利用主成分分析法对特征进行融合，在海试中验证了该类方法的有效性。万宏俊2将多波束声呐信号时域波形进行EMD分解，得到了信号瞬 NN 时频率分布图，并提取希尔伯特边际谱特征进行 3)偏度与峰度。偏度(s)是图像灰度分布偏海底底质分类。斜方向和程度的度量，用于表征概率密度曲线相对于平均值不对称程度。峰度(k)表征了数据概 2海底声呐图像特征提取方法率密度分布曲线在平均值处峰值高低的特性，描述了分布形态的陡缓程度。对海底反向散射强度数据按照地理位置信息进行处理和拼接，可以得到海底的声呐图像，进 N,Ne (1(i,)-) 而以更加直观的形式对海底反向散射数据的空间 i=l l 特性进行分析。海洋环境噪声随机性强，水声信 NNσ3 道受到诸多时变和空变因素的影响，目标边界或结构有较大的不规则性，仅利用单一的特征值难 i.- l 以准确地描述海底观测数据的特征，因此在水声 k= NN 图像识别中特征提取成为最为关键的技术。目 4)分位数。对海底底质图像灰度值分布函前针对海底图像的特征提取问题，相关研究学者数，采用四分位数作为分类特征量，包括第一四

1.2 海底回波空间分布关系模型海底回波空间分布特征以多波束和侧扫声呐为主要探测设备，通过综合分析一定空间范围内的反向散射强度特征，判断海底底质的类型和表层结构。Clarke 等 [39-40] 提出利用反向散射强度随波束入射角的变化曲线进行海底底质分类，实验证实不同类型的海底底质角度响应曲线的形状、方差和幅值特征具有区分性，该方法在多波束底质识别研究中受到广泛关注。Pace 等 [41] 提出了基于侧扫声呐图像纹理特征的海底沉积学类型自动识别方法，初步验证了图像法在海底地质特征分析中的有效性。此后，基于声呐图像的海底表层地质属性识别技术迅速发展，谱特征 [42] 、灰度共生矩阵[43] 、参数化反射概率密度模型[44] 、神经网络及其优化模型[44] 、支持向量机[45] 、决策树[46] 等方法被应用在海底声呐图像识别中，显著提升了海底底质识别的效率和准确度。 1.3 海底回波波形关系模型海底回波波形特征以单波束测深仪和浅地层剖面仪为主要的探测设备，声波到达海底后受硬度、粗糙度、声阻抗等因素的影响，经过反射和散射回到换能器，回波信号的振幅和相位发生变化，不同类型底质的回波呈现出独有特征。通过分析入射海底的声脉冲信号的幅值、波形特征，推断海底底质的类型和结构特性[47]。孟金生等[48-50] 提出利用高频正入射声脉冲估测海底表层沉积物的声衰减系数，从回波包络的形状提取声波传播衰减的指数因子。Prager 等 [51] 利用回声测深仪回波的形状信息，提取直方图统计特征、能量特征、谱特征和小波系数特征共 166 维的全特征向量，利用主成分分析法对特征进行融合，在海试中验证了该类方法的有效性。万宏俊[52] 将多波束声呐信号时域波形进行 EMD 分解，得到了信号瞬时频率分布图，并提取希尔伯特边际谱特征进行海底底质分类。 2 海底声呐图像特征提取方法对海底反向散射强度数据按照地理位置信息进行处理和拼接，可以得到海底的声呐图像，进而以更加直观的形式对海底反向散射数据的空间特性进行分析。海洋环境噪声随机性强，水声信道受到诸多时变和空变因素的影响，目标边界或结构有较大的不规则性，仅利用单一的特征值难以准确地描述海底观测数据的特征，因此在水声图像识别中特征提取成为最为关键的技术[53]。目前针对海底图像的特征提取问题，相关研究学者提出的方法可以归纳为三大类：空间域方法、频率域方法以及其他变换域方法。 2.1 空间域特征空间域特征是指基于声呐图像灰度空间分布特性的统计量。海底声呐图像的灰度变化在局部区域内具有不规则性，而在整体上又呈现出一定的规律性，这使图像中的不同区域可以依据概率统计特征和纹理特征进行识别，兼顾图像的宏观和微观结构特征[54]。 2.1.1 概率统计特征 I(x, y) Nr ×Nc 声呐系统将接收到的回波强度转换为图像灰度，由于海底底质的反射系数有所差异，不同底质的声呐图像会呈现出一定的明暗变化。通常情况下，声波反射能力强的底质类型回波强度值大，区域呈现亮色，声波吸收能力强的底质类型回波强度值小，区域呈现阴影区。为了表示海底图像灰度值的平均水平和起伏情况，选取均值、标准差、偏度、峰度、分位数描述海底声阻抗和界面粗糙度变化[55]。假设样本图像的分辨率为，则各项统计量计算如下： 1) 均值。不同底质类型会形成起伏变化的反向散射强度分布，可利用灰度均值表征底质对声波反射特性的平均水平： µ = 1 NrNc ∑Nr i=1 ∑Nc j=1 I(i, j) 2) 标准差。受海底起伏和表面粗糙度不均匀的影响，海底底质图像呈现出明暗变化，灰度值标准差反映了反向散射强度相对平均值的总离散度： σ = vuuuuuut ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 2 NrNc s k 3) 偏度与峰度。偏度 ( ) 是图像灰度分布偏斜方向和程度的度量，用于表征概率密度曲线相对于平均值不对称程度。峰度 ( ) 表征了数据概率密度分布曲线在平均值处峰值高低的特性，描述了分布形态的陡缓程度。 s = ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 3 NrNcσ3 k = ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 4 NrNcσ4 4) 分位数。对海底底质图像灰度值分布函数，采用四分位数作为分类特征量，包括第一四第 3 期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·589·

·590· 智能系统学报第15卷分位数、中位数、第三四分位数。 D=lgN, Ig(1/r) (1) 2.1.2灰度共生矩阵灰度共生矩阵是建立在图像二阶联合条件概利用式(1)定义的分形维数可以通过多种方率密度函数基础上的一种重要的纹理分析方法，法进行计算，常用的方法有Peleg法、微分盒计数通过统计图像中在特定距离和倾角上具有指定灰法、标准差盒计数法等。度级的像素对的数目或者概率，揭示图像灰度关 2.2频率域特征于方向、相邻间隔、变化幅度等的综合信息，是底频率域特征是指通过傅里叶变换等方式将声质分类中使用最多的声呐图像特征。呐图像在频域进行分解，获取图像在频率域的表首先在底质图像中选取一个窗口，给定方向示系数或其统计量作为图像特征。角6和距离d,在方向角为0的直线上有一个像 2.2.1谱特征素点的灰度值为i,若存在另一个与其相距d的谱特征是图像处理与分析领域的重要工具，像素点的灰度值为，则这样的灰度对同时出现也是较早引入声呐图像底质分类中的特征提取方的频数即为灰度共生矩阵P(i,,d,)的第(i,)个法，最具代表性的是功率谱特征和倒频谱特征。阵元的数值，0通常取0°、45°、90°、135°。功率谱描述了信号功率在频域的分布状况。在生成灰度共生矩阵的基础上，可以计算多声呐接收信号是时间的准谐随机函数，每ping回个特征统计量，选择其中不相关的统计量进行底波划分为个等距窗口，将声呐回波强度表示为质图像特征的表示，其中包括角二阶距(ASM)、时间窗口函数w(t)和区间信号幅值a:(t)的乘积：对比度(CON)、相关性(COR)和逆差矩(DM, g;(t)=w(t)a;(t) 计算如下：对窗口信号幅值进行傅里叶变换并取模的平方，则第i个窗口区间的功率谱为 ASM= Pi,id, P(ω)=Fg()川扫1归1 对n个功率谱在各个频率处取均值得到平均 NG NG CoN=∑∑i-Pi,id,0 功率谱： 1面 COR= 99ixj×Pi,,d,)-44 F()=n>P.(0) l Oj Pm为平均功率谱的最大值，A为常量因子，声呐图像的对数功率谱可以表示为 IDM= 99Pi,jd,四台台1+-羽 (AP)+1/(A+1) 其中参数NG表示底质图像的灰度级数，角二阶 Pi(0)-lg Pace等s]将对数功率谱进行标准化并定义矩反映图像灰度分布的均匀程度以及纹理粗细程了3个积分函数表示海底底质的图像特征。度，对比度主要反映图像清晰度与纹理深浅的程度，相关性是用来衡量元素在灰度共生矩阵的行倒频谱定义为：信号功率谱对数的傅里叶变换，在某些声信号处理应用中比功率谱和自相关或列方向上的相似度，逆差矩反映了图像的局部函数具有更好的应用效果。对平均功率谱的对数同质性。进行傅里叶逆变换并取幅值的模的平方即为图像 2.1.3分形雏的倒频谱C(r),t为倒频率。分形几何能够准确刻画自然中广泛存在的、不规则的自然现象，判断分形几何的一个准则是 C()=logP() 其自相似性。由于粒径、孔隙度等物理特性的差 Reut等21对声呐图像的倒频谱定义了积分异，各类型底质的声呐图像蕴含了海底起伏和表函数并引入斜率、截距两个参数表征倒频谱积分面结构特征，具有统计意义上的自相似性，利用的特性，以此作为海底底质识别的特征量。谱特声呐图像的分形维特征可以描述海底底质表面纹征独立于信号的幅值水平和系统增益，但是对样理的不规则性和粗糙程度。本的区分性严重依赖声波脉冲长度和载波频率，其对于n维欧氏空间中的有界集合F,能够以分类性能容易受到声呐类型及其工况参数的影响。尺度因子r分割为N,个独立的子集的联合，每个 2.2.2小波变换子集与原集合保持自相似性。分形集合通过分形小波变换是利用小波函数对信号进行多尺度维数进行特征量化，集合F的分形维数定义为分解，进而对信号进行时频域局部分析的一种数

分位数、中位数、第三四分位数。 2.1.2 灰度共生矩阵灰度共生矩阵是建立在图像二阶联合条件概率密度函数基础上的一种重要的纹理分析方法，通过统计图像中在特定距离和倾角上具有指定灰度级的像素对的数目或者概率，揭示图像灰度关于方向、相邻间隔、变化幅度等的综合信息，是底质分类中使用最多的声呐图像特征。 θ d θ i d j P(i, j,d, θ) (i, j) θ 首先在底质图像中选取一个窗口，给定方向角和距离，在方向角为的直线上有一个像素点的灰度值为，若存在另一个与其相距的像素点的灰度值为，则这样的灰度对同时出现的频数即为灰度共生矩阵的第个阵元的数值，通常取 0°、45°、90°、135°。在生成灰度共生矩阵的基础上，可以计算多个特征统计量，选择其中不相关的统计量进行底质图像特征的表示，其中包括角二阶距 (ASM)、对比度 (CON)、相关性 (COR) 和逆差矩 (IDM)[56] ，计算如下： ASM = ∑NG i=1 ∑NG j=1 P(i, j,d, θ) 2 CON = ∑NG i=1 ∑NG j=1 (i− j) 2P(i, j,d, θ) COR = ∑NG i=1 ∑NG j=1 i× j× P(i, j,d, θ)−µiµj σiσj IDM = ∑NG i=1 ∑NG j=1 P(i, j,d, θ) 1+(i− j) 2 其中参数 NG 表示底质图像的灰度级数，角二阶矩反映图像灰度分布的均匀程度以及纹理粗细程度，对比度主要反映图像清晰度与纹理深浅的程度，相关性是用来衡量元素在灰度共生矩阵的行或列方向上的相似度，逆差矩反映了图像的局部同质性。 2.1.3 分形维分形几何能够准确刻画自然中广泛存在的、不规则的自然现象，判断分形几何的一个准则是其自相似性。由于粒径、孔隙度等物理特性的差异，各类型底质的声呐图像蕴含了海底起伏和表面结构特征，具有统计意义上的自相似性，利用声呐图像的分形维特征可以描述海底底质表面纹理的不规则性和粗糙程度[57]。 n F r Nr F 对于维欧氏空间中的有界集合，能够以尺度因子分割为个独立的子集的联合，每个子集与原集合保持自相似性。分形集合通过分形维数进行特征量化，集合的分形维数定义为 D = lgNr lg(1/r) (1) 利用式 (1) 定义的分形维数可以通过多种方法进行计算，常用的方法有 Peleg 法、微分盒计数法、标准差盒计数法等[58]。 2.2 频率域特征频率域特征是指通过傅里叶变换等方式将声呐图像在频域进行分解，获取图像在频率域的表示系数或其统计量作为图像特征。 2.2.1 谱特征谱特征是图像处理与分析领域的重要工具，也是较早引入声呐图像底质分类中的特征提取方法，最具代表性的是功率谱特征和倒频谱特征。 n w(t) ai(t) 功率谱描述了信号功率在频域的分布状况。声呐接收信号是时间的准谐随机函数，每 ping 回波划分为个等距窗口，将声呐回波强度表示为时间窗口函数和区间信号幅值的乘积： gi(t) = w(t)ai(t) i 对窗口信号幅值进行傅里叶变换并取模的平方，则第个窗口区间的功率谱为 Pi(ω) = |F {gi(t)}| 2 对 n 个功率谱在各个频率处取均值得到平均功率谱： P(ω) = n −1∑n i=1 Pi(ω) Pm 为平均功率谱的最大值， A 为常量因子，声呐图像的对数功率谱可以表示为 PL(ω) = lg( AP(ω) Pm +1 ) / lg(A+1) Pace 等 [59] 将对数功率谱进行标准化并定义了 3 个积分函数表示海底底质的图像特征。 C(τ) τ 倒频谱定义为：信号功率谱对数的傅里叶变换，在某些声信号处理应用中比功率谱和自相关函数具有更好的应用效果。对平均功率谱的对数进行傅里叶逆变换并取幅值的模的平方即为图像的倒频谱，为倒频率。 C(τ) = F { logP(ω) } 2 Reut 等 [42] 对声呐图像的倒频谱定义了积分函数并引入斜率、截距两个参数表征倒频谱积分的特性，以此作为海底底质识别的特征量。谱特征独立于信号的幅值水平和系统增益，但是对样本的区分性严重依赖声波脉冲长度和载波频率，其分类性能容易受到声呐类型及其工况参数的影响。 2.2.2 小波变换小波变换是利用小波函数对信号进行多尺度分解，进而对信号进行时频域局部分析的一种数 ·590· 智能系统学报第 15 卷

第3期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·591· 学工具。图像小波分解处理的实质是分频处理，波分析的基础上提出的一种非自适应的多尺度分海底声呐图像中的粗纹理和细纹理空间能量分别析方法，能够在任意尺度上实现任意方向的分集中分布在低频段和高频段，因此不同底质类型解，在捕捉图像轮廓、纹理特征方面具有优越的的声呐图像在高低频段的能量占比存在着一定性能。差异60。李庆武等I6]提出的基于Contourlet变换的利用小波变换提取声呐图像特征首先要选取声呐图像特征提取方法，首先，利用多尺度分合适的小波基，对声呐图像进行二值图转化，利解提取边缘奇异点，根据方向信息将相近的奇用小波分解函数计算图像阈值并对图像进行分异点汇集成轮廓段；然后，利用拉普拉斯塔式解；然后获取各层各分解通道系数的均值、标准滤波器将图像进行多分辨率分解提取奇异点，差和能量等；计算不同底质不同层次信号能量百采用二维方向滤波器组将同向的奇异点连接成分比，归纳能量百分比分布特性，评估获取的各线，使生成的基结构逼近原图像；最后，分别针个指标在海底底质分类中的分离性。对高频子带和低频子带获取不同的统计特征 Hatanaka等6对不同类型底质的纹理特征进量，对具有显著方向特性的底质类型实现了较行分析，结果显示底质纹理结构的差异显著体现好的识别率。在小波变换的低频分量中。此外，在小波变换基 2.3其他变换域方法础上建立的曲波变换61、轮廓波变换6刷具有多分相关研究学者还提出利用其他方法描述海底辨、多尺度、各向异性等特点，对图像进行不同方底质特征，如SIFT特征、Weyl变换等64，由于向的分解时灵活性更强，提取的特征参数也更加篇幅有限不再详述。细致。表1中总结了常用的海底底质分类特征提取 2.2.3 Contourlet变换方法，在主要思想、特征量、方法、特点等方面进 Contourlet变换是由Donoho和Vetterli在小行了对比。表1常用的海底底质特征提取方法对比 Table 1 Various seabed sediment feature extraction methods 方法主要思想特征量尺度特点应用范例利用概率统计的方法表示反向散射均值、标准差计算简单，性能稳概率统计文献66)] 强度的平均水平、波动性、概率分布偏度、峰度可变尺度定，直观描述海底文献[67列的偏斜程度和峰态特性分位数、直方图声反射特性利用二阶联合条件概率密度计算量大，反映海角二阶矩、对比度文献[41] 灰度共生矩阵表示海底底质分布的均匀程可变尺度底声反射的空间分相关性、逆差矩等文献68] 度以及纹理粗细程度布相关性定量表示海底地形以及海床表征海底表面的粗文献I69] 分形维分形维数可变尺度表面粗糙度的分形特性糙度和复杂度文献[57刀表征灰度变化剧烈将图像的灰度分布变换为图功率谱频段程度，一定程度上文献59 功率谱多ping 像的频率分布分量比反映底质边界特征文献70] 和混杂程度分析原频谱上的细微周期成表征海底粗糙度和倒频谱积分的倒频谱分，能够分离出主声源和传多ping 硬度，依赖声波脉文献[42] 斜率和截距播噪声的频带冲长度和频率利用小波函数对图像进行多分别对图像高、低小波分解系文献71川小波变换尺度分解，在多个分解层上可变尺度频段进行分析，去数统计量文献[60] 分析图像时频域特征噪性能好非自适应的多尺度分析方法，高低频子对边缘、轮廓和方文献72] Contourlet?变换能够在任意尺度上实现任意方可变尺度带统计量向特征识别性好文献63] 向的分解

学工具。图像小波分解处理的实质是分频处理，海底声呐图像中的粗纹理和细纹理空间能量分别集中分布在低频段和高频段，因此不同底质类型的声呐图像在高低频段的能量占比存在着一定差异[60]。利用小波变换提取声呐图像特征首先要选取合适的小波基，对声呐图像进行二值图转化，利用小波分解函数计算图像阈值并对图像进行分解；然后获取各层各分解通道系数的均值、标准差和能量等；计算不同底质不同层次信号能量百分比，归纳能量百分比分布特性，评估获取的各个指标在海底底质分类中的分离性。 Hatanaka 等 [61] 对不同类型底质的纹理特征进行分析，结果显示底质纹理结构的差异显著体现在小波变换的低频分量中。此外，在小波变换基础上建立的曲波变换[62] 、轮廓波变换[63] 具有多分辨、多尺度、各向异性等特点，对图像进行不同方向的分解时灵活性更强，提取的特征参数也更加细致。 2.2.3 Contourlet 变换 Contourlet 变换是由 Donoho 和 Vetterli 在小波分析的基础上提出的一种非自适应的多尺度分析方法，能够在任意尺度上实现任意方向的分解，在捕捉图像轮廓、纹理特征方面具有优越的性能。李庆武等[63] 提出的基于 Contourlet 变换的声呐图像特征提取方法，首先，利用多尺度分解提取边缘奇异点，根据方向信息将相近的奇异点汇集成轮廓段；然后，利用拉普拉斯塔式滤波器将图像进行多分辨率分解提取奇异点，采用二维方向滤波器组将同向的奇异点连接成线，使生成的基结构逼近原图像；最后，分别针对高频子带和低频子带获取不同的统计特征量，对具有显著方向特性的底质类型实现了较好的识别率。 2.3 其他变换域方法相关研究学者还提出利用其他方法描述海底底质特征，如 SIFT 特征、Weyl 变换等[64-65] ，由于篇幅有限不再详述。表 1 中总结了常用的海底底质分类特征提取方法，在主要思想、特征量、方法、特点等方面进行了对比。表 1 常用的海底底质特征提取方法对比 Table 1 Various seabed sediment feature extraction methods 方法主要思想特征量尺度特点应用范例概率统计利用概率统计的方法表示反向散射强度的平均水平、波动性、概率分布的偏斜程度和峰态特性均值、标准差、偏度、峰度、分位数、直方图可变尺度计算简单，性能稳定，直观描述海底声反射特性文献[66] 文献[67] 灰度共生矩阵利用二阶联合条件概率密度表示海底底质分布的均匀程度以及纹理粗细程度角二阶矩、对比度、相关性、逆差矩等可变尺度计算量大，反映海底声反射的空间分布相关性文献[41] 文献[68] 分形维定量表示海底地形以及海床表面粗糙度的分形特性分形维数可变尺度表征海底表面的粗糙度和复杂度文献[69] 文献[57] 功率谱将图像的灰度分布变换为图像的频率分布功率谱频段分量比多ping 表征灰度变化剧烈程度，一定程度上反映底质边界特征和混杂程度文献[59] 文献[70] 倒频谱分析原频谱上的细微周期成分，能够分离出主声源和传播噪声的频带倒频谱积分的斜率和截距多ping 表征海底粗糙度和硬度，依赖声波脉冲长度和频率文献[42] 小波变换利用小波函数对图像进行多尺度分解，在多个分解层上分析图像时频域特征小波分解系数统计量可变尺度分别对图像高、低频段进行分析，去噪性能好文献[71] 文献[60] Contourlet变换非自适应的多尺度分析方法，能够在任意尺度上实现任意方向的分解高低频子带统计量可变尺度对边缘、轮廓和方向特征识别性好文献[72] 文献[63] 第 3 期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·591·

3 分类算法在声学海底底质分类应用中，分类算法按照是否利用底质采样数据可以分为两类：监督学习和无监督学习。鉴于深度学习在网络结构、模型性能等方面与传统的监督学习算法存在的差异性，本文将单独讨论深度学习算法在海底底质分类中的应用现状和发展前景。 3.1 监督学习利用监督学习算法可以基于已有的底质采样数据获得先验知识并储存在分类规则中，可以对未知的输入样本类型进行预测，一般适用于已有底质采样数据、明确掌握海底底质类型的区域。在监督学习算法构建的预测模型中，又可以根据采样数据标定方式的不同，将海底底质的描述方法分为离散类别法和连续量化法。离散类别法是指根据特定的底质分类原则 (如 Folk 分类体系等) 将底质标定为某一种类别描述，如泥、砂等，基于该描述方法构建的底质分类模型预测的是离散值，此类学习任务对应的是“分类”问题。而连续量化法则通过实验测定的方法将底质的物理属性用若干参数表示，如粒径分布等，是一种参数化描述方法，基于该描述方法构建的底质分类模型预测的是连续的属性值，此类学习任务对应的是“回归”问题，一般采用多项式回归、神经网络、随机森林等方法实现。由于连续量化法的底质样本测定较为复杂，且对声呐数据的分辨率要求极高，目前离散类别法仍然是声学海底底质分类中采样数据的主要标定方法，本文主要介绍与离散类别法对应的分类算法，主要包括支持向量机、决策树、随机森林、BP 神经网络等。 3.1.1 支持向量机 (w,b) 支持向量机 (SVM) 是由 Vapnik 等 [73] 提出的基于统计与判别的学习方法，基本思想是最大化分类间隔，通过寻找最优超平面对不同类别的样本进行划分。SVM 基本模型定义为特征空间上间隔最大的线性分类器，其间隔最大化的学习策略对训练样本局部抗扰动性最好，最终可变换为凸二次规划问题进行解答。对于线性可分问题，在样本空间中划分超平面可通过线性方程来描述： w T x+b = 0 w b r (xi , yi) yi = +1 w T xi +b > 0 yi = −1 w T xi+ 式中：为超平面法向量；为超平面与原点的距离，样本空间任意一点到超平面的距离为。设超平面把训练样本准确分类，对任意样本，若，则有，若，则有 b < 0 。满足上述关系的样本称作支持向量，两个异类支持向量距超平面距离之和称作间隔，表示为 γ = 2 ∥w∥ 在多个超平面中，寻找使间隔最大的分离超平面。非线性模型对应的是最优超曲面，原理与线性模型类似。通过使用核函数，支持向量机可以解决非线性分类问题，具有泛化性能好、适合小样本和高维特征等优点，使用高斯核的支持向量机在多分类问题中具有较好的性能。徐超等[74] 采用基于径向基核函数的合成核代替单核形式，一方面可以提升分类精度，另一方面合成核对于多特征融合具有更好的兼容性。 3.1.2 决策树算法决策树算法是一种用于分类和回归的非参数监督学习方法，目标是通过创建一个树状的决策模型，学习隐藏在数据中的决策规则来预测目标变量的数值或分类。利用决策树训练得到的模型是树状的决策图，表示对象属性和对象值之间的一种映射。决策树的深度越大，决策规则越复杂，拟合的模型也更精确。同时，为了增强训练模型的泛化能力，需要利用合适的约束规则避免对训练集的过拟合。决策树算法通过寻找观测值的最优划分，从观测数据的属性集合中选取一个或多个属性作为决策节点的分裂属性，将观测数据按照指定的属性阈值划分到子节点中，生成具有多重深度的完整分类树。然后利用剪枝算法对分类树的结构进行精简，结合测试数据对剪枝后的模型精度进行评估，确定最优的分类树结构。在树型结构的训练过程中，核心问题是如何确定各个决策节点的分裂属性和变量值。在进行贪婪搜索时，遍历各个属性的不同二分裂集合，通过计算节点处的分裂度量函数对当前采用的分裂属性及其变量值的分离性做出评价，最终通过迭代测试确定所有节点的分裂规则。决策树分类模型在基于海底声呐图像的底质分类应用中可以有效识别泥、岩、砂等底质类型，在运行效率上更加高效，分类规则明确易解释。决策树算法是一种结构清晰，可以处理多维度分类问题的监督学习算法，与神经网络的黑盒分类模型相比，决策树分类模型的逻辑更加清晰，利用交叉验证方法执行剪枝后的树形结构，使得从样本数据中学习的分类规则具备较好的泛化能力。 ·592· 智能系统学报第 15 卷

第3期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·593· 3.13随机森林底底质类型未知以探究底质分布范围为目标的应随机森林是通过集成学习的思想将多个决策用场景。树进行组合的分类器算法，其输出类别由单棵树 3.2.1K-均值算法的输出结果的众数决定。Diesing46利用随机森 K-均值算法是最为常用的聚类分析算法，是林算法对4种底质类型的声呐图像进行分类，结由MacQueen提出的一种基于类内误差总和最小果明显优于目标分析法和地质统计分析法。由于准则、通过不断迭代达到收敛条件的数据聚类思集成多个子分类器，随机森林模型具有十分优越想。该算法易于理解、实现过程简单、具有较高的性能，结构清晰，训练速度快，对超参数的调整伸缩性和可靠性，但迭代过程和准确率严重依赖不敏感，分类性能稳定，分类规则具有可解释性，初始聚类中心的选取，易陷入局部最优。与其他分类算法相比具有很强的竞争力，逐渐成 K-均值算法的主要思路是将每一个样本划为声学海底底质分类中广泛应用的分类模型训练分到最近中心所属的类簇，对于样本集X= 方法.阿 {:,,…,xw,指定想要实现的类簇数目K,算法 3.1.4BP神经网络首先随机选取K个样本{c1,c2,…,cx}作为互不相 BP神经网络是一种由多层感知器互联而成交的类簇C,C2,…,Cx}的初始聚类中心，样本集的有向无环网络结构，一般包含输人层、隐含层 X中的任意一个样本被划分到与之距离最近的中和输出层。输入层接收训练数据，经隐含层向前心所属的类簇，目标函数为数据集所有样本距簇传输到输出层，每层中分布若干个神经元，每个中心的欧式距离的平方和：神经元的输入与输出的关系可表示为 y=f∑wx+0 E=∑∑disx,c} =l xEC, 式中：w表示信号传输权重；0为偏置m。BP神迭代过程中不断优化各个数据点与聚类中心经网络是海底声呐图像分类中广泛使用的分类方之间的距离，直至目标函数到达最小。标准的K- 法，该算法是由Werbos提出并经过Rumelhart和均值算法包括4个步骤：1)选取目标聚类数目K, McCelland等科学家进一步发展的多层网络参数并随机指定K个聚类中心；2)对样本集合中每一训练模型。BP网络的拓扑结构通过误差逆向传个样本找到离它最近的聚类中心并将其分配到该播及梯度最速下降机制寻找网络误差最小化的参类簇；3)计算每一个类簇的平均值，将该簇的中数组合，能够在输人输出数学关系未知的情况心点移动到平均值的位置；4)重复2)、3)，直至中下，通过学习过程将复杂的映射关系存储在网络心点不再发生变化。结构中。由于该模型实现相对简单且分类效果金绍华等8给出了多波束底质分类中K值好，是较早应用在声学海底底质分类中的分类模的确定原则，海底底质被划分的聚类数是先验信型训练算法。息，若指定的类别数目过少，则会出现有些海底此后，相关研究学者也将各种改进型的BP 底质类型无法被识别出；若指定的类别数目过神经网络引入到海底底质分类中，阳凡林采用遗多，将造成海底底质分类不准确，因此需要合理传算法训练BP神经网络，较好地解决了BP算法确定底质的类别数目K值。对初始权值敏感和陷入局部极小的问题，熊明 3.2.2自组织网络宽等利用遗传算法优化小波神经网络的初始权值自组织竞争神经网络(SOM)是由Teuvo Ko- 及小波参数，结合了小波分析多分辨率、局部细 honen提出的一种无监督神经网络，由输人层和化的优点，在3种底质类型的识别中取得了较好竞争层组成，是一种由可变权值全连接的神经元的准确率。阵列组成的自组织、自学习网络。SOM的竞争性 3.2无监督学习体现在输出层，输出层的节点间通过一定的权重针对海底底质采样点稀缺时，监督学习难以连接，权重根据最大或最小距离准则来调整，通建立准确的分类模型的问题，可以采用无监督学过无监督竞争学习使不同神经元对不同的输入模习算法对底质类型进行划分。无监督学习可以对式敏感，使网络收敛于稳态。SOM的典型特点无标签数据进行内在结构分析，将属性相近的样是在处理单元阵列能够形成输入的特征拓扑分本聚集成簇，用于海底底质分类的无监督学习算布，因此SOM网具有抽取输入信号模式特征法主要包括K-均值和自组织网络。利用无监督的能力。学习可以对输入样本进行聚类分析，但无法获知 SOM可以将任意维数的输入模式以拓扑有样本所属的底质类型，因此无监督学习可用于海序的方式变换到一维或二维的离散空间上，这种

3.1.3 随机森林随机森林是通过集成学习的思想将多个决策树进行组合的分类器算法，其输出类别由单棵树的输出结果的众数决定。Diesing[46] 利用随机森林算法对 4 种底质类型的声呐图像进行分类，结果明显优于目标分析法和地质统计分析法。由于集成多个子分类器，随机森林模型具有十分优越的性能，结构清晰，训练速度快，对超参数的调整不敏感，分类性能稳定，分类规则具有可解释性，与其他分类算法相比具有很强的竞争力，逐渐成为声学海底底质分类中广泛应用的分类模型训练方法[75-76]。 3.1.4 BP 神经网络 BP 神经网络是一种由多层感知器互联而成的有向无环网络结构，一般包含输入层、隐含层和输出层。输入层接收训练数据，经隐含层向前传输到输出层，每层中分布若干个神经元，每个神经元的输入与输出的关系可表示为 y = f( ∑ wi jxi +θ) 式中： wi j 表示信号传输权重； θ 为偏置[77]。BP 神经网络是海底声呐图像分类中广泛使用的分类方法，该算法是由 Werbos 提出并经过 Rumelhart 和 McCelland 等科学家进一步发展的多层网络参数训练模型。BP 网络的拓扑结构通过误差逆向传播及梯度最速下降机制寻找网络误差最小化的参数组合，能够在输入输出数学关系未知的情况下，通过学习过程将复杂的映射关系存储在网络结构中[78]。由于该模型实现相对简单且分类效果好，是较早应用在声学海底底质分类中的分类模型训练算法[44]。此后，相关研究学者也将各种改进型的 BP 神经网络引入到海底底质分类中，阳凡林采用遗传算法训练 BP 神经网络，较好地解决了 BP 算法对初始权值敏感和陷入局部极小的问题[79] ；熊明宽等利用遗传算法优化小波神经网络的初始权值及小波参数，结合了小波分析多分辨率、局部细化的优点，在 3 种底质类型的识别中取得了较好的准确率。 3.2 无监督学习针对海底底质采样点稀缺时，监督学习难以建立准确的分类模型的问题，可以采用无监督学习算法对底质类型进行划分。无监督学习可以对无标签数据进行内在结构分析，将属性相近的样本聚集成簇，用于海底底质分类的无监督学习算法主要包括 K-均值和自组织网络。利用无监督学习可以对输入样本进行聚类分析，但无法获知样本所属的底质类型，因此无监督学习可用于海底底质类型未知以探究底质分布范围为目标的应用场景。 3.2.1 K-均值算法 K-均值算法是最为常用的聚类分析算法，是由 MacQueen 提出的一种基于类内误差总和最小准则、通过不断迭代达到收敛条件的数据聚类思想。该算法易于理解、实现过程简单、具有较高伸缩性和可靠性，但迭代过程和准确率严重依赖初始聚类中心的选取，易陷入局部最优[80]。 X = {x1, x2,··· , xN} K K {c1, c2,··· , cK} {C1,C2,··· ,CK} X K-均值算法的主要思路是将每一个样本划分到最近中心所属的类簇，对于样本集，指定想要实现的类簇数目，算法首先随机选取个样本作为互不相交的类簇的初始聚类中心，样本集中的任意一个样本被划分到与之距离最近的中心所属的类簇，目标函数为数据集所有样本距簇中心的欧式距离的平方和： E = ∑K i=1 ∑ x∈Ci dist(x, ci) 2 K K 迭代过程中不断优化各个数据点与聚类中心之间的距离，直至目标函数到达最小。标准的 K- 均值算法包括 4 个步骤：1) 选取目标聚类数目，并随机指定个聚类中心；2) 对样本集合中每一个样本找到离它最近的聚类中心并将其分配到该类簇；3) 计算每一个类簇的平均值，将该簇的中心点移动到平均值的位置；4) 重复 2)、3)，直至中心点不再发生变化。 K K 金绍华等[81] 给出了多波束底质分类中值的确定原则，海底底质被划分的聚类数是先验信息，若指定的类别数目过少，则会出现有些海底底质类型无法被识别出；若指定的类别数目过多，将造成海底底质分类不准确，因此需要合理确定底质的类别数目值。 3.2.2 自组织网络自组织竞争神经网络 (SOM) 是由 Teuvo Kohonen 提出的一种无监督神经网络，由输入层和竞争层组成，是一种由可变权值全连接的神经元阵列组成的自组织、自学习网络。SOM 的竞争性体现在输出层，输出层的节点间通过一定的权重连接，权重根据最大或最小距离准则来调整，通过无监督竞争学习使不同神经元对不同的输入模式敏感，使网络收敛于稳态[82]。SOM 的典型特点是在处理单元阵列能够形成输入的特征拓扑分布，因此 SOM 网络具有抽取输入信号模式特征的能力[83]。 SOM 可以将任意维数的输入模式以拓扑有序的方式变换到一维或二维的离散空间上，这种第 3 期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·593·

·594· 智能系统学报第15卷变换称为特征映射。其中，输入空间是输入向量升模型的复杂度。最具代表性的卷积神经网络的集合，输出空间在二维网格的自组织映射中是 (CNN)是由LeCun等提出并在计算机视觉领域得二维的平面。通过竞争、合作与更新3个过程，到巨大发展的神经网络模型，经过不断改进和发 SOM可以完成自组织映射⑧4。唐秋华等8s-86分展，CNN逐渐成为深度学习的主要架构之一。别将反向散射强度均值和灰度共生矩阵统计特征 CNN是一种深层前馈型神经网络，包含的多层感与SOM相结合，实现了对多种类型底质分布的知器具有强非线性逼近能力。与传统的神经网络快速识别，分类界线基本与实测数据吻合。Zhao 相比，CNN通过逐层卷积计算构建了强大的特征等87利用SOM对精细化处理的海底灰度图像进提取器，层与层之间的节点随机相连。CNN的特行识别，给出了用于海底底质分类的SOM网络点在于它的局部感知与权值共享，在对输入图像基本参数设置方案。进行处理时，利用卷积滤波同时作用于一定区域 3.3深度学习在海底底质分类中的应用的神经元，通过扫描整张图像得到全域的综合特在声呐图像海底底质分类技术的发展过程征信息。同一层级处理过程中共享同一卷积权中，传统的研究思路是将声呐图像和底质类型之值，并通过减少一定权值参数的方式降低网络的间关系模型的建立分为两个阶段，即声呐图像特复杂性。征提取和分类器训练。然而由于声呐图像分辨率卷积神经网络通常包含输入层、卷积层、池低、干扰严重等，对于特征提取算法的设计和分化层、全连接层和输出层，利用卷积神经网络进类算法的最优选择，一直是声学海底底质智能分行海底底质分类的基本架构如图1所示，其中卷类技术争论的焦点。相比之下，深度学习可以通积层和池化层可以有多个。各层的主要工作机制过内部网络结构自动提取目标的内在特征，并经如下。1)输入层。读取图像数据，原始图像保存过低层到高层的抽象过程建立稳定的特征组合，在该层。2)卷积层。利用卷积核进行特征提取，弱化了人工选择特征的主观性，节省了大量的时特点是局部感知域、权值共享和多核卷积。在每间和工作量。深度学习方法的特征分析具有类脑一卷积层中包含多个卷积核，使每一个卷积核都的抽象过程，使得模型的泛化能力更好，对声呐与本层输人图像的局部区域进行卷积运算获取不图像的噪声干扰具有更好的兼容性，为提升海底同种类的特征图，输入到下一层，其中卷积核的底质智能识别技术开辟了一种新的模型架构。深权重是经学习得到且在卷积过程中保持不变。度学习方法在人脸识别、行人检测等光学图像处 3)池化层。将图像划分为不重叠区域并对区域内理领域已经取得了很大的成功，而与声呐图像和的元素进行聚合。可以利用多种池化方式对输入水下目标识别应用的结合还有待于加强。因此，特征图进行池化，进而降低特征维度，保证网络本文对深度学习方法在声学海底底质分类中的应的抗噪能力。4)全连接层。经过卷积层处理之用前景进行了讨论，以卷积神经网络为例从深度后，图像信息被高度抽象化，全连接层在整幅图学习的核心算法和网络结构等方面对未来深层次像层面进行特征组合与推断，形成利于分类的特应用进行展望。征。5)输出层。对全连接层的输出向量进行类别深度学习方法具有更深的网络层数，其实现判定。针对不同的声呐图像识别任务，CNN网络架构主要基于多层的神经网络，通过增加隐含层的各层结构和参数设置需要结合图像数据特点进的数目、扩充阈值和连接权值等参数的规模，提行单独设计。输入层卷积层池化层全连接层输出层声呐图像 c品】 n卷积杉 c品2 海底底质分布图 ● ReLU Softmax Class 3 采样数据 ● Class 6 图1 卷积神经网络海底底质分类基本架构 Fig.1 Basic structure of seabed sediment classification using CNN

变换称为特征映射。其中，输入空间是输入向量的集合，输出空间在二维网格的自组织映射中是二维的平面。通过竞争、合作与更新 3 个过程， SOM 可以完成自组织映射[84]。唐秋华等[85-86] 分别将反向散射强度均值和灰度共生矩阵统计特征与 SOM 相结合，实现了对多种类型底质分布的快速识别，分类界线基本与实测数据吻合。Zhao 等 [87] 利用 SOM 对精细化处理的海底灰度图像进行识别，给出了用于海底底质分类的 SOM 网络基本参数设置方案。 3.3 深度学习在海底底质分类中的应用在声呐图像海底底质分类技术的发展过程中，传统的研究思路是将声呐图像和底质类型之间关系模型的建立分为两个阶段，即声呐图像特征提取和分类器训练。然而由于声呐图像分辨率低、干扰严重等，对于特征提取算法的设计和分类算法的最优选择，一直是声学海底底质智能分类技术争论的焦点。相比之下，深度学习可以通过内部网络结构自动提取目标的内在特征，并经过低层到高层的抽象过程建立稳定的特征组合，弱化了人工选择特征的主观性，节省了大量的时间和工作量。深度学习方法的特征分析具有类脑的抽象过程，使得模型的泛化能力更好，对声呐图像的噪声干扰具有更好的兼容性，为提升海底底质智能识别技术开辟了一种新的模型架构。深度学习方法在人脸识别、行人检测等光学图像处理领域已经取得了很大的成功，而与声呐图像和水下目标识别应用的结合还有待于加强。因此，本文对深度学习方法在声学海底底质分类中的应用前景进行了讨论，以卷积神经网络为例从深度学习的核心算法和网络结构等方面对未来深层次应用进行展望。深度学习方法具有更深的网络层数，其实现架构主要基于多层的神经网络，通过增加隐含层的数目、扩充阈值和连接权值等参数的规模，提升模型的复杂度。最具代表性的卷积神经网络 (CNN) 是由 LeCun 等提出并在计算机视觉领域得到巨大发展的神经网络模型，经过不断改进和发展，CNN 逐渐成为深度学习的主要架构之一。 CNN 是一种深层前馈型神经网络，包含的多层感知器具有强非线性逼近能力。与传统的神经网络相比，CNN 通过逐层卷积计算构建了强大的特征提取器，层与层之间的节点随机相连。CNN 的特点在于它的局部感知与权值共享，在对输入图像进行处理时，利用卷积滤波同时作用于一定区域的神经元，通过扫描整张图像得到全域的综合特征信息。同一层级处理过程中共享同一卷积权值，并通过减少一定权值参数的方式降低网络的复杂性。卷积神经网络通常包含输入层、卷积层、池化层、全连接层和输出层，利用卷积神经网络进行海底底质分类的基本架构如图 1 所示，其中卷积层和池化层可以有多个。各层的主要工作机制如下。1) 输入层。读取图像数据，原始图像保存在该层。2) 卷积层。利用卷积核进行特征提取，特点是局部感知域、权值共享和多核卷积。在每一卷积层中包含多个卷积核，使每一个卷积核都与本层输入图像的局部区域进行卷积运算获取不同种类的特征图，输入到下一层，其中卷积核的权重是经学习得到且在卷积过程中保持不变。 3) 池化层。将图像划分为不重叠区域并对区域内的元素进行聚合。可以利用多种池化方式对输入特征图进行池化，进而降低特征维度，保证网络的抗噪能力。4) 全连接层。经过卷积层处理之后，图像信息被高度抽象化，全连接层在整幅图像层面进行特征组合与推断，形成利于分类的特征。5) 输出层。对全连接层的输出向量进行类别判定。针对不同的声呐图像识别任务，CNN 网络的各层结构和参数设置需要结合图像数据特点进行单独设计。 ReLU 全连接层输出层 Softmax 输入层采样数据声呐图像 n卷积核卷积层 F1 F2 Fn Fn−1 Map1 Map2 Map(n−1) Mapn 池化层 Class 1 Class 2 Class 3 Class 4 Class 5 Class 6 海底底质分布图图 1 卷积神经网络海底底质分类基本架构 Fig. 1 Basic structure of seabed sediment classification using CNN ·594· 智能系统学报第 15 卷

第3期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·595· CNN与浅层神经网的区别在于：增加了卷散，涉及不同海域、不同数据采集和处理方案、不积运算和下采样过程，具有局部感知和权值共享同型号声呐及传感器等因素，研究成果难以对比的特点。纪雪[6]将声呐图像的纹理特征和统计和共享，而且这些数据主要由项目责任单位保量特征与CNN相结合，通过与SVM、ISODATA、存，缺少数据处理与共享机制，造成大量的数据 BP神经网络3种方法对比，证明卷积神经网络比资源闲置和浪费。建议对现有的海底观测数据进传统的机器学习算法具有更高的识别准确率。付行统筹规划，推动数据资源共享平台建设。楠6将灰度-基元共生矩阵与CNN相结合，并且 2)国产声呐设备研发与推广。现阶段我国已通过对网络参数的调整与优化，对10类图像的分经实现了大多数声呐设备的国产化，包括多波类准确率优于SVM和BP神经网络。焦佳⑧1在束、侧扫声呐、浅地层剖面仪等。由于起步较晚，实验中对比了不同激活函数对于分类性能的影国产声呐设备在测量精度、量程、可靠性等方面响，实验结果表明采用RLU作为CNN网络的激跟国外的技术仍然存在差距，对于测绘单位来说活函数对于砂纹、沉船等6类水下目标具有最优进口设备仍然是首选。然而一些国外设备厂商对的分类性能。Williams!8将CNN应用在海洋目声呐工作原理和数据格式严格保密，对于声呐数标识别中，与人工专家判别结果相比，仍然取得据包中的测量信息并未完全开放，用户只能通过了较好的识别率。刘韦伯采用具有较高实时其预留的数据接口导出指定的测量信息，导致后性的YOLOv3网络结构对水下目标进行识别，在期处理过程中无法制定有针对性的补偿和校正处平均识别准确率、目标检测精度及模型的识别速理方案，严重制约着测绘精度的提高。今后必须度方面均表现出优异的性能。努力提升国产设备技术水平和普及程度，自主开针对深度学习在海底声呐图像底质分类中的发勘测设备和后处理系统，尤其是面向深海及复应用现状，后续可以在以下方面进行改善。1)增杂环境的探测装备，真正掌握核心技术，实现测加训练集样本数量。深度学习在样本规模足够大绘过程的“全透明”才能让科研人员有更多有价值的情况下具有更强大的分析能力，由于实验条件的发现。所限，目前研究中所采用的声呐图像数据量难以 3)海底声学特性研究。海底声学特性是进行满足深度学习对数据规模的要求，可以利用迁移声学海底探测的物理学基础，早期的海底声学理学习等方法对现有图像数据进行学习，通过捕捉论体系与模型主要是由国外学者建立，我国的研声呐图像的深层次特征模拟海底声呐图像，扩展究主要集中在声呐数据解析、分类算法探讨等方样本数据集，从而提升深度神经网络的学习能面，相关研究并不深入，尤其是在地声模型理论力。2)深度优化网络结构。结合声呐图像样本数研究方面缺乏必要的研究基础和系统的实验分据的特点和海底底质分类对于准确率的高要求，析，不利于推动声学海底探测技术的发展。应该可以降低模型实时性的要求，优先保证模型精立足现有的理论体系，加强对海底基础科学的研度，选取合适的网络结构，对网络的损失函数、优究和支持力度，在典型区域统一规划、设计、实施化算法进行优选，从而制定最佳策略构建底质分系统性的海底物理特性测量实验，通过探索发现类模型。海底固有特性和规律，夯实理论研究基础。 4总结与展望 4)反向散射数据精细化处理技术。海底的反向散射强度与水深、底质、入射角、波束宽度、发随着声呐技术和计算机视觉水平的提高，我射功率、系统增益等因素有关，为了保证反向散国的海底声呐图像底质分类技术已经有了长足的射强度能够准确反映海底底质的声学特性，必须发展，但是研究中也面临着一些技术挑战。在人对影响反向散射强度的其他因素进行补偿。目前工智能理论蓬勃发展的重要机遇期，需要在立足对于反向散射强度数据的校正流程不规范，多数地声模型理论的基础上，利用大量的取样和观测情况下缺乏船体姿态与速度校正、海底地形校正数据进行探索和验证，提升海底底质探测的智能等，使得反向散射强度补偿不准确。可以结合海化水平，在未来的工作中需要在以下几个方面进底地声模型和散射模型对声传播过程进行模拟，一步加强：通过水池实验明确各个因素的作用机理和改正方 1)海底底质数据库建设。在长期的海洋观测法，逐步完善反向散射数据的标准化处理流程和中，我国曾开展过多次海洋调查科考航次，积累质量控制标准。了大量的海底观测数据。然而由于研究单位分 5)特征提取方法。特征提取方法的选取是影

CNN 与浅层神经网络的区别在于：增加了卷积运算和下采样过程，具有局部感知和权值共享的特点。纪雪[68] 将声呐图像的纹理特征和统计量特征与 CNN 相结合，通过与 SVM、ISODATA、 BP 神经网络 3 种方法对比，证明卷积神经网络比传统的机器学习算法具有更高的识别准确率。付楠 [64] 将灰度−基元共生矩阵与 CNN 相结合，并且通过对网络参数的调整与优化，对 10 类图像的分类准确率优于 SVM 和 BP 神经网络。焦佳[88] 在实验中对比了不同激活函数对于分类性能的影响，实验结果表明采用 ReLU 作为 CNN 网络的激活函数对于砂纹、沉船等 6 类水下目标具有最优的分类性能。Williams[89] 将 CNN 应用在海洋目标识别中，与人工专家判别结果相比，仍然取得了较好的识别率。刘韦伯[90] 采用具有较高实时性的 YOLOv3 网络结构对水下目标进行识别，在平均识别准确率、目标检测精度及模型的识别速度方面均表现出优异的性能。针对深度学习在海底声呐图像底质分类中的应用现状，后续可以在以下方面进行改善。1) 增加训练集样本数量。深度学习在样本规模足够大的情况下具有更强大的分析能力，由于实验条件所限，目前研究中所采用的声呐图像数据量难以满足深度学习对数据规模的要求，可以利用迁移学习等方法对现有图像数据进行学习，通过捕捉声呐图像的深层次特征模拟海底声呐图像，扩展样本数据集，从而提升深度神经网络的学习能力。2) 深度优化网络结构。结合声呐图像样本数据的特点和海底底质分类对于准确率的高要求，可以降低模型实时性的要求，优先保证模型精度，选取合适的网络结构，对网络的损失函数、优化算法进行优选，从而制定最佳策略构建底质分类模型。 4 总结与展望随着声呐技术和计算机视觉水平的提高，我国的海底声呐图像底质分类技术已经有了长足的发展，但是研究中也面临着一些技术挑战。在人工智能理论蓬勃发展的重要机遇期，需要在立足地声模型理论的基础上，利用大量的取样和观测数据进行探索和验证，提升海底底质探测的智能化水平，在未来的工作中需要在以下几个方面进一步加强： 1) 海底底质数据库建设。在长期的海洋观测中，我国曾开展过多次海洋调查科考航次，积累了大量的海底观测数据。然而由于研究单位分散，涉及不同海域、不同数据采集和处理方案、不同型号声呐及传感器等因素，研究成果难以对比和共享，而且这些数据主要由项目责任单位保存，缺少数据处理与共享机制，造成大量的数据资源闲置和浪费。建议对现有的海底观测数据进行统筹规划，推动数据资源共享平台建设。 2) 国产声呐设备研发与推广。现阶段我国已经实现了大多数声呐设备的国产化，包括多波束、侧扫声呐、浅地层剖面仪等。由于起步较晚，国产声呐设备在测量精度、量程、可靠性等方面跟国外的技术仍然存在差距，对于测绘单位来说进口设备仍然是首选。然而一些国外设备厂商对声呐工作原理和数据格式严格保密，对于声呐数据包中的测量信息并未完全开放，用户只能通过其预留的数据接口导出指定的测量信息，导致后期处理过程中无法制定有针对性的补偿和校正处理方案，严重制约着测绘精度的提高。今后必须努力提升国产设备技术水平和普及程度，自主开发勘测设备和后处理系统，尤其是面向深海及复杂环境的探测装备，真正掌握核心技术，实现测绘过程的“全透明”才能让科研人员有更多有价值的发现。 3) 海底声学特性研究。海底声学特性是进行声学海底探测的物理学基础，早期的海底声学理论体系与模型主要是由国外学者建立，我国的研究主要集中在声呐数据解析、分类算法探讨等方面，相关研究并不深入，尤其是在地声模型理论研究方面缺乏必要的研究基础和系统的实验分析，不利于推动声学海底探测技术的发展。应该立足现有的理论体系，加强对海底基础科学的研究和支持力度，在典型区域统一规划、设计、实施系统性的海底物理特性测量实验，通过探索发现海底固有特性和规律，夯实理论研究基础。 4) 反向散射数据精细化处理技术。海底的反向散射强度与水深、底质、入射角、波束宽度、发射功率、系统增益等因素有关，为了保证反向散射强度能够准确反映海底底质的声学特性，必须对影响反向散射强度的其他因素进行补偿。目前对于反向散射强度数据的校正流程不规范，多数情况下缺乏船体姿态与速度校正、海底地形校正等，使得反向散射强度补偿不准确。可以结合海底地声模型和散射模型对声传播过程进行模拟，通过水池实验明确各个因素的作用机理和改正方法，逐步完善反向散射数据的标准化处理流程和质量控制标准。 5) 特征提取方法。特征提取方法的选取是影第 3 期赵玉新，等：海底声呐图像智能底质分类技术研究综述 ·595·

·596· 智能系统学报第15卷响海底底质分类准确率的重要因素，日前的声呐 9)与水下无人平台的结合。面向局部区域的图像特征提取方法大都借鉴的是光学图像处理方高分辨率海底底质信息探测技术对于未来水下作法，而声学图像与光学图像特性差异较大，现有战、海洋工程建设、海底资源勘探等具有重要的的方法对海底底质的声呐图像特征缺乏针对性。支撑作用。目前水下机器人的载荷能力得到了很建议从声呐成像机制入手，深入分析声呐图像灰大提升，已经集成了侧扫声呐、水声定位系统、水度分布特性，发展适用于海底底质识别的特征提下摄像机等多种传感器设备，具备全面的海底观取方法。测能力。借助AUV等水下移动平台观测精度 6)声学海底底质分类软件的研发。国际上已高、观测信息完备的技术优势，开展实时性的海经出现多款商用底质分类软件，但是由于声呐数底底质探测与识别技术已经具备技术基础。未来据兼容性差、特征提取算法不稳定、对采样数据还可以利用水下无人平台对深水区海底地层进行要求高、在不同海域的普适性较差等因素，并未高精度探测，从而有效改善深水区的探测误差和获得广泛应用。目前国内已经有多家研究单位开可靠性等问题。展了海底底质分类的研究工作，但是由于缺乏系统性的规划，已取得的研究成果并未得到转化，参考文献：在自主研发可靠的底质分类软件过程中仍需要更 [1]金翔龙.海洋地球物理研究与海底探测声学技术的发多的投入。在进行软件架构设计时，必须考虑多展[.地球物理学进展，2007,22(4)：1243-1249 类型数据格式的兼容性问题，可以通过开发数据 JIN Xianglong.The development of research in marine 标准化处理模块，将不同声呐设备厂商的数据格 geophysics and acoustic technology for submarine explora- 式统一集成到标准化处理框架范围内，提升对现 tion[J].Progress in geophysics,2007,22(4):1243-1249. [2]路晓磊，张丽婷，王芳，等.海底声学探测技术装备综有的多类型设备和新型设备的兼容性，从而解决述[).海洋开发与管理，2018,35(6)：91-94 声呐设备型号和数据格式不同导致的数据处理方 LU Xiaolei,ZHANG Liting,WANG Fang,et al.Sum- 案设计中的超高复杂度。 mary of submarine acoustic detection technology and 7)与人工智能理论的深入结合。深度神经网 equipment[J].Ocean development and management,2018, 络通过多次迭代组合低层分布式特征形成抽象高 35(6):91-94 层特征的方式，在众多的图像识别领域展现了强 [3]庞新明，赵明辉，刘思青，等.复杂地质结构OBS地震剖大的分析能力。在水下目标识别方面，由于声呐面震相识别方法[J].地球物理学报，2019,62(9)： 3482-3491 图像与光学图像的特点存在一定差异，如何更好 PANG Xinming,ZHAO Minghui,LIU Siqing,et al.Seis- 地利用深度学习方法提升水下目标识别的准确性 mic phases identification in OBS seismic record sections 和可靠性，如何充分集成海洋环境信息在智能分 through the complex geological structure[J].Chinese 析与决策系统中的辅助作用，如何实现人工智能 journal of geophysics,2019,62(9):3482-3491. 技术与海洋探测技术的深度结合，发展智能海洋 [4]BROWN C J,BEAUDOIN J,BRISSETTE M,et al. 空间探测技术，将是未来海洋科学与技术发展的 Multispectral multibeam echo sounder backscatter as a tool 重要课题。 for improved seafloor characterization[J].Geosciences, 8)可视化水平。传统的离散点底质类型信息 2019,9(3):126. [5]SHIH CC,HORNG M F,TSENG Y R,et al.An adaptive 主要集成在电子海图或海底底质专题图中，随着 bottom tracking algorithm for side-scan sonar seabed map- 声学探测技术的发展，连续的海底底质信息获取 ping[C]//Proceedings of 2019 IEEE Underwater Techno- 已经日渐成熟，提升海底底质信息的可视化水平 logy.Taiwan,China,2019:1-7. 将是不可回避的问题。如今的制图技术已经更加 [6]TAN Cheng,ZHANG Xuebo,YANG Peixuan,et al.A 成熟，海底底质分布图的符号设计和显示风格都 novel sub-bottom profiler and signal processor[J].Sensors, 有提升的空间，尤其是在海底空间信息集成显示 2019.1922):5052 方面，可以结合现有的GIS平台和可视化技术， [7]张炳生.水下声学高精度定位算法的研究[D.西安：长加强底质信息展示的直观性、全面性和互操作安大学，2019. ZHANG Bingsheng.Research on high precision position 性，进一步开展海底三维地层信息显示的集成技 ing algorithm for underwater acoustics[D].Xi'an:Chang 术研究，使海底底质探测技术的创新发展成果能 an University,2019. 更好地服务于海洋科学、海洋工程和海洋军事领 [8]耿雪樵，徐行，刘方兰，等.我国海底取样设备的现状与域的重大需求。发展趋势.地质装备，2009,10(4)：11-16

响海底底质分类准确率的重要因素，目前的声呐图像特征提取方法大都借鉴的是光学图像处理方法，而声学图像与光学图像特性差异较大，现有的方法对海底底质的声呐图像特征缺乏针对性。建议从声呐成像机制入手，深入分析声呐图像灰度分布特性，发展适用于海底底质识别的特征提取方法。 6) 声学海底底质分类软件的研发。国际上已经出现多款商用底质分类软件，但是由于声呐数据兼容性差、特征提取算法不稳定、对采样数据要求高、在不同海域的普适性较差等因素，并未获得广泛应用。目前国内已经有多家研究单位开展了海底底质分类的研究工作，但是由于缺乏系统性的规划，已取得的研究成果并未得到转化，在自主研发可靠的底质分类软件过程中仍需要更多的投入。在进行软件架构设计时，必须考虑多类型数据格式的兼容性问题，可以通过开发数据标准化处理模块，将不同声呐设备厂商的数据格式统一集成到标准化处理框架范围内，提升对现有的多类型设备和新型设备的兼容性，从而解决声呐设备型号和数据格式不同导致的数据处理方案设计中的超高复杂度。 7) 与人工智能理论的深入结合。深度神经网络通过多次迭代组合低层分布式特征形成抽象高层特征的方式，在众多的图像识别领域展现了强大的分析能力。在水下目标识别方面，由于声呐图像与光学图像的特点存在一定差异，如何更好地利用深度学习方法提升水下目标识别的准确性和可靠性，如何充分集成海洋环境信息在智能分析与决策系统中的辅助作用，如何实现人工智能技术与海洋探测技术的深度结合，发展智能海洋空间探测技术，将是未来海洋科学与技术发展的重要课题。 8) 可视化水平。传统的离散点底质类型信息主要集成在电子海图或海底底质专题图中，随着声学探测技术的发展，连续的海底底质信息获取已经日渐成熟，提升海底底质信息的可视化水平将是不可回避的问题。如今的制图技术已经更加成熟，海底底质分布图的符号设计和显示风格都有提升的空间，尤其是在海底空间信息集成显示方面，可以结合现有的 GIS 平台和可视化技术，加强底质信息展示的直观性、全面性和互操作性，进一步开展海底三维地层信息显示的集成技术研究，使海底底质探测技术的创新发展成果能更好地服务于海洋科学、海洋工程和海洋军事领域的重大需求。 9) 与水下无人平台的结合。面向局部区域的高分辨率海底底质信息探测技术对于未来水下作战、海洋工程建设、海底资源勘探等具有重要的支撑作用。目前水下机器人的载荷能力得到了很大提升，已经集成了侧扫声呐、水声定位系统、水下摄像机等多种传感器设备，具备全面的海底观测能力。借助 AUV 等水下移动平台观测精度高、观测信息完备的技术优势，开展实时性的海底底质探测与识别技术已经具备技术基础。未来还可以利用水下无人平台对深水区海底地层进行高精度探测，从而有效改善深水区的探测误差和可靠性等问题。参考文献：金翔龙. 海洋地球物理研究与海底探测声学技术的发展 [J]. 地球物理学进展, 2007, 22(4): 1243–1249. JIN Xianglong. The development of research in marine geophysics and acoustic technology for submarine exploration[J]. Progress in geophysics, 2007, 22(4): 1243–1249. [1] 路晓磊, 张丽婷, 王芳, 等. 海底声学探测技术装备综述 [J]. 海洋开发与管理, 2018, 35(6): 91–94. LU Xiaolei, ZHANG Liting, WANG Fang, et al. Summary of submarine acoustic detection technology and equipment[J]. Ocean development and management, 2018, 35(6): 91–94. [2] 庞新明, 赵明辉, 刘思青, 等. 复杂地质结构 OBS 地震剖面震相识别方法 [J]. 地球物理学报, 2019, 62(9): 3482–3491. PANG Xinming, ZHAO Minghui, LIU Siqing, et al. Seismic phases identification in OBS seismic record sections through the complex geological structure[J]. Chinese journal of geophysics, 2019, 62(9): 3482–3491. [3] BROWN C J, BEAUDOIN J, BRISSETTE M, et al. Multispectral multibeam echo sounder backscatter as a tool for improved seafloor characterization[J]. Geosciences, 2019, 9(3): 126. [4] SHIH C C, HORNG M F, TSENG Y R, et al. An adaptive bottom tracking algorithm for side-scan sonar seabed mapping[C]//Proceedings of 2019 IEEE Underwater Technology. Taiwan, China, 2019: 1−7. [5] TAN Cheng, ZHANG Xuebo, YANG Peixuan, et al. A novel sub-bottom profiler and signal processor[J]. Sensors, 2019, 19(22): 5052. [6] 张炳生. 水下声学高精度定位算法的研究 [D]. 西安: 长安大学, 2019. ZHANG Bingsheng. Research on high precision positioning algorithm for underwater acoustics[D]. Xi’an: Chang’ an University, 2019. [7] 耿雪樵, 徐行, 刘方兰, 等. 我国海底取样设备的现状与发展趋势 [J]. 地质装备, 2009, 10(4): 11–16. [8] ·596· 智能系统学报第 15 卷

点击进入文档下载页（PDF格式）

共14页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录