第15卷第3期 智能系统学报 Vol.15 No.3 2020年5月 CAAI Transactions on Intelligent Systems May 2020 D0L:10.11992tis.202004026 海底声呐图像智能底质分类技术研究综述 赵玉新,赵廷 (哈尔滨工程大学自动化学院,黑龙江哈尔滨150001) 摘要:海底声呐图像底质分类技术是指利用多波束、侧扫声呐等设备获取海底图像进行浅表层地质属性信息 的反演和预测。综合运用水声学、图像处理以及机器学习的相关理论,声学海底底质分类技术能够快速、淮确 地识别海底底质类型。通过回顾国内外发展历程,对利用声学图像进行海底底质分类的关键技术进行了总结, 从声学海底底质分类的关系模型、海底声呐图像的特征表达和分类模型构建三个方面介绍了领域内的研究进 展和主要方法,重点分析了不同模型和方法的原理、技术特点和适用场合,并结合卷积神经网络对深度学习方 法在海底底质分类中的应用进行了讨论。最后,对海底声呐图像底质分类技术的研究方向和发展趋势进行了 归纳和展望。 关键词:声学探测:声呐图像:底质类型:特征提取:图像分类:监督学习:无监督学习:深度学习:卷积神经网 络:海底底质分类 中图分类号:TP753文献标志码:A文章编号:1673-4785(2020)03-0587-14 中文引用格式:赵玉新,赵廷.海底声呐图像智能底质分类技术研究综述.智能系统学报,2020,15(3):587-600. 英文引用格式:ZHAO Yuxin,,ZHAO Ting.Survey of the intelligent seabed sediment classification technology based on sonar im- ages[J].CAAI transactions on intelligent systems,2020,15(3):587-600. Survey of the intelligent seabed sediment classification technology based on sonar images ZHAO Yuxin,ZHAO Ting (College of Automation,Harbin Engineering University,Harbin 150001,China) Abstract:Image-based acoustic seabed sediment classification refers to the technology of inversion and prediction of the marine geological attributes of the shallow strata using seabed sonar image obtained using a multi-beam,side-scan sonar.As the multidisciplinary branch of oceanology,this technology is able to quickly identify a sediment type based on the relevant knowledge of underwater acoustics,image processing,and machine learning.Based on the review on the history and development of the technology at home and abroad,this article summarizes the key techniques in the frame- work of seabed sediment classification using sonar image and makes an introduction to the progress in research and main algorithms used in the domain,including the geoacoustic relationship model,the feature expression of the seabed sonar image,and the building of classification model.The emphasis is put on the analysis of the principles,technical features,and applications for various models and algorithms.Deep learning is also discussed for exploring proper ap- plication in the acoustic seabed classification with the case of convolutional neural network.The deep learning al- gorithms are applied on the sonar images and analyzed.Finally,acoustic image-based seabed sediment classification is completed and forecast is done. Keywords:acoustic detection;sonar image;sediment type;feature extraction;image classification;supervized learning; unsupervized learning:deep learning;convolutional neural network;seabed sediment classification 收稿日期:2020-04-24. 随着人类海上活动空间的进一步拓展,海洋 基金项目:国家重点基础研究发展计划(613317):国家自然科 学基金面上项目(41676088). 矿产资源勘探、地球生命系统演化等一系列重要 通信作者:赵廷.E-mail:zhaoting@hrbeu.edu.cn. 的科学问题都对海底科学的发展提出了新的要
DOI: 10.11992/tis.202004026 海底声呐图像智能底质分类技术研究综述 赵玉新,赵廷 (哈尔滨工程大学 自动化学院,黑龙江 哈尔滨 150001) 摘 要:海底声呐图像底质分类技术是指利用多波束、侧扫声呐等设备获取海底图像进行浅表层地质属性信息 的反演和预测。综合运用水声学、图像处理以及机器学习的相关理论,声学海底底质分类技术能够快速、准确 地识别海底底质类型。通过回顾国内外发展历程,对利用声学图像进行海底底质分类的关键技术进行了总结, 从声学海底底质分类的关系模型、海底声呐图像的特征表达和分类模型构建三个方面介绍了领域内的研究进 展和主要方法,重点分析了不同模型和方法的原理、技术特点和适用场合,并结合卷积神经网络对深度学习方 法在海底底质分类中的应用进行了讨论。最后,对海底声呐图像底质分类技术的研究方向和发展趋势进行了 归纳和展望。 关键词:声学探测;声呐图像;底质类型;特征提取;图像分类;监督学习;无监督学习;深度学习;卷积神经网 络;海底底质分类 中图分类号:TP753 文献标志码:A 文章编号:1673−4785(2020)03−0587−14 中文引用格式:赵玉新, 赵廷. 海底声呐图像智能底质分类技术研究综述 [J]. 智能系统学报, 2020, 15(3): 587–600. 英文引用格式:ZHAO Yuxin, ZHAO Ting. Survey of the intelligent seabed sediment classification technology based on sonar images[J]. CAAI transactions on intelligent systems, 2020, 15(3): 587–600. Survey of the intelligent seabed sediment classification technology based on sonar images ZHAO Yuxin,ZHAO Ting (College of Automation, Harbin Engineering University, Harbin 150001, China) Abstract: Image-based acoustic seabed sediment classification refers to the technology of inversion and prediction of the marine geological attributes of the shallow strata using seabed sonar image obtained using a multi-beam, side-scan sonar. As the multidisciplinary branch of oceanology, this technology is able to quickly identify a sediment type based on the relevant knowledge of underwater acoustics, image processing, and machine learning. Based on the review on the history and development of the technology at home and abroad, this article summarizes the key techniques in the framework of seabed sediment classification using sonar image and makes an introduction to the progress in research and main algorithms used in the domain, including the geoacoustic relationship model, the feature expression of the seabed sonar image, and the building of classification model. The emphasis is put on the analysis of the principles, technical features, and applications for various models and algorithms. Deep learning is also discussed for exploring proper application in the acoustic seabed classification with the case of convolutional neural network. The deep learning algorithms are applied on the sonar images and analyzed . Finally, acoustic image-based seabed sediment classification is completed and forecast is done. Keywords: acoustic detection; sonar image; sediment type; feature extraction; image classification; supervized learning; unsupervized learning; deep learning; convolutional neural network; seabed sediment classification 随着人类海上活动空间的进一步拓展,海洋 矿产资源勘探、地球生命系统演化等一系列重要 的科学问题都对海底科学的发展提出了新的要 收稿日期:2020−04−24. 基金项目:国家重点基础研究发展计划 (613317);国家自然科 学基金面上项目 (41676088). 通信作者:赵廷. E-mail:zhaoting@hrbeu.edu.cn. 第 15 卷第 3 期 智 能 系 统 学 报 Vol.15 No.3 2020 年 5 月 CAAI Transactions on Intelligent Systems May 2020
·588· 智能系统学报 第15卷 求,海底科学理论水平与探测技术亟需得到进 海底声反射特性对海底底质类型进行识别成为海 步提升。海底科学的主要研究内容包括海底形 底探测的重要手段。 态、组成、结构、地球物理场及其演化历史、海底 声学海底底质分类以声呐系统获取的反向散 各圈层间及海底与其他海洋圈层之间的相互作用四。 射强度数据为基础,结合机械取样方法获得的真 海底探测的目标则是利用一定的技术手段获取海 实海底底质样品数据,利用多种分类算法建立底 底地质的空间分布特性及其随时间的变化规律, 质类型自动分析模型,进而实现高效、准确的海 是一种基于连续时空系统的模式研究。由于海底 底底质分类。从20世纪60年代起,以Hamilton 圈层中不同的岩层介质在密度、弹性、磁性等方 为代表的国外研究学者首先从海底的力学结构特 面存在差异,通过综合运用声、光、电、磁、重力 性、声传播特性以及海底地声模型等多个角度开 等多种技术手段来观测地球物理场的变化,能够 展了相关研究与测试,奠定了声学海底底质探测 有效地掌握地层的物理特性、内部构造等信息口。 技术的物理学基础-20。此后,国内外研究学者 声波在海水中具有非常优越的传播特性,逐渐成 尝试利用多种方法构建海底反向散射强度与底质 为海底探测的主要技术手段。在现代海底科学研 类型之间的相关性模型,主要研究焦点可以归结 究中,已经发展出多种海底声学探测技术,如海 为海底物理参数反演模型川、海底回波空间分布 洋地震仪、多波束测深仪、侧扫声呐、海底地 关系模型22)、海底回波波形关系模型。 层剖面仪、水下声学定位等m,快速发展的水下 1.1海底物理参数反演模型 声学技术为探测海底浅部剖面乃至深部地层结构 海底底质是具有多重物理属性、特征变化明 发挥了重要的作用。 显的固体层,反映力学结构特性的参量包括孔隙 海底底质是海洋环境的要素之一,主要指海 度、密度、粒径、饱和度等,反映声学特性的参量 底表面的组成物质,包括海底岩石和水动力作用 有声速、声衰减系数、声反射系数、声阻抗等,力 过程中沉积下来的表层沉积物。研究海底底质物 学结构参量与声学结构参量之间具有很强的相关 理特性,探索高效、精确的海底底质分类方法,对 性。Biot等2s-2提出了以流体饱和多孔介质为基 于提升海上活动的环境信息保障能力具有十分重 础的声传播模型,该模型利用分析力学的方法给 要的意义。声学海底底质分类是一种高效的海底 出了流体饱和多孔介质的声波方程,建立了介质 探测技术,涉及海洋地质、海洋测绘、水声学、模 声速、声衰减、频率和孔隙度等参数之间的关 式识别等学科的庞大的知识体系,国内外研究学 系。Hamilton2-2通过研究海底声波在一定频段 者相继提出了许多新颖的算法和研究思路,本文 上的反射和折射特性,构建了水深、沉积层密度 从模式识别的角度出发对现有的声学海底底质识 声速和声衰减系数等参量之间的关系,以海洋沉 别方法进行梳理和归纳,对基于声呐图像的海底 积层弹性和黏弹性模型为基础提出了浅海和深海 底质分类技术的未来发展趋势进行分析和展望。 地声模型。Jackson等Bo提出的高频海底散射模 型中将反向散射强度的计算归结为粗糙界面散射 1声学海底底质探测技术 和沉积物体积散射两部分,为海底反向散射的物 理过程提供了合理精确的描述。经过众多研究学 早期的海底底质探测主要采用直接法8),通 者的发展和完善313,海底物理结构参数与声学 过站点式的机械取样获得底质样本,再经过实验 参数之间的数学关系模型逐步建立。基于该关系 室测定9或原位分析0)确定底质类型。常用的 模型演化出的海底底质分类方法,首先利用单波 取样方法包括重力取样器、冲击式取样器、原位 束和多波束测深仪的回波强度数据反演底质的地 采样器等,普遍存在效率低、成本高、无法在深水 声参数33,如根据回声振幅计算的反射系数3可 区取样、作业点离散等弊端,难以满足现代大面 以及根据多层介质声学理论估计的各层沉积物的 积海洋调查的需求。随着声呐信号处理技术的 声阻抗等,然后依据海底底质物理特性参数的 快速发展,利用声学方法探测海底底质信息展现 分布区间或经验公式推断海底底质类型。以该关 出巨大的潜力和优势,利用多波束、侧扫声呐、浅 系模型为基础的海底底质分类方法的优点是:有 地层剖面等勘测设备不仅可以获取高精度水深测 确定的物理学模型,计算的模型参数具有实际的 量数据,还能采集到海底反向散射强度数据,为 物理意义,分类规则具有可解释性。其缺点是: 精确推断海底地质结构提供了丰富的观测信息3。 地声模型理论复杂,底质物理参数分布和经验计 由于不同类型底质的声吸收系数、反射系数、表 算公式有较强的区域性,声学参量计算存在一定 面粗糙度等参数具有显著差异性,从多角度利用 误差
求,海底科学理论水平与探测技术亟需得到进一 步提升。海底科学的主要研究内容包括海底形 态、组成、结构、地球物理场及其演化历史、海底 各圈层间及海底与其他海洋圈层之间的相互作用[1]。 海底探测的目标则是利用一定的技术手段获取海 底地质的空间分布特性及其随时间的变化规律, 是一种基于连续时空系统的模式研究。由于海底 圈层中不同的岩层介质在密度、弹性、磁性等方 面存在差异,通过综合运用声、光、电、磁、重力 等多种技术手段来观测地球物理场的变化,能够 有效地掌握地层的物理特性、内部构造等信息[2]。 声波在海水中具有非常优越的传播特性,逐渐成 为海底探测的主要技术手段。在现代海底科学研 究中,已经发展出多种海底声学探测技术,如海 洋地震仪[3] 、多波束测深仪[4] 、侧扫声呐[5] 、海底地 层剖面仪[6] 、水下声学定位等[7] ,快速发展的水下 声学技术为探测海底浅部剖面乃至深部地层结构 发挥了重要的作用。 海底底质是海洋环境的要素之一,主要指海 底表面的组成物质,包括海底岩石和水动力作用 过程中沉积下来的表层沉积物。研究海底底质物 理特性,探索高效、精确的海底底质分类方法,对 于提升海上活动的环境信息保障能力具有十分重 要的意义。声学海底底质分类是一种高效的海底 探测技术,涉及海洋地质、海洋测绘、水声学、模 式识别等学科的庞大的知识体系,国内外研究学 者相继提出了许多新颖的算法和研究思路,本文 从模式识别的角度出发对现有的声学海底底质识 别方法进行梳理和归纳,对基于声呐图像的海底 底质分类技术的未来发展趋势进行分析和展望。 1 声学海底底质探测技术 早期的海底底质探测主要采用直接法[8] ,通 过站点式的机械取样获得底质样本,再经过实验 室测定[9] 或原位分析[10-11] 确定底质类型。常用的 取样方法包括重力取样器、冲击式取样器、原位 采样器等,普遍存在效率低、成本高、无法在深水 区取样、作业点离散等弊端,难以满足现代大面 积海洋调查的需求[12]。随着声呐信号处理技术的 快速发展,利用声学方法探测海底底质信息展现 出巨大的潜力和优势,利用多波束、侧扫声呐、浅 地层剖面等勘测设备不仅可以获取高精度水深测 量数据,还能采集到海底反向散射强度数据,为 精确推断海底地质结构提供了丰富的观测信息[13-16]。 由于不同类型底质的声吸收系数、反射系数、表 面粗糙度等参数具有显著差异性,从多角度利用 海底声反射特性对海底底质类型进行识别成为海 底探测的重要手段。 声学海底底质分类以声呐系统获取的反向散 射强度数据为基础,结合机械取样方法获得的真 实海底底质样品数据,利用多种分类算法建立底 质类型自动分析模型,进而实现高效、准确的海 底底质分类。从 20 世纪 60 年代起,以 Hamilton 为代表的国外研究学者首先从海底的力学结构特 性、声传播特性以及海底地声模型等多个角度开 展了相关研究与测试,奠定了声学海底底质探测 技术的物理学基础[17-20]。此后,国内外研究学者 尝试利用多种方法构建海底反向散射强度与底质 类型之间的相关性模型,主要研究焦点可以归结 为海底物理参数反演模型[21] 、海底回波空间分布 关系模型[22-23] 、海底回波波形关系模型[24]。 1.1 海底物理参数反演模型 海底底质是具有多重物理属性、特征变化明 显的固体层,反映力学结构特性的参量包括孔隙 度、密度、粒径、饱和度等,反映声学特性的参量 有声速、声衰减系数、声反射系数、声阻抗等,力 学结构参量与声学结构参量之间具有很强的相关 性。Biot 等 [25-26] 提出了以流体饱和多孔介质为基 础的声传播模型,该模型利用分析力学的方法给 出了流体饱和多孔介质的声波方程,建立了介质 声速、声衰减、频率和孔隙度等参数之间的关 系。Hamilton[27-29] 通过研究海底声波在一定频段 上的反射和折射特性,构建了水深、沉积层密度、 声速和声衰减系数等参量之间的关系,以海洋沉 积层弹性和黏弹性模型为基础提出了浅海和深海 地声模型。Jackson 等 [30] 提出的高频海底散射模 型中将反向散射强度的计算归结为粗糙界面散射 和沉积物体积散射两部分,为海底反向散射的物 理过程提供了合理精确的描述。经过众多研究学 者的发展和完善[31-32] ,海底物理结构参数与声学 参数之间的数学关系模型逐步建立。基于该关系 模型演化出的海底底质分类方法,首先利用单波 束和多波束测深仪的回波强度数据反演底质的地 声参数[33-36] ,如根据回声振幅计算的反射系数[37] 以及根据多层介质声学理论估计的各层沉积物的 声阻抗[38] 等,然后依据海底底质物理特性参数的 分布区间或经验公式推断海底底质类型。以该关 系模型为基础的海底底质分类方法的优点是:有 确定的物理学模型,计算的模型参数具有实际的 物理意义,分类规则具有可解释性。其缺点是: 地声模型理论复杂,底质物理参数分布和经验计 算公式有较强的区域性,声学参量计算存在一定 误差。 ·588· 智 能 系 统 学 报 第 15 卷
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·589· 1.2海底回波空间分布关系模型 提出的方法可以归纳为三大类:空间域方法、频 海底回波空间分布特征以多波束和侧扫声呐 率域方法以及其他变换域方法。 为主要探测设备,通过综合分析一定空间范围内 2.1空间域特征 的反向散射强度特征,判断海底底质的类型和表 空间域特征是指基于声呐图像灰度空间分布 层结构。Clarke等B.o提出利用反向散射强度随 特性的统计量。海底声呐图像的灰度变化在局部 波束入射角的变化曲线进行海底底质分类,实验 区域内具有不规则性,而在整体上又呈现出一定 证实不同类型的海底底质角度响应曲线的形状、 的规律性,这使图像中的不同区域可以依据概率 方差和幅值特征具有区分性,该方法在多波束底 统计特征和纹理特征进行识别,兼顾图像的宏观 质识别研究中受到广泛关注。Pace等山提出了 和微观结构特征6。 基于侧扫声呐图像纹理特征的海底沉积学类型自 2.1.1概率统计特征 动识别方法,初步验证了图像法在海底地质特征 声呐系统将接收到的回波强度转换为图像灰 分析中的有效性。此后,基于声呐图像的海底表 度,由于海底底质的反射系数有所差异,不同底 层地质属性识别技术迅速发展,谱特征)、灰度 质的声呐图像会呈现出一定的明暗变化。通常情 共生矩阵4)、参数化反射概率密度模型、神经 况下,声波反射能力强的底质类型回波强度值 网络及其优化模型、支持向量机、决策树6个 大,区域呈现亮色,声波吸收能力强的底质类型 等方法被应用在海底声呐图像识别中,显著提升 回波强度值小,区域呈现阴影区。为了表示海底 了海底底质识别的效率和准确度。 图像灰度值的平均水平和起伏情况,选取均值、 1.3海底回波波形关系模型 标准差、偏度、峰度、分位数描述海底声阻抗和界 海底回波波形特征以单波束测深仪和浅地层 面粗糙度变化s。假设样本图像1(x,y)的分辨率 剖面仪为主要的探测设备,声波到达海底后受硬 为N,×Ne,则各项统计量计算如下: 度、粗糙度、声阻抗等因素的影响,经过反射和散 1)均值。不同底质类型会形成起伏变化的反 射回到换能器,回波信号的振幅和相位发生变 向散射强度分布,可利用灰度均值表征底质对声 化,不同类型底质的回波呈现出独有特征。通过 波反射特性的平均水平: 分析入射海底的声脉冲信号的幅值、波形特征, 1 推断海底底质的类型和结构特性7。孟金生等s0 μ=1 N. 扫1扫1 提出利用高频正入射声脉冲估测海底表层沉积物 2)标准差。受海底起伏和表面粗糙度不均匀 的声衰减系数,从回波包络的形状提取声波传播 衰减的指数因子。Prager等s利用回声测深仪回 的影响,海底底质图像呈现出明暗变化,灰度值 标准差反映了反向散射强度相对平均值的总离 波的形状信息,提取直方图统计特征、能量特征、 散度: 谱特征和小波系数特征共166维的全特征向量, 利用主成分分析法对特征进行融合,在海试中验 证了该类方法的有效性。万宏俊2将多波束声 呐信号时域波形进行EMD分解,得到了信号瞬 NN 时频率分布图,并提取希尔伯特边际谱特征进行 3)偏度与峰度。偏度(s)是图像灰度分布偏 海底底质分类。 斜方向和程度的度量,用于表征概率密度曲线相 对于平均值不对称程度。峰度(k)表征了数据概 2海底声呐图像特征提取方法 率密度分布曲线在平均值处峰值高低的特性,描 述了分布形态的陡缓程度。 对海底反向散射强度数据按照地理位置信息 进行处理和拼接,可以得到海底的声呐图像,进 N,Ne (1(i,)-) 而以更加直观的形式对海底反向散射数据的空间 i=l l 特性进行分析。海洋环境噪声随机性强,水声信 NNσ3 道受到诸多时变和空变因素的影响,目标边界或 结构有较大的不规则性,仅利用单一的特征值难 i.- l 以准确地描述海底观测数据的特征,因此在水声 k= NN 图像识别中特征提取成为最为关键的技术。目 4)分位数。对海底底质图像灰度值分布函 前针对海底图像的特征提取问题,相关研究学者 数,采用四分位数作为分类特征量,包括第一四
1.2 海底回波空间分布关系模型 海底回波空间分布特征以多波束和侧扫声呐 为主要探测设备,通过综合分析一定空间范围内 的反向散射强度特征,判断海底底质的类型和表 层结构。Clarke 等 [39-40] 提出利用反向散射强度随 波束入射角的变化曲线进行海底底质分类,实验 证实不同类型的海底底质角度响应曲线的形状、 方差和幅值特征具有区分性,该方法在多波束底 质识别研究中受到广泛关注。Pace 等 [41] 提出了 基于侧扫声呐图像纹理特征的海底沉积学类型自 动识别方法,初步验证了图像法在海底地质特征 分析中的有效性。此后,基于声呐图像的海底表 层地质属性识别技术迅速发展,谱特征 [42] 、灰度 共生矩阵[43] 、参数化反射概率密度模型[44] 、神经 网络及其优化模型[44] 、支持向量机[45] 、决策树[46] 等方法被应用在海底声呐图像识别中,显著提升 了海底底质识别的效率和准确度。 1.3 海底回波波形关系模型 海底回波波形特征以单波束测深仪和浅地层 剖面仪为主要的探测设备,声波到达海底后受硬 度、粗糙度、声阻抗等因素的影响,经过反射和散 射回到换能器,回波信号的振幅和相位发生变 化,不同类型底质的回波呈现出独有特征。通过 分析入射海底的声脉冲信号的幅值、波形特征, 推断海底底质的类型和结构特性[47]。孟金生等[48-50] 提出利用高频正入射声脉冲估测海底表层沉积物 的声衰减系数,从回波包络的形状提取声波传播 衰减的指数因子。Prager 等 [51] 利用回声测深仪回 波的形状信息,提取直方图统计特征、能量特征、 谱特征和小波系数特征共 166 维的全特征向量, 利用主成分分析法对特征进行融合,在海试中验 证了该类方法的有效性。万宏俊[52] 将多波束声 呐信号时域波形进行 EMD 分解,得到了信号瞬 时频率分布图,并提取希尔伯特边际谱特征进行 海底底质分类。 2 海底声呐图像特征提取方法 对海底反向散射强度数据按照地理位置信息 进行处理和拼接,可以得到海底的声呐图像,进 而以更加直观的形式对海底反向散射数据的空间 特性进行分析。海洋环境噪声随机性强,水声信 道受到诸多时变和空变因素的影响,目标边界或 结构有较大的不规则性,仅利用单一的特征值难 以准确地描述海底观测数据的特征,因此在水声 图像识别中特征提取成为最为关键的技术[53]。目 前针对海底图像的特征提取问题,相关研究学者 提出的方法可以归纳为三大类:空间域方法、频 率域方法以及其他变换域方法。 2.1 空间域特征 空间域特征是指基于声呐图像灰度空间分布 特性的统计量。海底声呐图像的灰度变化在局部 区域内具有不规则性,而在整体上又呈现出一定 的规律性,这使图像中的不同区域可以依据概率 统计特征和纹理特征进行识别,兼顾图像的宏观 和微观结构特征[54]。 2.1.1 概率统计特征 I(x, y) Nr ×Nc 声呐系统将接收到的回波强度转换为图像灰 度,由于海底底质的反射系数有所差异,不同底 质的声呐图像会呈现出一定的明暗变化。通常情 况下,声波反射能力强的底质类型回波强度值 大,区域呈现亮色,声波吸收能力强的底质类型 回波强度值小,区域呈现阴影区。为了表示海底 图像灰度值的平均水平和起伏情况,选取均值、 标准差、偏度、峰度、分位数描述海底声阻抗和界 面粗糙度变化[55]。假设样本图像 的分辨率 为 ,则各项统计量计算如下: 1) 均值。不同底质类型会形成起伏变化的反 向散射强度分布,可利用灰度均值表征底质对声 波反射特性的平均水平: µ = 1 NrNc ∑Nr i=1 ∑Nc j=1 I(i, j) 2) 标准差。受海底起伏和表面粗糙度不均匀 的影响,海底底质图像呈现出明暗变化,灰度值 标准差反映了反向散射强度相对平均值的总离 散度: σ = vuuuuuut ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 2 NrNc s k 3) 偏度与峰度。偏度 ( ) 是图像灰度分布偏 斜方向和程度的度量,用于表征概率密度曲线相 对于平均值不对称程度。峰度 ( ) 表征了数据概 率密度分布曲线在平均值处峰值高低的特性,描 述了分布形态的陡缓程度。 s = ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 3 NrNcσ3 k = ∑Nr i=1 ∑Nc j=1 (I(i, j)−µ) 4 NrNcσ4 4) 分位数。对海底底质图像灰度值分布函 数,采用四分位数作为分类特征量,包括第一四 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·589·
·590· 智能系统学报 第15卷 分位数、中位数、第三四分位数。 D=lgN, Ig(1/r) (1) 2.1.2灰度共生矩阵 灰度共生矩阵是建立在图像二阶联合条件概 利用式(1)定义的分形维数可以通过多种方 率密度函数基础上的一种重要的纹理分析方法, 法进行计算,常用的方法有Peleg法、微分盒计数 通过统计图像中在特定距离和倾角上具有指定灰 法、标准差盒计数法等。 度级的像素对的数目或者概率,揭示图像灰度关 2.2频率域特征 于方向、相邻间隔、变化幅度等的综合信息,是底 频率域特征是指通过傅里叶变换等方式将声 质分类中使用最多的声呐图像特征。 呐图像在频域进行分解,获取图像在频率域的表 首先在底质图像中选取一个窗口,给定方向 示系数或其统计量作为图像特征。 角6和距离d,在方向角为0的直线上有一个像 2.2.1谱特征 素点的灰度值为i,若存在另一个与其相距d的 谱特征是图像处理与分析领域的重要工具, 像素点的灰度值为,则这样的灰度对同时出现 也是较早引入声呐图像底质分类中的特征提取方 的频数即为灰度共生矩阵P(i,,d,)的第(i,)个 法,最具代表性的是功率谱特征和倒频谱特征。 阵元的数值,0通常取0°、45°、90°、135°。 功率谱描述了信号功率在频域的分布状况。 在生成灰度共生矩阵的基础上,可以计算多 声呐接收信号是时间的准谐随机函数,每ping回 个特征统计量,选择其中不相关的统计量进行底 波划分为个等距窗口,将声呐回波强度表示为 质图像特征的表示,其中包括角二阶距(ASM)、 时间窗口函数w(t)和区间信号幅值a:(t)的乘积: 对比度(CON)、相关性(COR)和逆差矩(DM, g;(t)=w(t)a;(t) 计算如下: 对窗口信号幅值进行傅里叶变换并取模的平 方,则第i个窗口区间的功率谱为 ASM= Pi,id, P(ω)=Fg()川 扫1归1 对n个功率谱在各个频率处取均值得到平均 NG NG CoN=∑∑i-Pi,id,0 功率谱: 1面 COR= 99ixj×Pi,,d,)-44 F()=n>P.(0) l Oj Pm为平均功率谱的最大值,A为常量因子, 声呐图像的对数功率谱可以表示为 IDM= 99Pi,jd,四 台台1+-羽 (AP)+1/(A+1) 其中参数NG表示底质图像的灰度级数,角二阶 Pi(0)-lg Pace等s]将对数功率谱进行标准化并定义 矩反映图像灰度分布的均匀程度以及纹理粗细程 了3个积分函数表示海底底质的图像特征。 度,对比度主要反映图像清晰度与纹理深浅的程 度,相关性是用来衡量元素在灰度共生矩阵的行 倒频谱定义为:信号功率谱对数的傅里叶变 换,在某些声信号处理应用中比功率谱和自相关 或列方向上的相似度,逆差矩反映了图像的局部 函数具有更好的应用效果。对平均功率谱的对数 同质性。 进行傅里叶逆变换并取幅值的模的平方即为图像 2.1.3分形雏 的倒频谱C(r),t为倒频率。 分形几何能够准确刻画自然中广泛存在的、 不规则的自然现象,判断分形几何的一个准则是 C()=logP() 其自相似性。由于粒径、孔隙度等物理特性的差 Reut等21对声呐图像的倒频谱定义了积分 异,各类型底质的声呐图像蕴含了海底起伏和表 函数并引入斜率、截距两个参数表征倒频谱积分 面结构特征,具有统计意义上的自相似性,利用 的特性,以此作为海底底质识别的特征量。谱特 声呐图像的分形维特征可以描述海底底质表面纹 征独立于信号的幅值水平和系统增益,但是对样 理的不规则性和粗糙程度。 本的区分性严重依赖声波脉冲长度和载波频率,其 对于n维欧氏空间中的有界集合F,能够以 分类性能容易受到声呐类型及其工况参数的影响。 尺度因子r分割为N,个独立的子集的联合,每个 2.2.2小波变换 子集与原集合保持自相似性。分形集合通过分形 小波变换是利用小波函数对信号进行多尺度 维数进行特征量化,集合F的分形维数定义为 分解,进而对信号进行时频域局部分析的一种数
分位数、中位数、第三四分位数。 2.1.2 灰度共生矩阵 灰度共生矩阵是建立在图像二阶联合条件概 率密度函数基础上的一种重要的纹理分析方法, 通过统计图像中在特定距离和倾角上具有指定灰 度级的像素对的数目或者概率,揭示图像灰度关 于方向、相邻间隔、变化幅度等的综合信息,是底 质分类中使用最多的声呐图像特征。 θ d θ i d j P(i, j,d, θ) (i, j) θ 首先在底质图像中选取一个窗口,给定方向 角 和距离 ,在方向角为 的直线上有一个像 素点的灰度值为 ,若存在另一个与其相距 的 像素点的灰度值为 ,则这样的灰度对同时出现 的频数即为灰度共生矩阵 的第 个 阵元的数值, 通常取 0°、45°、90°、135°。 在生成灰度共生矩阵的基础上,可以计算多 个特征统计量,选择其中不相关的统计量进行底 质图像特征的表示,其中包括角二阶距 (ASM)、 对比度 (CON)、相关性 (COR) 和逆差矩 (IDM)[56] , 计算如下: ASM = ∑NG i=1 ∑NG j=1 P(i, j,d, θ) 2 CON = ∑NG i=1 ∑NG j=1 (i− j) 2P(i, j,d, θ) COR = ∑NG i=1 ∑NG j=1 i× j× P(i, j,d, θ)−µiµj σiσj IDM = ∑NG i=1 ∑NG j=1 P(i, j,d, θ) 1+(i− j) 2 其中参数 NG 表示底质图像的灰度级数,角二阶 矩反映图像灰度分布的均匀程度以及纹理粗细程 度,对比度主要反映图像清晰度与纹理深浅的程 度,相关性是用来衡量元素在灰度共生矩阵的行 或列方向上的相似度,逆差矩反映了图像的局部 同质性。 2.1.3 分形维 分形几何能够准确刻画自然中广泛存在的、 不规则的自然现象,判断分形几何的一个准则是 其自相似性。由于粒径、孔隙度等物理特性的差 异,各类型底质的声呐图像蕴含了海底起伏和表 面结构特征,具有统计意义上的自相似性,利用 声呐图像的分形维特征可以描述海底底质表面纹 理的不规则性和粗糙程度[57]。 n F r Nr F 对于 维欧氏空间中的有界集合 ,能够以 尺度因子 分割为 个独立的子集的联合,每个 子集与原集合保持自相似性。分形集合通过分形 维数进行特征量化,集合 的分形维数定义为 D = lgNr lg(1/r) (1) 利用式 (1) 定义的分形维数可以通过多种方 法进行计算,常用的方法有 Peleg 法、微分盒计数 法、标准差盒计数法等[58]。 2.2 频率域特征 频率域特征是指通过傅里叶变换等方式将声 呐图像在频域进行分解,获取图像在频率域的表 示系数或其统计量作为图像特征。 2.2.1 谱特征 谱特征是图像处理与分析领域的重要工具, 也是较早引入声呐图像底质分类中的特征提取方 法,最具代表性的是功率谱特征和倒频谱特征。 n w(t) ai(t) 功率谱描述了信号功率在频域的分布状况。 声呐接收信号是时间的准谐随机函数,每 ping 回 波划分为 个等距窗口,将声呐回波强度表示为 时间窗口函数 和区间信号幅值 的乘积: gi(t) = w(t)ai(t) i 对窗口信号幅值进行傅里叶变换并取模的平 方,则第 个窗口区间的功率谱为 Pi(ω) = |F {gi(t)}| 2 对 n 个功率谱在各个频率处取均值得到平均 功率谱: P(ω) = n −1∑n i=1 Pi(ω) Pm 为平均功率谱的最大值, A 为常量因子, 声呐图像的对数功率谱可以表示为 PL(ω) = lg( AP(ω) Pm +1 ) / lg(A+1) Pace 等 [59] 将对数功率谱进行标准化并定义 了 3 个积分函数表示海底底质的图像特征。 C(τ) τ 倒频谱定义为:信号功率谱对数的傅里叶变 换,在某些声信号处理应用中比功率谱和自相关 函数具有更好的应用效果。对平均功率谱的对数 进行傅里叶逆变换并取幅值的模的平方即为图像 的倒频谱 , 为倒频率。 C(τ) = F { logP(ω) } 2 Reut 等 [42] 对声呐图像的倒频谱定义了积分 函数并引入斜率、截距两个参数表征倒频谱积分 的特性,以此作为海底底质识别的特征量。谱特 征独立于信号的幅值水平和系统增益,但是对样 本的区分性严重依赖声波脉冲长度和载波频率,其 分类性能容易受到声呐类型及其工况参数的影响。 2.2.2 小波变换 小波变换是利用小波函数对信号进行多尺度 分解,进而对信号进行时频域局部分析的一种数 ·590· 智 能 系 统 学 报 第 15 卷
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·591· 学工具。图像小波分解处理的实质是分频处理, 波分析的基础上提出的一种非自适应的多尺度分 海底声呐图像中的粗纹理和细纹理空间能量分别 析方法,能够在任意尺度上实现任意方向的分 集中分布在低频段和高频段,因此不同底质类型 解,在捕捉图像轮廓、纹理特征方面具有优越的 的声呐图像在高低频段的能量占比存在着一定 性能。 差异60。 李庆武等I6]提出的基于Contourlet变换的 利用小波变换提取声呐图像特征首先要选取 声呐图像特征提取方法,首先,利用多尺度分 合适的小波基,对声呐图像进行二值图转化,利 解提取边缘奇异点,根据方向信息将相近的奇 用小波分解函数计算图像阈值并对图像进行分 异点汇集成轮廓段;然后,利用拉普拉斯塔式 解;然后获取各层各分解通道系数的均值、标准 滤波器将图像进行多分辨率分解提取奇异点, 差和能量等;计算不同底质不同层次信号能量百 采用二维方向滤波器组将同向的奇异点连接成 分比,归纳能量百分比分布特性,评估获取的各 线,使生成的基结构逼近原图像;最后,分别针 个指标在海底底质分类中的分离性。 对高频子带和低频子带获取不同的统计特征 Hatanaka等6对不同类型底质的纹理特征进 量,对具有显著方向特性的底质类型实现了较 行分析,结果显示底质纹理结构的差异显著体现 好的识别率。 在小波变换的低频分量中。此外,在小波变换基 2.3其他变换域方法 础上建立的曲波变换61、轮廓波变换6刷具有多分 相关研究学者还提出利用其他方法描述海底 辨、多尺度、各向异性等特点,对图像进行不同方 底质特征,如SIFT特征、Weyl变换等64,由于 向的分解时灵活性更强,提取的特征参数也更加 篇幅有限不再详述。 细致。 表1中总结了常用的海底底质分类特征提取 2.2.3 Contourlet变换 方法,在主要思想、特征量、方法、特点等方面进 Contourlet变换是由Donoho和Vetterli在小 行了对比。 表1常用的海底底质特征提取方法对比 Table 1 Various seabed sediment feature extraction methods 方法 主要思想 特征量 尺度 特点 应用范例 利用概率统计的方法表示反向散射均值、标准差 计算简单,性能稳 概率统计 文献66)] 强度的平均水平、波动性、概率分布偏度、峰度 可变尺度定,直观描述海底 文献[67列 的偏斜程度和峰态特性 分位数、直方图 声反射特性 利用二阶联合条件概率密度 计算量大,反映海 角二阶矩、对比度 文献[41] 灰度共生矩阵 表示海底底质分布的均匀程 可变尺度 底声反射的空间分 相关性、逆差矩等 文献68] 度以及纹理粗细程度 布相关性 定量表示海底地形以及海床 表征海底表面的粗 文献I69] 分形维 分形维数 可变尺度 表面粗糙度的分形特性 糙度和复杂度 文献[57刀 表征灰度变化剧烈 将图像的灰度分布变换为图 功率谱频段 程度,一定程度上 文献59 功率谱 多ping 像的频率分布 分量比 反映底质边界特征 文献70] 和混杂程度 分析原频谱上的细微周期成 表征海底粗糙度和 倒频谱积分的 倒频谱 分,能够分离出主声源和传 多ping 硬度,依赖声波脉 文献[42] 斜率和截距 播噪声的频带 冲长度和频率 利用小波函数对图像进行多 分别对图像高、低 小波分解系 文献71川 小波变换 尺度分解,在多个分解层上 可变尺度 频段进行分析,去 数统计量 文献[60] 分析图像时频域特征 噪性能好 非自适应的多尺度分析方法, 高低频子 对边缘、轮廓和方 文献72] Contourlet?变换 能够在任意尺度上实现任意方 可变尺度 带统计量 向特征识别性好 文献63] 向的分解
学工具。图像小波分解处理的实质是分频处理, 海底声呐图像中的粗纹理和细纹理空间能量分别 集中分布在低频段和高频段,因此不同底质类型 的声呐图像在高低频段的能量占比存在着一定 差异[60]。 利用小波变换提取声呐图像特征首先要选取 合适的小波基,对声呐图像进行二值图转化,利 用小波分解函数计算图像阈值并对图像进行分 解;然后获取各层各分解通道系数的均值、标准 差和能量等;计算不同底质不同层次信号能量百 分比,归纳能量百分比分布特性,评估获取的各 个指标在海底底质分类中的分离性。 Hatanaka 等 [61] 对不同类型底质的纹理特征进 行分析,结果显示底质纹理结构的差异显著体现 在小波变换的低频分量中。此外,在小波变换基 础上建立的曲波变换[62] 、轮廓波变换[63] 具有多分 辨、多尺度、各向异性等特点,对图像进行不同方 向的分解时灵活性更强,提取的特征参数也更加 细致。 2.2.3 Contourlet 变换 Contourlet 变换是由 Donoho 和 Vetterli 在小 波分析的基础上提出的一种非自适应的多尺度分 析方法,能够在任意尺度上实现任意方向的分 解,在捕捉图像轮廓、纹理特征方面具有优越的 性能。 李庆武等[63] 提出的基于 Contourlet 变换的 声呐图像特征提取方法,首先,利用多尺度分 解提取边缘奇异点,根据方向信息将相近的奇 异点汇集成轮廓段;然后,利用拉普拉斯塔式 滤波器将图像进行多分辨率分解提取奇异点, 采用二维方向滤波器组将同向的奇异点连接成 线,使生成的基结构逼近原图像;最后,分别针 对高频子带和低频子带获取不同的统计特征 量,对具有显著方向特性的底质类型实现了较 好的识别率。 2.3 其他变换域方法 相关研究学者还提出利用其他方法描述海底 底质特征,如 SIFT 特征、Weyl 变换等[64-65] ,由于 篇幅有限不再详述。 表 1 中总结了常用的海底底质分类特征提取 方法,在主要思想、特征量、方法、特点等方面进 行了对比。 表 1 常用的海底底质特征提取方法对比 Table 1 Various seabed sediment feature extraction methods 方法 主要思想 特征量 尺度 特点 应用范例 概率统计 利用概率统计的方法表示反向散射 强度的平均水平、波动性、概率分布 的偏斜程度和峰态特性 均值、标准差、 偏度、峰度、 分位数、直方图 可变尺度 计算简单,性能稳 定,直观描述海底 声反射特性 文献[66] 文献[67] 灰度共生矩阵 利用二阶联合条件概率密度 表示海底底质分布的均匀程 度以及纹理粗细程度 角二阶矩、对比度、 相关性、逆差矩等 可变尺度 计算量大,反映海 底声反射的空间分 布相关性 文献[41] 文献[68] 分形维 定量表示海底地形以及海床 表面粗糙度的分形特性 分形维数 可变尺度 表征海底表面的粗 糙度和复杂度 文献[69] 文献[57] 功率谱 将图像的灰度分布变换为图 像的频率分布 功率谱频段 分量比 多ping 表征灰度变化剧烈 程度,一定程度上 反映底质边界特征 和混杂程度 文献[59] 文献[70] 倒频谱 分析原频谱上的细微周期成 分,能够分离出主声源和传 播噪声的频带 倒频谱积分的 斜率和截距 多ping 表征海底粗糙度和 硬度,依赖声波脉 冲长度和频率 文献[42] 小波变换 利用小波函数对图像进行多 尺度分解,在多个分解层上 分析图像时频域特征 小波分解系 数统计量 可变尺度 分别对图像高、低 频段进行分析,去 噪性能好 文献[71] 文献[60] Contourlet变换 非自适应的多尺度分析方法, 能够在任意尺度上实现任意方 向的分解 高低频子 带统计量 可变尺度 对边缘、轮廓和方 向特征识别性好 文献[72] 文献[63] 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·591·
·592· 智能系统学报 第15卷 3分类算法 b0,若y=-1,则有wx+ 能力
3 分类算法 在声学海底底质分类应用中,分类算法按照 是否利用底质采样数据可以分为两类:监督学习 和无监督学习。鉴于深度学习在网络结构、模型 性能等方面与传统的监督学习算法存在的差异 性,本文将单独讨论深度学习算法在海底底质分 类中的应用现状和发展前景。 3.1 监督学习 利用监督学习算法可以基于已有的底质采样 数据获得先验知识并储存在分类规则中,可以对 未知的输入样本类型进行预测,一般适用于已有 底质采样数据、明确掌握海底底质类型的区域。 在监督学习算法构建的预测模型中,又可以根据 采样数据标定方式的不同,将海底底质的描述方 法分为离散类别法和连续量化法。离散类别法是 指根据特定的底质分类原则 (如 Folk 分类体系 等) 将底质标定为某一种类别描述,如泥、砂等, 基于该描述方法构建的底质分类模型预测的是离 散值,此类学习任务对应的是“分类”问题。而连 续量化法则通过实验测定的方法将底质的物理属 性用若干参数表示,如粒径分布等,是一种参数 化描述方法,基于该描述方法构建的底质分类模 型预测的是连续的属性值,此类学习任务对应的 是“回归”问题,一般采用多项式回归、神经网络、 随机森林等方法实现。由于连续量化法的底质样 本测定较为复杂,且对声呐数据的分辨率要求极 高,目前离散类别法仍然是声学海底底质分类中 采样数据的主要标定方法,本文主要介绍与离散 类别法对应的分类算法,主要包括支持向量机、 决策树、随机森林、BP 神经网络等。 3.1.1 支持向量机 (w,b) 支持向量机 (SVM) 是由 Vapnik 等 [73] 提出的 基于统计与判别的学习方法,基本思想是最大化 分类间隔,通过寻找最优超平面对不同类别的样 本进行划分。SVM 基本模型定义为特征空间上 间隔最大的线性分类器,其间隔最大化的学习策 略对训练样本局部抗扰动性最好,最终可变换为 凸二次规划问题进行解答。对于线性可分问题, 在样本空间中划分超平面可通过线性方程 来描述: w T x+b = 0 w b r (xi , yi) yi = +1 w T xi +b > 0 yi = −1 w T xi+ 式中: 为超平面法向量; 为超平面与原点的距 离,样本空间任意一点到超平面的距离为 。设 超平面把训练样本准确分类,对任意样本 , 若 ,则有 ,若 ,则有 b < 0 。满足上述关系的样本称作支持向量,两个 异类支持向量距超平面距离之和称作间隔,表 示为 γ = 2 ∥w∥ 在多个超平面中,寻找使间隔最大的分离超 平面。非线性模型对应的是最优超曲面,原理与 线性模型类似。通过使用核函数,支持向量机可 以解决非线性分类问题,具有泛化性能好、适合 小样本和高维特征等优点,使用高斯核的支持向 量机在多分类问题中具有较好的性能。徐超等[74] 采用基于径向基核函数的合成核代替单核形式, 一方面可以提升分类精度,另一方面合成核对于 多特征融合具有更好的兼容性。 3.1.2 决策树算法 决策树算法是一种用于分类和回归的非参数 监督学习方法,目标是通过创建一个树状的决策 模型,学习隐藏在数据中的决策规则来预测目标 变量的数值或分类。利用决策树训练得到的模型 是树状的决策图,表示对象属性和对象值之间的 一种映射。决策树的深度越大,决策规则越复 杂,拟合的模型也更精确。同时,为了增强训练 模型的泛化能力,需要利用合适的约束规则避免 对训练集的过拟合。 决策树算法通过寻找观测值的最优划分,从 观测数据的属性集合中选取一个或多个属性作为 决策节点的分裂属性,将观测数据按照指定的属 性阈值划分到子节点中,生成具有多重深度的完 整分类树。然后利用剪枝算法对分类树的结构进 行精简,结合测试数据对剪枝后的模型精度进行 评估,确定最优的分类树结构。在树型结构的训 练过程中,核心问题是如何确定各个决策节点的 分裂属性和变量值。在进行贪婪搜索时,遍历各 个属性的不同二分裂集合,通过计算节点处的分 裂度量函数对当前采用的分裂属性及其变量值的 分离性做出评价,最终通过迭代测试确定所有节 点的分裂规则。 决策树分类模型在基于海底声呐图像的底质 分类应用中可以有效识别泥、岩、砂等底质类型, 在运行效率上更加高效,分类规则明确易解释。 决策树算法是一种结构清晰,可以处理多维度分 类问题的监督学习算法,与神经网络的黑盒分类 模型相比,决策树分类模型的逻辑更加清晰,利 用交叉验证方法执行剪枝后的树形结构,使得 从样本数据中学习的分类规则具备较好的泛化 能力。 ·592· 智 能 系 统 学 报 第 15 卷
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·593· 3.13随机森林 底底质类型未知以探究底质分布范围为目标的应 随机森林是通过集成学习的思想将多个决策 用场景。 树进行组合的分类器算法,其输出类别由单棵树 3.2.1K-均值算法 的输出结果的众数决定。Diesing46利用随机森 K-均值算法是最为常用的聚类分析算法,是 林算法对4种底质类型的声呐图像进行分类,结 由MacQueen提出的一种基于类内误差总和最小 果明显优于目标分析法和地质统计分析法。由于 准则、通过不断迭代达到收敛条件的数据聚类思 集成多个子分类器,随机森林模型具有十分优越 想。该算法易于理解、实现过程简单、具有较高 的性能,结构清晰,训练速度快,对超参数的调整 伸缩性和可靠性,但迭代过程和准确率严重依赖 不敏感,分类性能稳定,分类规则具有可解释性, 初始聚类中心的选取,易陷入局部最优。 与其他分类算法相比具有很强的竞争力,逐渐成 K-均值算法的主要思路是将每一个样本划 为声学海底底质分类中广泛应用的分类模型训练 分到最近中心所属的类簇,对于样本集X= 方法.阿 {:,,…,xw,指定想要实现的类簇数目K,算法 3.1.4BP神经网络 首先随机选取K个样本{c1,c2,…,cx}作为互不相 BP神经网络是一种由多层感知器互联而成 交的类簇C,C2,…,Cx}的初始聚类中心,样本集 的有向无环网络结构,一般包含输人层、隐含层 X中的任意一个样本被划分到与之距离最近的中 和输出层。输入层接收训练数据,经隐含层向前 心所属的类簇,目标函数为数据集所有样本距簇 传输到输出层,每层中分布若干个神经元,每个 中心的欧式距离的平方和: 神经元的输入与输出的关系可表示为 y=f∑wx+0 E=∑∑disx,c} =l xEC, 式中:w表示信号传输权重;0为偏置m。BP神 迭代过程中不断优化各个数据点与聚类中心 经网络是海底声呐图像分类中广泛使用的分类方 之间的距离,直至目标函数到达最小。标准的K- 法,该算法是由Werbos提出并经过Rumelhart和 均值算法包括4个步骤:1)选取目标聚类数目K, McCelland等科学家进一步发展的多层网络参数 并随机指定K个聚类中心;2)对样本集合中每一 训练模型。BP网络的拓扑结构通过误差逆向传 个样本找到离它最近的聚类中心并将其分配到该 播及梯度最速下降机制寻找网络误差最小化的参 类簇;3)计算每一个类簇的平均值,将该簇的中 数组合,能够在输人输出数学关系未知的情况 心点移动到平均值的位置;4)重复2)、3),直至中 下,通过学习过程将复杂的映射关系存储在网络 心点不再发生变化。 结构中。由于该模型实现相对简单且分类效果 金绍华等8给出了多波束底质分类中K值 好,是较早应用在声学海底底质分类中的分类模 的确定原则,海底底质被划分的聚类数是先验信 型训练算法。 息,若指定的类别数目过少,则会出现有些海底 此后,相关研究学者也将各种改进型的BP 底质类型无法被识别出;若指定的类别数目过 神经网络引入到海底底质分类中,阳凡林采用遗 多,将造成海底底质分类不准确,因此需要合理 传算法训练BP神经网络,较好地解决了BP算法 确定底质的类别数目K值。 对初始权值敏感和陷入局部极小的问题,熊明 3.2.2自组织网络 宽等利用遗传算法优化小波神经网络的初始权值 自组织竞争神经网络(SOM)是由Teuvo Ko- 及小波参数,结合了小波分析多分辨率、局部细 honen提出的一种无监督神经网络,由输人层和 化的优点,在3种底质类型的识别中取得了较好 竞争层组成,是一种由可变权值全连接的神经元 的准确率。 阵列组成的自组织、自学习网络。SOM的竞争性 3.2无监督学习 体现在输出层,输出层的节点间通过一定的权重 针对海底底质采样点稀缺时,监督学习难以 连接,权重根据最大或最小距离准则来调整,通 建立准确的分类模型的问题,可以采用无监督学 过无监督竞争学习使不同神经元对不同的输入模 习算法对底质类型进行划分。无监督学习可以对 式敏感,使网络收敛于稳态。SOM的典型特点 无标签数据进行内在结构分析,将属性相近的样 是在处理单元阵列能够形成输入的特征拓扑分 本聚集成簇,用于海底底质分类的无监督学习算 布,因此SOM网具有抽取输入信号模式特征 法主要包括K-均值和自组织网络。利用无监督 的能力。 学习可以对输入样本进行聚类分析,但无法获知 SOM可以将任意维数的输入模式以拓扑有 样本所属的底质类型,因此无监督学习可用于海 序的方式变换到一维或二维的离散空间上,这种
3.1.3 随机森林 随机森林是通过集成学习的思想将多个决策 树进行组合的分类器算法,其输出类别由单棵树 的输出结果的众数决定。Diesing[46] 利用随机森 林算法对 4 种底质类型的声呐图像进行分类,结 果明显优于目标分析法和地质统计分析法。由于 集成多个子分类器,随机森林模型具有十分优越 的性能,结构清晰,训练速度快,对超参数的调整 不敏感,分类性能稳定,分类规则具有可解释性, 与其他分类算法相比具有很强的竞争力,逐渐成 为声学海底底质分类中广泛应用的分类模型训练 方法[75-76]。 3.1.4 BP 神经网络 BP 神经网络是一种由多层感知器互联而成 的有向无环网络结构,一般包含输入层、隐含层 和输出层。输入层接收训练数据,经隐含层向前 传输到输出层,每层中分布若干个神经元,每个 神经元的输入与输出的关系可表示为 y = f( ∑ wi jxi +θ) 式中: wi j 表示信号传输权重; θ 为偏置[77]。BP 神 经网络是海底声呐图像分类中广泛使用的分类方 法,该算法是由 Werbos 提出并经过 Rumelhart 和 McCelland 等科学家进一步发展的多层网络参数 训练模型。BP 网络的拓扑结构通过误差逆向传 播及梯度最速下降机制寻找网络误差最小化的参 数组合,能够在输入输出数学关系未知的情况 下,通过学习过程将复杂的映射关系存储在网络 结构中[78]。由于该模型实现相对简单且分类效果 好,是较早应用在声学海底底质分类中的分类模 型训练算法[44]。 此后,相关研究学者也将各种改进型的 BP 神经网络引入到海底底质分类中,阳凡林采用遗 传算法训练 BP 神经网络,较好地解决了 BP 算法 对初始权值敏感和陷入局部极小的问题[79] ;熊明 宽等利用遗传算法优化小波神经网络的初始权值 及小波参数,结合了小波分析多分辨率、局部细 化的优点,在 3 种底质类型的识别中取得了较好 的准确率。 3.2 无监督学习 针对海底底质采样点稀缺时,监督学习难以 建立准确的分类模型的问题,可以采用无监督学 习算法对底质类型进行划分。无监督学习可以对 无标签数据进行内在结构分析,将属性相近的样 本聚集成簇,用于海底底质分类的无监督学习算 法主要包括 K-均值和自组织网络。利用无监督 学习可以对输入样本进行聚类分析,但无法获知 样本所属的底质类型,因此无监督学习可用于海 底底质类型未知以探究底质分布范围为目标的应 用场景。 3.2.1 K-均值算法 K-均值算法是最为常用的聚类分析算法,是 由 MacQueen 提出的一种基于类内误差总和最小 准则、通过不断迭代达到收敛条件的数据聚类思 想。该算法易于理解、实现过程简单、具有较高 伸缩性和可靠性,但迭代过程和准确率严重依赖 初始聚类中心的选取,易陷入局部最优[80]。 X = {x1, x2,··· , xN} K K {c1, c2,··· , cK} {C1,C2,··· ,CK} X K-均值算法的主要思路是将每一个样本划 分到最近中心所属的类簇,对于样本集 ,指定想要实现的类簇数目 ,算法 首先随机选取 个样本 作为互不相 交的类簇 的初始聚类中心,样本集 中的任意一个样本被划分到与之距离最近的中 心所属的类簇,目标函数为数据集所有样本距簇 中心的欧式距离的平方和: E = ∑K i=1 ∑ x∈Ci dist(x, ci) 2 K K 迭代过程中不断优化各个数据点与聚类中心 之间的距离,直至目标函数到达最小。标准的 K- 均值算法包括 4 个步骤:1) 选取目标聚类数目 , 并随机指定 个聚类中心;2) 对样本集合中每一 个样本找到离它最近的聚类中心并将其分配到该 类簇;3) 计算每一个类簇的平均值,将该簇的中 心点移动到平均值的位置;4) 重复 2)、3),直至中 心点不再发生变化。 K K 金绍华等[81] 给出了多波束底质分类中 值 的确定原则,海底底质被划分的聚类数是先验信 息,若指定的类别数目过少,则会出现有些海底 底质类型无法被识别出;若指定的类别数目过 多,将造成海底底质分类不准确,因此需要合理 确定底质的类别数目 值。 3.2.2 自组织网络 自组织竞争神经网络 (SOM) 是由 Teuvo Kohonen 提出的一种无监督神经网络,由输入层和 竞争层组成,是一种由可变权值全连接的神经元 阵列组成的自组织、自学习网络。SOM 的竞争性 体现在输出层,输出层的节点间通过一定的权重 连接,权重根据最大或最小距离准则来调整,通 过无监督竞争学习使不同神经元对不同的输入模 式敏感,使网络收敛于稳态[82]。SOM 的典型特点 是在处理单元阵列能够形成输入的特征拓扑分 布,因此 SOM 网络具有抽取输入信号模式特征 的能力[83]。 SOM 可以将任意维数的输入模式以拓扑有 序的方式变换到一维或二维的离散空间上,这种 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·593·
·594· 智能系统学报 第15卷 变换称为特征映射。其中,输入空间是输入向量 升模型的复杂度。最具代表性的卷积神经网络 的集合,输出空间在二维网格的自组织映射中是 (CNN)是由LeCun等提出并在计算机视觉领域得 二维的平面。通过竞争、合作与更新3个过程, 到巨大发展的神经网络模型,经过不断改进和发 SOM可以完成自组织映射⑧4。唐秋华等8s-86分 展,CNN逐渐成为深度学习的主要架构之一。 别将反向散射强度均值和灰度共生矩阵统计特征 CNN是一种深层前馈型神经网络,包含的多层感 与SOM相结合,实现了对多种类型底质分布的 知器具有强非线性逼近能力。与传统的神经网络 快速识别,分类界线基本与实测数据吻合。Zhao 相比,CNN通过逐层卷积计算构建了强大的特征 等87利用SOM对精细化处理的海底灰度图像进 提取器,层与层之间的节点随机相连。CNN的特 行识别,给出了用于海底底质分类的SOM网络 点在于它的局部感知与权值共享,在对输入图像 基本参数设置方案。 进行处理时,利用卷积滤波同时作用于一定区域 3.3深度学习在海底底质分类中的应用 的神经元,通过扫描整张图像得到全域的综合特 在声呐图像海底底质分类技术的发展过程 征信息。同一层级处理过程中共享同一卷积权 中,传统的研究思路是将声呐图像和底质类型之 值,并通过减少一定权值参数的方式降低网络的 间关系模型的建立分为两个阶段,即声呐图像特 复杂性。 征提取和分类器训练。然而由于声呐图像分辨率 卷积神经网络通常包含输入层、卷积层、池 低、干扰严重等,对于特征提取算法的设计和分 化层、全连接层和输出层,利用卷积神经网络进 类算法的最优选择,一直是声学海底底质智能分 行海底底质分类的基本架构如图1所示,其中卷 类技术争论的焦点。相比之下,深度学习可以通 积层和池化层可以有多个。各层的主要工作机制 过内部网络结构自动提取目标的内在特征,并经 如下。1)输入层。读取图像数据,原始图像保存 过低层到高层的抽象过程建立稳定的特征组合, 在该层。2)卷积层。利用卷积核进行特征提取, 弱化了人工选择特征的主观性,节省了大量的时 特点是局部感知域、权值共享和多核卷积。在每 间和工作量。深度学习方法的特征分析具有类脑 一卷积层中包含多个卷积核,使每一个卷积核都 的抽象过程,使得模型的泛化能力更好,对声呐 与本层输人图像的局部区域进行卷积运算获取不 图像的噪声干扰具有更好的兼容性,为提升海底 同种类的特征图,输入到下一层,其中卷积核的 底质智能识别技术开辟了一种新的模型架构。深 权重是经学习得到且在卷积过程中保持不变。 度学习方法在人脸识别、行人检测等光学图像处 3)池化层。将图像划分为不重叠区域并对区域内 理领域已经取得了很大的成功,而与声呐图像和 的元素进行聚合。可以利用多种池化方式对输入 水下目标识别应用的结合还有待于加强。因此, 特征图进行池化,进而降低特征维度,保证网络 本文对深度学习方法在声学海底底质分类中的应 的抗噪能力。4)全连接层。经过卷积层处理之 用前景进行了讨论,以卷积神经网络为例从深度 后,图像信息被高度抽象化,全连接层在整幅图 学习的核心算法和网络结构等方面对未来深层次 像层面进行特征组合与推断,形成利于分类的特 应用进行展望。 征。5)输出层。对全连接层的输出向量进行类别 深度学习方法具有更深的网络层数,其实现 判定。针对不同的声呐图像识别任务,CNN网络 架构主要基于多层的神经网络,通过增加隐含层 的各层结构和参数设置需要结合图像数据特点进 的数目、扩充阈值和连接权值等参数的规模,提 行单独设计。 输入层 卷积层 池化层 全连接层 输出层 声呐图像 c品】 n卷积杉 c品2 海底底质分布图 ● ReLU Softmax Class 3 采样数据 ● Class 6 图1 卷积神经网络海底底质分类基本架构 Fig.1 Basic structure of seabed sediment classification using CNN
变换称为特征映射。其中,输入空间是输入向量 的集合,输出空间在二维网格的自组织映射中是 二维的平面。通过竞争、合作与更新 3 个过程, SOM 可以完成自组织映射[84]。唐秋华等[85-86] 分 别将反向散射强度均值和灰度共生矩阵统计特征 与 SOM 相结合,实现了对多种类型底质分布的 快速识别,分类界线基本与实测数据吻合。Zhao 等 [87] 利用 SOM 对精细化处理的海底灰度图像进 行识别,给出了用于海底底质分类的 SOM 网络 基本参数设置方案。 3.3 深度学习在海底底质分类中的应用 在声呐图像海底底质分类技术的发展过程 中,传统的研究思路是将声呐图像和底质类型之 间关系模型的建立分为两个阶段,即声呐图像特 征提取和分类器训练。然而由于声呐图像分辨率 低、干扰严重等,对于特征提取算法的设计和分 类算法的最优选择,一直是声学海底底质智能分 类技术争论的焦点。相比之下,深度学习可以通 过内部网络结构自动提取目标的内在特征,并经 过低层到高层的抽象过程建立稳定的特征组合, 弱化了人工选择特征的主观性,节省了大量的时 间和工作量。深度学习方法的特征分析具有类脑 的抽象过程,使得模型的泛化能力更好,对声呐 图像的噪声干扰具有更好的兼容性,为提升海底 底质智能识别技术开辟了一种新的模型架构。深 度学习方法在人脸识别、行人检测等光学图像处 理领域已经取得了很大的成功,而与声呐图像和 水下目标识别应用的结合还有待于加强。因此, 本文对深度学习方法在声学海底底质分类中的应 用前景进行了讨论,以卷积神经网络为例从深度 学习的核心算法和网络结构等方面对未来深层次 应用进行展望。 深度学习方法具有更深的网络层数,其实现 架构主要基于多层的神经网络,通过增加隐含层 的数目、扩充阈值和连接权值等参数的规模,提 升模型的复杂度。最具代表性的卷积神经网络 (CNN) 是由 LeCun 等提出并在计算机视觉领域得 到巨大发展的神经网络模型,经过不断改进和发 展 ,CNN 逐渐成为深度学习的主要架构之一。 CNN 是一种深层前馈型神经网络,包含的多层感 知器具有强非线性逼近能力。与传统的神经网络 相比,CNN 通过逐层卷积计算构建了强大的特征 提取器,层与层之间的节点随机相连。CNN 的特 点在于它的局部感知与权值共享,在对输入图像 进行处理时,利用卷积滤波同时作用于一定区域 的神经元,通过扫描整张图像得到全域的综合特 征信息。同一层级处理过程中共享同一卷积权 值,并通过减少一定权值参数的方式降低网络的 复杂性。 卷积神经网络通常包含输入层、卷积层、池 化层、全连接层和输出层,利用卷积神经网络进 行海底底质分类的基本架构如图 1 所示,其中卷 积层和池化层可以有多个。各层的主要工作机制 如下。1) 输入层。读取图像数据,原始图像保存 在该层。2) 卷积层。利用卷积核进行特征提取, 特点是局部感知域、权值共享和多核卷积。在每 一卷积层中包含多个卷积核,使每一个卷积核都 与本层输入图像的局部区域进行卷积运算获取不 同种类的特征图,输入到下一层,其中卷积核的 权重是经学习得到且在卷积过程中保持不变。 3) 池化层。将图像划分为不重叠区域并对区域内 的元素进行聚合。可以利用多种池化方式对输入 特征图进行池化,进而降低特征维度,保证网络 的抗噪能力。4) 全连接层。经过卷积层处理之 后,图像信息被高度抽象化,全连接层在整幅图 像层面进行特征组合与推断,形成利于分类的特 征。5) 输出层。对全连接层的输出向量进行类别 判定。针对不同的声呐图像识别任务,CNN 网络 的各层结构和参数设置需要结合图像数据特点进 行单独设计。 ReLU 全连接层 输出层 Softmax 输入层 采样数据 声呐图像 n卷积核 卷积层 F1 F2 Fn Fn−1 Map1 Map2 Map(n−1) Mapn 池化层 Class 1 Class 2 Class 3 Class 4 Class 5 Class 6 海底底质分布图 图 1 卷积神经网络海底底质分类基本架构 Fig. 1 Basic structure of seabed sediment classification using CNN ·594· 智 能 系 统 学 报 第 15 卷
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·595· CNN与浅层神经网的区别在于:增加了卷 散,涉及不同海域、不同数据采集和处理方案、不 积运算和下采样过程,具有局部感知和权值共享 同型号声呐及传感器等因素,研究成果难以对比 的特点。纪雪[6]将声呐图像的纹理特征和统计 和共享,而且这些数据主要由项目责任单位保 量特征与CNN相结合,通过与SVM、ISODATA、 存,缺少数据处理与共享机制,造成大量的数据 BP神经网络3种方法对比,证明卷积神经网络比 资源闲置和浪费。建议对现有的海底观测数据进 传统的机器学习算法具有更高的识别准确率。付 行统筹规划,推动数据资源共享平台建设。 楠6将灰度-基元共生矩阵与CNN相结合,并且 2)国产声呐设备研发与推广。现阶段我国已 通过对网络参数的调整与优化,对10类图像的分 经实现了大多数声呐设备的国产化,包括多波 类准确率优于SVM和BP神经网络。焦佳⑧1在 束、侧扫声呐、浅地层剖面仪等。由于起步较晚, 实验中对比了不同激活函数对于分类性能的影 国产声呐设备在测量精度、量程、可靠性等方面 响,实验结果表明采用RLU作为CNN网络的激 跟国外的技术仍然存在差距,对于测绘单位来说 活函数对于砂纹、沉船等6类水下目标具有最优 进口设备仍然是首选。然而一些国外设备厂商对 的分类性能。Williams!8将CNN应用在海洋目 声呐工作原理和数据格式严格保密,对于声呐数 标识别中,与人工专家判别结果相比,仍然取得 据包中的测量信息并未完全开放,用户只能通过 了较好的识别率。刘韦伯采用具有较高实时 其预留的数据接口导出指定的测量信息,导致后 性的YOLOv3网络结构对水下目标进行识别,在 期处理过程中无法制定有针对性的补偿和校正处 平均识别准确率、目标检测精度及模型的识别速 理方案,严重制约着测绘精度的提高。今后必须 度方面均表现出优异的性能。 努力提升国产设备技术水平和普及程度,自主开 针对深度学习在海底声呐图像底质分类中的 发勘测设备和后处理系统,尤其是面向深海及复 应用现状,后续可以在以下方面进行改善。1)增 杂环境的探测装备,真正掌握核心技术,实现测 加训练集样本数量。深度学习在样本规模足够大 绘过程的“全透明”才能让科研人员有更多有价值 的情况下具有更强大的分析能力,由于实验条件 的发现。 所限,目前研究中所采用的声呐图像数据量难以 3)海底声学特性研究。海底声学特性是进行 满足深度学习对数据规模的要求,可以利用迁移 声学海底探测的物理学基础,早期的海底声学理 学习等方法对现有图像数据进行学习,通过捕捉 论体系与模型主要是由国外学者建立,我国的研 声呐图像的深层次特征模拟海底声呐图像,扩展 究主要集中在声呐数据解析、分类算法探讨等方 样本数据集,从而提升深度神经网络的学习能 面,相关研究并不深入,尤其是在地声模型理论 力。2)深度优化网络结构。结合声呐图像样本数 研究方面缺乏必要的研究基础和系统的实验分 据的特点和海底底质分类对于准确率的高要求, 析,不利于推动声学海底探测技术的发展。应该 可以降低模型实时性的要求,优先保证模型精 立足现有的理论体系,加强对海底基础科学的研 度,选取合适的网络结构,对网络的损失函数、优 究和支持力度,在典型区域统一规划、设计、实施 化算法进行优选,从而制定最佳策略构建底质分 系统性的海底物理特性测量实验,通过探索发现 类模型。 海底固有特性和规律,夯实理论研究基础。 4总结与展望 4)反向散射数据精细化处理技术。海底的反 向散射强度与水深、底质、入射角、波束宽度、发 随着声呐技术和计算机视觉水平的提高,我 射功率、系统增益等因素有关,为了保证反向散 国的海底声呐图像底质分类技术已经有了长足的 射强度能够准确反映海底底质的声学特性,必须 发展,但是研究中也面临着一些技术挑战。在人 对影响反向散射强度的其他因素进行补偿。目前 工智能理论蓬勃发展的重要机遇期,需要在立足 对于反向散射强度数据的校正流程不规范,多数 地声模型理论的基础上,利用大量的取样和观测 情况下缺乏船体姿态与速度校正、海底地形校正 数据进行探索和验证,提升海底底质探测的智能 等,使得反向散射强度补偿不准确。可以结合海 化水平,在未来的工作中需要在以下几个方面进 底地声模型和散射模型对声传播过程进行模拟, 一步加强: 通过水池实验明确各个因素的作用机理和改正方 1)海底底质数据库建设。在长期的海洋观测 法,逐步完善反向散射数据的标准化处理流程和 中,我国曾开展过多次海洋调查科考航次,积累 质量控制标准。 了大量的海底观测数据。然而由于研究单位分 5)特征提取方法。特征提取方法的选取是影
CNN 与浅层神经网络的区别在于:增加了卷 积运算和下采样过程,具有局部感知和权值共享 的特点。纪雪[68] 将声呐图像的纹理特征和统计 量特征与 CNN 相结合,通过与 SVM、ISODATA、 BP 神经网络 3 种方法对比,证明卷积神经网络比 传统的机器学习算法具有更高的识别准确率。付 楠 [64] 将灰度−基元共生矩阵与 CNN 相结合,并且 通过对网络参数的调整与优化,对 10 类图像的分 类准确率优于 SVM 和 BP 神经网络。焦佳[88] 在 实验中对比了不同激活函数对于分类性能的影 响,实验结果表明采用 ReLU 作为 CNN 网络的激 活函数对于砂纹、沉船等 6 类水下目标具有最优 的分类性能。Williams[89] 将 CNN 应用在海洋目 标识别中,与人工专家判别结果相比,仍然取得 了较好的识别率。刘韦伯[90] 采用具有较高实时 性的 YOLOv3 网络结构对水下目标进行识别,在 平均识别准确率、目标检测精度及模型的识别速 度方面均表现出优异的性能。 针对深度学习在海底声呐图像底质分类中的 应用现状,后续可以在以下方面进行改善。1) 增 加训练集样本数量。深度学习在样本规模足够大 的情况下具有更强大的分析能力,由于实验条件 所限,目前研究中所采用的声呐图像数据量难以 满足深度学习对数据规模的要求,可以利用迁移 学习等方法对现有图像数据进行学习,通过捕捉 声呐图像的深层次特征模拟海底声呐图像,扩展 样本数据集,从而提升深度神经网络的学习能 力。2) 深度优化网络结构。结合声呐图像样本数 据的特点和海底底质分类对于准确率的高要求, 可以降低模型实时性的要求,优先保证模型精 度,选取合适的网络结构,对网络的损失函数、优 化算法进行优选,从而制定最佳策略构建底质分 类模型。 4 总结与展望 随着声呐技术和计算机视觉水平的提高,我 国的海底声呐图像底质分类技术已经有了长足的 发展,但是研究中也面临着一些技术挑战。在人 工智能理论蓬勃发展的重要机遇期,需要在立足 地声模型理论的基础上,利用大量的取样和观测 数据进行探索和验证,提升海底底质探测的智能 化水平,在未来的工作中需要在以下几个方面进 一步加强: 1) 海底底质数据库建设。在长期的海洋观测 中,我国曾开展过多次海洋调查科考航次,积累 了大量的海底观测数据。然而由于研究单位分 散,涉及不同海域、不同数据采集和处理方案、不 同型号声呐及传感器等因素,研究成果难以对比 和共享,而且这些数据主要由项目责任单位保 存,缺少数据处理与共享机制,造成大量的数据 资源闲置和浪费。建议对现有的海底观测数据进 行统筹规划,推动数据资源共享平台建设。 2) 国产声呐设备研发与推广。现阶段我国已 经实现了大多数声呐设备的国产化,包括多波 束、侧扫声呐、浅地层剖面仪等。由于起步较晚, 国产声呐设备在测量精度、量程、可靠性等方面 跟国外的技术仍然存在差距,对于测绘单位来说 进口设备仍然是首选。然而一些国外设备厂商对 声呐工作原理和数据格式严格保密,对于声呐数 据包中的测量信息并未完全开放,用户只能通过 其预留的数据接口导出指定的测量信息,导致后 期处理过程中无法制定有针对性的补偿和校正处 理方案,严重制约着测绘精度的提高。今后必须 努力提升国产设备技术水平和普及程度,自主开 发勘测设备和后处理系统,尤其是面向深海及复 杂环境的探测装备,真正掌握核心技术,实现测 绘过程的“全透明”才能让科研人员有更多有价值 的发现。 3) 海底声学特性研究。海底声学特性是进行 声学海底探测的物理学基础,早期的海底声学理 论体系与模型主要是由国外学者建立,我国的研 究主要集中在声呐数据解析、分类算法探讨等方 面,相关研究并不深入,尤其是在地声模型理论 研究方面缺乏必要的研究基础和系统的实验分 析,不利于推动声学海底探测技术的发展。应该 立足现有的理论体系,加强对海底基础科学的研 究和支持力度,在典型区域统一规划、设计、实施 系统性的海底物理特性测量实验,通过探索发现 海底固有特性和规律,夯实理论研究基础。 4) 反向散射数据精细化处理技术。海底的反 向散射强度与水深、底质、入射角、波束宽度、发 射功率、系统增益等因素有关,为了保证反向散 射强度能够准确反映海底底质的声学特性,必须 对影响反向散射强度的其他因素进行补偿。目前 对于反向散射强度数据的校正流程不规范,多数 情况下缺乏船体姿态与速度校正、海底地形校正 等,使得反向散射强度补偿不准确。可以结合海 底地声模型和散射模型对声传播过程进行模拟, 通过水池实验明确各个因素的作用机理和改正方 法,逐步完善反向散射数据的标准化处理流程和 质量控制标准。 5) 特征提取方法。特征提取方法的选取是影 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·595·
·596· 智能系统学报 第15卷 响海底底质分类准确率的重要因素,日前的声呐 9)与水下无人平台的结合。面向局部区域的 图像特征提取方法大都借鉴的是光学图像处理方 高分辨率海底底质信息探测技术对于未来水下作 法,而声学图像与光学图像特性差异较大,现有 战、海洋工程建设、海底资源勘探等具有重要的 的方法对海底底质的声呐图像特征缺乏针对性。 支撑作用。目前水下机器人的载荷能力得到了很 建议从声呐成像机制入手,深入分析声呐图像灰 大提升,已经集成了侧扫声呐、水声定位系统、水 度分布特性,发展适用于海底底质识别的特征提 下摄像机等多种传感器设备,具备全面的海底观 取方法。 测能力。借助AUV等水下移动平台观测精度 6)声学海底底质分类软件的研发。国际上已 高、观测信息完备的技术优势,开展实时性的海 经出现多款商用底质分类软件,但是由于声呐数 底底质探测与识别技术已经具备技术基础。未来 据兼容性差、特征提取算法不稳定、对采样数据 还可以利用水下无人平台对深水区海底地层进行 要求高、在不同海域的普适性较差等因素,并未 高精度探测,从而有效改善深水区的探测误差和 获得广泛应用。目前国内已经有多家研究单位开 可靠性等问题。 展了海底底质分类的研究工作,但是由于缺乏系 统性的规划,已取得的研究成果并未得到转化, 参考文献: 在自主研发可靠的底质分类软件过程中仍需要更 [1]金翔龙.海洋地球物理研究与海底探测声学技术的发 多的投入。在进行软件架构设计时,必须考虑多 展[.地球物理学进展,2007,22(4):1243-1249 类型数据格式的兼容性问题,可以通过开发数据 JIN Xianglong.The development of research in marine 标准化处理模块,将不同声呐设备厂商的数据格 geophysics and acoustic technology for submarine explora- 式统一集成到标准化处理框架范围内,提升对现 tion[J].Progress in geophysics,2007,22(4):1243-1249. [2]路晓磊,张丽婷,王芳,等.海底声学探测技术装备综 有的多类型设备和新型设备的兼容性,从而解决 述[).海洋开发与管理,2018,35(6):91-94 声呐设备型号和数据格式不同导致的数据处理方 LU Xiaolei,ZHANG Liting,WANG Fang,et al.Sum- 案设计中的超高复杂度。 mary of submarine acoustic detection technology and 7)与人工智能理论的深入结合。深度神经网 equipment[J].Ocean development and management,2018, 络通过多次迭代组合低层分布式特征形成抽象高 35(6):91-94 层特征的方式,在众多的图像识别领域展现了强 [3]庞新明,赵明辉,刘思青,等.复杂地质结构OBS地震剖 大的分析能力。在水下目标识别方面,由于声呐 面震相识别方法[J].地球物理学报,2019,62(9): 3482-3491 图像与光学图像的特点存在一定差异,如何更好 PANG Xinming,ZHAO Minghui,LIU Siqing,et al.Seis- 地利用深度学习方法提升水下目标识别的准确性 mic phases identification in OBS seismic record sections 和可靠性,如何充分集成海洋环境信息在智能分 through the complex geological structure[J].Chinese 析与决策系统中的辅助作用,如何实现人工智能 journal of geophysics,2019,62(9):3482-3491. 技术与海洋探测技术的深度结合,发展智能海洋 [4]BROWN C J,BEAUDOIN J,BRISSETTE M,et al. 空间探测技术,将是未来海洋科学与技术发展的 Multispectral multibeam echo sounder backscatter as a tool 重要课题。 for improved seafloor characterization[J].Geosciences, 8)可视化水平。传统的离散点底质类型信息 2019,9(3):126. [5]SHIH CC,HORNG M F,TSENG Y R,et al.An adaptive 主要集成在电子海图或海底底质专题图中,随着 bottom tracking algorithm for side-scan sonar seabed map- 声学探测技术的发展,连续的海底底质信息获取 ping[C]//Proceedings of 2019 IEEE Underwater Techno- 已经日渐成熟,提升海底底质信息的可视化水平 logy.Taiwan,China,2019:1-7. 将是不可回避的问题。如今的制图技术已经更加 [6]TAN Cheng,ZHANG Xuebo,YANG Peixuan,et al.A 成熟,海底底质分布图的符号设计和显示风格都 novel sub-bottom profiler and signal processor[J].Sensors, 有提升的空间,尤其是在海底空间信息集成显示 2019.1922):5052 方面,可以结合现有的GIS平台和可视化技术, [7]张炳生.水下声学高精度定位算法的研究[D.西安:长 加强底质信息展示的直观性、全面性和互操作 安大学,2019. ZHANG Bingsheng.Research on high precision position 性,进一步开展海底三维地层信息显示的集成技 ing algorithm for underwater acoustics[D].Xi'an:Chang 术研究,使海底底质探测技术的创新发展成果能 an University,2019. 更好地服务于海洋科学、海洋工程和海洋军事领 [8]耿雪樵,徐行,刘方兰,等.我国海底取样设备的现状与 域的重大需求。 发展趋势.地质装备,2009,10(4):11-16
响海底底质分类准确率的重要因素,目前的声呐 图像特征提取方法大都借鉴的是光学图像处理方 法,而声学图像与光学图像特性差异较大,现有 的方法对海底底质的声呐图像特征缺乏针对性。 建议从声呐成像机制入手,深入分析声呐图像灰 度分布特性,发展适用于海底底质识别的特征提 取方法。 6) 声学海底底质分类软件的研发。国际上已 经出现多款商用底质分类软件,但是由于声呐数 据兼容性差、特征提取算法不稳定、对采样数据 要求高、在不同海域的普适性较差等因素,并未 获得广泛应用。目前国内已经有多家研究单位开 展了海底底质分类的研究工作,但是由于缺乏系 统性的规划,已取得的研究成果并未得到转化, 在自主研发可靠的底质分类软件过程中仍需要更 多的投入。在进行软件架构设计时,必须考虑多 类型数据格式的兼容性问题,可以通过开发数据 标准化处理模块,将不同声呐设备厂商的数据格 式统一集成到标准化处理框架范围内,提升对现 有的多类型设备和新型设备的兼容性,从而解决 声呐设备型号和数据格式不同导致的数据处理方 案设计中的超高复杂度。 7) 与人工智能理论的深入结合。深度神经网 络通过多次迭代组合低层分布式特征形成抽象高 层特征的方式,在众多的图像识别领域展现了强 大的分析能力。在水下目标识别方面,由于声呐 图像与光学图像的特点存在一定差异,如何更好 地利用深度学习方法提升水下目标识别的准确性 和可靠性,如何充分集成海洋环境信息在智能分 析与决策系统中的辅助作用,如何实现人工智能 技术与海洋探测技术的深度结合,发展智能海洋 空间探测技术,将是未来海洋科学与技术发展的 重要课题。 8) 可视化水平。传统的离散点底质类型信息 主要集成在电子海图或海底底质专题图中,随着 声学探测技术的发展,连续的海底底质信息获取 已经日渐成熟,提升海底底质信息的可视化水平 将是不可回避的问题。如今的制图技术已经更加 成熟,海底底质分布图的符号设计和显示风格都 有提升的空间,尤其是在海底空间信息集成显示 方面,可以结合现有的 GIS 平台和可视化技术, 加强底质信息展示的直观性、全面性和互操作 性,进一步开展海底三维地层信息显示的集成技 术研究,使海底底质探测技术的创新发展成果能 更好地服务于海洋科学、海洋工程和海洋军事领 域的重大需求。 9) 与水下无人平台的结合。面向局部区域的 高分辨率海底底质信息探测技术对于未来水下作 战、海洋工程建设、海底资源勘探等具有重要的 支撑作用。目前水下机器人的载荷能力得到了很 大提升,已经集成了侧扫声呐、水声定位系统、水 下摄像机等多种传感器设备,具备全面的海底观 测能力。借助 AUV 等水下移动平台观测精度 高、观测信息完备的技术优势,开展实时性的海 底底质探测与识别技术已经具备技术基础。未来 还可以利用水下无人平台对深水区海底地层进行 高精度探测,从而有效改善深水区的探测误差和 可靠性等问题。 参考文献: 金翔龙. 海洋地球物理研究与海底探测声学技术的发 展 [J]. 地球物理学进展, 2007, 22(4): 1243–1249. JIN Xianglong. The development of research in marine geophysics and acoustic technology for submarine exploration[J]. Progress in geophysics, 2007, 22(4): 1243–1249. [1] 路晓磊, 张丽婷, 王芳, 等. 海底声学探测技术装备综 述 [J]. 海洋开发与管理, 2018, 35(6): 91–94. LU Xiaolei, ZHANG Liting, WANG Fang, et al. Summary of submarine acoustic detection technology and equipment[J]. Ocean development and management, 2018, 35(6): 91–94. [2] 庞新明, 赵明辉, 刘思青, 等. 复杂地质结构 OBS 地震剖 面震相识别方法 [J]. 地球物理学报, 2019, 62(9): 3482–3491. PANG Xinming, ZHAO Minghui, LIU Siqing, et al. Seismic phases identification in OBS seismic record sections through the complex geological structure[J]. Chinese journal of geophysics, 2019, 62(9): 3482–3491. [3] BROWN C J, BEAUDOIN J, BRISSETTE M, et al. Multispectral multibeam echo sounder backscatter as a tool for improved seafloor characterization[J]. Geosciences, 2019, 9(3): 126. [4] SHIH C C, HORNG M F, TSENG Y R, et al. An adaptive bottom tracking algorithm for side-scan sonar seabed mapping[C]//Proceedings of 2019 IEEE Underwater Technology. Taiwan, China, 2019: 1−7. [5] TAN Cheng, ZHANG Xuebo, YANG Peixuan, et al. A novel sub-bottom profiler and signal processor[J]. Sensors, 2019, 19(22): 5052. [6] 张炳生. 水下声学高精度定位算法的研究 [D]. 西安: 长 安大学, 2019. ZHANG Bingsheng. Research on high precision positioning algorithm for underwater acoustics[D]. Xi’an: Chang’ an University, 2019. [7] 耿雪樵, 徐行, 刘方兰, 等. 我国海底取样设备的现状与 发展趋势 [J]. 地质装备, 2009, 10(4): 11–16. [8] ·596· 智 能 系 统 学 报 第 15 卷