正在加载图片...
第3期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·593· 3.13随机森林 底底质类型未知以探究底质分布范围为目标的应 随机森林是通过集成学习的思想将多个决策 用场景。 树进行组合的分类器算法,其输出类别由单棵树 3.2.1K-均值算法 的输出结果的众数决定。Diesing46利用随机森 K-均值算法是最为常用的聚类分析算法,是 林算法对4种底质类型的声呐图像进行分类,结 由MacQueen提出的一种基于类内误差总和最小 果明显优于目标分析法和地质统计分析法。由于 准则、通过不断迭代达到收敛条件的数据聚类思 集成多个子分类器,随机森林模型具有十分优越 想。该算法易于理解、实现过程简单、具有较高 的性能,结构清晰,训练速度快,对超参数的调整 伸缩性和可靠性,但迭代过程和准确率严重依赖 不敏感,分类性能稳定,分类规则具有可解释性, 初始聚类中心的选取,易陷入局部最优。 与其他分类算法相比具有很强的竞争力,逐渐成 K-均值算法的主要思路是将每一个样本划 为声学海底底质分类中广泛应用的分类模型训练 分到最近中心所属的类簇,对于样本集X= 方法.阿 {:,,…,xw,指定想要实现的类簇数目K,算法 3.1.4BP神经网络 首先随机选取K个样本{c1,c2,…,cx}作为互不相 BP神经网络是一种由多层感知器互联而成 交的类簇C,C2,…,Cx}的初始聚类中心,样本集 的有向无环网络结构,一般包含输人层、隐含层 X中的任意一个样本被划分到与之距离最近的中 和输出层。输入层接收训练数据,经隐含层向前 心所属的类簇,目标函数为数据集所有样本距簇 传输到输出层,每层中分布若干个神经元,每个 中心的欧式距离的平方和: 神经元的输入与输出的关系可表示为 y=f∑wx+0 E=∑∑disx,c} =l xEC, 式中:w表示信号传输权重;0为偏置m。BP神 迭代过程中不断优化各个数据点与聚类中心 经网络是海底声呐图像分类中广泛使用的分类方 之间的距离,直至目标函数到达最小。标准的K- 法,该算法是由Werbos提出并经过Rumelhart和 均值算法包括4个步骤:1)选取目标聚类数目K, McCelland等科学家进一步发展的多层网络参数 并随机指定K个聚类中心;2)对样本集合中每一 训练模型。BP网络的拓扑结构通过误差逆向传 个样本找到离它最近的聚类中心并将其分配到该 播及梯度最速下降机制寻找网络误差最小化的参 类簇;3)计算每一个类簇的平均值,将该簇的中 数组合,能够在输人输出数学关系未知的情况 心点移动到平均值的位置;4)重复2)、3),直至中 下,通过学习过程将复杂的映射关系存储在网络 心点不再发生变化。 结构中。由于该模型实现相对简单且分类效果 金绍华等8给出了多波束底质分类中K值 好,是较早应用在声学海底底质分类中的分类模 的确定原则,海底底质被划分的聚类数是先验信 型训练算法。 息,若指定的类别数目过少,则会出现有些海底 此后,相关研究学者也将各种改进型的BP 底质类型无法被识别出;若指定的类别数目过 神经网络引入到海底底质分类中,阳凡林采用遗 多,将造成海底底质分类不准确,因此需要合理 传算法训练BP神经网络,较好地解决了BP算法 确定底质的类别数目K值。 对初始权值敏感和陷入局部极小的问题,熊明 3.2.2自组织网络 宽等利用遗传算法优化小波神经网络的初始权值 自组织竞争神经网络(SOM)是由Teuvo Ko- 及小波参数,结合了小波分析多分辨率、局部细 honen提出的一种无监督神经网络,由输人层和 化的优点,在3种底质类型的识别中取得了较好 竞争层组成,是一种由可变权值全连接的神经元 的准确率。 阵列组成的自组织、自学习网络。SOM的竞争性 3.2无监督学习 体现在输出层,输出层的节点间通过一定的权重 针对海底底质采样点稀缺时,监督学习难以 连接,权重根据最大或最小距离准则来调整,通 建立准确的分类模型的问题,可以采用无监督学 过无监督竞争学习使不同神经元对不同的输入模 习算法对底质类型进行划分。无监督学习可以对 式敏感,使网络收敛于稳态。SOM的典型特点 无标签数据进行内在结构分析,将属性相近的样 是在处理单元阵列能够形成输入的特征拓扑分 本聚集成簇,用于海底底质分类的无监督学习算 布,因此SOM网具有抽取输入信号模式特征 法主要包括K-均值和自组织网络。利用无监督 的能力。 学习可以对输入样本进行聚类分析,但无法获知 SOM可以将任意维数的输入模式以拓扑有 样本所属的底质类型,因此无监督学习可用于海 序的方式变换到一维或二维的离散空间上,这种3.1.3 随机森林 随机森林是通过集成学习的思想将多个决策 树进行组合的分类器算法,其输出类别由单棵树 的输出结果的众数决定。Diesing[46] 利用随机森 林算法对 4 种底质类型的声呐图像进行分类,结 果明显优于目标分析法和地质统计分析法。由于 集成多个子分类器,随机森林模型具有十分优越 的性能,结构清晰,训练速度快,对超参数的调整 不敏感,分类性能稳定,分类规则具有可解释性, 与其他分类算法相比具有很强的竞争力,逐渐成 为声学海底底质分类中广泛应用的分类模型训练 方法[75-76]。 3.1.4 BP 神经网络 BP 神经网络是一种由多层感知器互联而成 的有向无环网络结构,一般包含输入层、隐含层 和输出层。输入层接收训练数据,经隐含层向前 传输到输出层,每层中分布若干个神经元,每个 神经元的输入与输出的关系可表示为 y = f( ∑ wi jxi +θ) 式中: wi j 表示信号传输权重; θ 为偏置[77]。BP 神 经网络是海底声呐图像分类中广泛使用的分类方 法,该算法是由 Werbos 提出并经过 Rumelhart 和 McCelland 等科学家进一步发展的多层网络参数 训练模型。BP 网络的拓扑结构通过误差逆向传 播及梯度最速下降机制寻找网络误差最小化的参 数组合,能够在输入输出数学关系未知的情况 下,通过学习过程将复杂的映射关系存储在网络 结构中[78]。由于该模型实现相对简单且分类效果 好,是较早应用在声学海底底质分类中的分类模 型训练算法[44]。 此后,相关研究学者也将各种改进型的 BP 神经网络引入到海底底质分类中,阳凡林采用遗 传算法训练 BP 神经网络,较好地解决了 BP 算法 对初始权值敏感和陷入局部极小的问题[79] ;熊明 宽等利用遗传算法优化小波神经网络的初始权值 及小波参数,结合了小波分析多分辨率、局部细 化的优点,在 3 种底质类型的识别中取得了较好 的准确率。 3.2 无监督学习 针对海底底质采样点稀缺时,监督学习难以 建立准确的分类模型的问题,可以采用无监督学 习算法对底质类型进行划分。无监督学习可以对 无标签数据进行内在结构分析,将属性相近的样 本聚集成簇,用于海底底质分类的无监督学习算 法主要包括 K-均值和自组织网络。利用无监督 学习可以对输入样本进行聚类分析,但无法获知 样本所属的底质类型,因此无监督学习可用于海 底底质类型未知以探究底质分布范围为目标的应 用场景。 3.2.1 K-均值算法 K-均值算法是最为常用的聚类分析算法,是 由 MacQueen 提出的一种基于类内误差总和最小 准则、通过不断迭代达到收敛条件的数据聚类思 想。该算法易于理解、实现过程简单、具有较高 伸缩性和可靠性,但迭代过程和准确率严重依赖 初始聚类中心的选取,易陷入局部最优[80]。 X = {x1, x2,··· , xN} K K {c1, c2,··· , cK} {C1,C2,··· ,CK} X K-均值算法的主要思路是将每一个样本划 分到最近中心所属的类簇,对于样本集 ,指定想要实现的类簇数目 ,算法 首先随机选取 个样本 作为互不相 交的类簇 的初始聚类中心,样本集 中的任意一个样本被划分到与之距离最近的中 心所属的类簇,目标函数为数据集所有样本距簇 中心的欧式距离的平方和: E = ∑K i=1 ∑ x∈Ci dist(x, ci) 2 K K 迭代过程中不断优化各个数据点与聚类中心 之间的距离,直至目标函数到达最小。标准的 K- 均值算法包括 4 个步骤:1) 选取目标聚类数目 , 并随机指定 个聚类中心;2) 对样本集合中每一 个样本找到离它最近的聚类中心并将其分配到该 类簇;3) 计算每一个类簇的平均值,将该簇的中 心点移动到平均值的位置;4) 重复 2)、3),直至中 心点不再发生变化。 K K 金绍华等[81] 给出了多波束底质分类中 值 的确定原则,海底底质被划分的聚类数是先验信 息,若指定的类别数目过少,则会出现有些海底 底质类型无法被识别出;若指定的类别数目过 多,将造成海底底质分类不准确,因此需要合理 确定底质的类别数目 值。 3.2.2 自组织网络 自组织竞争神经网络 (SOM) 是由 Teuvo Ko￾honen 提出的一种无监督神经网络,由输入层和 竞争层组成,是一种由可变权值全连接的神经元 阵列组成的自组织、自学习网络。SOM 的竞争性 体现在输出层,输出层的节点间通过一定的权重 连接,权重根据最大或最小距离准则来调整,通 过无监督竞争学习使不同神经元对不同的输入模 式敏感,使网络收敛于稳态[82]。SOM 的典型特点 是在处理单元阵列能够形成输入的特征拓扑分 布,因此 SOM 网络具有抽取输入信号模式特征 的能力[83]。 SOM 可以将任意维数的输入模式以拓扑有 序的方式变换到一维或二维的离散空间上,这种 第 3 期 赵玉新,等:海底声呐图像智能底质分类技术研究综述 ·593·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有