ME-Faster R-CNN 检测流程主要分为 3 个部分，分别是特征

点击下载：【机器感知与模式识别】基于Faster R-CNN的多任务增强裂缝图像检测方法

正在加载图片...

·288· 智能系统学报第16卷 ME-Faster R-CNN检测流程主要分为3个部 CNN模型结构中只有一个RPN,RPN使用最后一分，分别是特征提取、特征融合以及候选区域生个卷积层获得特征图。称之为原始RPN,其结成、检测处理。构如图2(a)所示，输入图像大小为224×224，原 1)特征提取：本文选用ResNet-50深度残差网始RPN在网络中感受野要远远大于224×224，仅络)作为大坝裂缝图像特征提取器，通过5级能获得少量典型裂缝特征。然而，图像中裂缝存 ResNet-50将图片转换成特征图。在不同大小和比例。如果检测到裂缝大小对于检 2)特征融合以及候选区域生成：将所得特征测区域太大，则检测区域周围多余裂缝形状可能图输人多任务增强RPN模型，并改善RPN模型会被视为噪音。如果检测到裂缝大小对于检测区的锚盒尺寸和大小以提高检测识别精度，最后生域太小，RPN将无法生成ROI。因此，原始成候选框。具体方法如下： RPN的功能不足以检测不同大小和比例的完整 ①多任务增强RPN方法：最初Faster R- 裂缝对象。 ConvI_x Conv2_x Conv3_x Conv4_x Conv5_x Bbox ROI Pooling Layer FC6 FC7 FC8 Class Input ROI Score RPN 619×619 (a)原始RPN模块 Convl x Conv2_x Conv3_x Conv4_x Conv5_x Bbox ROI Pooling Layer FC6 FC7 FC8 Input Class Score ROI RPNI 146×146 ROI-Merge Layer RPN2 229×229 RPN3 619×619 (b)多任务增强RPN模块图2原始RPN模型与多任务增强RPN模型 Fig.2 Primitive RPN module &multi-task enhanced RPN module 针对以上问题，ME-Faster R-CNN方法提出一 Merge Layer仅输出一个数组。为了避免重复的种多任务增强RPN方法，其结构如图2(b)所示。 ROI和低的ROI裂缝似然分数，本文使用非极大该方法在ResNet-50的基础上引入多个RPN来产值抑制方法，不同卷积层后RPN输出的候选区域生ROL,提取不同大小特征图。具体是在ResNet- 中，在对应位置两ROI的交并比大于0.7的 50的第3卷积层Cov3x后加入一个RPN模块，ROI为同一ROI。具体方法为，3个卷积层后其感受野大小为146×146，用来检测较小目标；同 RPN输出的候选区域均带有建议得分，该分数对时在ResNet-50的第4卷积层Conv4x后加入一应的是目标的可能性，在对应位置选取分数最高个RPN模块，其感受野大小为229×229，用来检的一个ROI区域，另外两层对应位置的ROI与所测较大目标；在ResNet-.50的第5卷积层Conv5_x选ROI交并比IoU若大于0.7，则认为是同一之后利用多RPN任务可以输出图像总体信息。 ROI,ROI-Merge Layer的输出数组中对应位置仅由于每个RPN输出独立的ROI数组，为聚集输出该得分最高的数组。在使用非极大值抑制方和选择有效的区域，多任务增强RPN方法提供法之后，选择前100个值较高的ROI。因此，RO ROI-Merge Layer用于接受独立ROI数组，ROI- Merge Layer只需要调整超参数即可控制ROI的ME-Faster R-CNN 检测流程主要分为 3 个部分，分别是特征提取、特征融合以及候选区域生成、检测处理。 1) 特征提取：本文选用 ResNet-50 深度残差网络 [13] 作为大坝裂缝图像特征提取器，通过 5 级 ResNet-50 将图片转换成特征图。 2) 特征融合以及候选区域生成：将所得特征图输入多任务增强 RPN 模型，并改善 RPN 模型的锚盒尺寸和大小以提高检测识别精度，最后生成候选框。具体方法如下： ①多任务增强 RPN 方法：最初 Faster R- 224×224 224×224 CNN 模型结构中只有一个 RPN，RPN 使用最后一个卷积层获得特征图[2]。称之为原始 RPN，其结构如图 2(a) 所示，输入图像大小为，原始 RPN 在网络中感受野要远远大于，仅能获得少量典型裂缝特征。然而，图像中裂缝存在不同大小和比例。如果检测到裂缝大小对于检测区域太大，则检测区域周围多余裂缝形状可能会被视为噪音。如果检测到裂缝大小对于检测区域太小， R P N 将无法生成 ROI。因此，原始 RPN 的功能不足以检测不同大小和比例的完整裂缝对象。 ROI Pooling Layer FC6 FC7 Bbox Class Score RPN Input ROI Conv1_x Conv2_x Conv3_x Conv4_x Conv5_x 619×619 FC8 (a) 原始RPN模块 ROI Pooling Layer FC6 FC7 Bbox Class Score RPN3 Input ROI Conv1_x Conv2_x Conv3_x Conv4_x Conv5_x 229×229 FC8 RPN2 RPN1 146×146 619×619 ROI-Merge Layer (b) 多任务增强RPN模块图 2 原始 RPN 模型与多任务增强 RPN 模型 Fig. 2 Primitive RPN module &multi-task enhanced RPN module 146×146 229×229 针对以上问题，ME-Faster R-CNN 方法提出一种多任务增强 RPN 方法，其结构如图 2(b) 所示。该方法在 ResNet-50 的基础上引入多个 RPN 来产生 ROI，提取不同大小特征图。具体是在 ResNet- 50 的第 3 卷积层 Conv3_x 后加入一个 RPN 模块，其感受野大小为，用来检测较小目标；同时在 ResNet-50 的第 4 卷积层 Conv4_x 后加入一个 RPN 模块，其感受野大小为，用来检测较大目标；在 ResNet-50 的第 5 卷积层 Conv5_x 之后利用多 RPN 任务可以输出图像总体信息。由于每个 RPN 输出独立的 ROI 数组，为聚集和选择有效的区域，多任务增强 RPN 方法提供 ROI-Merge Layer 用于接受独立 ROI 数组，ROIMerge Layer 仅输出一个数组。为了避免重复的 ROI 和低的 ROI 裂缝似然分数，本文使用非极大值抑制方法，不同卷积层后 RPN 输出的候选区域中，在对应位置两 R OI 的交并比大于 0 . 7 的 ROI 为同一 ROI。具体方法为， 3 个卷积层后 RPN 输出的候选区域均带有建议得分，该分数对应的是目标的可能性，在对应位置选取分数最高的一个 ROI 区域，另外两层对应位置的 ROI 与所选 ROI 交并比 IoU 若大于 0.7，则认为是同一 ROI，ROI-Merge Layer 的输出数组中对应位置仅输出该得分最高的数组。在使用非极大值抑制方法之后，选择前 100 个值较高的 ROI。因此，ROIMerge Layer 只需要调整超参数即可控制 ROI 的 ·288· 智能系统学报第 16 卷

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】基于Faster R-CNN的多任务增强裂缝图像检测方法