0 50 100 150 200 250 假阳数 300 350 400 _中国高校课件下载中心

正在加载图片...

·702· 智能系统学报第15卷 1.0 的候选区域，因此能更有效地定位到实例所在的 0.9 0.8 区域。 0.7 表4PNet和RPN的对比 0.6 Table 4 Comparison between P-Net and RPN 0.4 方法生成候选区域数量召回率% 0.3 Faster RCNN-VGG16-0.7685 ---RetinaNet-0.902 300 92.75 0.2 -0urs-0.9042 RPN 0.1 -Faster RCNN-ResNet50-FPN-0.9247 2000 95.12 0 50100150200250300350400 300 92.77 假阳数 P-Net (b)ROC曲线 2000 96.45 图4测试集上的准确率召回率曲线和ROC曲线 4.2.3OHEM的有效性 Fig.4 PR curve and ROC curve on test set 为了验证OHEM方法的有效性，比较了不使表2检测精度对比用OHEM、使用MTCNN中的OHEM方法以及使 Table 2 Accuracy comparison between different methods 用本文中的OHEM这3种情况下的模型检测效方法主干网络 mAP/% 存储空间MB 果，结果如表5所示。可以看出，OHEM可以使 VGG16 76.85 261 网络在训练期间更关注不容易被正确分类的样 Faster R-CNN ResNet-50+FPN 92.47 160 本，而本文提出的改进可以让模型在训练过程中 RetinaNet ResNet-50+FPN 90.20 146 忽略某些异常点，进一步提高性能。 RCNN-Lite 90.42 2.1 表5不同OHEM的效果 Table 5 Comparison between different OHEM methods 本文同时测试了模型检测速度。作为对照，方法 mAP/% Faster R-CNN和RetinaNet均使用ResNet-50+ 无OHEM 88.45 FPN作为主干网络。测试集图片主要包括了3 MTCNN 90.26 种不同的分辨率：256×256、1000×900和4800× 2800。表3给出了模型在不同分辨率输入下的检本文方法 90.42 测速度。为公平起见，所有模型运行都在一张T- 4.2.4不同NMS的影响 tanX(Pascal)显卡上。可以看出，本文的方法在在后处理阶段，通常需要采用非极大值抑制各种分辨率的输入上都是检测速度最快的，并且的方法去除冗余窗口，表6给出了采用常规的领先其他2种方法2~3倍。 NMS和Soft-NMS对检测结果的影响。其中，高表3检测速度对比斯加权使用的方差o=0.5。可以看出，采用Sof Table 3 Speed comparison between different methods NMS相比常规NMS可以获得一定的提升，而线输入分辨率ms 性加权和高斯加权两种不同方式带来的差异非常方法 256×256 1000×900 4800×2800 小，可以忽略。 Faster R-CNN 55 102 819 表6不同NMS的效果 RetinaNet 29 Table 6 Comparison between different NMS methods 81 877 17 方法加权方式 RCNN-Lite 40 314 mAP/% NMS 89.9 4.2.2P-Net与RPN的对比线性加权 90.39 RPN是Faster R-CNN中使用的候选区域生成 Soft-NMS 高斯加权 90.42 的方法。表4以召回率为指标，比较了P-Net和 RPN提取候选区域的能力。可以看出，在生成候 4.2.5损失函数的影响选区域数量较少时，P-Net和RPN的效果基本一表7比较了在分类和回归两类任务中，不同致。而生成候选区域数量较多时，P-Net领先了损失函数的影响。在分类任务中，使用交叉嫡损 1.33%。可以认为这是由于P-Nt使用了更多的失和Focal Loss的效果基本相同，这是由于Focal 锚框（约32.2万个），且可以产生更多种尺度不同 L0ss主要是为了解决训练期间正负样本数量极度0 50 100 150 200 250 假阳数 300 350 400 准确率 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Faster RCNN-VGG16-0.7685 Faster RCNN-ResNet50-FPN-0.9247 RetinaNet-0.902 Ours-0.9042 (b) ROC 曲线图 4 测试集上的准确率-召回率曲线和 ROC 曲线 Fig. 4 PR curve and ROC curve on test set 表 2 检测精度对比 Table 2 Accuracy comparison between different methods 方法主干网络 mAP/% 存储空间/MB Faster R-CNN VGG16 76.85 261 ResNet-50+FPN 92.47 160 RetinaNet ResNet-50+FPN 90.20 146 RCNN-Lite — 90.42 2.1 本文同时测试了模型检测速度。作为对照， Faster R-CNN 和 RetinaNet 均使用 ResNet-50+ FPN 作为主干网络。测试集图片主要包括了 3 种不同的分辨率：256×256、 1 000×900 和 4 800× 2 800。表 3 给出了模型在不同分辨率输入下的检测速度。为公平起见，所有模型运行都在一张 Titan X (Pascal) 显卡上。可以看出，本文的方法在各种分辨率的输入上都是检测速度最快的，并且领先其他 2 种方法 2~3 倍。表 3 检测速度对比 Table 3 Speed comparison between different methods 方法输入分辨率/ms 256×256 1 000×900 4 800×2 800 Faster R-CNN 55 102 819 RetinaNet 29 81 877 RCNN-Lite 17 40 314 4.2.2 P-Net 与 RPN 的对比 RPN 是 Faster R-CNN 中使用的候选区域生成的方法。表 4 以召回率为指标，比较了 P-Net 和 RPN 提取候选区域的能力。可以看出，在生成候选区域数量较少时，P-Net 和 RPN 的效果基本一致。而生成候选区域数量较多时，P-Net 领先了 1.33%。可以认为这是由于 P-Net 使用了更多的锚框 (约 32.2 万个)，且可以产生更多种尺度不同的候选区域，因此能更有效地定位到实例所在的区域。表 4 P-Net 和 RPN 的对比 Table 4 Comparison between P-Net and RPN 方法生成候选区域数量召回率/% RPN 300 92.75 2 000 95.12 P-Net 300 92.77 2 000 96.45 4.2.3 OHEM 的有效性为了验证 OHEM 方法的有效性，比较了不使用 OHEM、使用 MTCNN 中的 OHEM 方法以及使用本文中的 OHEM 这 3 种情况下的模型检测效果，结果如表 5 所示。可以看出，OHEM 可以使网络在训练期间更关注不容易被正确分类的样本，而本文提出的改进可以让模型在训练过程中忽略某些异常点，进一步提高性能。表 5 不同 OHEM 的效果 Table 5 Comparison between different OHEM methods 方法 mAP/% 无OHEM 88.45 MTCNN 90.26 本文方法 90.42 4.2.4 不同 NMS 的影响在后处理阶段，通常需要采用非极大值抑制的方法去除冗余窗口，表 6 给出了采用常规的 NMS 和 Soft-NMS 对检测结果的影响。其中，高斯加权使用的方差 σ=0.5。可以看出，采用 SoftNMS 相比常规 NMS 可以获得一定的提升，而线性加权和高斯加权两种不同方式带来的差异非常小，可以忽略。表 6 不同 NMS 的效果 Table 6 Comparison between different NMS methods 方法加权方式 mAP/% NMS — 89.9 Soft-NMS 线性加权 90.39 高斯加权 90.42 4.2.5 损失函数的影响表 7 比较了在分类和回归两类任务中，不同损失函数的影响。在分类任务中，使用交叉熵损失和 Focal Loss 的效果基本相同，这是由于 Focal Loss 主要是为了解决训练期间正负样本数量极度 ·702· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】一种基于级联神经网络的飞机检测方法