正在加载图片...
·702· 智能系统学报 第15卷 1.0 的候选区域,因此能更有效地定位到实例所在的 0.9 0.8 区域。 0.7 表4PNet和RPN的对比 0.6 Table 4 Comparison between P-Net and RPN 0.4 方法 生成候选区域数量 召回率% 0.3 Faster RCNN-VGG16-0.7685 ---RetinaNet-0.902 300 92.75 0.2 -0urs-0.9042 RPN 0.1 -Faster RCNN-ResNet50-FPN-0.9247 2000 95.12 0 50100150200250300350400 300 92.77 假阳数 P-Net (b)ROC曲线 2000 96.45 图4测试集上的准确率召回率曲线和ROC曲线 4.2.3OHEM的有效性 Fig.4 PR curve and ROC curve on test set 为了验证OHEM方法的有效性,比较了不使 表2检测精度对比 用OHEM、使用MTCNN中的OHEM方法以及使 Table 2 Accuracy comparison between different methods 用本文中的OHEM这3种情况下的模型检测效 方法 主干网络 mAP/% 存储空间MB 果,结果如表5所示。可以看出,OHEM可以使 VGG16 76.85 261 网络在训练期间更关注不容易被正确分类的样 Faster R-CNN ResNet-50+FPN 92.47 160 本,而本文提出的改进可以让模型在训练过程中 RetinaNet ResNet-50+FPN 90.20 146 忽略某些异常点,进一步提高性能。 RCNN-Lite 90.42 2.1 表5不同OHEM的效果 Table 5 Comparison between different OHEM methods 本文同时测试了模型检测速度。作为对照, 方法 mAP/% Faster R-CNN和RetinaNet均使用ResNet-50+ 无OHEM 88.45 FPN作为主干网络。测试集图片主要包括了3 MTCNN 90.26 种不同的分辨率:256×256、1000×900和4800× 2800。表3给出了模型在不同分辨率输入下的检 本文方法 90.42 测速度。为公平起见,所有模型运行都在一张T- 4.2.4不同NMS的影响 tanX(Pascal)显卡上。可以看出,本文的方法在 在后处理阶段,通常需要采用非极大值抑制 各种分辨率的输入上都是检测速度最快的,并且 的方法去除冗余窗口,表6给出了采用常规的 领先其他2种方法2~3倍。 NMS和Soft-NMS对检测结果的影响。其中,高 表3检测速度对比 斯加权使用的方差o=0.5。可以看出,采用Sof Table 3 Speed comparison between different methods NMS相比常规NMS可以获得一定的提升,而线 输入分辨率ms 性加权和高斯加权两种不同方式带来的差异非常 方法 256×256 1000×900 4800×2800 小,可以忽略。 Faster R-CNN 55 102 819 表6不同NMS的效果 RetinaNet 29 Table 6 Comparison between different NMS methods 81 877 17 方法 加权方式 RCNN-Lite 40 314 mAP/% NMS 89.9 4.2.2P-Net与RPN的对比 线性加权 90.39 RPN是Faster R-CNN中使用的候选区域生成 Soft-NMS 高斯加权 90.42 的方法。表4以召回率为指标,比较了P-Net和 RPN提取候选区域的能力。可以看出,在生成候 4.2.5损失函数的影响 选区域数量较少时,P-Net和RPN的效果基本一 表7比较了在分类和回归两类任务中,不同 致。而生成候选区域数量较多时,P-Net领先了 损失函数的影响。在分类任务中,使用交叉嫡损 1.33%。可以认为这是由于P-Nt使用了更多的 失和Focal Loss的效果基本相同,这是由于Focal 锚框(约32.2万个),且可以产生更多种尺度不同 L0ss主要是为了解决训练期间正负样本数量极度0 50 100 150 200 250 假阳数 300 350 400 准确率 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Faster RCNN-VGG16-0.7685 Faster RCNN-ResNet50-FPN-0.9247 RetinaNet-0.902 Ours-0.9042 (b) ROC 曲线 图 4 测试集上的准确率-召回率曲线和 ROC 曲线 Fig. 4 PR curve and ROC curve on test set 表 2 检测精度对比 Table 2 Accuracy comparison between different methods 方法 主干网络 mAP/% 存储空间/MB Faster R-CNN VGG16 76.85 261 ResNet-50+FPN 92.47 160 RetinaNet ResNet-50+FPN 90.20 146 RCNN-Lite — 90.42 2.1 本文同时测试了模型检测速度。 作为对照, Faster R-CNN 和 RetinaNet 均使用 ResNet-50+ FPN 作为主干网络。 测试集图片主要包括了 3 种不同的分辨率:256×256、 1 000×900 和 4 800× 2 800。表 3 给出了模型在不同分辨率输入下的检 测速度。为公平起见,所有模型运行都在一张 Ti￾tan X (Pascal) 显卡上。可以看出,本文的方法在 各种分辨率的输入上都是检测速度最快的,并且 领先其他 2 种方法 2~3 倍。 表 3 检测速度对比 Table 3 Speed comparison between different methods 方法 输入分辨率/ms 256×256 1 000×900 4 800×2 800 Faster R-CNN 55 102 819 RetinaNet 29 81 877 RCNN-Lite 17 40 314 4.2.2 P-Net 与 RPN 的对比 RPN 是 Faster R-CNN 中使用的候选区域生成 的方法。表 4 以召回率为指标,比较了 P-Net 和 RPN 提取候选区域的能力。可以看出,在生成候 选区域数量较少时,P-Net 和 RPN 的效果基本一 致。而生成候选区域数量较多时,P-Net 领先了 1.33%。可以认为这是由于 P-Net 使用了更多的 锚框 (约 32.2 万个),且可以产生更多种尺度不同 的候选区域,因此能更有效地定位到实例所在的 区域。 表 4 P-Net 和 RPN 的对比 Table 4 Comparison between P-Net and RPN 方法 生成候选区域数量 召回率/% RPN 300 92.75 2 000 95.12 P-Net 300 92.77 2 000 96.45 4.2.3 OHEM 的有效性 为了验证 OHEM 方法的有效性,比较了不使 用 OHEM、使用 MTCNN 中的 OHEM 方法以及使 用本文中的 OHEM 这 3 种情况下的模型检测效 果,结果如表 5 所示。可以看出,OHEM 可以使 网络在训练期间更关注不容易被正确分类的样 本,而本文提出的改进可以让模型在训练过程中 忽略某些异常点,进一步提高性能。 表 5 不同 OHEM 的效果 Table 5 Comparison between different OHEM methods 方法 mAP/% 无OHEM 88.45 MTCNN 90.26 本文方法 90.42 4.2.4 不同 NMS 的影响 在后处理阶段,通常需要采用非极大值抑制 的方法去除冗余窗口,表 6 给出了采用常规的 NMS 和 Soft-NMS 对检测结果的影响。其中,高 斯加权使用的方差 σ=0.5。可以看出,采用 Soft￾NMS 相比常规 NMS 可以获得一定的提升,而线 性加权和高斯加权两种不同方式带来的差异非常 小,可以忽略。 表 6 不同 NMS 的效果 Table 6 Comparison between different NMS methods 方法 加权方式 mAP/% NMS — 89.9 Soft-NMS 线性加权 90.39 高斯加权 90.42 4.2.5 损失函数的影响 表 7 比较了在分类和回归两类任务中,不同 损失函数的影响。在分类任务中,使用交叉熵损 失和 Focal Loss 的效果基本相同,这是由于 Focal Loss 主要是为了解决训练期间正负样本数量极度 ·702· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有