正在加载图片...
第4期 刘召,等:基于改进的Faster R-CNN高压线缆目标检测方法 ·631· 量,也影响着网络对不同尺寸目标的识别能力。 2.1.2标注检测目标 原始Faster R-CNN针对特征图谱上的每个“锚” 对采集到的线缆图像中需要检测的目标进行 由3种长宽比和3种尺寸生成9个候选框,然后 了人工标签,使用LabelImg标注工具。图像中需 对获得的原始图片候选区域使用非极大值抑制算 要检测的目标有线缆与瓷柱的连接处(连接点 法删除冗余的候选区域,其中最小的尺寸为 corner)、向右倾斜的线缆(右倾线,rline)、向左倾 128×128。但是在高压线缆识别中存在着连接点 斜的线(左倾线,lline)和带线夹的线(线夹线, 等尺寸较小的目标,为了提升网络对小目标的检 clampline)。表1中所列的数据集Data,和Data, 测性能,本文增加了一组64×64大小的候选框, 的场景近似,Data,中的连接点只有一种情况,即 其长宽比依然有3种。在训练过程中,RPN部分 横向连接;而数据集Data,中连接点有两种情况, 使用的候选框尺寸则由9种变为12种,分别为 包括横向连接和纵向连接,如图8(a)和图8(d)所 64×64、128×128、256×256、512×512,3个长宽比 示,图8(d)展示了Data,中的两种连接点。 分别为2:1、1:2和1:1。 表1不同场景的数据集 在整个模型结构中,多任务分类器的损失函 Table 1 Test sets of five scenarios 数定义为 数据集总数训练测试类别 场景特点 ii=∑L(,Br Data 16601494166 3 晴天、重叠多 ∑n.60 (2) Dataz 293726432944 阴天、背景复杂 Data; 25572301 256 3 强光、背景复杂 式中:p:、是目标包围框和类别的预测值;P:、 Data 20561850206 3 晴天、重叠多 是目标包围框和类别的实际值;Ns、N分别为 Datas 17901611179 3 晴天、背景复杂 分类和回归的归一化参数;是平衡分类与回归 的系数。回归损失函数和分类损失函数如公式 2.2训练设置及评价指标 (3)和式(4)所示: 所有场景的数据均训练迭代10万次,采用衰 Ltes R(ti-ti) (3) 减学习率,前5万代为0.001,后5万代为0.0001。 L(Pp)=-log(pP:+(1-p)(1-p) (4) 为了对比本文所提方法的有效性,对比方法为原 式(3)中R是Fast R-CNN中定义的鲁棒的损 始的Faster R-CNN。高压线缆图像尺寸为 失函数,如式(⑤)所示: 640×480。 R={0.5xM<1 1d-0.5,其他 (5) 评价指标选择目标检测中常用的平均准确 率(average precision,.AP),其值为P-R曲线围成的 2仿真实验与结果分析 面积,其中P表示准确率、R表示召回率。P、 R的计算方法如式(6)和式(⑦)所示: 2.1高压线缆图像数据集 P=TP/(TP+FP) (6) 为了验证本文提出的基于Faster R-CNN的高 R=TP/(TP+FN) (7) 压线缆目标检测方法的有效性和先进性,首先本 式中:TP是被正确划分为正例的个数,FP是被错 文生成了具有大量高压线缆图片的数据集,并将 误划分为正例的个数,FN是被错误划分为负例 数据处理成VOC2007数据形式,主要包括采集高 个数。mAP(mean average precision)即是所有类别 压线缆图像数据和标注需检测目标两个部分。 的平均准确率的平均值。 2.1.1采集高压线缆图像数据 实验环境为Ubuntul6.04系统,Intel Core i7- 本文使用高清摄像机采集了不同场景、天气 8700K和英伟达GTX1080Ti显卡,使用Tensor- 环境下的高压线缆图像,并对其中感兴趣的目标 Flow框架进行提出算法的训练和测试。 进行了人工标签。天气环境主要分为晴天、阴天 和强光3种情况,之所以将强光单独作为一类是 2.3实验结果及分析 因为强光会导致拍摄的线缆图像出现断裂的情 使用5种场景数据的训练集分别训练原始 况。高压线缆图像中的杆塔结构较复杂,有单回 Faster R-CNN模型和提出的改进Faster R-CNN模 路结构和多回路结构,上有瓷柱,有多根线缆,线 型,然后在测试集上进行测试,得到各类别的平 缆有时会出现重叠现象;图像背景一般都较为复 均准确率。原始Faster R-CNN的测试结果如表2 杂,主要包含房屋、树木等。 所示,改进的Faster R-CNN的测试结果如表3所示。128×128 64×64 64×64 128×128 256×256 512×512 2 : 1 1 : 2 1 : 1 量,也影响着网络对不同尺寸目标的识别能力。 原始 Faster R-CNN 针对特征图谱上的每个“锚”, 由 3 种长宽比和 3 种尺寸生成 9 个候选框,然后 对获得的原始图片候选区域使用非极大值抑制算 法删除冗余的候选区域,其中最小的尺寸为 。但是在高压线缆识别中存在着连接点 等尺寸较小的目标,为了提升网络对小目标的检 测性能,本文增加了一组 大小的候选框, 其长宽比依然有 3 种。在训练过程中,RPN 部分 使用的候选框尺寸则由 9 种变为 12 种,分别为 、 、 、 ,3 个长宽比 分别为 、 和 。 在整个模型结构中,多任务分类器的损失函 数定义为 L({pi},{ti}) = 1 Ncls ∑ Lcls ( pi , p ∗ i ) + λ 1 Nreg ∑ i p ∗ i Lreg ( ti ,t ∗ i ) (2) pi ti p ∗ i t ∗ i Ncls Nreg λ 式中: 、 是目标包围框和类别的预测值; 、 是目标包围框和类别的实际值; 、 分别为 分类和回归的归一化参数; 是平衡分类与回归 的系数。回归损失函数和分类损失函数如公式 (3) 和式 (4) 所示: Lreg = R ( ti −t ∗ i ) (3) Lcls ( pi , p ∗ i ) = −log( p ∗ i pi + ( 1− p ∗ i ) (1− pi) ) (4) 式 (3) 中 R 是 Fast R-CNN 中定义的鲁棒的损 失函数,如式 (5) 所示: R(x) = { 0.5x 2 , |x| < 1 |x|−0.5, 其他 (5) 2 仿真实验与结果分析 2.1 高压线缆图像数据集 为了验证本文提出的基于 Faster R-CNN 的高 压线缆目标检测方法的有效性和先进性,首先本 文生成了具有大量高压线缆图片的数据集,并将 数据处理成 VOC2007 数据形式,主要包括采集高 压线缆图像数据和标注需检测目标两个部分。 2.1.1 采集高压线缆图像数据 本文使用高清摄像机采集了不同场景、天气 环境下的高压线缆图像,并对其中感兴趣的目标 进行了人工标签。天气环境主要分为晴天、阴天 和强光 3 种情况,之所以将强光单独作为一类是 因为强光会导致拍摄的线缆图像出现断裂的情 况。高压线缆图像中的杆塔结构较复杂,有单回 路结构和多回路结构,上有瓷柱,有多根线缆,线 缆有时会出现重叠现象;图像背景一般都较为复 杂,主要包含房屋、树木等。 2.1.2 标注检测目标 对采集到的线缆图像中需要检测的目标进行 了人工标签,使用 LabelImg 标注工具。图像中需 要检测的目标有线缆与瓷柱的连接处 (连接点, corner)、向右倾斜的线缆 (右倾线, rline)、向左倾 斜的线 (左倾线, lline) 和带线夹的线 (线夹线, clampline)。表 1 中所列的数据集 Data1 和 Data4 的场景近似,Data1 中的连接点只有一种情况,即 横向连接;而数据集 Data4 中连接点有两种情况, 包括横向连接和纵向连接,如图 8(a) 和图 8(d) 所 示,图 8(d) 展示了 Data4 中的两种连接点。 表 1 不同场景的数据集 Table 1 Test sets of five scenarios 数据集 总数 训练 测试 类别 场景特点 Data1 1 660 1 494 166 3 晴天、重叠多 Data2 2 937 2 643 294 4 阴天、背景复杂 Data3 2 557 2 301 256 3 强光、背景复杂 Data4 2 056 1 850 206 3 晴天、重叠多 Data5 1 790 1 611 179 3 晴天、背景复杂 2.2 训练设置及评价指标 640×480 所有场景的数据均训练迭代 10 万次,采用衰 减学习率,前 5 万代为 0.001,后 5 万代为 0.000 1。 为了对比本文所提方法的有效性,对比方法为原 始 的 Faster R-CNN。高压线缆图像尺寸为 。 评价指标选择目标检测中常用的平均准确 率 (average precision, AP),其值为 P-R 曲线围成的 面积,其中 P 表示准确率、R 表示召回率。P、 R 的计算方法如式 (6) 和式 (7) 所示: P = TP/(TP+FP) (6) R = TP/(TP+FN) (7) 式中:TP 是被正确划分为正例的个数,FP 是被错 误划分为正例的个数, FN 是被错误划分为负例 个数。mAP(mean average precision) 即是所有类别 的平均准确率的平均值。 实验环境为 Ubuntu16.04 系统,Intel Core i7- 8700K 和英伟达 GTX 1080Ti 显卡,使用 Tensor￾Flow 框架进行提出算法的训练和测试。 2.3 实验结果及分析 使用 5 种场景数据的训练集分别训练原始 Faster R-CNN 模型和提出的改进 Faster R-CNN 模 型,然后在测试集上进行测试,得到各类别的平 均准确率。原始 Faster R-CNN 的测试结果如表 2 所示,改进的 Faster R-CNN 的测试结果如表 3 所示。 第 4 期 刘召,等:基于改进的 Faster R-CNN 高压线缆目标检测方法 ·631·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有