正在加载图片...
·1078 工程科学学报,第42卷,第8期 1h类别中亮度高的图像(≥0.5),算法主要是 处理后再将尺寸恢复到原图大小,对于压缩的插 要增加其对比度,突出图像更多的细节,因此根据 值方式,本文进行了测试,发现采用双线性插值法 式(4),此时c=1,式(1)转化为: 的时间和效果较其他插值方法好.这种处理方式 S=RY (7) 的唯一缺点是造成了图像轻微模糊,但对后续检 为了增加这类图像的对比度,变换曲线需要 测结果影响不大,且大大提高了图像增强的实时 扩展图像的像素范围,分布一定的亮灰度值到暗 性,改动后图像增强处理一张图像只需要9ms 灰度范围,在自适应Gamma算法中,根据式(2)和 2.2 YOLOv3锚点框聚类算法优化 (3)证明得,y大于1. YOLO框架将目标检测看作回归问题,YOLOv32 1类别中亮度低的图像(1<0.5),通常其大部 替换了YOLOv1直接从图像像素中得到边界框的 分像素值分布在暗灰度水平,且聚集在较小的范 思想,借用RPN的方法生成锚点框.而先验锚点 围内,对于这类图像,变换曲线需要将一部分暗灰 框的尺度比例和数目对计算速度和最终的边界框 度值扩展到更亮的灰度范围,此时的变换曲线会 回归效果有较大影响)不同于Faster R-CNN,SSD 落在s=R曲线之上.结合式(4)和(5),式(1)变换 的人为设定,YOLOv3延用YOLOv22的方法,采 函数转化为: 用k-means聚类分析法聚类出均值先验锚点框.但 RY 是实际应用时发现,聚类结果与样本统计结果存 5=Rr+(1-R)×D (8) 在一定偏差,影响了后续检测性能,因此本文对先 2.1.2H类图像处理 验锚点框的聚类算法进行了优化,增加了对聚类 H类图像σ值大,图像像素值在动态范围内 结果的随机修正处理: 明显呈分散分布,相比加强其对比度,亮度调节显 W=O{random[v1,2]×wb} (10) 得更加重要,输出图像的强度和c值依然如式(1) 其中,O表示每三个聚类中心随机选两个进行修 和(4)所示,y值控制输入输出曲线的斜率,y值越 正,y1取1.4,2取1.55;wb为先验锚点框修正前的 大,图像对比度越大,因此,对于类别的图像, 宽,W。为修正后的宽 y值的计算调整为: 对本文构建的交通标志数据集,首选确定聚 y=eL-4e) (9) 类中心数目Q,根据聚类统计平均交并比(Intersection 可以看出,对于此类图像,?值的变化不大,对图像 over union,.IOU)结果,结合YOLOv3框架中多尺度 对比度的影响相对较小.由式(9)分析可知,y值的 预测的特点,分别取Q=6,9,12三个值做训练,权 衡回归速度和准确度后,选择O=9,如图4所示 取值范围为[1,1.649] 1H类中亮度高的图像(1≥0.5)质量较好,亮度 1.00 0.90 和对比度也合适,对这类图像算法主要目标是保 0.85 留图像原有的质量,s、c和y值的计算均同式(1)、 日080 (4)和(9) 05 4类别中亮度低的图像(<0.5),1+o≤1,由于 0.65 1和σ的值均小于0.5,所以y≥1.分析可知,这类 0.60 图像的输入输出曲线必定落在s=R这条线性曲线 0.55 123456789101112131415 之上的,算法会使这类图像中的偏暗的像素转换 Number of anchors 到亮度大一些的范围内,图像的亮度分布更为均 图4聚类中心数目测试结果 匀.对于亮度稍微偏低但强度均值较大的图像来 Fig.4 Test results of number for cluster centers 说,变换曲线非常接近s=R曲线. 聚类10次取平均后锚点框的尺寸为(14,21)、 在实时性方面,以处理416像素×416像素的 (19.32)、(25.38)、(29.55)、(30.43)、(37.56)、 图像为标准,在本文的实验平台上,自适应图像增 (41,70)、(55,77)、(73,108).括号中数字分别表 强阶段的耗时约为32ms,较为影响整体检测实时 示锚点框的宽和高,观察发现上述聚类结果的宽 性,为此本文对图像增强过程进行了如下改动:分 高比最小是0.527,最大是0.714.而对于本文的数 离出图像V通道后,先将V通道的尺寸压缩到原 据集,统计训练样本的宽高比发现.70%的样本宽 图的四分之一,然后进行上文自适应Gamma校正 高比在0.72~1之间,20%的样本宽高比在0.6~IL 类别中亮度高的图像(λ≥0.5),算法主要是 要增加其对比度,突出图像更多的细节,因此根据 式(4),此时 c=1,式(1)转化为: s=R γ (7) 为了增加这类图像的对比度,变换曲线需要 扩展图像的像素范围,分布一定的亮灰度值到暗 灰度范围,在自适应 Gamma 算法中,根据式(2)和 (3)证明得,γ 大于 1. IL 类别中亮度低的图像(λ<0.5),通常其大部 分像素值分布在暗灰度水平,且聚集在较小的范 围内,对于这类图像,变换曲线需要将一部分暗灰 度值扩展到更亮的灰度范围,此时的变换曲线会 落在 s=R 曲线之上. 结合式(4)和(5),式(1)变换 函数转化为: s= R γ Rγ +(1−Rγ )×λ γ (8) 2.1.2    IH 类图像处理 IH 类图像 σ 值大,图像像素值在动态范围内 明显呈分散分布,相比加强其对比度,亮度调节显 得更加重要,输出图像的强度和 c 值依然如式(1) 和(4)所示,γ 值控制输入输出曲线的斜率,γ 值越 大,图像对比度越大,因此,对于 IH 类别的图像, γ 值的计算调整为: γ = e 1−(λ+σ) 2 (9) 可以看出,对于此类图像,γ 值的变化不大,对图像 对比度的影响相对较小. 由式(9)分析可知,γ 值的 取值范围为 [1,1.649]. IH 类中亮度高的图像(λ≥0.5)质量较好,亮度 和对比度也合适,对这类图像算法主要目标是保 留图像原有的质量,s、c 和 γ 值的计算均同式(1)、 (4)和(9). IH 类别中亮度低的图像(λ<0.5),λ+σ≤1,由于 λ 和 σ 的值均小于 0.5,所以 γ≥1. 分析可知,这类 图像的输入输出曲线必定落在 s=R 这条线性曲线 之上的,算法会使这类图像中的偏暗的像素转换 到亮度大一些的范围内,图像的亮度分布更为均 匀. 对于亮度稍微偏低但强度均值较大的图像来 说,变换曲线非常接近 s=R 曲线. 在实时性方面,以处理 416 像素×416 像素的 图像为标准,在本文的实验平台上,自适应图像增 强阶段的耗时约为 32 ms,较为影响整体检测实时 性,为此本文对图像增强过程进行了如下改动:分 离出图像 V 通道后,先将 V 通道的尺寸压缩到原 图的四分之一,然后进行上文自适应 Gamma 校正 处理后再将尺寸恢复到原图大小. 对于压缩的插 值方式,本文进行了测试,发现采用双线性插值法 的时间和效果较其他插值方法好. 这种处理方式 的唯一缺点是造成了图像轻微模糊,但对后续检 测结果影响不大,且大大提高了图像增强的实时 性,改动后图像增强处理一张图像只需要 9 ms. 2.2    YOLOv3 锚点框聚类算法优化 YOLO 框架将目标检测看作回归问题,YOLOv3[25] 替换了 YOLOv1 直接从图像像素中得到边界框的 思想,借用 RPN 的方法生成锚点框. 而先验锚点 框的尺度比例和数目对计算速度和最终的边界框 回归效果有较大影响[13] . 不同于 Faster R-CNN,SSD 的人为设定,YOLOv3 延用 YOLOv2[26] 的方法,采 用 k-means 聚类分析法聚类出均值先验锚点框. 但 是实际应用时发现,聚类结果与样本统计结果存 在一定偏差,影响了后续检测性能,因此本文对先 验锚点框的聚类算法进行了优化,增加了对聚类 结果的随机修正处理: Wb = O 2 3 {random[v1, v2]×wb} (10) O 2 其中, 3 表示每三个聚类中心随机选两个进行修 正,v1 取 1.4,v2 取 1.55;wb 为先验锚点框修正前的 宽,Wb 为修正后的宽. 对本文构建的交通标志数据集,首选确定聚 类中心数目 Q,根据聚类统计平均交并比(Intersection over union, IOU)结果,结合 YOLOv3 框架中多尺度 预测的特点,分别取 Q=6,9,12 三个值做训练,权 衡回归速度和准确度后,选择 Q=9,如图 4 所示. 聚类 10 次取平均后锚点框的尺寸为(14, 21)、 (19, 32)、(25, 38)、(29, 55)、(30, 43)、(37, 56)、 (41, 70)、(55, 77)、(73, 108). 括号中数字分别表 示锚点框的宽和高,观察发现上述聚类结果的宽 高比最小是 0.527,最大是 0.714. 而对于本文的数 据集,统计训练样本的宽高比发现,70% 的样本宽 高比在 0.72~1 之间,20% 的样本宽高比在 0.6~ 1.00 0.90 0.85 0.80 Average IOU 0.75 0.70 0.65 0.60 0.55 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Number of anchors 图 4    聚类中心数目测试结果 Fig.4    Test results of number for cluster centers · 1078 · 工程科学学报,第 42 卷,第 8 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有