第1期 王成济,等:一种多层特征融合的人脸检测方法 ·143· 5.2实验设置与结果分析 在Easy难度上本文算法比LDCF+o高0.5个百分 本文使用的训练数据来自Wider Face2的训练 点,在UnitBox的基础上提高了9个百分点,在 集,总共有12880张图像,统一将训练图像的宽和 Medium难度上取得了0.737的检测结果,在Hard 高用ImageNet!21上的图像均值填充为32的倍数, 难度上比UnitBox提升了9.8个百分点。图7展 测试时同样对图像填充为32的倍数。训练是以标 示了本文算法的部分检测结果。 注的人脸区域中心周围占整个人脸区域3/5的区域 1.0f 为正样本,该区域关于标注的人脸区域中心对称。 0.9 其他像素点设为负样本。由于原始的UnitBox论 0.8 0.7 文没有公布测试模型和源代码,在本文中我们复现 1 了UnitBox!代码作为比较对象。在使用多任务联 袋06 知0.5 -Multitask Cascade CNN-0.848 合训练,由于人脸区域分类的损失和人脸区域边框 --0us-0.795 0.4 ..LDCF+.0.790 回归的损失函数不在同一个数量级上,本文对分类 0.3 ---Faceness-WIDER-0.713 0与0 02 9b0.659 损失赋权O.O01。训练是在WiderFacei训练集上训 0.1 unitbox-refine-0.653 练,每次使用一张图像,使用Adam算法2在整个数 00.10.20.30.40.50.60.70.80.91.0 查全率 据集上迭代训练30轮,本文使用加权的非极大值抑 (a)Easy 制算法做后处理。 1.02立 图5中比较了本文的算法与原始UnitBox!算 0.9 法在FDDB数据集上的性能,同时对比了另外7个 0.8 经典的人脸检测算法:DDFDU)、CascadeCNNI6 0.7 ACF-multiscale2o、Pico2、HeadHunter2sl、Joint- 6 0.5 -Multitask Cascade CNN-0.825 --LDCF+-0.769 Cascade2、Viola-Jones,实验表明本文的多级特征 04…0us-0.737 0.3 ---Faceness-WIDER-0.634 串联能明显提升算法性能。本文的方法在共享的卷 unitbox-0.633 0.2 ----unitbox-refine-0.597 积层和串联的特征层后都添加了卷积层,同时本文 ...ACF-WIDER-0.541 0.1 单独对pool5层的特征添加同样的卷积层作为对比 00.10.20.30.40.50.60.70.80.91.0 查全率 实验(UnitBox-.refine)。从图5中可以看出,仅仅在 (b)Medium pool5层输出的特征后添加卷积操作的结果为0.859, 1.0 而在结合pool4和pool5层特征后再添加卷积操作 09 的结果为0.906,说明仅仅对单层特征进行多次卷积 0.8 和池化操作不能有效提升检测结果。 0.7 0.6 0.95 将0.5 -Multitask Cascade CNN-0.598 0.90 --LDCF+-0.522 0.85 .4 …0us-0.4 03 WIDER-0.345 0.80 Ours 02 ----unitbox-refine-0.289 Ξ0.75 …ACF-WIDER-0.273 nter 0.1 00.10.20.30.40.50.60.70.80.910 0.70 UnitBo DFpultiscale 查全率 0.65 UnitBox-refine (c)Hard 0.60 Viola-Jones 图6 ViderFace验证集上的准确率-召回率曲线 0.55 01002003004005006007008009001000 Fig.6 Percision-recall curve on Wider Face Val set 假阳数 表1比较了加权得分的非极大值抑制方法和不 图5FDDB数据集ROC曲线 加权的极大值抑制方法的后处理结果,这里高斯加 Fig.5 ROC Curve on FDDB dataset 同样的,在WiderFace数据集的验证集上测试 权中使用的方差sigma=0.5。可以看出在FDDB数 比较了本文算法与其他领先算法的性能。图6展示 据集中使用高斯加权和线性加权获得的提升一样, 了本文算法在WiderFace验证集的Easy、Medium 在WiderFace数据中使用高斯加权的提升明显大于 和Hard三个难易程度上的性能曲线。还对比了多 线性加权,说明高斯加权的方法更适合于小人脸检 个先进的人脸检测算法:LDCF+Bo、Multiscale Cas- 测问题。在图8中我们展示了部分不同的NMS方 cade CNNI22)、Faceness-WIDERI3、ACF-WIDER2!a 法的处理结果。5.2 实验设置与结果分析 本文使用的训练数据来自 Wider Face[22]的训练 集,总共有 12 880 张图像,统一将训练图像的宽和 高用 ImageNet[24]上的图像均值填充为 32 的倍数, 测试时同样对图像填充为 32 的倍数。训练是以标 注的人脸区域中心周围占整个人脸区域 3/5 的区域 为正样本,该区域关于标注的人脸区域中心对称。 其他像素点设为负样本。由于原始的 UnitBox[6]论 文没有公布测试模型和源代码,在本文中我们复现 了 UnitBox[6]代码作为比较对象。在使用多任务联 合训练,由于人脸区域分类的损失和人脸区域边框 回归的损失函数不在同一个数量级上,本文对分类 损失赋权 0.001。训练是在 WiderFace训练集上训 练,每次使用一张图像,使用 Adam 算法[25]在整个数 据集上迭代训练 30 轮,本文使用加权的非极大值抑 制算法做后处理。 图 5 中比较了本文的算法与原始 UnitBox[6]算 法在 FDDB 数据集上的性能,同时对比了另外 7 个 经典的人脸检测算法:DDFD[17] 、CascadeCNN[16] 、 ACF-multiscale[26] 、Pico[27] 、HeadHunter[28] 、JointCascade[29] 、Viola-Jones[9] ,实验表明本文的多级特征 串联能明显提升算法性能。本文的方法在共享的卷 积层和串联的特征层后都添加了卷积层,同时本文 单独对 pool5 层的特征添加同样的卷积层作为对比 实验 (UnitBox-refine)。从图 5 中可以看出,仅仅在 pool5 层输出的特征后添加卷积操作的结果为 0.859, 而在结合 pool4 和 pool5 层特征后再添加卷积操作 的结果为 0.906,说明仅仅对单层特征进行多次卷积 和池化操作不能有效提升检测结果。 同样的,在 WiderFace 数据集的验证集上测试 比较了本文算法与其他领先算法的性能。图 6 展示 了本文算法在 WiderFace 验证集的 Easy、Medium 和 Hard 三个难易程度上的性能曲线。还对比了多 个先进的人脸检测算法:LDCF+[30] 、Multiscale Cascade CNN[22] 、Faceness-WIDER[31] 、ACF-WIDER[26] , 在 Easy 难度上本文算法比 LDCF+[30]高 0.5 个百分 点,在 UnitBox[6]的基础上提高了 9 个百分点,在 Medium 难度上取得了 0.737 的检测结果,在 Hard 难度上比 UnitBox[6]提升了 9.8 个百分点。图 7 展 示了本文算法的部分检测结果。 表 1 比较了加权得分的非极大值抑制方法和不 加权的极大值抑制方法的后处理结果,这里高斯加 权中使用的方差 sigma=0.5。可以看出在 FDDB 数 据集中使用高斯加权和线性加权获得的提升一样, 在 WiderFace 数据中使用高斯加权的提升明显大于 线性加权,说明高斯加权的方法更适合于小人脸检 测问题。在图 8 中我们展示了部分不同的 NMS 方 法的处理结果。 0 100 200 300 400 500 600 700 800 900 1 000 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 ճ䭟 ⱋ䭟⢳ Ours CascadeCNN Joint Cascade HeadHunter UnitBox ACF-multiscale DDFD UnitBox-refine Pico Viola-Jones 图 5 FDDB 数据集 ROC 曲线 Fig. 5 ROC Curve on FDDB dataset 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0.1 ᴑڔ⢳ (a) Easy (b) Medium (c) Hard ᴑ۲⢳ 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Multitask Cascade CNN-0.848 Ours-0.795 LDCF+-0.790 Faceness-WIDER-0.713 unitbox-0.705 ACF-WIDER-0.659 unitbox-refine-0.653 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0.1 ᴑڔ⢳ ᴑ۲⢳ 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Multitask Cascade CNN-0.825 LDCF+-0.769 Ours-0.737 Faceness-WIDER-0.634 unitbox-0.633 unitbox-refine-0.597 ACF-WIDER-0.541 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0.1 ᴑڔ⢳ ᴑ۲⢳ 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Multitask Cascade CNN-0.598 LDCF+-0.522 Ours-0.404 Faceness-WIDER-0.345 unitbox-0.306 unitbox-refine-0.289 ACF-WIDER-0.273 图 6 WiderFace 验证集上的准确率-召回率曲线 Fig. 6 Percision-recall curve on Wider Face Val set 第 1 期 王成济,等:一种多层特征融合的人脸检测方法 ·143·