正在加载图片...
·178· 智能系统学报 第13卷 标注。 4.2与流行方法的比较 选取了5个观察者进行标注。不同用户标注 与27种流行方法比较,实验结果如表1和图 结果通常存在不一致的现象。为了减少标注的不 4、5所示。 一致性,计算每个像素标注的一致性分值。 表1本文方法与27种流行方法的比较 a Table 1 Compare with 27 popular methods (6) 方法 F measure AUC MAE 式中:a表示第p个观察者对像素x的标注,如 CBRI 0.5472 0.7971 0.2662 果像素x标注为显著,则aP=1,否则a=0:N为 SEGR2 0.4917 0.7588 0.3592 观察者的个数;5为显著阈值。根据文献[13],如 SVOR4I 0.3498 0.8361 0.4090 果一个像素有50%的观测者都标注为显著,则认 SFl26] 0.3659 0.7541 0.2077 为显著。 CAI28] 0.5161 0.8287 0.2778 最后,两个观察者使用Adobe Photoshop手动 TDI30 0.5432 0.8081 0.2333 从图像中分割出显著区域。 Ss129 0.2516 0.6714 0.2499 3.3数据集的标签信息 HSR 0.5576 0.7883 0.2747 NUS-WIDE数据集提供了81个基准标签 DRFIB 0.5897 0.8623 0.2063 集。新构建的数据集标签来自于81个基准标签 HMB33) 0.4892 0.7945 0.2263 集,共78个标签。每幅图像包含1~9个标签。 BDI38] 0.5443 0.8185 0.1955 4实验 BLIis 0.5823 0.8562 0.2660 MRB51 0.5084 0.7753 0.2290 4.1实验设置 PCA I21 0.5392 0.8439 0.2778 以本文构建的数据集为实验对象,选择20个 FTlq 0.3559 0.6126 0.2808 对象标签,包括bear、birds、boats、buildings、cars、cat、 RCR3 0.5307 0.8105 0.3128 computer、coral、cow、dog、elk、fish、flowers、fox、 LRRI25] 0.5124 0.7956 0.3067 horses、person、plane、tiger、train、zebra;选取和对 GSRn 象标签相对应的20个对象检测子进行RCNN特 0.5164 0.8136 0.2056 征提取,选取2000个包含对象概率最大的矩形框。 SMDB7 0.6033 0.8437 0.1976 采用Caf框架进行深度卷积神经网络的 GCl34 0.5063 0.7511 0.2596 训练和测试。通过随机下降方法进行训练,每次 DSRB阿 0.5035 0.8139 0.2105 迭代参与的样本数量(batch)为256;冲量值(momen- MCl的 0.5740 0.8427 0.2287 tum)为0.9;正则化项的权重为0.0005;学习率初 SBEB37 0.4930 0.8480 0.2325 始值为0.01,当损失稳定的时候学习率以0.1的速 LEGS16 0.6124 0.8193 0.1844 度下降;对每层的输出采用比率为0.5的drop MCDLI 0.6559 0.8813 0.1457 out操作来防止过拟合;训练迭代次数为80次。 RFCN 0.6768 0.8803 0.1476 实验对比了27种流行的显著区域检测方法 SMDFI5) 0.6574 0.8483 0.1556 包括HSII、DRFI31、SMDFISI、LEGSI6I、MCDLI DBS 0.6621 0.8917 0.1505 FTI、BLII、RFCNUS1、CB2、SEG2I、RCI SVO2、LRR1、SF26、GS2m、CA2I、SS2、TDB0 表1中,F measure、AUC和MAE排在前3位 MRI、PCA2I、HMIB、GCB、MCB1、DSRI6、 的为4种目前流行的深度学习方法SMDF、LEGS、 SBF7、BDB和SMDB7。这些检测方法涵盖范围 MCDLII、RFCN9和本文的DBS方法。在某种程 特别广泛。 度上可以说深度学习的检测方法超过了非深度学 本文的检测方法简称为DBS。 习的检测方法,精度上有所提高。其中,DBS方 在定量的性能评价中,采用当前流行的性能 法的AUC值是最高的,DBS方法的F-measure值 评价指标:1)查准率和查全率曲线(PR曲线):2)F 是最高的,DBS的MAE值是最低的,所以 measure值;3)受试者工作特征曲线(ROC Curve): DBS方法的性能最佳。 4)AUC值(ROC曲线下面的面积):5)平均绝对误 PR曲线图和ROC曲线图如图4和5所示。DBS 差(MAE). 的PR曲线和ROC曲线均高于其他所有方法。标注。 选取了 5 个观察者进行标注。不同用户标注 结果通常存在不一致的现象。为了减少标注的不 一致性,计算每个像素标注的一致性分值。 sx = ∑N p=1 a (p) x N (6) a (P) x a (P) x = 1 a (P) x = 0 sx 式中: 表示第 p 个观察者对像素 x 的标注,如 果像素 x 标注为显著,则 ,否则 ;N 为 观察者的个数; 为显著阈值。根据文献 [13],如 果一个像素有 50% 的观测者都标注为显著,则认 为显著。 最后,两个观察者使用 Adobe Photoshop 手动 从图像中分割出显著区域。 3.3 数据集的标签信息 NUS-WIDE 数据集提供了 81 个基准标签 集。新构建的数据集标签来自于 81 个基准标签 集,共 78 个标签。每幅图像包含 1~9 个标签。 4 实验 4.1 实验设置 以本文构建的数据集为实验对象,选择 20 个 对象标签,包括 bear、birds、boats、buildings、cars、cat、 computer、coral、cow、dog、elk、fish、flowers、fox、 horses、person、plane、tiger、train、zebra;选取和对 象标签相对应的 20 个对象检测子进行 RCNN 特 征提取,选取 2 000 个包含对象概率最大的矩形框。 采用 Cafffe 框架[16] 进行深度卷积神经网络的 训练和测试。通过随机下降方法进行训练,每次 迭代参与的样本数量 (batch) 为 256;冲量值 (momen￾tum) 为 0.9;正则化项的权重为 0.000 5;学习率初 始值为 0.01,当损失稳定的时候学习率以 0.1 的速 度下降;对每层的输出采用比率为 0.5 的 drop￾out 操作来防止过拟合;训练迭代次数为 80 次。 实验对比了 27 种流行的显著区域检测方法, 包括 HS[2] 、DRFI[3] 、SMDF[5] 、LEGS[6] 、MCDL[7] 、 FT[14] 、BL[18] 、RFCN[19] 、CB[21] 、SEG[22] 、RC[23] 、 SVO[24] 、LRR[25] 、SF[26] 、GS[27] 、CA[28] 、SS[29] 、TD[30] 、 MR[31] 、PCA[32] 、HM[33] 、GC[34] 、MC[35] 、DSR[36] 、 SBF[37] 、BD[38] 和 SMD[37]。这些检测方法涵盖范围 特别广泛。 本文的检测方法简称为 DBS。 在定量的性能评价中,采用当前流行的性能 评价指标:1) 查准率和查全率曲线 (PR 曲线);2)F￾measure 值;3) 受试者工作特征曲线 (ROC Curve); 4)AUC 值 (ROC 曲线下面的面积);5) 平均绝对误 差 (MAE)。 4.2 与流行方法的比较 与 27 种流行方法比较,实验结果如表 1 和图 4、5 所示。 表 1 本文方法与 27 种流行方法的比较 Table 1 Compare with 27 popular methods 方法 F_measure AUC MAE CB[21] 0.547 2 0.797 1 0.266 2 SEG[22] 0.491 7 0.758 8 0.359 2 SVO[24] 0.349 8 0.836 1 0.409 0 SF[26] 0.365 9 0.754 1 0.207 7 CA[28] 0.516 1 0.828 7 0.277 8 TD[30] 0.543 2 0.808 1 0.233 3 SS[29] 0.251 6 0.671 4 0.249 9 HS[2] 0.557 6 0.788 3 0.274 7 DRFI[3] 0.589 7 0.862 3 0.206 3 HM[33] 0.489 2 0.794 5 0.226 3 BD[38] 0.544 3 0.818 5 0.195 5 BL[18] 0.582 3 0.856 2 0.266 0 MR[31] 0.508 4 0.775 3 0.229 0 PCA[32] 0.539 2 0.843 9 0.277 8 FT[14] 0.355 9 0.612 6 0.280 8 RC[23] 0.530 7 0.810 5 0.312 8 LRR[25] 0.512 4 0.795 6 0.306 7 GS[27] 0.516 4 0.813 6 0.205 6 SMD[37] 0.603 3 0.843 7 0.197 6 GC[34] 0.506 3 0.751 1 0.259 6 DSR[36] 0.503 5 0.813 9 0.210 5 MC[35] 0.574 0 0.842 7 0.228 7 SBF[37] 0.493 0 0.848 0 0.232 5 LEGS[6] 0.612 4 0.819 3 0.184 4 MCDL[7] 0.655 9 0.881 3 0.145 7 RFCN[19] 0.676 8 0.880 3 0.147 6 SMDF[5] 0.657 4 0.848 3 0.155 6 DBS 0.662 1 0.891 7 0.150 5 表 1 中,F_measure、AUC 和 MAE 排在前 3 位 的为 4 种目前流行的深度学习方法 SMDF[5] 、LEGS[6] 、 MCDL[7] 、RFCN[19] 和本文的 DBS 方法。在某种程 度上可以说深度学习的检测方法超过了非深度学 习的检测方法,精度上有所提高。其中,DBS 方 法的 AUC 值是最高的,DBS 方法的 F-measure 值 是最高的, D B S 的 M A E 值是最低的,所 以 DBS 方法的性能最佳。 PR 曲线图和 ROC 曲线图如图 4 和 5 所示。DBS 的 PR 曲线和 ROC 曲线均高于其他所有方法。 ·178· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有