标注。选取了 5 个观察者进行标注。不同用户标注结果通常存在不一致的现

正在加载图片...

·178· 智能系统学报第13卷标注。 4.2与流行方法的比较选取了5个观察者进行标注。不同用户标注与27种流行方法比较，实验结果如表1和图结果通常存在不一致的现象。为了减少标注的不 4、5所示。一致性，计算每个像素标注的一致性分值。表1本文方法与27种流行方法的比较 a Table 1 Compare with 27 popular methods (6) 方法 F measure AUC MAE 式中：a表示第p个观察者对像素x的标注，如 CBRI 0.5472 0.7971 0.2662 果像素x标注为显著，则aP=1,否则a=0:N为 SEGR2 0.4917 0.7588 0.3592 观察者的个数；5为显著阈值。根据文献[13]，如 SVOR4I 0.3498 0.8361 0.4090 果一个像素有50%的观测者都标注为显著，则认 SFl26] 0.3659 0.7541 0.2077 为显著。 CAI28] 0.5161 0.8287 0.2778 最后，两个观察者使用Adobe Photoshop手动 TDI30 0.5432 0.8081 0.2333 从图像中分割出显著区域。 Ss129 0.2516 0.6714 0.2499 3.3数据集的标签信息 HSR 0.5576 0.7883 0.2747 NUS-WIDE数据集提供了81个基准标签 DRFIB 0.5897 0.8623 0.2063 集。新构建的数据集标签来自于81个基准标签 HMB33) 0.4892 0.7945 0.2263 集，共78个标签。每幅图像包含1~9个标签。 BDI38] 0.5443 0.8185 0.1955 4实验 BLIis 0.5823 0.8562 0.2660 MRB51 0.5084 0.7753 0.2290 4.1实验设置 PCA I21 0.5392 0.8439 0.2778 以本文构建的数据集为实验对象，选择20个 FTlq 0.3559 0.6126 0.2808 对象标签，包括bear、birds、boats、buildings、cars、cat、 RCR3 0.5307 0.8105 0.3128 computer、coral、cow、dog、elk、fish、flowers、fox、 LRRI25] 0.5124 0.7956 0.3067 horses、person、plane、tiger、train、zebra;选取和对 GSRn 象标签相对应的20个对象检测子进行RCNN特 0.5164 0.8136 0.2056 征提取，选取2000个包含对象概率最大的矩形框。 SMDB7 0.6033 0.8437 0.1976 采用Caf框架进行深度卷积神经网络的 GCl34 0.5063 0.7511 0.2596 训练和测试。通过随机下降方法进行训练，每次 DSRB阿 0.5035 0.8139 0.2105 迭代参与的样本数量(batch)为256；冲量值(momen- MCl的 0.5740 0.8427 0.2287 tum)为0.9；正则化项的权重为0.0005；学习率初 SBEB37 0.4930 0.8480 0.2325 始值为0.01，当损失稳定的时候学习率以0.1的速 LEGS16 0.6124 0.8193 0.1844 度下降；对每层的输出采用比率为0.5的drop MCDLI 0.6559 0.8813 0.1457 out操作来防止过拟合；训练迭代次数为80次。 RFCN 0.6768 0.8803 0.1476 实验对比了27种流行的显著区域检测方法 SMDFI5) 0.6574 0.8483 0.1556 包括HSII、DRFI31、SMDFISI、LEGSI6I、MCDLI DBS 0.6621 0.8917 0.1505 FTI、BLII、RFCNUS1、CB2、SEG2I、RCI SVO2、LRR1、SF26、GS2m、CA2I、SS2、TDB0 表1中，F measure、AUC和MAE排在前3位 MRI、PCA2I、HMIB、GCB、MCB1、DSRI6、的为4种目前流行的深度学习方法SMDF、LEGS、 SBF7、BDB和SMDB7。这些检测方法涵盖范围 MCDLII、RFCN9和本文的DBS方法。在某种程特别广泛。度上可以说深度学习的检测方法超过了非深度学本文的检测方法简称为DBS。习的检测方法，精度上有所提高。其中，DBS方在定量的性能评价中，采用当前流行的性能法的AUC值是最高的，DBS方法的F-measure值评价指标：1)查准率和查全率曲线(PR曲线)：2)F 是最高的，DBS的MAE值是最低的，所以 measure值；3)受试者工作特征曲线(ROC Curve): DBS方法的性能最佳。 4)AUC值(ROC曲线下面的面积)：5)平均绝对误 PR曲线图和ROC曲线图如图4和5所示。DBS 差(MAE). 的PR曲线和ROC曲线均高于其他所有方法。标注。选取了 5 个观察者进行标注。不同用户标注结果通常存在不一致的现象。为了减少标注的不一致性，计算每个像素标注的一致性分值。 sx = ∑N p=1 a (p) x N (6) a (P) x a (P) x = 1 a (P) x = 0 sx 式中：表示第 p 个观察者对像素 x 的标注，如果像素 x 标注为显著，则，否则；N 为观察者的个数；为显著阈值。根据文献 [13]，如果一个像素有 50% 的观测者都标注为显著，则认为显著。最后，两个观察者使用 Adobe Photoshop 手动从图像中分割出显著区域。 3.3 数据集的标签信息 NUS-WIDE 数据集提供了 81 个基准标签集。新构建的数据集标签来自于 81 个基准标签集，共 78 个标签。每幅图像包含 1～9 个标签。 4 实验 4.1 实验设置以本文构建的数据集为实验对象，选择 20 个对象标签，包括 bear、birds、boats、buildings、cars、cat、 computer、coral、cow、dog、elk、fish、flowers、fox、 horses、person、plane、tiger、train、zebra；选取和对象标签相对应的 20 个对象检测子进行 RCNN 特征提取，选取 2 000 个包含对象概率最大的矩形框。采用 Cafffe 框架[16] 进行深度卷积神经网络的训练和测试。通过随机下降方法进行训练，每次迭代参与的样本数量 (batch) 为 256；冲量值 (momentum) 为 0.9；正则化项的权重为 0.000 5；学习率初始值为 0.01，当损失稳定的时候学习率以 0.1 的速度下降；对每层的输出采用比率为 0.5 的 dropout 操作来防止过拟合；训练迭代次数为 80 次。实验对比了 27 种流行的显著区域检测方法，包括 HS[2] 、DRFI[3] 、SMDF[5] 、LEGS[6] 、MCDL[7] 、 FT[14] 、BL[18] 、RFCN[19] 、CB[21] 、SEG[22] 、RC[23] 、 SVO[24] 、LRR[25] 、SF[26] 、GS[27] 、CA[28] 、SS[29] 、TD[30] 、 MR[31] 、PCA[32] 、HM[33] 、GC[34] 、MC[35] 、DSR[36] 、 SBF[37] 、BD[38] 和 SMD[37]。这些检测方法涵盖范围特别广泛。本文的检测方法简称为 DBS。在定量的性能评价中，采用当前流行的性能评价指标：1) 查准率和查全率曲线 (PR 曲线)；2)Fmeasure 值；3) 受试者工作特征曲线 (ROC Curve)； 4)AUC 值 (ROC 曲线下面的面积)；5) 平均绝对误差 (MAE)。 4.2 与流行方法的比较与 27 种流行方法比较，实验结果如表 1 和图 4、5 所示。表 1 本文方法与 27 种流行方法的比较 Table 1 Compare with 27 popular methods 方法 F_measure AUC MAE CB[21] 0.547 2 0.797 1 0.266 2 SEG[22] 0.491 7 0.758 8 0.359 2 SVO[24] 0.349 8 0.836 1 0.409 0 SF[26] 0.365 9 0.754 1 0.207 7 CA[28] 0.516 1 0.828 7 0.277 8 TD[30] 0.543 2 0.808 1 0.233 3 SS[29] 0.251 6 0.671 4 0.249 9 HS[2] 0.557 6 0.788 3 0.274 7 DRFI[3] 0.589 7 0.862 3 0.206 3 HM[33] 0.489 2 0.794 5 0.226 3 BD[38] 0.544 3 0.818 5 0.195 5 BL[18] 0.582 3 0.856 2 0.266 0 MR[31] 0.508 4 0.775 3 0.229 0 PCA[32] 0.539 2 0.843 9 0.277 8 FT[14] 0.355 9 0.612 6 0.280 8 RC[23] 0.530 7 0.810 5 0.312 8 LRR[25] 0.512 4 0.795 6 0.306 7 GS[27] 0.516 4 0.813 6 0.205 6 SMD[37] 0.603 3 0.843 7 0.197 6 GC[34] 0.506 3 0.751 1 0.259 6 DSR[36] 0.503 5 0.813 9 0.210 5 MC[35] 0.574 0 0.842 7 0.228 7 SBF[37] 0.493 0 0.848 0 0.232 5 LEGS[6] 0.612 4 0.819 3 0.184 4 MCDL[7] 0.655 9 0.881 3 0.145 7 RFCN[19] 0.676 8 0.880 3 0.147 6 SMDF[5] 0.657 4 0.848 3 0.155 6 DBS 0.662 1 0.891 7 0.150 5 表 1 中，F_measure、AUC 和 MAE 排在前 3 位的为 4 种目前流行的深度学习方法 SMDF[5] 、LEGS[6] 、 MCDL[7] 、RFCN[19] 和本文的 DBS 方法。在某种程度上可以说深度学习的检测方法超过了非深度学习的检测方法，精度上有所提高。其中，DBS 方法的 AUC 值是最高的，DBS 方法的 F-measure 值是最高的， D B S 的 M A E 值是最低的，所以 DBS 方法的性能最佳。 PR 曲线图和 ROC 曲线图如图 4 和 5 所示。DBS 的 PR 曲线和 ROC 曲线均高于其他所有方法。 ·178· 智能系统学报第 13 卷

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】面向社群图像的显著区域检测方法