正在加载图片...
第5期 王凯诚,等:基于注意力机制的显著性目标检测方法 ·961· 表2不同尺度融合阶段网络性能差异 进一步,对比其他文章中上下文提取模块方 Table 2 Performance of our network in different stages 法,分析本文提出的注意力精炼模块对空间注意 ECSSD 力特征的利用情况,如表4所示。其中DeepLab 阶段 上采样率 F-measure MAE V2指文献26]中提出的使用全连接的条件随机 场来整合空间信息,PSP-Net为文献[37]中提出 Baseline 0.849 0.097 32× 的特征金字塔方法,DeepLab V3B使用空洞卷积 arm2 0.878 0.060 16× 提高网络的感受野,提高网络对多尺度信息的获 arm3 0.890 0.057 8× 取能力。根据结果可以发现,本文方法相较性能 arm4 0.906 0.049 4× 最好的DeepLab V3方法提高了0.016的F-meas ure指标,降低了O.O08的MAE指标,取得了更加 优异的空间注意力精炼效果。 表4空间注意力精炼效果对比 Table 4 Comparison on spatial attention refinement per- formance ECSSD 使用方法 F-measure MAE DeepLab V2 0.866 0.083 PSP-Net 0.889 0.058 DeepLab V3 0.882 0.057 本文方法 0.906 0.049 原始图片 预测结果 真值图 4 结束语 图3在ECSSD数据集上的预测结果 Fig.3 Predicted results on ECSSD dataset 本文提出了一种基于注意力机制的显著性目 为了分析本文提出的注意力精炼模块对通道 标检测方法,设计注意力精炼模块融合通道和空 注意力的整合效果,对比了文献[36]中的通道注 间注意力,使得网络能够根据输入特征图选取其 意力模块(channel attention block)与本文方法在 中重要的信息。使用训练样本的真值图有监督地 ECSSD数据集上测试的结果,结果如表3所示, 训练空间注意力,提高了像素间相关关系的准确 其中CAB表示使用通道注意力模块整合通道上 性。最后,本文将注意力精炼模块逐级连接,使 的信息,ARM表示使用本文的注意力精炼模块中 用低级特征精修高级语义特征,修正预测显著图 的通道注意力对特征图进行精炼,而不使用空间 细节,实现了多尺度特征的融合。在MSRA1OK 注意力。ARM+AS表示使用训练样本真值图对 数据集上训练模型后,在DUT-OMRON和EC 只使用通道注意力的注意力精炼模块进行额外监 SSD数据集上进行测试,并在ECSSD数据集上与 督。结果可以发现,本文方法相较文章中的方 其他主流通道和空间特征提取方法对比。实现结 法,F-measure指标提高了0.027,MAE指标降低 果表明,与目前主流的显著性目标检测方法相 了0.011,展示出更加优异的通道全局信息整合能力。 比,本文提出的方法能够更有效地精炼特征图上 表3通道注意力精炼效果对比 的通道和空间信息,因此取得了更加优异的效果。 Table 3 Comparison on channel attention refinement per- formance 参考文献: ECSSD 使用方法 [1]ZHANG Fan,DU Bo,ZHANG Liangpei.Salien-cy-guided F-measure MAE unsupervised feature learning for scene classi-fication[J] Baseline 0.849 0.097 IEEE transactions on geoscience and remote sensing,2015, CAB 0.879 0.06 53(4):2175-2184. ARM 0.89 0.057 [2]ITTI L,KOCH C.NIEBUR E.A model of saliency-based visual attention for rapid scene analysis[J].IEEE transac- ARM+AS 0.906 0.049 tions on pattern analysis and machine intelligence,1998.表 2 不同尺度融合阶段网络性能差异 Table 2 Performance of our network in different stages 阶段 ECSSD 上采样率 F-measure MAE Baseline 0.849 0.097 32× arm2 0.878 0.060 16× arm3 0.890 0.057 8× arm4 0.906 0.049 4× 原始图片 预测结果 真值图 图 3 在 ECSSD 数据集上的预测结果 Fig. 3 Predicted results on ECSSD dataset 为了分析本文提出的注意力精炼模块对通道 注意力的整合效果,对比了文献 [36] 中的通道注 意力模块 (channel attention block) 与本文方法在 ECSSD 数据集上测试的结果,结果如表 3 所示, 其中 CAB 表示使用通道注意力模块整合通道上 的信息,ARM 表示使用本文的注意力精炼模块中 的通道注意力对特征图进行精炼,而不使用空间 注意力。ARM+AS 表示使用训练样本真值图对 只使用通道注意力的注意力精炼模块进行额外监 督。结果可以发现,本文方法相较文章中的方 法,F-measure 指标提高了 0.027,MAE 指标降低 了 0.011,展示出更加优异的通道全局信息整合能力。 表 3 通道注意力精炼效果对比 Table 3 Comparison on channel attention refinement per￾formance 使用方法 ECSSD F-measure MAE Baseline 0.849 0.097 CAB 0.879 0.06 ARM 0.89 0.057 ARM+AS 0.906 0.049 进一步,对比其他文章中上下文提取模块方 法,分析本文提出的注意力精炼模块对空间注意 力特征的利用情况,如表 4 所示。其中 DeepLab V2 指文献 [26] 中提出的使用全连接的条件随机 场来整合空间信息,PSP-Net 为文献 [37] 中提出 的特征金字塔方法,DeepLab V3[38] 使用空洞卷积 提高网络的感受野,提高网络对多尺度信息的获 取能力。根据结果可以发现,本文方法相较性能 最好的 DeepLab V3 方法提高了 0.016 的 F-meas￾ure 指标,降低了 0.008 的 MAE 指标,取得了更加 优异的空间注意力精炼效果。 表 4 空间注意力精炼效果对比 Table 4 Comparison on spatial attention refinement per￾formance 使用方法 ECSSD F-measure MAE DeepLab V2 0.866 0.083 PSP-Net 0.889 0.058 DeepLab V3 0.882 0.057 本文方法 0.906 0.049 4 结束语 本文提出了一种基于注意力机制的显著性目 标检测方法,设计注意力精炼模块融合通道和空 间注意力,使得网络能够根据输入特征图选取其 中重要的信息。使用训练样本的真值图有监督地 训练空间注意力,提高了像素间相关关系的准确 性。最后,本文将注意力精炼模块逐级连接,使 用低级特征精修高级语义特征,修正预测显著图 细节,实现了多尺度特征的融合。在 MSRA10K 数据集上训练模型后,在 DUT-OMRON 和 EC￾SSD 数据集上进行测试,并在 ECSSD 数据集上与 其他主流通道和空间特征提取方法对比。实现结 果表明,与目前主流的显著性目标检测方法相 比,本文提出的方法能够更有效地精炼特征图上 的通道和空间信息,因此取得了更加优异的效果。 参考文献: ZHANG Fan, DU Bo, ZHANG Liangpei. Salien-cy-guided unsupervised feature learning for scene classi-fication[J]. IEEE transactions on geoscience and remote sensing, 2015, 53(4): 2175–2184. [1] ITTI L, KOCH C, NIEBUR E. A model of saliency-based visual attention for rapid scene analysis[J]. IEEE transac￾tions on pattern analysis and machine intelligence, 1998, [2] 第 5 期 王凯诚,等:基于注意力机制的显著性目标检测方法 ·961·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有