正在加载图片...
第6期 申凯,等:基于双向消息链路卷积网络的显著性物体检测 ·1159· 如图7,第1行表示输入的图片,可以看出, 幅图片可以看出,在动物显著性预测时本文 本文提出的BML-CNN模型在显著物体预测和边 模型比其他模型保留了更多实体的信息,且边 界保持中均优于现有的Amulet和UCF方法,此 界保持较好,从第3幅图片中可以看出,注意力机 外在处理含有倒影的图片(例如图7中第5幅图 制的应用消除了更多背景的影响,实现了更准确 片),BML-CNN模型具有更高的鲁邦性。 的预测。从第4幅图中可以看出,使用更有效的 定性比较:在HKU-IS与DUTS-TE两个数据 高层语义与底层轮廓传递策略,可在显著性预测 集上,使用13个模型中表现比较出色的Amu- 时保留更加完整的边界信息。从第5幅图片中可 let与UC℉模型给出的显著性预测图进行比较,为 以看出,注意力机制和高层语义与低层轮廓传递 防止模型对特定显著性物体出现过拟合,选取具 策略在处理镜像实体的问题中表现出更高的 有不同显著性物体来进行比较。如图7,从第一 鲁棒性。 (a)输人的图片 b)GT显著性预测真实图 (c)本文提出模型的预测结果 (d)Amulte的预测结果 (d)UCF的预测结果 图7物体显著性预测图对比 Fig.7 Object saliency prediction graph comparison 4结束语 CNN模型的性能在不同数据集上均获得较高的 本文提出了结合注意力机制与多尺度融合的 提升,在边界保持、抑制背景噪声和镜像实体的 双向消息传递链路显著性目标检测算法,首先通 处理等问题上都有最优异的表现。 过带有注意力模块的特征提取层获取有效高层语 模型虽然在复杂背景下的表现比较出色,也 义信息,然后通过双向消息传递链路实现高层语 有很好的边界保持。但是该模型对于镜像实体问 义与底层轮廓的双向传递,最后通过多尺度融合 题(如倒影、镜中映像)的处理尚未达到最优效 策略实现多层不同尺度的卷积特征的融合,从而 果,接下来可以针对镜像实体问题来优化模型。 产生显著物体的预测图。与现有算法相比,BML 此外,注意力模块与带门控函数的消息传递链路如图 7,第 1 行表示输入的图片,可以看出, 本文提出的 BML-CNN 模型在显著物体预测和边 界保持中均优于现有的 Amulet 和 UCF 方法,此 外在处理含有倒影的图片 (例如图 7 中第 5 幅图 片),BML-CNN 模型具有更高的鲁邦性。 定性比较:在 HKU-IS 与 DUTS-TE 两个数据 集上,使用 13 个模型中表现比较出色的 Amu￾let 与 UCF 模型给出的显著性预测图进行比较,为 防止模型对特定显著性物体出现过拟合,选取具 有不同显著性物体来进行比较。如图 7,从第一 幅图片可以看出,在动物显著性预测时本文 模型比其他模型保留了更多实体的信息,且边 界保持较好,从第 3 幅图片中可以看出,注意力机 制的应用消除了更多背景的影响,实现了更准确 的预测。从第 4 幅图中可以看出,使用更有效的 高层语义与底层轮廓传递策略,可在显著性预测 时保留更加完整的边界信息。从第 5 幅图片中可 以看出,注意力机制和高层语义与低层轮廓传递 策略在处理镜像实体的问题中表现出更高的 鲁棒性。 (a) 输入的图片 (b) GT显著性预测真实图 (c) 本文提出模型的预测结果 (d) Amulte的预测结果 (d) UCF的预测结果 图 7 物体显著性预测图对比 Fig. 7 Object saliency prediction graph comparison 4 结束语 本文提出了结合注意力机制与多尺度融合的 双向消息传递链路显著性目标检测算法,首先通 过带有注意力模块的特征提取层获取有效高层语 义信息,然后通过双向消息传递链路实现高层语 义与底层轮廓的双向传递,最后通过多尺度融合 策略实现多层不同尺度的卷积特征的融合,从而 产生显著物体的预测图。与现有算法相比,BML￾CNN 模型的性能在不同数据集上均获得较高的 提升,在边界保持、抑制背景噪声和镜像实体的 处理等问题上都有最优异的表现。 模型虽然在复杂背景下的表现比较出色,也 有很好的边界保持。但是该模型对于镜像实体问 题 (如倒影、镜中映像) 的处理尚未达到最优效 果,接下来可以针对镜像实体问题来优化模型。 此外,注意力模块与带门控函数的消息传递链路 第 6 期 申凯,等:基于双向消息链路卷积网络的显著性物体检测 ·1159·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有