第6期 杨晓兰,等:基于医学征象和卷积神经网络的肺结节CT图像哈希检索 ·863· 表2列出了本文方法与其他哈希方法在不同特 优势。本文使用的CNNs特征在不同编码长度下一 征下随着编码长度的增加,所对应的平均准确率 直拥有最高的MPA值,与GIST特征(手工设计)相 (MPA)实验结果。 比.效果分别提升了4.6%、9.2%、11.6%、13%、12.5%、 对比表2中CNNs特征与GIST特征的实验结 11%。进一步验证了从肺结节底层图像到高层语义 果,可以看出基于CNNs特征的检索方法具有明显 中逐层提取的CNNs特征对检索结果的有效性。 表2不同编码长度下两种特征的MPA值 Table 2 The two features of MAP(%)on r bits Gist特征 CNNs特征 方法 12b 24b 32b 48b 64b 72b 12b 24b 32b 48b 64b 72b ours 45.6 60.4 63.2 65.7 67.9 70.3 50.2 69.6 74.8 78.7 80.4 81.3 KSH 30.4 35.8 40.8 46.0 65.9 66.1 42.6 66.2 70.8 74.5 75.9 75.4 ITQ 23.1 26.2 30.3 34.4 37.8 38.6 40.1 55.9 66.7 72.5 76.3 80.4 PCA 16.4 18.7 21.9 23.5 33.1 34.3 22.9 32.1 51.5 62.7 69.2 71.2 SH 6.3 7.5 8.4 10.6 11.2 12.5 20.7 26.4 33.4 36.1 35.8 35.2 LSH 9.7 11.9 15.3 23.6 30.7 30.1 4.8 10.3 18.2 29.1 36.5 42.3 为了评估本文方法的有效性,使用P@K比较 义特征反向求解哈希函数;3)为了进一步提高检索 检索结果中前5个相似结节的精确度。 精度,使用自适应比特位的加权汉明距离代替传统 图8所示是两种方法在不同编码长度下,在检 的汉明距离。本文对公共数据集LDC和医院数据 索到的15个相似结节图像中P@K=5的对比结 集进行实验,验证了本文方法在肺结节图像检索过 果。随着编码长度的增加,两种方法在前5个检索 程中的有效性。未来的工作将研究基于深度哈希的 结果下的精确度都有所提高。当=64b时,本文方 肺结节图像检索,以提高结节图像的检索精度,从 法在检索到的前5个肺结节图像中,精确度达到 而进一步为医师诊断肺部病灶提供参考依据。 88.23%,高于传统方法23.41%。之后随着编码长度 的增加,两种方法的准确率都有所降低。从图中可 参考文献: 以看出,本文方法与汉明直接排序的方法相比,显 [1]REBECCA L,KIMBERLY D M,STACEY A F,et al.Can- 著提高了肺结节的检索精确率。 cer statistics[J].CA:a cancer journal for clinicians,2017, ■本文方法■传统方法 0.90 67(3):177 0.80 2]ZHAO Y,BOCK G H D,VLIEGENTHART R,et al.Per 0.70 formance of computer-aided detection of pulmonary nod- 0.60 ules in low-dose CT:comparison with double reading by 0.50 nodule volume[J].European radiology.2012.22(10):2076. 4 24324864 72 编码长度b [3]CHEN S,NI D,QIN J,et al.Bridging computational fea- tures toward multiple semantic features with multi-task re- 图8不同汉明排序方法的检索结果 gression:a study of CT pulmonary nodules[M //Medical Im- Fig.8 Retrieval results with different Hamming sorting age Computing and Computer-Assisted Intervention-MIC- methods CAI 2016.Springer International Publishing,2016:53-60. 4结束语 [4]VADLAMUDI L N,VADDELLA R P V,DEVARA V.Ro- bust image hashing technique for content authentication 本文提出一种基于医学征象和CNNs的肺结 based on DWT[C]//Proceedings of International Confer- 节CT图像哈希方法,用于实现肺结节CT图像的 ence on Computer Vision and Image Processing.Singapore: 快速检出。本文方法的主要贡献有:1)利用卷积神 Springer,2017:189-191. 经网络和主成分分析法提取肺结节的重要语义特 [5]GIONIS A,IINDYK P,MOTWANI R.Similarity search in 征,能更有效地表示肺结节含有的征象信息;2)通 high dimensions via Hashing[C]//International Conference 过构造征象训练集准确的哈希码和肺结节的重要语 on Very Large Data Bases.Morgan Kaufmann Publishers表 2 列出了本文方法与其他哈希方法在不同特 征下随着编码长度的增加,所对应的平均准确率 (MPA)实验结果。 对比表 2 中 CNNs 特征与 GIST 特征的实验结 果,可以看出基于 CNNs 特征的检索方法具有明显 优势。本文使用的 CNNs 特征在不同编码长度下一 直拥有最高的 MPA 值,与 GIST 特征(手工设计)相 比,效果分别提升了 4.6%、9.2%、11.6%、13%、12.5%、 11%。进一步验证了从肺结节底层图像到高层语义 中逐层提取的 CNNs 特征对检索结果的有效性。 为了评估本文方法的有效性,使用 P@K 比较 检索结果中前 5 个相似结节的精确度。 图 8 所示是两种方法在不同编码长度下,在检 索到的 15 个相似结节图像中 P@K=5 的对比结 果。随着编码长度的增加,两种方法在前 5 个检索 结果下的精确度都有所提高。当 r=64 b 时,本文方 法在检索到的前 5 个肺结节图像中,精确度达到 88.23%,高于传统方法 23.41%。之后随着编码长度 的增加,两种方法的准确率都有所降低。从图中可 以看出,本文方法与汉明直接排序的方法相比,显 著提高了肺结节的检索精确率。 4 结束语 本文提出一种基于医学征象和 CNNs 的肺结 节 CT 图像哈希方法,用于实现肺结节 CT 图像的 快速检出。本文方法的主要贡献有:1)利用卷积神 经网络和主成分分析法提取肺结节的重要语义特 征,能更有效地表示肺结节含有的征象信息;2)通 过构造征象训练集准确的哈希码和肺结节的重要语 义特征反向求解哈希函数;3)为了进一步提高检索 精度,使用自适应比特位的加权汉明距离代替传统 的汉明距离。本文对公共数据集 LIDC 和医院数据 集进行实验,验证了本文方法在肺结节图像检索过 程中的有效性。未来的工作将研究基于深度哈希的 肺结节图像检索,以提高结节图像的检索精度,从 而进一步为医师诊断肺部病灶提供参考依据。 参考文献: REBECCA L, KIMBERLY D M, STACEY A F, et al. Cancer statistics[J]. CA: a cancer journal for clinicians, 2017, 67(3): 177. [1] ZHAO Y, BOCK G H D, VLIEGENTHART R, et al. Performance of computer-aided detection of pulmonary nodules in low-dose CT: comparison with double reading by nodule volume[J]. European radiology, 2012, 22(10): 2076. [2] CHEN S, NI D, QIN J, et al. Bridging computational features toward multiple semantic features with multi-task regression: a study of CT pulmonary nodules[M]//Medical Image Computing and Computer-Assisted Intervention-MICCAI 2016. Springer International Publishing, 2016: 53–60. [3] VADLAMUDI L N, VADDELLA R P V, DEVARA V. Robust image hashing technique for content authentication based on DWT[C]//Proceedings of International Conference on Computer Vision and Image Processing. Singapore: Springer, 2017: 189–191. [4] GIONIS A, IINDYK P, MOTWANI R. Similarity search in high dimensions via Hashing[C]//International Conference on Very Large Data Bases. Morgan Kaufmann Publishers [5] 0.90 0.80 0.70 0.60 0.50 0.40 12 24 32 48 64 72 㕆⸱䮯ᓖ γ/b ᱘᪳∁ ь㐋∁ P @K=5 图 8 不同汉明排序方法的检索结果 Fig. 8 Retrieval results with different Hamming sorting methods 表 2 不同编码长度下两种特征的 MPA 值 Table 2 The two features of MAP (%) on r bits 方法 Gist特征 CNNs特征 12 b 24 b 32 b 48 b 64 b 72 b 12 b 24 b 32 b 48 b 64 b 72 b ours 45.6 60.4 63.2 65.7 67.9 70.3 50.2 69.6 74.8 78.7 80.4 81.3 KSH 30.4 35.8 40.8 46.0 65.9 66.1 42.6 66.2 70.8 74.5 75.9 75.4 ITQ 23.1 26.2 30.3 34.4 37.8 38.6 40.1 55.9 66.7 72.5 76.3 80.4 PCA 16.4 18.7 21.9 23.5 33.1 34.3 22.9 32.1 51.5 62.7 69.2 71.2 SH 6.3 7.5 8.4 10.6 11.2 12.5 20.7 26.4 33.4 36.1 35.8 35.2 LSH 9.7 11.9 15.3 23.6 30.7 30.1 4.8 10.3 18.2 29.1 36.5 42.3 第 6 期 杨晓兰,等:基于医学征象和卷积神经网络的肺结节 CT 图像哈希检索 ·863·