正在加载图片...
第5期 姜婷,等:基于分布先验的半监督FCM的肺结节分类 .733· 表1不同方法的准确率对比 Tablel Comparison of the accuracy of different methods 号 标记样本:未标记样本FCM算法部分监督FCM算法 SS-FCM算法 改进半监督FCM算法本文提出的算法 43:307 73.4 74.3 75.5 72.6 78.2 65:307 73.4 73.2 75.7 72.8 78.4 90:307 73.4 75.1 78.1 77.1 80.1 144:307 73.4 78.7 79.4 77.6 79.3 由表1可知,随着标记样本数量的增加,半监督 nodules in CT images[J].Journal of data acquisition and FCM框架下的肺结节分类的准确率大致是逐渐提 processing,2016,31(5):868-881. 高的。与其他的半监督FCM方法相比较,本文提出 [3]LEE S L A,KOUZANI A Z.HU E J.Automated detection 的算法效果更好。因为本文引入了样本的先验分 of lung nodules in computed tomography images:a review 布信息,能够强化标记信息对聚类的指导作用,从 [J].Machine vision and applications,2012,23 (1): 151-163. 而能够提高分类效果。但是根据表1中数据我们可 [4]VALENTE I R S,CORTEZ P C,NETO E C,et al. 以看出,标记样本为90时的分类准确率要比标记样 Automatic 3D pulmonary nodule detection in CT images:A 本为144时的分类准确率高,这是因为随着标记样 survey[J].Computer methods and programs in biomedicine, 本的增加,当标记样本和未标记样本的数量越来越 2016,124(C):91-107. 接近时,公式中引人的标记样本和未标记样本的权 [5]HAN F,WANG H,ZHANG G,et al.Texture feature 重也就越来越相近,那么式(17)中的系数就可以约 analysis for computer-aided diagnosis on pulmonary nodules 掉,本文的算法退化为传统的半监督模糊C均值算 [J].Journal of digital imaging,2015,28(1):99. 法,从而使得准确率降低。这也是下一步工作的 [6]HADY M F A,SCHWENKER F.Semi-supervised learning 重点。 []Intelligent systems reference library,2010,49(2): 215-239. 4结束语 [7]BENSAID A M,HALL L O,BEZDEK J C,et al.Partially supervised clustering for image segmentation[].Pattern 为了解决半监督聚类算法中标记样本数量少 recognition,1996,29(5):859-871. 导致标记信息在聚类过程中作用弱化的问题,本文 [8]张慧哲,王坚.基于初始聚类中心选取的改进FCM聚类 提出了一种基于先验分布的半监督FCM算法。引 算法[J].计算机科学,2009,36(6):206-209. 入样本的分布先验信息,自适应调节样本的权重, ZHANG Huizhe,WANG Jian.Improved fuzzy C means 强化标记样本在聚类过程中的指导作用,提高半监 clustering algorithm based on selecting initial clustering 督FCM算法在少量标记样本情况下的性能。在本 centers[J].Computer science,2009,36(6):206-209. 文的实验中,通过与传统的半监督聚类算法对比, [9]李春芳,庞雅静,钱丽璞,等.半监督FCM聚类算法目 证明提出的方法能够取得更高的聚类正确率。 标函数研究[J].计算机工程与应用,2009,45(14): 128-132 但是当标记样本数量非常小的时候,给其赋以 LI Chunfang,PANG Yajing,QIAN Lipu,et al.Objective 过大的权重会出现分类结果偏离实际的情况。这 function of semi-supervised FCM clustering algorithm[J]. 也是在未来的工作中进一步研究的问题。 Computer engineering and application,2009,45(14): 参考文献: 128-132. [10]WU K L.Analysis of parameter selections for fuzzy C- [1 MCGUIRE S.World Cancer Report 2014.Geneva, means[J].Pattern recognition,2012,45(1):407-415. Switzerland:World Health Organization,International [11]侯薇,董红斌,印桂生.一种基于隶属度优化的演化聚 Agency for Research on Cancer,WHO Press,2015[R] 类算法[J].计算机研究与发展,2013,50(3): Advances in nutrition,2016,7(2):418-419. 548-558. [2]伍长荣,接标,叶明全.CT图像肺结节计算机辅助检测 HOU Wei,DONG Hongbin,YIN Guisheng.A membership 与诊断技术研究综述[J].数据采集与处理,2016,31 degree refinement-based evolutionary clustering algorithm (5):868-881. [J].Journal of computer research and development,2013, WU Changrong,JIE Biao,YE Mingquan.Reviews on 50(3):548-558. computer-aided detection and diagnosis of pulmonary [12]李斌,狄岚,王少华,等.基于改进核模糊C均值类间表 1 不同方法的准确率对比 Table1 Comparison of the accuracy of different methods % 标记样本:未标记样本 FCM 算法 部分监督 FCM 算法 SS⁃FCM 算法 改进半监督 FCM 算法 本文提出的算法 43:307 73.4 74.3 75.5 72.6 78.2 65:307 73.4 73.2 75.7 72.8 78.4 90:307 73.4 75.1 78.1 77.1 80.1 144:307 73.4 78.7 79.4 77.6 79.3 由表 1 可知,随着标记样本数量的增加,半监督 FCM 框架下的肺结节分类的准确率大致是逐渐提 高的。 与其他的半监督 FCM 方法相比较,本文提出 的算法效果更好。 因为本文引入了样本的先验分 布信息,能够强化标记信息对聚类的指导作用,从 而能够提高分类效果。 但是根据表 1 中数据我们可 以看出,标记样本为 90 时的分类准确率要比标记样 本为 144 时的分类准确率高,这是因为随着标记样 本的增加,当标记样本和未标记样本的数量越来越 接近时,公式中引入的标记样本和未标记样本的权 重也就越来越相近,那么式(17)中的系数就可以约 掉,本文的算法退化为传统的半监督模糊 C 均值算 法,从而使得准确率降低。 这也是下一步工作的 重点。 4 结束语 为了解决半监督聚类算法中标记样本数量少 导致标记信息在聚类过程中作用弱化的问题,本文 提出了一种基于先验分布的半监督 FCM 算法。 引 入样本的分布先验信息,自适应调节样本的权重, 强化标记样本在聚类过程中的指导作用,提高半监 督 FCM 算法在少量标记样本情况下的性能。 在本 文的实验中,通过与传统的半监督聚类算法对比, 证明提出的方法能够取得更高的聚类正确率。 但是当标记样本数量非常小的时候,给其赋以 过大的权重会出现分类结果偏离实际的情况。 这 也是在未来的工作中进一步研究的问题。 参考文献: [ 1 ] MCGUIRE S. World Cancer Report 2014. Geneva, Switzerland: World Health Organization, International Agency for Research on Cancer, WHO Press, 2015[R]. Advances in nutrition, 2016, 7(2): 418-419. [2]伍长荣, 接标, 叶明全. CT 图像肺结节计算机辅助检测 与诊断技术研究综述[ J]. 数据采集与处理, 2016, 31 (5): 868-881. WU Changrong, JIE Biao, YE Mingquan. Reviews on computer⁃aided detection and diagnosis of pulmonary nodules in CT images [ J]. Journal of data acquisition and processing, 2016, 31(5): 868-881. [3]LEE S L A, KOUZANI A Z, HU E J. Automated detection of lung nodules in computed tomography images: a review [J ]. Machine vision and applications, 2012, 23 ( 1 ): 151-163. [4] VALENTE I R S, CORTEZ P C, NETO E C, et al. Automatic 3D pulmonary nodule detection in CT images: A survey[J]. Computer methods and programs in biomedicine, 2016, 124(C): 91-107. [5] HAN F, WANG H, ZHANG G, et al. Texture feature analysis for computer⁃aided diagnosis on pulmonary nodules [J]. Journal of digital imaging, 2015, 28(1): 99. [6]HADY M F A, SCHWENKER F. Semi⁃supervised learning [J]. Intelligent systems reference library, 2010, 49 ( 2): 215-239. [7]BENSAID A M, HALL L O, BEZDEK J C, et al. Partially supervised clustering for image segmentation [ J]. Pattern recognition, 1996, 29(5): 859-871. [8]张慧哲, 王坚. 基于初始聚类中心选取的改进 FCM 聚类 算法[J]. 计算机科学, 2009, 36(6): 206-209. ZHANG Huizhe, WANG Jian. Improved fuzzy C means clustering algorithm based on selecting initial clustering centers[J]. Computer science, 2009, 36(6): 206-209. [9]李春芳, 庞雅静, 钱丽璞,等. 半监督 FCM 聚类算法目 标函数研究[ J]. 计算机工程与应用, 2009, 45 ( 14): 128-132. LI Chunfang, PANG Yajing, QIAN Lipu, et al. Objective function of semi⁃supervised FCM clustering algorithm [ J]. Computer engineering and application, 2009, 45 ( 14 ): 128-132. [10] WU K L. Analysis of parameter selections for fuzzy C⁃ means[J]. Pattern recognition, 2012, 45(1): 407-415. [11]侯薇, 董红斌, 印桂生. 一种基于隶属度优化的演化聚 类算 法 [ J ]. 计 算 机 研 究 与 发 展, 2013, 50 ( 3 ): 548-558. HOU Wei, DONG Hongbin, YIN Guisheng. A membership degree refinement⁃based evolutionary clustering algorithm [J]. Journal of computer research and development, 2013, 50(3): 548-558. [12]李斌, 狄岚, 王少华,等. 基于改进核模糊 C 均值类间 第 5 期 姜婷,等:基于分布先验的半监督 FCM 的肺结节分类 ·733·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有