正在加载图片...
·732 智能系统学报 第12卷 由于未标记样本数量会远远大于标记样本的 数量,基于上述公式,权重0的值一般要大于B。通 过在聚类中心中引入权重日和B,聚类中心以及样 本的聚类结果可以根据样本的先验分布进行自动 的调整,0可以强化标记信息对聚类的指导。 综上所述,基于先验分布的半监督FCM算法的 1u7 e 流程大致如下所示。 输入肺结节图像。 输出肺结节的分类结果和肺结节分类准 确率。 算法流程: 1)计算输入图像中肺结节的特征,并组成一个 矩阵: 2)确定样本个数C,平衡因子α,阈值ε,标记样 115。 101Bg 31417f 39323 (a)部分恶性肺结节分类结果 本的先验概率g,未标记样本的先验概率「,以及标 记样本的个数M: 3)初始化聚类中心4以及模糊隶属度u(包括 标记样本的隶属度4以及未标记样本隶属度“); 4)按照式(15)、(16)更新模糊隶属度u: 5)按照式(17)更新聚类中心: 6)重复循环步骤3),当两次迭代矩阵模糊隶属 度的差小于ε阈值时停止迭代: 7)根据计算得到的模糊隶属度u结果进行 分类。 3实验结果及分析 51 +.5E 本文的实验图像来自美国的LDC[0(美国癌 症研究),本文选择了188个病例,一共451个结节, -1:w ,E,41 其中包括了147个恶性结点,155个假阳性结点, (b)部分良性肺结节分类结果 149个良性结点。同时,本文实验中选取144例监 督样本,即47个恶性、42个良性及55个假阳性结 ta2T-1 IRe EN12-1 t523 1t3i456 iiTS Je 点,剩余的样本作为测试样本。实验中,采用肺结 节分类识别准确率作为评估算法性能准则。图3为 部分分类后的结节,大部分样本都能分类正确,只 105 有少量样本存在分类错误,这是因为在特征提取方 面这些肺结节的灰度特征不够明显,导致分类错 误。本实验为了证明提出算法的有效性,在不同未 lt6-1 JPC 215按 1公》0 标记样本和标记样本之间的比例下(分别为7倍、6 倍、5倍、4倍、3倍、2倍),对比提出的算法与其他 4498 30121- 5l1开g 330-51p6 算法的分类正确率。未标记样本和标记样本比例 为7倍、6倍、5倍时分类结果准确率变化不是十分 明显,所以本文只给出了比例为7倍的分类准确率。 343:3g 38)e 34-2B 3行-53月r 表1给出了传统FCM部分监督FCM算法、SS-FCM、 (©)部分假阳性肺结点分类结果 改进的半监督FCM算法[2]以及本文提出的基于样 图3部分结节分类后的结果 本先验概率的半监督聚类算法准确率的比较结果。 Fig.3 Nodules classification results由于未标记样本数量会远远大于标记样本的 数量,基于上述公式,权重 θ 的值一般要大于 β。 通 过在聚类中心中引入权重 θ 和 β,聚类中心以及样 本的聚类结果可以根据样本的先验分布进行自动 的调整,θ 可以强化标记信息对聚类的指导。 综上所述,基于先验分布的半监督 FCM 算法的 流程大致如下所示。 输入 肺结节图像。 输出 肺结节的分类结果和肺结节分类准 确率。 算法流程: 1)计算输入图像中肺结节的特征,并组成一个 矩阵; 2)确定样本个数 C,平衡因子 α,阈值 ε,标记样 本的先验概率 q,未标记样本的先验概率 r,以及标 记样本的个数 M; 3)初始化聚类中心 vik以及模糊隶属度 uik(包括 标记样本的隶属度 u d ik以及未标记样本隶属度 u u ik); 4)按照式(15)、(16)更新模糊隶属度 uik; 5)按照式(17)更新聚类中心; 6)重复循环步骤 3),当两次迭代矩阵模糊隶属 度的差小于 ε 阈值时停止迭代; 7)根据计算得到的模糊隶属度 uik 结果进行 分类。 3 实验结果及分析 本文的实验图像来自美国的 LIDC [20] (美国癌 症研究),本文选择了 188 个病例,一共 451 个结节, 其中包括了 147 个恶性结点,155 个假阳性结点, 149 个良性结点。 同时,本文实验中选取 144 例监 督样本,即 47 个恶性、42 个良性及 55 个假阳性结 点,剩余的样本作为测试样本。 实验中,采用肺结 节分类识别准确率作为评估算法性能准则。 图 3 为 部分分类后的结节,大部分样本都能分类正确,只 有少量样本存在分类错误,这是因为在特征提取方 面这些肺结节的灰度特征不够明显,导致分类错 误。 本实验为了证明提出算法的有效性,在不同未 标记样本和标记样本之间的比例下(分别为 7 倍、6 倍、5 倍、4 倍、3 倍、2 倍),对比提出的算法与其他 算法的分类正确率。 未标记样本和标记样本比例 为 7 倍、6 倍、5 倍时分类结果准确率变化不是十分 明显,所以本文只给出了比例为 7 倍的分类准确率。 表 1 给出了传统 FCM 部分监督 FCM 算法、SS⁃FCM、 改进的半监督 FCM 算法[21]以及本文提出的基于样 本先验概率的半监督聚类算法准确率的比较结果。 (a)部分恶性肺结节分类结果 (b)部分良性肺结节分类结果 (c)部分假阳性肺结点分类结果 图 3 部分结节分类后的结果 Fig. 3 Nodules classification results ·732· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有