正在加载图片...
·548· 智能系统学报 第16卷 被应用于阿尔滋海默症2、脑瘤2和肺结节1等 8组数据共享编码器,并分别使用8个解码器,最 疾病的医学图像分类或分割研究当中,并表现出 后只迁移共用的编码器部分用于肺结节CT图像 了优秀的效果。据我们所知,目前没有任何关于 的分类研究。受Chen等2例的启发,本文设计了 抑郁症医学图像分类的研究使用迁移学习,但所 一个新颖的三维sMRI数据迁移学习框架。在数 有上述研究都证明,将迁移学习应用于医学成像 据选择方面,只收集同一部位(大脑)和同一类型 领域具有巨大的价值,并且与从无到有的训练相 (sMR)的数据进行预训练,并只考虑分类任务。 比,在训练数据集较小的情况下,迁移学习的引 在这3个限制条件下,选择使用开源的老年痴呆 入有可能提高抑郁症sMRI图像分类的精度。 症数据集ADNI(htps:/ida.loni.usc.edu)作为预训 Chen等收集了包括肝脏、心脏等8种不同 练数据。为了实现本文的迁移学习,设计了1个 部位的3D医学图像分割数据集,在训练过程中, 3步处理工作流,如图4所示。 AD uonisue-Ce HC 迁移 MDD Na-dE AuoD-dE uorsueIL-dE 图4 迁移学习架构 Fig.4 Framework of the proposed transfer learning 1)从ADNI数据库中挑选出合适的sMRI数 的学习速率对迁移过后的主干网络进行微调,用 据,包含阿兹海默患者(alzheimer's disease, 较大的学习速率来训练未经过预训练的分类层 AD)、轻度认知障碍(mild cognitive impairment,. 以使传输的网络能够从MDD数据中提取一些新 MC),以及健康对照组(heathy control,HC)3类, 的特征,提高分类性能。 共656个被试者,并用与本文中相同的数据预处 理步骤,对挑选出来的数据进行预处理: 3实验与结果分析 2)用所选数据训练1个三分类的3D-DenseNet 为了验证本文提出方法的有效性,本文精心 网络,让网络学习sMRI数据的特征; 设计了一系列实验,探讨不同深度学习网络以及 3)将训练好的网络模型中的主干网络(图4 三维化相应网络对分类精度的影响,验证所设计 中红框部分)部分迁移到抑郁症sMRI数据的分类 任务中,并添加二分类层,使用本文的抑郁症sMRI 的迁移学习流程的有效性和优越性。 数据继续进行训练,以增强网络的分类性能。 3.1模型评价指标 之所以只从脑部sMRI数据集中选择数据作 本文分类问题为二分类问题,也就是将样本 预训练,是因为如果选择的源域和目标域的相似 分成MDD患者和HC两类,规定MDD患者为正 度太小,很可能会导致负迁移,从而导致性能下 类(positive),HC为负类(negative),分类算法对测 降,即分类准确率不提高反而降低。相反,2个数 试数据集的预测有正确或错误之分,具体包括将 据集越相似,2个数据集的高层特征就越相似,这 正类预测为正类数(true positive,TP)、将正类预测 将产生更好的代表性特征和更适合目标域的预训 为负类数(false negative,FN)、将负类预测为正类 练模型,以提高目标域任务的分类性能。为了进 数(false positive,FP)、将负类预测为负类数(true 行对比实验,在第3步中用相同的过程和相同的 negative,TN)4种情况。针对研究课题的特殊性, 数据训练三维化的ResNet。此外,本文使用较小 本文选取了正确率和召回率2个指标来评价模型被应用于阿尔兹海默症[26] 、脑瘤[27] 和肺结节[28] 等 疾病的医学图像分类或分割研究当中,并表现出 了优秀的效果。据我们所知,目前没有任何关于 抑郁症医学图像分类的研究使用迁移学习,但所 有上述研究都证明,将迁移学习应用于医学成像 领域具有巨大的价值,并且与从无到有的训练相 比,在训练数据集较小的情况下,迁移学习的引 入有可能提高抑郁症 sMRI 图像分类的精度。 Chen 等 [29] 收集了包括肝脏、心脏等 8 种不同 部位的 3D 医学图像分割数据集,在训练过程中, 8 组数据共享编码器,并分别使用 8 个解码器,最 后只迁移共用的编码器部分用于肺结节 CT 图像 的分类研究。受 Chen 等 [29] 的启发,本文设计了 一个新颖的三维 sMRI 数据迁移学习框架。在数 据选择方面,只收集同一部位 (大脑) 和同一类型 (sMRI) 的数据进行预训练,并只考虑分类任务。 在这 3 个限制条件下,选择使用开源的老年痴呆 症数据集 ADNI(https://ida.loni.usc.edu) 作为预训 练数据。为了实现本文的迁移学习,设计了 1 个 3 步处理工作流,如图 4 所示。 3D-Conv, 3D-BN ReLU, 3D-MaxPool 3D-DenseBlock (1) 3D-Transition 3D-DenseBlock (2) 3D-Transition 3D-DenseBlock (3) 3D-Transition 3D-DenseBlock (4) ReLU, 3D-AvgPool FC, Softmax MCI AD HC AD MCI HC 3D-Conv, 3D-BN ReLU, 3D-MaxPool 3D-DenseBlock (1) 3D-Transition 3D-DenseBlock (2) 3D-Transition 3D-DenseBlock (3) 3D-Transition 3D-DenseBlock (4) ReLU, 3D-AvgPool FC, Softmax MDD HC 迁移 MDD HC 图 4 迁移学习架构 Fig. 4 Framework of the proposed transfer learning 1) 从 ADNI 数据库中挑选出合适的 sMRI 数 据,包含阿兹海默患者 (alzheimer’s disease, AD)、轻度认知障碍 (mild cognitive impairment, MCI),以及健康对照组 (heathy control, HC)3 类, 共 656 个被试者,并用与本文中相同的数据预处 理步骤,对挑选出来的数据进行预处理; 2) 用所选数据训练 1 个三分类的 3D-DenseNet 网络,让网络学习 sMRI 数据的特征; 3) 将训练好的网络模型中的主干网络 (图 4 中红框部分) 部分迁移到抑郁症 sMRI 数据的分类 任务中,并添加二分类层,使用本文的抑郁症 sMRI 数据继续进行训练,以增强网络的分类性能。 之所以只从脑部 sMRI 数据集中选择数据作 预训练,是因为如果选择的源域和目标域的相似 度太小,很可能会导致负迁移,从而导致性能下 降,即分类准确率不提高反而降低。相反,2 个数 据集越相似,2 个数据集的高层特征就越相似,这 将产生更好的代表性特征和更适合目标域的预训 练模型,以提高目标域任务的分类性能。为了进 行对比实验,在第 3 步中用相同的过程和相同的 数据训练三维化的 ResNet。此外,本文使用较小 的学习速率对迁移过后的主干网络进行微调,用 较大的学习速率来训练未经过预训练的分类层, 以使传输的网络能够从 MDD 数据中提取一些新 的特征,提高分类性能。 3 实验与结果分析 为了验证本文提出方法的有效性,本文精心 设计了一系列实验,探讨不同深度学习网络以及 三维化相应网络对分类精度的影响,验证所设计 的迁移学习流程的有效性和优越性。 3.1 模型评价指标 本文分类问题为二分类问题,也就是将样本 分成 MDD 患者和 HC 两类,规定 MDD 患者为正 类 (positive),HC 为负类 (negative),分类算法对测 试数据集的预测有正确或错误之分,具体包括将 正类预测为正类数 (true positive, TP)、将正类预测 为负类数 (false negative, FN)、将负类预测为正类 数 (false positive, FP)、将负类预测为负类数 (true negative, TN)4 种情况。针对研究课题的特殊性, 本文选取了正确率和召回率 2 个指标来评价模型 ·548· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有