第14卷第4期 智能系统学报 Vol.14 No.4 2019年7月 CAAI Transactions on Intelligent Systems Jul.2019 D0:10.11992/tis.201806015 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180716.1333.014html 基于深度学习的椎间孔狭窄自动多分级研究 洪雁飞2,魏本征2,刘川2,韩忠义2,李天阳2 (1.山东中医药大学理工学院,山东济南250355,2.山东中医药大学计算医学实验室,山东济南250355) 摘要:椎间孔狭窄症的术前定性分级诊断对临床医生治疗策略的制定和患者健康恢复至关重要,但目前该方 面临床上仍然存在很多问题,并且缺乏相关的研究和行之有效的方法用于辅助临床医生诊断。因此,为提高计 算机辅助椎间孔狭窄症诊断准确率以及医生工作效率,本文提出一种基于深度学习的椎间孔狭窄图像自动分 级算法。从人体矢状切脊柱核磁共振图像中提取脊柱椎间孔图像,并做图像预处理:设计一种监督式深度卷积 神经网络模型,用于实现脊柱椎间孔图像数据集的自动多分级:利用迁移学习方法,解决深度学习算法在小样 本数据集上的过拟合问题。实验结果表明,本文算法在脊柱椎间孔图像数据集上的分类精确度可达到 87.5%以上,且其具有良好的鲁棒性和泛化能力。 关键词:椎间孔狭窄;自动分级;机器学习;深度学习;特征提取:监督训练:迁移学习;过拟合 中图分类号:TP311文献标志码:A文章编号:1673-4785(2019)04-0708-08 中文引用格式:洪雁飞,魏本征,刘川,等.基于深度学习的椎间孔狭窄自动多分级研究J.智能系统学报,2019,14(4): 708-715. 英文引用格式:HONG Yanfei,,VEI Benzheng,LIU Chuan,etal.Deep learning based automatic multi--classification algorithm for intervertebral foraminal stenosis J.CAAI transactions on intelligent systems,2019,14(4):708-715. Deep learning based automatic multi-classification algorithm for intervertebral foraminal stenosis HONG Yanfei2,WEI Benzheng'2,LIU Chuan',HAN Zhongyi2,LI Tianyang2 (1.College of Science and Technology,Shandong University of Traditional Chinese Medicine,Ji'nan 250355,China;2.Computa- tional Medicine Lab,Shandong University of Traditional Chinese Medicine,Ji'nan 250355,China) Abstract:Preoperative qualitative diagnosis of intervertebral foraminal stenosis is essential for the formulation of clini- cian treatment strategies and patients'health recovery.However,there are still many clinical challenges in this aspect and a lack of relevant research and proven methods to assist clinicians in diagnosis.Therefore,a deep learning-based automatic classification algorithm is proposed in this study to improve the diagnosis accuracy and the efficiency.First, we extracted the spinal foramen images from the sagittal spine MRI image,and then these images were preprocessed. Second,a supervised deep convolutional neural network model was designed to achieve automatic multi-classification for the datasets of the intervertebral foraminal stenosis.Finally,we used the transfer learning to optimize the overfitting problem of the deep learning algorithm in the small sample dataset.The experimental results show that the classification accuracy of this algorithm on the dataset of spinal foramen was 87.5%,and it has good robustness and generalization performance. Keywords:intervertebral foraminal stenosis;automatic grade;machine learning;deep learning;feature extraction;su- pervised training;transfer learning,over fitting 椎间孔狭窄症(intervertebral foraminal stenosis, 收稿日期:2018-06-05.网络出版日期:2018-07-17. 基金项目:国家自然科学基金项目(U1201258,61572300):山东 FS)是指由于椎间孔狭窄压迫脊髓神经根周围神 省自然科学基金项目(ZR20I5FM0IO):山东高等学 校科技计划项目(J15LN20):山东省医药卫生科技发 经系统引发的退行性疾病。脊髓神经根作为感 展计划项目(2016WS0577):山东省中医药科技发展 觉输入的传递中枢,受压迫后将会引起疼痛、肌 计划项目(2017-001). 通信作者:魏本征.E-mail:wbz99@sina.com. 肉无力,甚至身体残疾,并且FS会随着人的自然
DOI: 10.11992/tis.201806015 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180716.1333.014.html 基于深度学习的椎间孔狭窄自动多分级研究 洪雁飞1,2,魏本征1,2,刘川2 ,韩忠义1,2,李天阳1,2 (1. 山东中医药大学 理工学院,山东 济南 250355; 2. 山东中医药大学 计算医学实验室,山东 济南 250355) 摘 要:椎间孔狭窄症的术前定性分级诊断对临床医生治疗策略的制定和患者健康恢复至关重要,但目前该方 面临床上仍然存在很多问题,并且缺乏相关的研究和行之有效的方法用于辅助临床医生诊断。因此,为提高计 算机辅助椎间孔狭窄症诊断准确率以及医生工作效率,本文提出一种基于深度学习的椎间孔狭窄图像自动分 级算法。从人体矢状切脊柱核磁共振图像中提取脊柱椎间孔图像,并做图像预处理;设计一种监督式深度卷积 神经网络模型,用于实现脊柱椎间孔图像数据集的自动多分级;利用迁移学习方法,解决深度学习算法在小样 本数据集上的过拟合问题。实验结果表明,本文算法在脊柱椎间孔图像数据集上的分类精确度可达到 87.5% 以上,且其具有良好的鲁棒性和泛化能力。 关键词:椎间孔狭窄;自动分级;机器学习;深度学习;特征提取;监督训练;迁移学习;过拟合 中图分类号:TP311 文献标志码:A 文章编号:1673−4785(2019)04−0708−08 中文引用格式:洪雁飞, 魏本征, 刘川, 等. 基于深度学习的椎间孔狭窄自动多分级研究 [J]. 智能系统学报, 2019, 14(4): 708–715. 英文引用格式:HONG Yanfei, WEI Benzheng, LIU Chuan, et al. Deep learning based automatic multi-classification algorithm for intervertebral foraminal stenosis[J]. CAAI transactions on intelligent systems, 2019, 14(4): 708–715. Deep learning based automatic multi-classification algorithm for intervertebral foraminal stenosis HONG Yanfei1,2 ,WEI Benzheng1,2 ,LIU Chuan2 ,HAN Zhongyi1,2 ,LI Tianyang1,2 (1. College of Science and Technology, Shandong University of Traditional Chinese Medicine, Ji’nan 250355, China; 2. Computational Medicine Lab, Shandong University of Traditional Chinese Medicine, Ji’nan 250355, China) Abstract: Preoperative qualitative diagnosis of intervertebral foraminal stenosis is essential for the formulation of clinician treatment strategies and patients' health recovery. However, there are still many clinical challenges in this aspect and a lack of relevant research and proven methods to assist clinicians in diagnosis. Therefore, a deep learning-based automatic classification algorithm is proposed in this study to improve the diagnosis accuracy and the efficiency. First, we extracted the spinal foramen images from the sagittal spine MRI image, and then these images were preprocessed. Second, a supervised deep convolutional neural network model was designed to achieve automatic multi-classification for the datasets of the intervertebral foraminal stenosis. Finally, we used the transfer learning to optimize the overfitting problem of the deep learning algorithm in the small sample dataset. The experimental results show that the classification accuracy of this algorithm on the dataset of spinal foramen was 87.5%, and it has good robustness and generalization performance. Keywords: intervertebral foraminal stenosis; automatic grade; machine learning; deep learning; feature extraction; supervised training; transfer learning; over fitting 椎间孔狭窄症 (intervertebral foraminal stenosis, IFS) 是指由于椎间孔狭窄压迫脊髓神经根周围神 经系统引发的退行性疾病[1]。脊髓神经根作为感 觉输入的传递中枢,受压迫后将会引起疼痛、肌 肉无力,甚至身体残疾,并且 IFS 会随着人的自然 收稿日期:2018−06−05. 网络出版日期:2018−07−17. 基金项目:国家自然科学基金项目 (U1201258,61572300);山东 省自然科学基金项目 (ZR2015FM010); 山东高等学 校科技计划项目 (J15LN20);山东省医药卫生科技发 展计划项目 (2016WSO577);山东省中医药科技发展 计划项目 (2017-001). 通信作者:魏本征. E-mail:wbz99@sina.com. 第 14 卷第 4 期 智 能 系 统 学 报 Vol.14 No.4 2019 年 7 月 CAAI Transactions on Intelligent Systems Jul. 2019
第4期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·709· 衰老过程导致严重的脊柱侧凸和脊椎滑脱,大约 变和椎间盘突出等原因同样会导致神经根受压 80%的老年人深受IFS引起的腰背疼痛折磨。 迫,易导致误诊。因此,研究一种高效的算法提 临床数据表明,治疗计划随着FS等级的不同而 取图像全局“病灶特征”并实现自动分级诊断,就 变化,如对于1级狭窄,通常的物理治疗和运动将 成为辅助FS诊断亟待解决的重要问题。 是治疗的第一选择,而对于更严重的等级,患者 在图像处理算法方面,深度学习模型能够很 可能需要接受手术治疗或者减压治疗等1。因 好地提取图像深层特征,且可通过改变模型的网 此,有效和精确的分级是椎间孔狭窄症诊断和治 络拓扑结构,如适当增加网络的深度和宽度,降 疗至关重要的一步。但是现有的临床椎间孔狭窄 低特征冗余度和提高特征相关性。自1995年 分级主要存在3个方面的问题:1)医生对FS图 L0等1将卷积神经网络用于医学图像分析起,深 像的目视检查和人工评分,耗时耗力且低效; 度学习模型已经迅速成为研究分析医学图像的重 2)由于FS的病症多样性,临床医生常更多关注 要方法,且其在辅助脑、乳腺、肺等器官的临床 椎间盘突出、椎管狭窄和侧隐窝狭窄的情况,而 诊断方面已取得重要进展,但在辅助脊椎脊柱疾 容易忽略椎间孔的狭窄情况,主观性强;3)特殊 病诊断的研究基本处于空白。 的椎间孔解剖结构及复杂的致狭窄因素,易导致 针对FS的自动分级问题,本文采用设计基 临床难以全面准确判定,误诊、漏诊率高。因此, 于椎间孔狭窄自动分级的监督式深度卷积神经网 为提高FS诊断效率、减少医生主观影响以及降 (supervised deep convolutional neural network 低误诊漏诊率,设计自动化的临床辅助诊断系统 based on automatic classification of intervertebral fo 具有重要的应用价值。 raminal stenosis,.IFS-Net),提取图像纹理特征、颜 当前,计算机辅助诊断IFS方面的研究已取 色特征、形状特征和空间关系特征,并将这些特 得了重要进展,按照感兴趣区域的不同可分为两 征融合起来作为不同级别的疾病“症状”特征与 种类型。第一种类型是基于椎间孔周围结构的自 IF$之间建立特殊的“病理”联系。另外,由于深 动定位分割研究,主要有Alomari等使用一种两 级模型在核磁共振图像中捕获像素级和对象级特 度学习算法需要海量的训练数据,而IF$影像数 征,以实现对椎间盘的局部异常检测;Zhan等o 据的数量有限,因此本文选用先进的迁移学习 采用基于CT和MR图像的共同的脊柱几何结构 和微调16方法,来克服和避免因FS影像数据规 设计分析算法初始化椎骨的标记实现椎体定位; 模不足导致的过拟合等问题,提高算法对椎间孔 Wang等采用回归分割的方法分割出MB脊柱图。 狭窄图像的识别率,满足高标准的临床要求。 第二种类型是直接基于椎间孔的自动分割或分级 1 研究,主要有Ghosha等通过对椎体中心线以及 IFS-Net算法 椎间孔主要边界点的检测实现分割;Huang等9 1.1 算法结构 采用Adaboost检测算法和迭代归一化分割算法 本文设计的IFS-Net是一个端到端的模式识 对MRI椎体图像进行检测同时成定位和分割; 别模型,该模型可实现FS的高精度自动分级,且 Klinder等o采用将全局脊柱形状在连续的局部 具有网络结构简单、高效的特点。端到端的方法 椎体坐标系中表示,并将个体椎骨建模为三角曲 使得模型完成提取图像潜在特征的同时,可以自 面网络的方法,实现了基于双尺度的脊柱和椎间 孔建模与分割;He等山采用超像素分割法在对 动将10ss值前反馈到每一层,经多次迭代调节模 椎间孔狭窄图像定位和良恶性分类问题上精确度 型参数,获得最优解。 达到98.52%。 IFS-Nt模型结构共包含8层网络结构,分别 以上研究均取得不同程度的进展,但仍存在 是3个卷积层、3个池化层、1个全连接层和1个 些问题。此类基于部分形态学解剖结构的定 输出层,其中的全连接层和输出层是该模型的优 位、分割或者比较简单的二级分类的辅助诊断研 势模块。因椎间孔图像目标区域小而集中(如图1 究,忽略了全局信息,影响诊断精确度。而临床 所示,图1为椎间孔结构及狭窄症分级示意图), 上基于常规仰卧位MRI图像的椎间孔狭窄诊断 故本文采用全连接的方式将所有模型学到的“分 是由椎间孔形态、神经根周围脂肪或神经根形态 布式特征”映射到样本标记空间叨,以达到最大化 改变情况等多种因素决定的),如2级狭窄虽然 利用模型提取的特征信息,进而实现更有效的分 在神经根周围4个方向(垂直和横向)无形态学变 类。IFS-Net模型框架如图2所示,主要结构和功 化,但椎间盘空间狭窄、韧带黄斑增厚、小关节病 能包括:
衰老过程导致严重的脊柱侧凸和脊椎滑脱,大约 80% 的老年人深受 IFS 引起的腰背疼痛折磨[2]。 临床数据表明,治疗计划随着 IFS 等级的不同而 变化,如对于 1 级狭窄,通常的物理治疗和运动将 是治疗的第一选择,而对于更严重的等级,患者 可能需要接受手术治疗或者减压治疗等[3]。因 此,有效和精确的分级是椎间孔狭窄症诊断和治 疗至关重要的一步。但是现有的临床椎间孔狭窄 分级主要存在 3 个方面的问题:1) 医生对 IFS 图 像的目视检查和人工评分,耗时耗力且低效; 2) 由于 IFS 的病症多样性,临床医生常更多关注 椎间盘突出、椎管狭窄和侧隐窝狭窄的情况,而 容易忽略椎间孔的狭窄情况,主观性强;3) 特殊 的椎间孔解剖结构及复杂的致狭窄因素,易导致 临床难以全面准确判定,误诊、漏诊率高。因此, 为提高 IFS 诊断效率、减少医生主观影响以及降 低误诊漏诊率,设计自动化的临床辅助诊断系统 具有重要的应用价值[4]。 当前,计算机辅助诊断 IFS 方面的研究已取 得了重要进展,按照感兴趣区域的不同可分为两 种类型。第一种类型是基于椎间孔周围结构的自 动定位分割研究,主要有 Alomari 等 [5] 使用一种两 级模型在核磁共振图像中捕获像素级和对象级特 征,以实现对椎间盘的局部异常检测;Zhan 等 [6] 采用基于 CT 和 MR 图像的共同的脊柱几何结构 设计分析算法初始化椎骨的标记实现椎体定位; Wang 等 [7] 采用回归分割的方法分割出 M3 脊柱图。 第二种类型是直接基于椎间孔的自动分割或分级 研究,主要有 Ghosha 等 [8] 通过对椎体中心线以及 椎间孔主要边界点的检测实现分割;Huang 等 [9] 采用 Adaboost 检测算法和迭代归一化分割算法 对 MRI 椎体图像进行检测同时成定位和分割; Klinder 等 [10] 采用将全局脊柱形状在连续的局部 椎体坐标系中表示,并将个体椎骨建模为三角曲 面网络的方法,实现了基于双尺度的脊柱和椎间 孔建模与分割;He 等 [11] 采用超像素分割法在对 椎间孔狭窄图像定位和良恶性分类问题上精确度 达到 98.52%。 以上研究均取得不同程度的进展,但仍存在 一些问题。此类基于部分形态学解剖结构的定 位、分割或者比较简单的二级分类的辅助诊断研 究,忽略了全局信息,影响诊断精确度。而临床 上基于常规仰卧位 MRI 图像的椎间孔狭窄诊断 是由椎间孔形态、神经根周围脂肪或神经根形态 改变情况等多种因素决定的[3] ,如 2 级狭窄虽然 在神经根周围 4 个方向 (垂直和横向) 无形态学变 化,但椎间盘空间狭窄、韧带黄斑增厚、小关节病 变和椎间盘突出等原因同样会导致神经根受压 迫,易导致误诊[12]。因此,研究一种高效的算法提 取图像全局“病灶特征”并实现自动分级诊断,就 成为辅助 IFS 诊断亟待解决的重要问题。 在图像处理算法方面,深度学习模型能够很 好地提取图像深层特征,且可通过改变模型的网 络拓扑结构,如适当增加网络的深度和宽度,降 低特征冗余度和提高特征相关性。自 1995 年 Lo 等 [13] 将卷积神经网络用于医学图像分析起,深 度学习模型已经迅速成为研究分析医学图像的重 要方法[14] ,且其在辅助脑、乳腺、肺等器官的临床 诊断方面已取得重要进展,但在辅助脊椎脊柱疾 病诊断的研究基本处于空白。 针对 IFS 的自动分级问题,本文采用设计基 于椎间孔狭窄自动分级的监督式深度卷积神经网 络 (supervised deep convolutional neural network based on automatic classification of intervertebral foraminal stenosis,IFS-Net),提取图像纹理特征、颜 色特征、形状特征和空间关系特征,并将这些特 征融合起来作为不同级别的疾病“症状”特征与 IFS 之间建立特殊的“病理”联系。另外,由于深 度学习算法需要海量的训练数据,而 IFS 影像数 据的数量有限,因此本文选用先进的迁移学习[15] 和微调[16] 方法,来克服和避免因 IFS 影像数据规 模不足导致的过拟合等问题,提高算法对椎间孔 狭窄图像的识别率,满足高标准的临床要求。 1 IFS-Net 算法 1.1 算法结构 本文设计的 IFS-Net 是一个端到端的模式识 别模型,该模型可实现 IFS 的高精度自动分级,且 具有网络结构简单、高效的特点。端到端的方法 使得模型完成提取图像潜在特征的同时,可以自 动将 loss 值前反馈到每一层,经多次迭代调节模 型参数,获得最优解。 IFS-Net 模型结构共包含 8 层网络结构,分别 是 3 个卷积层、3 个池化层、1 个全连接层和 1 个 输出层,其中的全连接层和输出层是该模型的优 势模块。因椎间孔图像目标区域小而集中 (如图 1 所示,图 1 为椎间孔结构及狭窄症分级示意图), 故本文采用全连接的方式将所有模型学到的“分 布式特征”映射到样本标记空间[17] ,以达到最大化 利用模型提取的特征信息,进而实现更有效的分 类。IFS-Net 模型框架如图 2 所示,主要结构和功 能包括: 第 4 期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·709·
·710· 智能系统学报 第14卷 正常0级 d Te 神经孔 L 狭窄1级 狭窄2级 L:o 狭窄3级 神经孔 神经孔 神经孔 LN:神经孔;LF;黄韧带::椎体:D:椎间盘;F可:小关节 图1椎间孔结构及狭窄症分级示意 Fig.1 Intervertebral foramen structure and stenosis classification diagram 输人图像 卷积层 池化层卷积层 池化层 卷积层 池化层 100×100 32@94×94 Padding:1 64@44×44 步长:2 128@20×20 步长2 卷积核尺寸:7步长:2 卷积核尺寸:5 卷积核尺寸:3 512×1 步长:2 步长:2 步长:2 标签 Co 卷积 最大池化① 卷积 平均池化 卷积 最大池化 全连接 ·特征提取。 分类 图2IFS-Net模型框架 Fig.2 IFS-Net model framework 1)输入层:该层将整幅椎间孔图像导入FS- 征点实现Feature maps的降维,除此之外还可以 Net结构,并产生第1个卷积层的输入。 降低噪声和扩大接受域。池化层的输出在保持 2)卷积层:负责特征的学习。该层通过卷积 标量不变的基础上减少了参数的数量。本文模型 计算连接到输入层或者上一层的局部区域的神经 的3个池化层分别采用Max-pooling和Mean-pool- 元的输出来提取特征,每个神经元与前一层的区 ig的策略实现特征降维,步长为2。池化层拥有 域连接为稀疏连接。其中输入卷积的权重集为卷 与其前端卷积层相等的Feature map个数,分别为 积核,也称作滤波器。一个可学习的卷积核与前 32、64和128个。 一层若干个Feature Maps作卷积,将所有元素累 4)全连接层:该层有512个神经单元,每个神 加后再加上一个偏置,传给一个非线性激活函 经单元都与上一层进行全连接,最终得到512维 数,本文结构采用ReLU函数作为非线性激活函 特征向量。 数。另外,为了减少计算复杂度,同一层中某些 5)输出层:输出层由欧式径向基函数(euc- 神经元之间的连接权重是共享的,即相同的。每 lidean radial basis function,.E-RNF)单元组成。计 层滤波器的大小依次递减分别为7×7、5× 算公式为 5和3×3,步长设置为2:并由高斯分布初始化,标 y=∑-w (2) 准差为0.01.3个卷积层分别包含32、64和128个 式中x和W,分别为最后一层卷积层的输入和权重。 Feature maps。卷积计算公式如(I)所示: 此外,本文模型学习率为0.0001,最大迭代 ,=f(∑*K+的 (1) 次数为25000次,动量设置为0.9,选取随机梯度 式中:I表示层数;K表示连接第I层的Feature 下降(stochastic gradient descent,.SGD)为优化函数。 Mapj与-l层的Feature Map i的卷积核;M-l表 1.2算法训练策略 示第-l层选择的输入Feature Maps;*表示卷积 1.2.1参数初始化 操作;b:表示I层中Mapj的偏置;f表示非线 在FS-Net模型的参数权重初始化方面,本文 性激活函数。 采用自训练和迁移学习相融合的参数初始化策 3)池化层:池化层的目的是通过减少相似特 略。自训练方法是将网络参数用随机初始化的方
正常0级 神经孔 T12 LN L1 L1 L2 L3 L4 L5 S1 L2 L3 L4 L5 ⓐ ⓑ ⓒ ⓓ V D LN LF FJ 狭窄1级 神经孔 狭窄2级 神经孔 狭窄3级 神经孔 L2 T12 L1 L2 L3 L4 L5 L3 L4 L5 LN:神经孔;LF;黄韧带; V:椎体; D:椎间盘; FJ:小关节 图 1 椎间孔结构及狭窄症分级示意 Fig. 1 Intervertebral foramen structure and stenosis classification diagram 输入图像 100×100 卷积层 32@94×94 卷积核尺寸:7 步长:2 池化层 Padding:1 步长:2 卷积层 64@44×44 卷积核尺寸:5 步长:2 池化层 步长:2 卷积层 128@20×20 卷积核尺寸:3 步长:2 池化层 步长:2 512×1 标签 C0 C1 C2 C3 卷积 最大池化 卷积 平均池化 卷积 最大池化 全连接 特征提取 分类 图 2 IFS-Net 模型框架 Fig. 2 IFS-Net model framework 1) 输入层:该层将整幅椎间孔图像导入 IFSNet 结构,并产生第 1 个卷积层的输入。 2) 卷积层:负责特征的学习。该层通过卷积 计算连接到输入层或者上一层的局部区域的神经 元的输出来提取特征,每个神经元与前一层的区 域连接为稀疏连接。其中输入卷积的权重集为卷 积核,也称作滤波器。一个可学习的卷积核与前 一层若干个 Feature Maps 作卷积,将所有元素累 加后再加上一个偏置,传给一个非线性激活函 数,本文结构采用 ReLU 函数作为非线性激活函 数。另外,为了减少计算复杂度,同一层中某些 神经元之间的连接权重是共享的,即相同的。每 层滤波器的大小依次递减分别 为 7×7 、 5 × 5 和 3×3,步长设置为 2;并由高斯分布初始化,标 准差为 0.01。3 个卷积层分别包含 32、64 和 128 个 Feature maps。卷积计算公式如 (1) 所示: x l Kj = f((∑ ieMl−1 x i−1 i ∗K l i j)+b l j ) (1) Ki j j i Ml−1 b l j j f(·) 式中:l 表示层数; 表示连接第 l 层的 Feature Map 与 l−1 层的 Feature Map 的卷积核; 表 示第 l−1 层选择的输入 Feature Maps;*表示卷积 操作; 表示 l 层中 Map 的偏置; 表示非线 性激活函数。 3) 池化层:池化层的目的是通过减少相似特 征点实现 Feature maps 的降维,除此之外还可以 降低噪声和扩大接受域[15]。池化层的输出在保持 标量不变的基础上减少了参数的数量。本文模型 的 3 个池化层分别采用 Max-pooling 和 Mean-pooling 的策略实现特征降维,步长为 2。池化层拥有 与其前端卷积层相等的 Feature map 个数,分别为 32、64 和 128 个。 4) 全连接层:该层有 512 个神经单元,每个神 经单元都与上一层进行全连接,最终得到 512 维 特征向量。 5) 输出层:输出层由欧式径向基函数 (euclidean radial basis function,E-RNF) 单元组成。计 算公式为 yj = ∑ j (xi −wi j) 2 (2) 式中xi 和 wi j 分别为最后一层卷积层的输入和权重。 此外,本文模型学习率为 0.000 1,最大迭代 次数为 25 000 次,动量设置为 0.9,选取随机梯度 下降 (stochastic gradient descent,SGD) 为优化函数。 1.2 算法训练策略 1.2.1 参数初始化 在 IFS-Net 模型的参数权重初始化方面,本文 采用自训练和迁移学习相融合的参数初始化策 略。自训练方法是将网络参数用随机初始化的方 ·710· 智 能 系 统 学 报 第 14 卷
第4期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·711· 式从头开始训练模型;迁移学习方法则是采用预 实验对象的脊柱图像中采集的406个椎间孔图 先训练的参数权重来初始化网络,使得模型预先 像。每一个脊柱图像均使用矢状T,加权MRI扫 学到最基本特征(比如色彩、边缘特征等)能够有 描,重复时间(repetition time,.TR)为4O00ms,回 助于目标数据集分类,并提高算法分类性能。随 波时间(echo time,.TE)为85ms,磁场为1.5t。平 机初始化网络参数是最常用的深度学习训练方 面分辨率为0.5mm,厚度为1mm或1.6mm。在 法,但考虑到采用深度学习对医学图像进行处理FSI数据集中,每个IFS图像Ground Truth由拥 的一个局限是数据集大小不能得到最大满足。因 有7年工作经验的专业医生手工标注,分别是 此,为提高分类精确度并解决深度学习算法在小 0级(正常)图像108幅、1级(轻微)图像100幅、 样本数据集上的过拟合问题,本研究借鉴参考文 2级(显著)图像105幅和3级(严重)图像93幅。 献[18]的方法,将迁移学习应用于本文算法中。 IFSI数据集分级标注遵循的是Wildermuth椎间孔 迁移学习主要原理为:存在一个带有任务 狭窄分级诊断系统9。 T,=(Y,f(》的源域D,=(X,P(X)》和一个带有任 2.2评价标准 务T,={Y,f》的目标域D,={X,P(X)h,域和任务 在医学图像数据集中评估机器学习算法的多 之间的条件为D,≠T,和/或T,≠T。在迁移学习 分类性能,主要有基于患者水平和图像水平的两 中,D和T,获得的“知识”被用来帮助D,中预测 种评价方法。由于IFSI数据集是基于图像层面 函数⊙的学习。其中一个域由特征空间和边缘 的,因此本文从图像层面评估算法的识别率。假 概率分布两部分组成,T,和D,为模型训练其他数 设N为图像验证集或测试集的图像总数量,如果 据集的任务和域,T,和D,为本文训练任务和域。 N,幅图像被正确分类,那么图像层面的准确率 本文在ImageNet数据集上对模型进行预训 RR为 练,之后再将获得的网络参数迁移到目标数据集 RR=N,/Na (5) 上进行训练,从而获得稳定的网络参数。该数据 由于多分类问题中准确率不再是唯一的评价 集包含120余幅自然图像和1000多种不同的类别。 指标,因此本文引人F-score作为评价本文模型的 1.2.2 Softmax分类器 另一个指标。与F-score密切相关的两个值分别 模型采用Softmax分类器对模型提取的“分 为精确度P,和召回率R 布式特征”进行概率量化,Softmax是逻辑回归 P,=TP/(TP+FP) (6) 二分类器泛化到多分类的推广。对于训练集 R=TP/(TP+FN) (7) {(x,y),(x2,y2),…,(xm,ym}对应标签为y0∈(1,2, 式中:TP为真阳性记录数;FN为假阴性记录数: …,k,本文设定k=4。对于每个输入x都有对应 FP为假阳性记录数。 的每个类的概率po=x,即Softmax函数: F-score作为调和精确度和召回率的一个综合 exp(x) P()= (3) 指标,计算公式如下: ∑exp(eTx) F8=(B2+1/BP,+R (8) 式中:x为最够一层向输出层的输入,0为Soft- 另外,B用来调节两部分的比例。当B=1 max参数。训练优化实质上是逼近最佳gr的过 时,式(8)退化成简单的调和平均函数,称为 程。则Softmax的损失函数为 F,-score: 2PRE+Re F1= (9) J()=- og(P() (4) P. m 11 2.3实验设计 式中:100=)为指示性函数,取值规则为:1{值 为保证实验的严谨性,尽量避免特殊个例影 为真的表达式}=1,1{值为假的表达式}=0。 响最终结果,本文采用交叉验证的方式将FSI数 2实验及结果分析 据集平均分成5份,每次实验训练集和测试集比 例为4:1,且确保用于构建训练集的图像不再用 2.1数据集 于测试。 为验证和测试IFS-Net模型的性能,实验选用 本文算法采用Caffe模型编写基本框架2o。 国际通用的脊柱椎间孔图像(intervertebral fo- 算法在Lenovo ThinkStation、Intel e3CPU、NVIDIA raminal stenosis znxtxb-l4-4-hongyanfeis,IFSI))数据 Quadro K2200GPU上训练,平均训练时间为4min 集作为测试数据集。该数据集包含从110个临床 21s,单张测试时间平均为0.047s
式从头开始训练模型;迁移学习方法则是采用预 先训练的参数权重来初始化网络,使得模型预先 学到最基本特征 (比如色彩、边缘特征等) 能够有 助于目标数据集分类,并提高算法分类性能。随 机初始化网络参数是最常用的深度学习训练方 法,但考虑到采用深度学习对医学图像进行处理 的一个局限是数据集大小不能得到最大满足。因 此,为提高分类精确度并解决深度学习算法在小 样本数据集上的过拟合问题,本研究借鉴参考文 献 [18] 的方法,将迁移学习应用于本文算法中。 Ts = {Ys , fs(·)} Ds = {Xs ,Ps(Xs)} Tt = {Yt , ft(·)} Dt = {Xt ,Pt(Xt)} Ds , Tt Ts , Tt Ds Ts Dt ft(·) Ts Ds Tt Dt 迁移学习主要原理为:存在一个带有任务 的源域 和一个带有任 务 的目标域 ,域和任务 之间的条件为 和/或 。在迁移学习 中, 和 获得的“知识”被用来帮助 中预测 函数 的学习。其中一个域由特征空间和边缘 概率分布两部分组成, 和 为模型训练其他数 据集的任务和域, 和 为本文训练任务和域。 本文在 ImageNet 数据集上对模型进行预训 练,之后再将获得的网络参数迁移到目标数据集 上进行训练,从而获得稳定的网络参数。该数据 集包含 120 余幅自然图像和 1 000 多种不同的类别。 1.2.2 Softmax 分类器 { (x (1) , y (1)),(x (2) , y (2)),··· ,(x (m) , y (m) ) } y (i) ∈ {1,2, ··· , k} k = 4 x p(y = i|x) 模型采用 Softmax 分类器对模型提取的“分 布式特征”进行概率量化,Softmax 是逻辑回归 二分类器泛化到多分类的推广。对于训练集 对应标签为 ,本文设定 。对于每个输入 都有对应 的每个类的概率 ,即 Softmax 函数: P(j) = exp(θ T i x) ∑k i=1 exp(θ T i x) (3) θ T i x θ θ T 式中: 为最够一层向输出层的输入, 为 Softmax 参数。训练优化实质上是逼近最佳 的过 程。则 Softmax 的损失函数为 J(θ) = − 1 m ∑m i=1 ∑k j=1 1 { y (i) = j } ·log(P(j)) (4) 1(y (i) 式中: = j) 为指示性函数,取值规则为:1{值 为真的表达式}=1 ,1{值为假的表达式}=0。 2 实验及结果分析 2.1 数据集 为验证和测试 IFS-Net 模型的性能,实验选用 国际通用的脊柱椎间孔图像 (intervertebral foraminal stenosis znxtxb-14-4-hongyanfeis, IFSI) 数据 集作为测试数据集。该数据集包含从 110 个临床 实验对象的脊柱图像中采集的 406 个椎间孔图 像。每一个脊柱图像均使用矢状 T1 加权 MRI 扫 描,重复时间 (repetition time, TR) 为 4 000 ms,回 波时间 (echo time, TE) 为 85 ms,磁场为 1.5 t。平 面分辨率为 0.5 mm,厚度为 1 mm 或 1.6 mm。在 IFSI 数据集中,每个 IFS 图像 Ground Truth 由拥 有 7 年工作经验的专业医生手工标注,分别是 0 级 (正常) 图像 108 幅、1 级 (轻微) 图像 100 幅、 2 级 (显著) 图像 105 幅和 3 级 (严重) 图像 93 幅。 IFSI 数据集分级标注遵循的是 Wildermuth 椎间孔 狭窄分级诊断系统[19]。 2.2 评价标准 Nall Nr 在医学图像数据集中评估机器学习算法的多 分类性能,主要有基于患者水平和图像水平的两 种评价方法。由于 IFSI 数据集是基于图像层面 的,因此本文从图像层面评估算法的识别率。假 设 为图像验证集或测试集的图像总数量,如果 幅图像被正确分类,那么图像层面的准确率 RR 为 RR = Nr/Nall (5) 由于多分类问题中准确率不再是唯一的评价 指标,因此本文引入 F-score 作为评价本文模型的 另一个指标。与 F-score 密切相关的两个值分别 为精确度 Pr 和召回率 Rc : Pr = TP/(TP+FP) (6) Rc = TP/(TP+FN) (7) 式中:TP 为真阳性记录数;FN 为假阴性记录数; FP 为假阳性记录数。 F-score 作为调和精确度和召回率的一个综合 指标,计算公式如下: Fβ = ( β 2 +1 ) /β2Pr +Rc (8) 另外, β 用来调节两部分的比例。当 β = 1 时 , 式 (8) 退化成简单的调和平均函数,称为 F1 -score: F1 = 2PrRc Pr +Rc (9) 2.3 实验设计 为保证实验的严谨性,尽量避免特殊个例影 响最终结果,本文采用交叉验证的方式将 IFSI 数 据集平均分成 5 份,每次实验训练集和测试集比 例为 4∶1,且确保用于构建训练集的图像不再用 于测试。 本文算法采用 Caffe 模型编写基本框架[20]。 算法在 Lenovo ThinkStation、Intel e3 CPU、NVIDIA Quadro K2200 GPU 上训练,平均训练时间为 4 min 21 s,单张测试时间平均为 0.047 s。 第 4 期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·711·
·712· 智能系统学报 第14卷 2.4对比实验 表2不同方法的准确率和F统计表 为了验证本文模型的有效性,本文采用传统 Table 2 Accuracy of different methods and F statistics 机器学习算法对F$I数据集进行分类。传统机 验证集 测试集 传统分类器 方法 器学习算法主要包含两个步骤:特征提取和分 准确率 准确率 类。特征提取部分本文选取5种最先进的纹理表 LBP 49.4±2.1 51.8±2.5 0.712 示的全局算法,分别是:局部二值模式(local bin- LPQ 63.5±2.7 53.7±2.7 0.517 ary patterns,,LBP)P"、局部相位量化((local phase 1-NN GLCM 65.3±1.7 53.6±1.60.725 quantization,.LPQ)m、灰度共生矩阵(gray-level co- ORB 66.1±3.5 63.7±3.4 0.764 occurrence matrix,GLCM)2、方向梯度直方图特 HOG 51.7±1.3 61.3±0.7 0.768 (histogram of oriented gridien,HOG)ORB (ori- LBP 69.4±1.0 51.3±2.1 0.742 ented FAST and rotated BRIEF)P。5种特征描述子 LPQ 61.6±1.8 57.6±2.3 0.76 的特征维度如表1所示。 ELM GLCM 73.6±2.9 57.3±3.0 0.786 表1特征描述子及其特征向量维度列表 ORB 67.2±1.9 65.4±3.8 0.73 Table 1 Feature descriptor and feature vector dimension table HOG 63.5±2.7 61.4±1.8 0.697 描述子 特征向量维度 LBP 55.8±4.7 53.4±2.8 0.711 LBP 59 LPQ 61.4±0.4 55.1±1.5 0.723 LPQ 256 RF GLCM 74.3±3.6 56.6±2.8 0.731 9 ORB 70.1±2.5 67.6±2.4 0.693 GLCM HOG 73.8±5.0 62.0±1.5 0.665 HOG 4356 LBP 50.2±1.9 52.4±0.4 0.728 ORB 32 LPQ 71.1±6.4 56.2±2.6 0.694 本文利用4种不同的分类器来评估上述特征 SVM GLCM 69.3±1.0 54.7±3.8 0.737 集:k近邻算法(k-NN、极限学习机(extreme ORB 63.5±2.2 64.1±2.4 0.807 learning machine,ELM)2o、支持向量机(support HOG 73.4±0.8 64.7±1.1 0.81 vector machine,.SVM2)以及随机森林算法(ran- LeNet-5 79.375%±1.378.5±2.1 0.614 dom forest,,RF)2。 Alex-Net 65.2%±3.8 63.7±0.7 0.739 2.5实验结果 深度学习 GoogLeNet91.6%±1.1 46.3±1.40.51 2.5.1FS-Net与传统机器学习算法性能对比结果 模型 IFS-Net 82.15%±1.781.2±1.6 0.763 为验证本文算法在FSI数据集上的多分类性 能,将其与具有代表性的4种传统机器学习分类 IFS-Net+TL*87.5%±2.386.375±1.80.857 器算法(k-NN、ELM、SVM和RF)对比分析,实验 注:TL*为Transfer Learning 结果如表2所示。 HOG■ORB ■GLCM■LPQ■LBP 在测试集准确度和F,两个评价指标上,本文 SVM 设计的IFS-Net算法模型的结果明显优于传统机 器学习算法所取得的结果。由图3传统机器学习 算法(特征描述子+分类器)分类准确率对比图, ELM 可更直观地看出,传统机器学习方法中,选取的 特征向量在分类性能上都表现出稳定接近的结 I-NN 果,4种传统分类器对于每个特征描述子的识别 20 40 60 80 精确度 率差距都在4%之内。值得一提的是,ORB虽然 为关键点描述符且通常用于对象识别,但其在微 图3 传统机器学习算法(特征描述子+分类器)分类准确 率对比 观图像分类问题上获得了比传统纹理特征更优的 Fig.3 The classification accuracy of traditional machine 结果。 learning algorithm(feature descriptor classifier)
2.4 对比实验 为了验证本文模型的有效性,本文采用传统 机器学习算法对 IFSI 数据集进行分类。传统机 器学习算法主要包含两个步骤:特征提取和分 类。特征提取部分本文选取 5 种最先进的纹理表 示的全局算法,分别是:局部二值模式 (local binary patterns,LBP)[21] 、局部相位量化 (local phase quantization,LPQ)[22] 、灰度共生矩阵 (gray-level cooccurrence matrix,GLCM)[23] 、方向梯度直方图特 征 (histogram of oriented gridien,HOG)、ORB (oriented FAST and rotated BRIEF)[24]。5 种特征描述子 的特征维度如表 1 所示。 表 1 特征描述子及其特征向量维度列表 Table 1 Feature descriptor and feature vector dimension table 描述子 特征向量维度 LBP 59 LPQ 256 GLCM 8 HOG 4 356 ORB 32 本文利用 4 种不同的分类器来评估上述特征 集:k 近邻算法 (k-NN)[25] 、极限学习机 (extreme learning machine,ELM)[26] 、支持向量机 (support vector machine,SVM)[27] 以及随机森林算法 (random forest,RF)[28]。 2.5 实验结果 2.5.1 IFS-Net 与传统机器学习算法性能对比结果 为验证本文算法在 IFSI 数据集上的多分类性 能,将其与具有代表性的 4 种传统机器学习分类 器算法 (k-NN、ELM、SVM 和 RF) 对比分析,实验 结果如表 2 所示。 在测试集准确度和 F1 两个评价指标上,本文 设计的 IFS-Net 算法模型的结果明显优于传统机 器学习算法所取得的结果。由图 3 传统机器学习 算法 (特征描述子+分类器) 分类准确率对比图, 可更直观地看出,传统机器学习方法中,选取的 特征向量在分类性能上都表现出稳定接近的结 果,4 种传统分类器对于每个特征描述子的识别 率差距都在 4% 之内。值得一提的是,ORB 虽然 为关键点描述符且通常用于对象识别,但其在微 观图像分类问题上获得了比传统纹理特征更优的 结果。 表 2 不同方法的准确率和 F1 统计表 Table 2 Accuracy of different methods and F1 statistics 传统分类器 方法 验证集 准确率 测试集 准确率 F1 1-NN LBP 49.4 ±2.1 51.8±2.5 0.712 LPQ 63.5 ±2.7 53.7±2.7 0.517 GLCM 65.3 ±1.7 53.6 ± 1.6 0.725 ORB 66.1 ±3.5 63.7±3.4 0.764 HOG 51.7 ±1.3 61.3±0.7 0.768 ELM LBP 69.4 ±1.0 51.3±2.1 0.742 LPQ 61.6 ±1.8 57.6±2.3 0.76 GLCM 73.6 ±2.9 57.3±3.0 0.786 ORB 67.2 ±1.9 65.4±3.8 0.73 HOG 63.5 ±2.7 61.4±1.8 0.697 RF LBP 55.8 ±4.7 53.4±2.8 0.711 LPQ 61.4 ±0.4 55.1±1.5 0.723 GLCM 74.3 ±3.6 56.6±2.8 0.731 ORB 70.1 ±2.5 67.6±2.4 0.693 HOG 73.8 ±5.0 62.0±1.5 0.665 SVM LBP 50.2 ±1.9 52.4±0.4 0.728 LPQ 71.1 ±6.4 56.2±2.6 0.694 GLCM 69.3 ±1.0 54.7±3.8 0.737 ORB 63.5 ±2.2 64.1±2.4 0.807 HOG 73.4 ±0.8 64.7±1.1 0.81 深度学习 模型 LeNet-5 79.375%±1.3 78.5 ± 2.1 0.614 Alex-Net 65.2%±3.8 63.7 ± 0.7 0.739 GoogLeNet 91.6%±1.1 46.3 ± 1.4 0.51 IFS-Net 82.15%±1.7 81.2 ± 1.6 0.763 IFS-Net+TL* 87.5%±2.3 86.375±1.8 0.857 注:TL*为Transfer Learning SVM RF ELM 1-NN 特征描述子 0 20 40 60 80 精确度 HOG ORB GLCM LPQ LBP 图 3 传统机器学习算法 (特征描述子+分类器) 分类准确 率对比 Fig. 3 The classification accuracy of traditional machine learning algorithm (feature descriptor + classifier) ·712· 智 能 系 统 学 报 第 14 卷
第4期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·713· 2.5.2FS-Nt与其他深度学习算法性能对比结果 分析中的性能,本研究在F$I数据集上做了不同 本文算法与其他典型深度学习算法在IF- F$图像狭窄度识别分析测试实验,实验结果如 SI数据集上的分类性能对比实验结果,如图4所 表3所示。实验结果表明,FS-Net算法对FSI数 示。实验中,FS-Net取得了87.5%的分类精度结 据集中的0级和3级的区分度最高,1级分类结 果,明显优于其他深度学习算法。该图还直观地 果较差。分析其原因,主要是1级图像中的椎间 显示出本文算法的验证集和测试集几乎具有相 孔是在两个相对方向(垂直或横向)的脂肪闭塞 同的精确度,这表明IFS-Net模型具有较强的泛 引起的轻度口部狭窄,没有显示神经根的形态学 化和避免过拟合的能力。而由于数据集的限制, 变化叨,因此容易被误分为C(正常类)。另外,虽 层数过深的卷积神经网络在FSI数据集上没有 然2级椎间孔也没有表现出形态学上的变化,但 表现出层级优势,如GoogLe-Net模型出现的严 其周围结构的变化使得算法可以挖掘出潜在特征 重的过拟合现象,就是由于其过于复杂的结构造 并对特征进行相关性建模实现精准分类,说明本 成的,这也是本文采用较为简单网络结构的一个 文模型具有提取微小病变特征的能力,能够将不 原因。另外,采用迁移学习+微调训练策略的分 同级别的疾病“症状”特征与FS分级之间建立起 类精度高于自训练2.5%。如图5不同模型 特殊的“病理”联系。 loss曲线拟合度对比所示,从IFS-Net和IFS-Net+ 表3FS-Net算法狭窄度分类结果混淆矩阵 TL两个模型的train-loss和val-loss曲线图可以看 Table 3 A hybrid matrix of the classification results of 出,采用迁移学习方法能够降低模型的过拟合 IFS-Net algorithm 程度。 狭窄度类别 Co C C3 ACC/% 一训练精确度一测试精确度一F, Co 24 0 0 2 92.31 LeNet-5 C 4 16 3 2 71.54 C 4 0 21 0 84 70809% C3 0 0 22 88 IFS-Net+TL Alex-Net 3结束语 为提高计算机辅助椎间孔狭窄症诊断准确率 及工作效率,本文提出并设计出一种基于深度学 IFS-Net Google-Net 习的椎间孔狭窄图像自动多分级模型。并且在基 图4不同深度学习模型算法性能对比 于设计的IFS-Net模型基础上,采用迁移学习有效 Fig.4 Performance comparison of different depth learn- ing model algorithms 提升了网络分类性能。实验结果表明,本文设计 的模型不仅结构简单,且分类性能高效,可为临床 1.8 train-lossl FIS-Net模型 辅助诊断及分级提供有效的技术支撑。本研究中 1.6 -val-loss1 1.4 train-loss2 迁移学习的特定引入方式以及数据联合训练的应 数2月 FIS-Net+TL*模型 val-loss2 1. 用方法,对于医学影像微观数据集分析及多分类 0.8 任务具有一定的参考价值。在后续的研究工作 三0.6 中,将针对椎间孔狭窄图像多分级工作,融合特定 0.4 0.2 的形态解剖学特征,研究设计性能更优的深度学 习模型算法,进一步提高分类识别的性能,给临床 0 5 101520253035 迭代步数 提供更有效的辅助诊断技术。 图5不同训练策略1oss曲线拟合度对比 参考文献: Fig.5 Different training strategy models loss curve fitting degree comparison chart [1]KANEKO Y,MATSUMOTO M,TAKAISHI H,et al. 2.5.3FS图像狭窄度识别分析结果 Morphometric analysis of the lumbar intervertebral fora- 为进一步测试IFS-Net算法在狭窄程度识别 men in patients with degenerative lumbar scoliosis by mul-
2.5.2 IFS-Net 与其他深度学习算法性能对比结果 本文算法与其他典型深度学习算法在 IFSI 数据集上的分类性能对比实验结果,如图 4 所 示。实验中,IFS-Net 取得了 87.5% 的分类精度结 果,明显优于其他深度学习算法。该图还直观地 显示出本文算法的验证集和测试集几乎具有相 同的精确度,这表明 IFS-Net 模型具有较强的泛 化和避免过拟合的能力。而由于数据集的限制, 层数过深的卷积神经网络在 IFSI 数据集上没有 表现出层级优势,如 GoogLe-Net 模型出现的严 重的过拟合现象,就是由于其过于复杂的结构造 成的,这也是本文采用较为简单网络结构的一个 原因。另外,采用迁移学习+微调训练策略的分 类精度高于自训 练 2.5%。 如 图 5 不同模型 loss 曲线拟合度对比所示,从 IFS-Net 和 IFS-Net + TL 两个模型的 train-loss 和 val-loss 曲线图可以看 出,采用迁移学习方法能够降低模型的过拟合 程度。 LeNet-5 IFS-Net+TL Alex-Net IFS-Net Google-Net 100.00% 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 训练精确度 测试精确度 F1 图 4 不同深度学习模型算法性能对比 Fig. 4 Performance comparison of different depth learning model algorithms 1.8 1.6 1.4 1.2 1.0 0.8 0.6 0.4 0.2 训练损失 0 5 10 15 20 25 30 35 迭代步数 train-loss1 val-loss1 train-loss2 val-loss2 FIS-Net 模型 FIS-Net+TL* 模型 图 5 不同训练策略 loss 曲线拟合度对比 Fig. 5 Different training strategy models loss curve fitting degree comparison chart 2.5.3 IFS 图像狭窄度识别分析结果 为进一步测试 IFS-Net 算法在狭窄程度识别 分析中的性能,本研究在 IFSI 数据集上做了不同 IFS 图像狭窄度识别分析测试实验,实验结果如 表 3 所示。实验结果表明,IFS-Net 算法对 IFSI 数 据集中的 0 级和 3 级的区分度最高,1 级分类结 果较差。分析其原因,主要是 1 级图像中的椎间 孔是在两个相对方向 (垂直或横向) 的脂肪闭塞 引起的轻度口部狭窄,没有显示神经根的形态学 变化[19] ,因此容易被误分为 C0 (正常类)。另外,虽 然 2 级椎间孔也没有表现出形态学上的变化,但 其周围结构的变化使得算法可以挖掘出潜在特征 并对特征进行相关性建模实现精准分类,说明本 文模型具有提取微小病变特征的能力,能够将不 同级别的疾病“症状”特征与 IFS 分级之间建立起 特殊的“病理”联系。 表 3 IFS-Net 算法狭窄度分类结果混淆矩阵 Table 3 A hybrid matrix of the classification results of IFS-Net algorithm 狭窄度类别 C0 C1 C2 C3 ACC/% C0 24 0 0 2 92.31 C1 4 16 3 3 71.54 C2 4 0 21 0 84 C3 0 0 3 22 88 3 结束语 为提高计算机辅助椎间孔狭窄症诊断准确率 及工作效率,本文提出并设计出一种基于深度学 习的椎间孔狭窄图像自动多分级模型。并且在基 于设计的 IFS-Net 模型基础上,采用迁移学习有效 提升了网络分类性能。实验结果表明,本文设计 的模型不仅结构简单,且分类性能高效,可为临床 辅助诊断及分级提供有效的技术支撑。本研究中 迁移学习的特定引入方式以及数据联合训练的应 用方法,对于医学影像微观数据集分析及多分类 任务具有一定的参考价值。在后续的研究工作 中,将针对椎间孔狭窄图像多分级工作,融合特定 的形态解剖学特征,研究设计性能更优的深度学 习模型算法,进一步提高分类识别的性能,给临床 提供更有效的辅助诊断技术。 参考文献: KANEKO Y, MATSUMOTO M, TAKAISHI H, et al. Morphometric analysis of the lumbar intervertebral foramen in patients with degenerative lumbar scoliosis by mul- [1] 第 4 期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·713·
·714· 智能系统学报 第14卷 tidetector-row computed tomography[J].European spine [12]VERBIEST H.Results of surgical treatment of idiopathic journal,2012,21(12):2594-2602 developmental stenosis of the lumbar vertebral canal.A [2]RAJAEE S S.BAE H W.KANIM L E.et al.Spinal fusion review of twenty-seven years'experience[J].The journal in the united states:analysis of trends from 1998 to of bone and joint surgery,1977,59(2):181-188. 2008[J】.Spine,2012.37(1):67-76. [13]LO S C B,LOU S L A,LIN J S,et al.Artificial convolu- [3]LEE S,LEE J W,YEOM J S,et al.A practical MRI grad- tion neural network techniques and applications for lung ing system for lumbar foraminal stenosis[J].American nodule detection[J].IEEE transactions on medical ima- journal of roentgenology,2010,194(4):1095-1098. ging1995,14(4)711-718. [4]HAN Zhongyi,WEI Benzheng,LEUNG S,et al.Auto- [14]LITJENS G,KOOI T,BEJNORDI B E,et al.A survey on mated pathogenesis-based diagnosis of lumbar neural fo- deep learning in medical image analysis[J].Medical im- raminal stenosis via deep multiscale multitask learning[J]. age analysis,2017,42(9):60-88. Neuroinformatics,2018,16(3/4):325-337. [15]WANG Xiaosong,PENG Yifan,LU Le,et al.ChestX- [5]ALOMARI R S,CORSO J J,CHAUDHARY V.Labeling Ray8:Hospital-scale chest x-ray database and bench- of lumbar discs using both pixel-and object-level features marks on weakly-supervised classification and localiza- with a two-level probabilistic model[J].IEEE transactions tion of common thorax diseases[C]//Proceeding of 2017 on medical imaging,2011,30(1):1-10. IEEE Conference on Computer Vision and Pattern Recog- [6]ZHAN Yigiang,MANEESH D,HARDER M,et al.Ro- nition.Honolulu,USA,2017:3462-3471. bust MR spine detection using hierarchical learning and [16]SHEN Dinggang,WU Guorong,SUK H I.Deep learning local articulated model[C]//Proceedings of the 15th Inter- in medical image analysis[J.Annual review of biomedic- national Conference on Medical Image Computing and al engineering,2017,19:221-248. Computer-Assisted Intervention.Nice,France,2012: [17]BENGIO Y,DELALLEAU O.On the expressive power 141-148,D0L:10.1007/978-3-642-33415-318 of deep architectures[Cl//Proceedings of the 22nd Interna- [7]WANG Zhijie,ZHEN Xiantong,TAY K,et al.Regression tional Conference on Algorithmic Learning Theory.Es- segmentation for M3 spinal images[J].IEEE transactions poo,Finland,2011:18-36. on medical imaging,2015,34(8):1640-1648 [18]PAN S J,YANG Qiang.A survey on transfer learning[]. [8]GHOSHA S.ALOMARI R S.CHAUDHARY V.et al. IEEE Transactions on Knowledge and Data Engineering Automatic lumbar vertebra segmentation from clinical CT 2010,22(10):1345-1359 for wedge compression fracture diagnosis[C]//Proceedings [19]WILDERMUTH S,ZANETTI M,DUEWELL S,et al. of the SPIE 7963,Medical Imaging 2011:Computer-Aided Magnetic resonance imaging and magnetic resonance my- Diagnosis.Lake Buena Vista(Orlando),United States, elography in the presurgical diagnosis of lumbar foramin- 2011:796303,D0L:10.1117/12.878055 al stenosis [J].Spine,2007,32(8):896-903. [9]HUANG S H,CHU Yihong,LAI Shanghong,et al.Learn- [20]JIA Yangqing,SHELHAMER E,DONAHUE J,et al. ing-based vertebra detection and iterative normalized-cut Caffe:convolutional architecture for fast feature embed- segmentation for spinal MRI[J].IEEE transactions on med- ding[C]//Proceedings of the 22nd ACM International ical imaging,2009,28(10):1595-1605 Conference on Multimedia.Orlando,USA,2014: [10]KLINDER T,WOLZ R,LORENZ C,et al.Spine seg- 675-678. mentation using articulated shape models[C]//Proceed- [21]OJALA T,PIETIKAINEN M,MAENPAA T.Multiresol- ings of the 1Ith International Conference on Medical Im- ution gray-scale and rotation invariant texture classifica- age Computing and Computer-Assisted Intervention.New tion with local binary patterns[J].IEEE transactions on York,USA,2008:227-234. pattern analysis and machine intelligence,2002,24(7): [11]HE Xiaoxu,YIN Yilong,SHARMA M,et al.Automated 971-987. diagnosis of neural foraminal stenosis using synchronized [22]GUO Zhenhua,ZHANG Lei,ZHANG D.A completed superpixels representation[C]//Proceedings of the 19th In- modeling of local binary pattern operator for texture clas- ternational Conference on Medical Image Computing and sification[J].IEEE transactions on image processing, Computer-Assisted Intervention.Athens,Greece,2016: 2010,196:1657-1663. 335-343 [23]HONG Huichao,ZHENG Lixin,PAN Shuwan.Fast com-
tidetector-row computed tomography[J]. European spine journal, 2012, 21(12): 2594–2602. RAJAEE S S, BAE H W, KANIM L E, et al. Spinal fusion in the united states: analysis of trends from 1998 to 2008[J]. Spine, 2012, 37(1): 67–76. [2] LEE S, LEE J W, YEOM J S, et al. A practical MRI grading system for lumbar foraminal stenosis[J]. American journal of roentgenology, 2010, 194(4): 1095–1098. [3] HAN Zhongyi, WEI Benzheng, LEUNG S, et al. Automated pathogenesis-based diagnosis of lumbar neural foraminal stenosis via deep multiscale multitask learning[J]. Neuroinformatics, 2018, 16(3/4): 325–337. [4] ALOMARI R S, CORSO J J, CHAUDHARY V. Labeling of lumbar discs using both pixel- and object-level features with a two-level probabilistic model[J]. IEEE transactions on medical imaging, 2011, 30(1): 1–10. [5] ZHAN Yiqiang, MANEESH D, HARDER M, et al. Robust MR spine detection using hierarchical learning and local articulated model[C]//Proceedings of the 15th International Conference on Medical Image Computing and Computer-Assisted Intervention. Nice, France, 2012: 141–148, DOI: 10.1007/978-3-642-33415-3_18. [6] WANG Zhijie, ZHEN Xiantong, TAY K, et al. Regression segmentation for M3 spinal images[J]. IEEE transactions on medical imaging, 2015, 34(8): 1640–1648. [7] GHOSHA S, ALOMARI R S, CHAUDHARY V, et al. Automatic lumbar vertebra segmentation from clinical CT for wedge compression fracture diagnosis[C]//Proceedings of the SPIE 7963, Medical Imaging 2011: Computer-Aided Diagnosis. Lake Buena Vista (Orlando), United States, 2011: 796303, DOI: 10.1117/12.878055. [8] HUANG S H, CHU Yihong, LAI Shanghong, et al. Learning-based vertebra detection and iterative normalized-cut segmentation for spinal MRI[J]. IEEE transactions on medical imaging, 2009, 28(10): 1595–1605. [9] KLINDER T, WOLZ R, LORENZ C, et al. Spine segmentation using articulated shape models[C]//Proceedings of the 11th International Conference on Medical Image Computing and Computer-Assisted Intervention. New York, USA, 2008: 227–234. [10] HE Xiaoxu, YIN Yilong, SHARMA M, et al. Automated diagnosis of neural foraminal stenosis using synchronized superpixels representation[C]//Proceedings of the 19th International Conference on Medical Image Computing and Computer-Assisted Intervention. Athens, Greece, 2016: 335–343. [11] VERBIEST H. Results of surgical treatment of idiopathic developmental stenosis of the lumbar vertebral canal. A review of twenty-seven years' experience[J]. The journal of bone and joint surgery, 1977, 59(2): 181-188. [12] LO S C B, LOU S L A, LIN J S, et al. Artificial convolution neural network techniques and applications for lung nodule detection[J]. IEEE transactions on medical imaging, 1995, 14(4): 711–718. [13] LITJENS G, KOOI T, BEJNORDI B E, et al. A survey on deep learning in medical image analysis[J]. Medical image analysis, 2017, 42(9): 60–88. [14] WANG Xiaosong, PENG Yifan, LU Le, et al. ChestXRay8: Hospital-scale chest x-ray database and benchmarks on weakly-supervised classification and localization of common thorax diseases[C]//Proceeding of 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA, 2017: 3462–3471. [15] SHEN Dinggang, WU Guorong, SUK H I. Deep learning in medical image analysis[J]. Annual review of biomedical engineering, 2017, 19: 221–248. [16] BENGIO Y, DELALLEAU O. On the expressive power of deep architectures[C]//Proceedings of the 22nd International Conference on Algorithmic Learning Theory. Espoo, Finland, 2011: 18–36. [17] PAN S J, YANG Qiang. A survey on transfer learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10): 1345–1359. [18] WILDERMUTH S, ZANETTI M, DUEWELL S, et al. Magnetic resonance imaging and magnetic resonance myelography in the presurgical diagnosis of lumbar foraminal stenosis [J]. Spine, 2007, 32(8): 896-903. [19] JIA Yangqing, SHELHAMER E, DONAHUE J, et al. Caffe: convolutional architecture for fast feature embedding[C]//Proceedings of the 22nd ACM International Conference on Multimedia. Orlando, USA, 2014: 675–678. [20] OJALA T, PIETIKÄINEN M, MÄENPÄÄ T. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(7): 971–987. [21] GUO Zhenhua, ZHANG Lei, ZHANG D. A completed modeling of local binary pattern operator for texture classification[J]. IEEE transactions on image processing, 2010, 19(6): 1657–1663. [22] [23] HONG Huichao, ZHENG Lixin, PAN Shuwan. Fast com- ·714· 智 能 系 统 学 报 第 14 卷
第4期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·715· putational technique for gray-level co-occurrence matrix 作者简介: based on graphics process unit in biomedical engineering 洪雁飞,女,1994年生.硕士研究 applications[J].Journal of medical imaging and health in- 生,主要研究方向为医学影像分析和 formatics,.2018.8(2):309-312 机器学习算法。 [24]RUBLEE E,RABAUD V,KONOLIGE K,et al.ORB:an efficient alternative to SIFT or SURF[C]//Proceedings of 2011 International Conference on Computer Vision.Bar- celona,Spain,2011:2564-2571. 魏本征,男,1976年生.教授,主 [25]SAHAN S,POLAT K,KODAZ H,et al.A new hybrid 要研究方向为医学图像处理、机器学 method based on fuzzy-artificial immune system and k-nn 习、计算医学和医学信息工程。发表 algorithm for breast cancer diagnosis[J].Computers in 学术论文60余篇。 biology and medicine,2007,37(3):415-423. [26]WONG P K,GAO Xianghui,WONG K I,et al.Online extreme learning machine based modeling and optimiza- tion for point-by-point engine calibration[J].Neurocom- 刘川.男,1972年生,副教授,主 puting,2018,277:187-197. 要研究方向为中医骨伤学和中医药文 [27]CORTES C,VAPNIK V.Support-vector networks[J]. 化社会学。 Machine learning,1995,20(3):273-297. [28]BREIMAN L.Random forests[J].Machine Learning, 2001,45(15-32
putational technique for gray-level co-occurrence matrix based on graphics process unit in biomedical engineering applications[J]. Journal of medical imaging and health informatics, 2018, 8(2): 309–312. RUBLEE E, RABAUD V, KONOLIGE K, et al. ORB: an efficient alternative to SIFT or SURF[C]//Proceedings of 2011 International Conference on Computer Vision. Barcelona, Spain, 2011: 2564–2571. [24] ŞAHAN S, POLAT K, KODAZ H, et al. A new hybrid method based on fuzzy-artificial immune system and k-nn algorithm for breast cancer diagnosis[J]. Computers in biology and medicine, 2007, 37(3): 415-423. [25] WONG P K, GAO Xianghui, WONG K I, et al. Online extreme learning machine based modeling and optimization for point-by-point engine calibration[J]. Neurocomputing, 2018, 277: 187–197. [26] CORTES C, VAPNIK V. Support-vector networks[J]. Machine learning, 1995, 20(3): 273–297. [27] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5–32. [28] 作者简介: 洪雁飞,女,1994 年生,硕士研究 生,主要研究方向为医学影像分析和 机器学习算法。 魏本征,男,1976 年生,教授,主 要研究方向为医学图像处理、机器学 习、计算医学和医学信息工程。发表 学术论文 60 余篇。 刘川,男,1972 年生,副教授,主 要研究方向为中医骨伤学和中医药文 化社会学。 第 4 期 洪雁飞,等:基于深度学习的椎间孔狭窄自动多分级研究 ·715·