【机器感知与模式识别】迁移学习特征提取的rs-fMRI早期轻度认知障碍分类

团购合买资源类别：文库，文档格式：PDF，文档页数：11，文件大小：5.47MB

第16卷第4期智能系统学报 Vol.16 No.4 2021年7月 CAAI Transactions on Intelligent Systems Jul.2021 D0:10.11992tis.202007041 网络出版地址：https:/kns.cnki.net/kcms/detail/23.1538.TP.20210412.1113.002.html 迁移学习特征提取的rs-MRI早期轻度认知障碍分类孔伶旭，吴海锋2，曾玉2，陆小玲，罗金玲 (1.云南民族大学电气信息工程学院，云南昆明650500：2.云南省高校智能传感网络及信息系统创新团队，云南昆明650500) 摘要：早期轻度认知障碍(early mild cognitive impairment,.EMC)是阿尔兹海默症(Alzheimer's disease, AD)发生前的必经阶段，EMCI的准确诊断对AD早期预防和治疗都具有积极作用。通过静息态功能性磁共振成像(rest-state functional magnetic resonance imaging,rs-fMR)来诊断EMCI的深度学习方法性能主要依赖如何提取特征值，而传统提取方法存在特征信息易损失和训练网络时间过长等问题。针对该问题，本文采用迁移学习的特征提取方法来对EMCI分类，首先从rs-fMRI中提取兴趣区(region of interest,ROD时间序列，以此完成源数据的降维，然后利用MobileNet迁移网络从ROI中提取瓶颈特征，最后将该特征输入到设计的分类顶层网络以得到最后分类结果。在实验中，采用阿尔茨海默病神经影像学数据库(Alzheimer's disease neuroimaging initi-- ative,ADNI)的数据进行测试.实验结果表明，本文的方法比传统方法的分类精度提高了约10%，而分类时间大约只有传统方法的25%。关键词：轻度认知障碍；rs-fMRL;迁移学习；阿尔茨海默症；MobileNet;深度学习；机器学习：兴趣区中图分类号：TP391.41文献标志码：A文章编号：1673-4785(2021)04-0662-11 中文引用格式：孔伶旭，吴海锋，曾玉，等.迁移学习特征提取的s-MRI早期轻度认知障碍分类.智能系统学报，2021， 16(4):662-672. 英文引用格式：KONG Lingxu,WU Haifeng,ZENGYu,.etal.Transfer learning-based feature extraction method for the classifica- tion of rs-fMRI early mild cognitive impairment J.CAAI transactions on intelligent systems,2021,16(4):662-672. Transfer learning-based feature extraction method for the classification of rs-fMRI early mild cognitive impairment KONG Lingxu',WU Haifeng2,ZENG Yu2,LU Xiaoling',LUO Jinling' (1.School of Electrical and Information Technology,Yunnan Minzu University,Kunming 650500,China;2.Program for Innovative Research Team(in Science and Technology)in University of Yunnan Province,Kunming 650500,China) Abstract:Early mild cognitive impairment(EMCI)is a necessary stage before Alzheimer's disease(AD).Thus,accur- ate diagnosis of EMCI will help the early prevention and treatment of AD.The performance of the deep learning meth- od for the diagnosis of EMCI through rest-state functional magnetic resonance imaging (rs-fMRI)mainly depends on how feature values are extracted.However,traditional extraction methods have problems,such as loss of feature inform- ation and long training network time.To address these problems,this paper proposes a transfer learning-based feature extraction method for EMCI classification.First,the region of interest (ROI)time series is extracted from rs-fMRI to complete the dimensional reduction of source data.Second,bottleneck features are extracted from the ROI by using a transfer learning MobileNet.Lastly,a final classification result is obtained from those entered features into a designed top-layer net.The data of the Alzheimer's Disease Neuroimaging Initiative are tested through experiments.Experiment- al results show that compared with traditional methods,the classification accuracy of the proposed method is enhanced by around 10%,and 75%or so of classification time is saved. Keywords:EMCI;rs-fMRI;transfer learning;Alzheimer's disease;MobileNet;deep learning;machine learning;region of interest 收稿日期：2020-07-24.网络出版日期：2021-04-12. 基金项目：国家自然科学基金项目(61762093)：云南省教育厅阿尔兹海默症(Alzheimer's disease,AD)是最科学研究基金项目(2020Y0238,云南省重点应用和基础常见的一种老年痴呆症，占所有痴呆症的60%~ 研究基金项目(2018FA036). 通信作者：吴海锋.E-mail:whf5469@gmail.com 70%山。AD的形成原因尚未完全研究清楚四，目

DOI: 10.11992/tis.202007041 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20210412.1113.002.html 迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类孔伶旭1 ，吴海锋1,2，曾玉1,2，陆小玲1 ，罗金玲1 （1. 云南民族大学电气信息工程学院，云南昆明 650500; 2. 云南省高校智能传感网络及信息系统创新团队，云南昆明 650500）摘要：早期轻度认知障碍 (early mild cognitive impairment, EMCI) 是阿尔兹海默症 (Alzheimer’s disease, AD) 发生前的必经阶段，EMCI 的准确诊断对 AD 早期预防和治疗都具有积极作用。通过静息态功能性磁共振成像 (rest-state functional magnetic resonance imaging，rs-fMRI) 来诊断 EMCI 的深度学习方法性能主要依赖如何提取特征值，而传统提取方法存在特征信息易损失和训练网络时间过长等问题。针对该问题，本文采用迁移学习的特征提取方法来对 EMCI 分类，首先从 rs-fMRI 中提取兴趣区 (region of interest, ROI) 时间序列，以此完成源数据的降维，然后利用 MobileNet 迁移网络从 ROI 中提取瓶颈特征，最后将该特征输入到设计的分类顶层网络以得到最后分类结果。在实验中，采用阿尔茨海默病神经影像学数据库 (Alzheimer’s disease neuroimaging initiative，ADNI) 的数据进行测试，实验结果表明，本文的方法比传统方法的分类精度提高了约 10%，而分类时间大约只有传统方法的 25%。关键词：轻度认知障碍；rs-fMRI；迁移学习；阿尔茨海默症；MobileNet；深度学习；机器学习；兴趣区中图分类号：TP391.41 文献标志码：A 文章编号：1673−4785(2021)04−0662−11 中文引用格式：孔伶旭, 吴海锋, 曾玉, 等. 迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类 [J]. 智能系统学报, 2021, 16(4): 662–672. 英文引用格式：KONG Lingxu, WU Haifeng, ZENG Yu, et al. Transfer learning-based feature extraction method for the classification of rs-fMRI early mild cognitive impairment[J]. CAAI transactions on intelligent systems, 2021, 16(4): 662–672. Transfer learning-based feature extraction method for the classification of rs-fMRI early mild cognitive impairment KONG Lingxu1 ，WU Haifeng1,2 ，ZENG Yu1,2 ，LU Xiaoling1 ，LUO Jinling1 (1. School of Electrical and Information Technology, Yunnan Minzu University, Kunming 650500, China; 2. Program for Innovative Research Team (in Science and Technology) in University of Yunnan Province, Kunming 650500, China) Abstract: Early mild cognitive impairment (EMCI) is a necessary stage before Alzheimer’s disease (AD). Thus, accurate diagnosis of EMCI will help the early prevention and treatment of AD. The performance of the deep learning method for the diagnosis of EMCI through rest-state functional magnetic resonance imaging (rs-fMRI) mainly depends on how feature values are extracted. However, traditional extraction methods have problems, such as loss of feature information and long training network time. To address these problems, this paper proposes a transfer learning-based feature extraction method for EMCI classification. First, the region of interest (ROI) time series is extracted from rs-fMRI to complete the dimensional reduction of source data. Second, bottleneck features are extracted from the ROI by using a transfer learning MobileNet. Lastly, a final classification result is obtained from those entered features into a designed top-layer net. The data of the Alzheimer’s Disease Neuroimaging Initiative are tested through experiments. Experimental results show that compared with traditional methods, the classification accuracy of the proposed method is enhanced by around 10%, and 75% or so of classification time is saved. Keywords: EMCI; rs-fMRI; transfer learning; Alzheimer’s disease; MobileNet; deep learning; machine learning; region of interest 阿尔兹海默症 (Alzheimer's disease，AD) 是最常见的一种老年痴呆症，占所有痴呆症的 60%~ 70%[1]。AD 的形成原因尚未完全研究清楚[1] ，目收稿日期：2020−07−24. 网络出版日期：2021−04−12. 基金项目：国家自然科学基金项目 (61762093)；云南省教育厅科学研究基金项目 (2020Y0238)；云南省重点应用和基础研究基金项目 (2018FA036). 通信作者：吴海锋. E-mail：whf5469@gmail.com. 第 16 卷第 4 期智能系统学报 Vol.16 No.4 2021 年 7 月 CAAI Transactions on Intelligent Systems Jul. 2021

第4期孔伶旭，等：迁移学习特征提取的s-fMRI早期轻度认知障碍分类 ·663· 前还没有任何药物可以阻止或逆转其发展，只有 1相关工作在AD早期时通过一些治疗来改善症状和干预其进一步的恶化，从而减轻患者的病情和延长存 AD症被视为一种神经退化性疾病，疾病早活时间。因此，AD的早期诊断对于该疾病的治期的症状常被误认为是正常的老化，错过了最佳疗具有非常积极的作用。在AD发病之前，患者诊断时机。AD症的前期诊断一般通过病史收集会经历早期轻度认知障碍(early mild cognitive 和行为观察获得，耗时又耗力。若要较为准确的 impairment,EMCI),该阶段是老年正常认知衰退诊断，则需要进行详细的神经心理学检查才有可和痴呆症严重认知衰退的中间阶段，此时的大脑能判断是否存在认知障碍。随着机器学习技术已具有轻微的认知和记忆障碍，但不会影响患者的发展，人们发现作为一种辅助诊断方法，机器学习可以提高诊断的效率和准确率。的日常生活，因此在临床检测中很难被发现。已在传统的机器学习分类技术中，支持向量机有研究表明，患有EMCI的个体患AD的风险高于正常人，约为正常人的10倍。因此，准确诊 (support vector machine,.SVM)是一类具有较高分类准确率的诊断方法，但SVM的准确率依赖于断EMCI对AD的治疗有着十分积极的作用。提取的特征值，当特征值本身未能准确反映疾病目前，较准确的EMCI诊断方法为生物标志的特征，则其准确率往往会达到一个瓶颈。近年物诊断，如通过脑脊髓液完成，然而脑脊髓液抽来随着深度学习的兴起，出现了很多可以自动从取属有创诊断，且诊断过程也较为复杂。另外一分类数据中提取有效特征值的方法，如堆叠自动种对EMCI的诊断方法是让患者完成神经心理学编码器(stacked auto-encoders,SAE)和CNNl6 问卷四，再经神经心理学医师进行评估，但这种诊等，这些方法均使得分类准确率得到了很大的提断往往带有一定主观性，只能作为一种辅助诊断高。通常，深度学习的网络较为复杂，权重数量方式。近年来，随着神经影像技术的发展，具有巨大，且需要海量的训练数据作支持，这都使得无创的核磁共振成像(magnetic resonance imaging, 深度学习的训练耗时耗力。然而，公开的AD病 MRI)和功能性磁共振成像(functional magnetic 症数据非常有限，AD早期病症的数据更为稀少， resonance imaging,fMRI)）技术被越来越多的用于因此深度学习的分类准确率将严重依赖于疾病数 AD的诊断中s。fMRI反映了受试者执行特定任据的完备性。为了解决该问题，近年来迁移学习被务时血氧水平依赖(blood oxygen level dependent, 提出来对AD进行诊断，例如AlexNet"和VGG16m BOLD)信号的波动情况，相比MRI数据，其不仅等。由于迁移学习网络已在其他数据库进行了预包含结构性信息还包含功能性信息，只是获取训练，只需在AD数据库中只训练其顶层即可，因 fMRI数据需要设计合理的实验任务。为避免实此可以缩短训练时间，并可减少分类对训练数据验任务因素对MRI数据的影响，越来越多的研的依赖。然而，迁移学习的预训练网络是否对究o表明静息态fMRI(resting state fMRI,.rs- EMCI的诊断有效，目前仍无文献进行报道，这也 fMRI)可替代fMRI来完成EMCI的诊断。由是本文关注的一个重点。于在rs-fMRI数据获取时受试者不用完成任何机器学习可以同神经影像学相结合以完成疾特定任务，因此避免了实验任务对数据所带来的病的诊断，常用的影像技术包括电子计算机断层影响。扫描(computed tomography,CT)、正电子发射型计本文采用深度学习的分类方法，通过rs 算机断层显像(positron emission computed tomo- fMRI数据来进行EMCI分类，以辅助AD的早期 graphy,PET)、MRI和fMRIUS]等，其中又以发现。首先将大脑划分成若干个兴趣点(region of MRI和fMRI的低辐射和无创性而得到了广泛的 interest,.RO),依照ROI从rs-fMRI数据中抽取关注。对于MRI,其成像较为清晰，且包含信息出时间序列来形成一个二维矩阵，再用一个二维丰富，因此被广泛应用于对AD的诊断。通过卷积神经网络(convolutional neural networks, 对皮质体积、皮质厚度及皮质下体积等脑部结构 CNN)从该二维矩阵中提取特征信息，以此进行数据，MRI可以较准确预测MCI到AD的转变。后面的分类。同时，为了提高运算速度和减少训然而，对EMCI患者来说，其脑部结构变化并不明练时间，CNN采用迁移学习网络，用一种轻量化显，因此仅使用MRI数据对EMCI的检测还是具 CNN网络一拥有从ImageNet数据库中预训有一定限制。最近有研究表明，AD还表现在某练权重的MobileNet来提取ROI的特征信息。些脑区功能连接的变化上0，而MRI又恰恰能反

前还没有任何药物可以阻止或逆转其发展，只有在 AD 早期时通过一些治疗来改善症状和干预其进一步的恶化[2] ，从而减轻患者的病情和延长存活时间。因此，AD 的早期诊断对于该疾病的治疗具有非常积极的作用。在 AD 发病之前，患者会经历早期轻度认知障碍 (early mild cognitive impairment，EMCI)，该阶段是老年正常认知衰退和痴呆症严重认知衰退的中间阶段，此时的大脑已具有轻微的认知和记忆障碍，但不会影响患者的日常生活，因此在临床检测中很难被发现。已有研究表明，患有 EMCI 的个体患 AD 的风险高于正常人，约为正常人的 10 倍 [3-5]。因此，准确诊断 EMCI 对 AD 的治疗有着十分积极的作用。目前，较准确的 EMCI 诊断方法为生物标志物诊断，如通过脑脊髓液完成[6] ，然而脑脊髓液抽取属有创诊断，且诊断过程也较为复杂。另外一种对 EMCI 的诊断方法是让患者完成神经心理学问卷[7] ，再经神经心理学医师进行评估，但这种诊断往往带有一定主观性，只能作为一种辅助诊断方式。近年来，随着神经影像技术的发展，具有无创的核磁共振成像 (magnetic resonance imaging， MRI) 和功能性磁共振成像 (functional magnetic resonance imaging，fMRI) 技术被越来越多的用于 AD 的诊断中[8]。fMRI 反映了受试者执行特定任务时血氧水平依赖 (blood oxygen level dependent, BOLD) 信号的波动情况，相比 MRI 数据，其不仅包含结构性信息还包含功能性信息，只是获取 fMRI 数据需要设计合理的实验任务[9]。为避免实验任务因素对 fMRI 数据的影响，越来越多的研究 [ 1 0 ] 表明静息态 fMRI(resting state fMRI, rsfMRI) 可替代 fMRI 来完成 EMCI 的诊断。由于在 rs-fMRI 数据获取时受试者不用完成任何特定任务，因此避免了实验任务对数据所带来的影响。本文采用深度学习的分类方法，通过 rsfMRI 数据来进行 EMCI 分类，以辅助 AD 的早期发现。首先将大脑划分成若干个兴趣点 (region of interest, ROI)[11] ，依照 ROI 从 rs-fMRI 数据中抽取出时间序列来形成一个二维矩阵，再用一个二维卷积神经网络 (convolutional neural networks， CNN) 从该二维矩阵中提取特征信息，以此进行后面的分类。同时，为了提高运算速度和减少训练时间，CNN 采用迁移学习网络，用一种轻量化 CNN 网络−拥有从 ImageNet 数据库[12] 中预训练权重的 MobileNet 来提取 ROI 的特征信息。 1 相关工作 AD 症被视为一种神经退化性疾病，疾病早期的症状常被误认为是正常的老化，错过了最佳诊断时机。AD 症的前期诊断一般通过病史收集和行为观察获得，耗时又耗力。若要较为准确的诊断，则需要进行详细的神经心理学检查才有可能判断是否存在认知障碍[13]。随着机器学习技术的发展，人们发现作为一种辅助诊断方法，机器学习可以提高诊断的效率和准确率。在传统的机器学习分类技术中，支持向量机 (support vector machine, SVM) 是一类具有较高分类准确率的诊断方法[14] ，但 SVM 的准确率依赖于提取的特征值，当特征值本身未能准确反映疾病的特征，则其准确率往往会达到一个瓶颈。近年来随着深度学习的兴起，出现了很多可以自动从分类数据中提取有效特征值的方法，如堆叠自动编码器 (stacked auto-encoders, SAE)[15] 和 CNN[16] 等，这些方法均使得分类准确率得到了很大的提高。通常，深度学习的网络较为复杂，权重数量巨大，且需要海量的训练数据作支持，这都使得深度学习的训练耗时耗力。然而，公开的 AD 病症数据非常有限，AD 早期病症的数据更为稀少，因此深度学习的分类准确率将严重依赖于疾病数据的完备性。为了解决该问题，近年来迁移学习被提出来对 AD 进行诊断，例如 AlexNet[16] 和 VGG16[17] 等。由于迁移学习网络已在其他数据库进行了预训练，只需在 AD 数据库中只训练其顶层即可，因此可以缩短训练时间，并可减少分类对训练数据的依赖。然而，迁移学习的预训练网络是否对 EMCI 的诊断有效，目前仍无文献进行报道，这也是本文关注的一个重点。机器学习可以同神经影像学相结合以完成疾病的诊断，常用的影像技术包括电子计算机断层扫描 (computed tomography, CT)、正电子发射型计算机断层显像 (positron emission computed tomography， PET)、 MRI 和 fMRI[ 1 8 ] 等，其中又以 MRI 和 fMRI 的低辐射和无创性而得到了广泛的关注。对于 MRI，其成像较为清晰，且包含信息丰富，因此被广泛应用于对 AD 的诊断[19]。通过对皮质体积、皮质厚度及皮质下体积等脑部结构数据，MRI 可以较准确预测 MCI 到 AD 的转变。然而，对 EMCI 患者来说，其脑部结构变化并不明显，因此仅使用 MRI 数据对 EMCI 的检测还是具有一定限制。最近有研究表明，AD 还表现在某些脑区功能连接的变化上[20] ，而 fMRI 又恰恰能反第 4 期孔伶旭，等：迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类 ·663·

·664· 智能系统学报第16卷映功能连接特性，因此可以使用fMRI数据来有息，因此是一个Nr×Nx×Nr×2的四维数据，其效诊断AD和EMCI。然而，采集fMRI通常需要中Nr表示时间维度，Nx、Ny和N2分别表示脑区被试者完成特定的实验任务，因此fMRI数据又的3个空间维度。目前，常用的CNN大多是针对往往与完成的任务有关。其实，大脑即使在不完二维图像的分类网络，因此s-fMRI并不能直接拿成任何特定任务时，各脑区仍然在相互作用，存来作为输入。当然，由于AD影像数据的高维特在一个默认的功能网络，而这种默认模式在一些性，近年来还出现了一些三维CNN网络2，但作认知障碍的大脑疾病中通常遭到了破坏，因此s 为四维的rs-fMRI仍然无法被直接使用，需要进 fMRI也逐渐地用在EMCI诊断中P。与fMRI数行降维。据相比，rs-fMRI的获取不需要被试者完成预先设一种常用的降维方式是使用自动解剖标记定好的实验动作，仅需要被试者保持休息状态， (automated anatomical labeling,AAL)2图谱来得到因此避免了人为因素对数据的干扰。一个N,×Na的二维ROI时间序列，其中Na表示通常，rS-fMRI为一四维数据，用于深度分类 ROI的数量。此时，原来的rs-fMRI将从原来的四网络需先降维。常用的一种降维方式是，将脑区维降至二维，数据量得到了减少。然而，为了从划分成一些ROL,从这些ROI中提取BOLD信号， ROI时间序列数据提取特征值，仍然需要训练，再从这些BOLD信号提取特征值，如利用SAE2四以SAE方法为例2，设该网络共有N个隐藏层，或受限玻尔兹曼机(restricted Boltzmann machine, 其每层隐藏层的神经元数量分别为S,S2,…,SN, RBM)2)提取特征值，最后利用这些特征值进行那么该网络总共的权重数量为分类。由于输入数据的降维不可避免带来信息丢 WsAE=2 NiNASS2…SN (1) 失，而不降维又容易产生较复杂的分类网络，因从式(1)看到，由于SAE采用的是全连接网此，在rs-fMRI中如何解决分类网络的数据输人络，因此其权重的数量与神经元数量和隐藏层数是本文需要关注的另一个重点。相关，当这两者数量增大时将不可避免使得整个网络权重数变得庞大。当然，CNN也可以自动提 2问题提出取特征值，目前的CNN利用卷积运算对权重进行由于深度学习能自动提取特征值，且具有较共享，相比全连接层可以减少权重数量。假设高的分类准确率，因此本文将采用深度学习的方个CNN网络共有Nc个卷积层，其中每个卷积层法来进行EMCI的诊断。同时，由于rs-fMRI无需分别由L1,L2,…,Lw个特征图组成，特征图的大小分完成任何实验任务，本文也采用rs-fMRI数据来别为F1×F1,F2×F2,…,F×F,所使用的卷积核进行诊断。尺寸分别为M1×M1,M2×M2,…,M×MN,若步长将rs-fMRI应用于深度学习的EMCI诊断首 (stride)为l时，那么该网络的总共的权重数量为先需要解决数据输入的问题，如图1所示，既要保 WaN=∑FF,L,(M,M+b) (2) 证输入到分类网络的数据降维后应包含丰富的分类信息，又能降低分类网络的复杂性，以确保较其中b是偏置数。式(2)的权重与其层数密切相少的训练时间。关，通常CNN在深度学习中的层数都较多，即使 rs-fMRI 权重实现共享但权重数依然庞大。 AAL Mask 利用脑区功能性连接网络理论来提取特征值的方法可以进一步对数据降维20，其本质是求统提取求相关函数计相关系数，若x和y,分别为任意两个ROI在第输入端 t时刻BOLD信号，那么其相关函数可表示为 T-1 2D或3DCNN SAE,RBM或CNN 分类网络 (3) 维度不匹配训练时间长仁0 瞬时信息损失 1分类器因此，对于一个N,×Na的二维ROI时间序列图1特征提取的相关问题求相关以后，其维度将变为心×W,- ,相比原 2 Fig.1 Issues related to feature extraction ROI序列，数量得到了减少。然而由式(3)可知，若用y表示一个被测试的rs-fMRI信号，则 R,是一个时间统计平均值，虽然去掉了时间维度该信号不仅包含脑区结构像信息，还包含时间信 N,但也去掉了ROI数据的瞬时量，不可避免地

映功能连接特性，因此可以使用 fMRI 数据来有效诊断 AD 和 EMCI。然而，采集 fMRI 通常需要被试者完成特定的实验任务，因此 fMRI 数据又往往与完成的任务有关。其实，大脑即使在不完成任何特定任务时，各脑区仍然在相互作用，存在一个默认的功能网络，而这种默认模式在一些认知障碍的大脑疾病中通常遭到了破坏，因此 rsfMRI 也逐渐地用在 EMCI 诊断中[21]。与 fMRI 数据相比，rs-fMRI 的获取不需要被试者完成预先设定好的实验动作，仅需要被试者保持休息状态，因此避免了人为因素对数据的干扰。通常，rs-fMRI 为一四维数据，用于深度分类网络需先降维。常用的一种降维方式是，将脑区划分成一些 ROI，从这些 ROI 中提取 BOLD 信号，再从这些 BOLD 信号提取特征值，如利用 SAE[22] 或受限玻尔兹曼机 (restricted Boltzmann machine， RBM)[23] 提取特征值，最后利用这些特征值进行分类。由于输入数据的降维不可避免带来信息丢失，而不降维又容易产生较复杂的分类网络，因此，在 rs-fMRI 中如何解决分类网络的数据输入是本文需要关注的另一个重点。 2 问题提出由于深度学习能自动提取特征值，且具有较高的分类准确率，因此本文将采用深度学习的方法来进行 EMCI 的诊断。同时，由于 rs-fMRI 无需完成任何实验任务，本文也采用 rs-fMRI 数据来进行诊断。将 rs-fMRI 应用于深度学习的 EMCI 诊断首先需要解决数据输入的问题，如图 1 所示，既要保证输入到分类网络的数据降维后应包含丰富的分类信息，又能降低分类网络的复杂性，以确保较少的训练时间。 2D 或 3D CNN SAE, RBM 或 CNN 分类网络 AAL Mask 求相关函数提取 ROI 维度不匹配训练时间长瞬时信息损失 rs-fMRI ... 输入端分类器图 1 特征提取的相关问题 Fig. 1 Issues related to feature extraction 若用 Y 表示一个被测试的 rs-fMRI 信号，则该信号不仅包含脑区结构像信息，还包含时间信 NT ×NX ×NY ×NZ NT NX NY NZ 息，因此是一个的四维数据，其中表示时间维度，、和分别表示脑区的 3 个空间维度。目前，常用的 CNN大多是针对二维图像的分类网络，因此 rs-fMRI并不能直接拿来作为输入。当然，由于 AD 影像数据的高维特性，近年来还出现了一些三维 CNN网络[24] ，但作为四维的 rs-fMRI 仍然无法被直接使用，需要进行降维。 NT ×NA NA NS S 1,S 2,··· ,S N 一种常用的降维方式是使用自动解剖标记 (automated anatomical labeling，AAL)[25] 图谱来得到一个的二维 ROI 时间序列，其中表示 ROI 的数量。此时，原来的 rs-fMRI 将从原来的四维降至二维，数据量得到了减少。然而，为了从 ROI 时间序列数据提取特征值，仍然需要训练，以 SAE 方法为例[22] , 设该网络共有个隐藏层，其每层隐藏层的神经元数量分别为，那么该网络总共的权重数量为 WSAE=2NTNAS 1S 2 ···S Ns (1) NC L1,L2,··· ,LNc F1 × F1,F2 × F2,··· ,FNc × FNc M1 × M1, M2 × M2,··· , MNc × MNc 从式 (1) 看到，由于 SAE 采用的是全连接网络，因此其权重的数量与神经元数量和隐藏层数相关，当这两者数量增大时将不可避免使得整个网络权重数变得庞大。当然，CNN 也可以自动提取特征值，目前的 CNN 利用卷积运算对权重进行共享，相比全连接层可以减少权重数量。假设一个 CNN 网络共有个卷积层，其中每个卷积层分别由个特征图组成，特征图的大小分别为，所使用的卷积核尺寸分别为，若步长 (stride) 为 1 时，那么该网络的总共的权重数量为 WCNN = ∑Nc i=1 FiFiLi(MiMi +b) (2) 其中 b 是偏置数。式 (2) 的权重与其层数密切相关，通常 CNN 在深度学习中的层数都较多，即使权重实现共享但权重数依然庞大。 xt yt t 利用脑区功能性连接网络理论来提取特征值的方法可以进一步对数据降维[20] ，其本质是求统计相关系数，若和分别为任意两个 ROI 在第时刻 BOLD 信号，那么其相关函数可表示为 Rxy = 1 T ∑T−1 t=0 xtyt (3) NT ×NA NA ×(NA −1) 2 Rxy NT 因此，对于一个的二维 ROI 时间序列求相关以后，其维度将变为，相比原 ROI 序列，数量得到了减少。然而由式 (3) 可知，是一个时间统计平均值，虽然去掉了时间维度，但也去掉了 ROI 数据的瞬时量，不可避免地 ·664· 智能系统学报第 16 卷

第4期孔伶旭，等：迁移学习特征提取的s-MRI早期轻度认知障碍分类 ·665· 带来了部分信息丢失。因此，如何在数据降维、瓶颈层函数f无ek(),以此得到瓶颈层特征：信息丢失以及训练时间寻找平衡将是本文主要研 F=foaneck(Wh,XT) (5) 究的一个问题。其中F即是从ROI时间序列提取的特征值。若目标网络的顶层()经训练后，使得X,及其对 3方法应标签Dr满足 3.1总体框架 Dr fo two,F) (6) 本文使用rs-fMRI数据以及迁移学习的则本迁移学习任务完成，其中w是目标网络 CNN网络来对EMCI进行诊断，方法总体框架如的顶层输出的权重矢量。图2所示，把患有EMCI和正常控制组(normal 图3给出了式(6)的迁移学习过程，图中预训 control,NC)的rs-fMRI数据进行配准、头动校正、练部分通常无需在本地端完成，即使瓶颈层的权颅骨剥离、归一化、平滑及滤波等预处理操作，然重w。非常庞大，但由于可由第三方预先完成而获后使用AAL对完成预处理数据提取ROI得到相得，因此可大幅减少提取特征的训练时间。更重应的二维时间序列，随后输入到已预训练的迁移要的是，为保证提取瓶颈特征的有效性，训练和网络，以此得到瓶颈(bottneck)特征，最后将该特获取瓶颈层权重w。往往在一个非常巨大的源数征输入到设计好的TOP层中得到分类结果，完成据集中完成，如ImageNet数据库，因此相比单纯无迁移的CNN,迁移网络可以解决目标数据集疾病诊断。不足的情形，而目前获取大规模EMCI的rs-fMRI 数据仍存在一定困难。 rs-fMRI 提取ROI 源数据集X ROI时间序列X, 迁移学习 Bottleneck特征预训练顶层容限形 CNN瓶颈层迁移至 MobileNet CNN瓶颈层 /ineck(WB.Xs) fmeck(WB:X) 分类结果顶层顶层图2算法总体框架 f(·) Fig.2 Algorithm overall framework 3.2迁移学习的特征提取输出标签Ds 输出标签D 将一个具有脑区空间和时间维度的四维s 预训练 fMRI信号直接作为分类器的输入，维度较高，可图3迁移学习提取ROI特征从其中提取ROI时间序列来降维，但从ROI时间 Fig.3 Transfer learning to extract ROI features 序列提取特征值，仍需训练。如前所述，SAE和其实，图3的EMCI目标网络训练仅仅对一 CNN网络提取特征将面临权重数庞大和训练时顶层网络进行训练，而顶层只是一个浅层神经网间增多的问题，而采用相关法提取特征又容易丢络，其权重w°数量并不大，因此可保证训练能在失瞬时信息，因此本文考虑采用迁移学习方法从短时间内完成。另外，由于瓶颈层特征F来源于 ROI提取特征值。 ROI时间序列，因此相比于求相关系数的特征值设X,和D分别是一源数据集中的二维图像提取方法，其瞬时特征也得到了保留。当然，虽矢量和对应标签，将一CNN网络在该源数据集中然ak(⊙的权重可由预训练得到，但特征F也需进行预训练，使其满足：通过feek(O的计算得到，因此太复杂的可迁移 Ds=fopwi,fomneck(wo.Xs) (4) CNN会增大特征提取的计算量，本文将选用一种式中：fp)和无nek()分别是该预训练CNN网络轻型的CNN网络来实现迁移学习。的顶层和瓶颈层函数；w和。分别是顶层和瓶 3.3 MobileNet网络颈层的权重矢量。作为一种轻型的CNN网络，Mobilenet'2a使用预训练完成后，将由四维rs-fMR数据张量Y 深度可分离卷积替代原有的传统卷积以减少计算提取出来ROI时间序列X,输入到预训练完成的量，本文将采用该网络来作为迁移学习函数

带来了部分信息丢失。因此，如何在数据降维、信息丢失以及训练时间寻找平衡将是本文主要研究的一个问题。 3 方法 3.1 总体框架本文使用 rs-fMRI 数据以及迁移学习的 CNN 网络来对 EMCI 进行诊断，方法总体框架如图 2 所示，把患有 EMCI 和正常控制组 (normal control，NC) 的 rs-fMRI 数据进行配准、头动校正、颅骨剥离、归一化、平滑及滤波等预处理操作，然后使用 AAL 对完成预处理数据提取 ROI 得到相应的二维时间序列，随后输入到已预训练的迁移网络，以此得到瓶颈 (bottneck) 特征，最后将该特征输入到设计好的 TOP 层中得到分类结果，完成疾病诊断。顶层预训练 MobileNet 迁移学习分类结果 AAL Mask 提取 ROI rs-fMRI ... Bottleneck 特征 ... 图 2 算法总体框架 Fig. 2 Algorithm overall framework 3.2 迁移学习的特征提取将一个具有脑区空间和时间维度的四维 rsfMRI 信号直接作为分类器的输入，维度较高，可从其中提取 ROI 时间序列来降维，但从 ROI 时间序列提取特征值，仍需训练。如前所述，SAE 和 CNN 网络提取特征将面临权重数庞大和训练时间增多的问题，而采用相关法提取特征又容易丢失瞬时信息，因此本文考虑采用迁移学习方法从 ROI 提取特征值。设 Xs 和 DS 分别是一源数据集中的二维图像矢量和对应标签，将一 CNN 网络在该源数据集中进行预训练，使其满足： DS = f S top{w S t , fbtneck(wb ,XS )} (4) f S top(·) fbtneck(·) w S t wb 式中：和分别是该预训练 CNN 网络的顶层和瓶颈层函数；和分别是顶层和瓶颈层的权重矢量。 Y XT 预训练完成后，将由四维 rs-fMRI 数据张量提取出来 ROI 时间序列，输入到预训练完成的瓶颈层函数 fbtneck(·) ，以此得到瓶颈层特征： F = fbtneck(wb,XT ) (5) F f O top(·) XT DT 其中即是从 ROI 时间序列提取的特征值。若目标网络的顶层经训练后，使得及其对应标签满足 DT = f O top{w O t ,F} (6) w O 则本迁移学习任务完成，其中 t 是目标网络的顶层输出的权重矢量。 wb wb 图 3 给出了式 (6) 的迁移学习过程，图中预训练部分通常无需在本地端完成，即使瓶颈层的权重非常庞大，但由于可由第三方预先完成而获得，因此可大幅减少提取特征的训练时间。更重要的是，为保证提取瓶颈特征的有效性，训练和获取瓶颈层权重往往在一个非常巨大的源数据集中完成，如 ImageNet 数据库[12] ，因此相比单纯无迁移的 CNN，迁移网络可以解决目标数据集不足的情形，而目前获取大规模 EMCI 的 rs-fMRI 数据仍存在一定困难。输出标签 DT CNN 瓶颈层 fbtneck(wb , XT ) 顶层顶层输出标签 DS 预训练源数据集 XS 迁移至 ROI 时间序列 XT T top f (·) CNN 瓶颈层 fbtneck(wb , XS ) 图 3 迁移学习提取 ROI 特征 Fig. 3 Transfer learning to extract ROI features w O t F fbtneck(·) F fbtneck(·) 其实，图 3 的 EMCI 目标网络训练仅仅对一顶层网络进行训练，而顶层只是一个浅层神经网络，其权重数量并不大，因此可保证训练能在短时间内完成。另外，由于瓶颈层特征来源于 ROI 时间序列，因此相比于求相关系数的特征值提取方法，其瞬时特征也得到了保留。当然，虽然的权重可由预训练得到，但特征也需通过的计算得到，因此太复杂的可迁移 CNN 会增大特征提取的计算量，本文将选用一种轻型的 CNN 网络来实现迁移学习。 3.3 MobileNet 网络作为一种轻型的 CNN 网络，Mobilenet[26] 使用深度可分离卷积替代原有的传统卷积以减少计算量，本文将采用该网络来作为迁移学习函数第 4 期孔伶旭，等：迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类 ·665·

·666· 智能系统学报第16卷 x(~)。深度可分离卷积将标准卷积分解成一个计的顶层)就可进行分类。顶层网络)设深度卷积和一个点卷积，如图4所示。深度卷积计如图5所示，主要包括全局平均池化层、Dro- 将单个卷积核应用于每个输人通道，点卷积使用 pout层、全连接层和输出层，其中全局平均池化 1×1卷积核来组合输出，这种分解可大幅度地减层可将瓶颈层特征融合，Dropout层可避免网络出少模型大小和计算量。现过拟合。因此，该顶层的权重数量为 ×(1-r）(12) M D N→ 式中：NGAP×NGAP为瓶颈特征经过全局平均池化 (a)标准卷积层的融合后得到的数据维度；C:为第i层全连接层的神经元数；m为全连接层的总层数；r为Dropout DT D M→ 层的权重丢弃率。由于在顶层中，经提取和融合 (b)深度卷积后的瓶颈层特征维度已经降至很低，且层数m值较小，因此式(12)的权重数不会很大，保证了较 M 少的网络训练时间。 ←-N→ (c)1×1点卷积瓶颈特征全局平均池化层图4深度可分离卷积 Dropout层 Fig.4 Depth separable convolution 对于一个Nr×Na的ROI时间序列来说，设其全连接层1 顶层输入通道为M,经过一个标准卷积层，则将产生全连接层2 一个N×Nr×WA的特征图，W是输出通道数。若经过一个卷积核大小为Dx×Dx×MXN的标准卷积层，其中Dx是卷积核维度，那么该标准卷积的全连接层m 计算成本为输出标签输出层 DKXDkXMXNXNTXNA (7) 在深度可分离卷积中，先使用深度卷积为每图5顶层设计个输入通道应用单个滤波器，那么深度卷积的计 Fig.5 Top-level design 算成本为另外，顶层中的一些参数设定会影响最后的 DkXDkXMXNTXNA (8) 分类结果，如全连接层层数m、Dropout.层的权重然后使用点卷积(1×1的卷积核)来创建深度丢弃率，和全连接层的神经元数C。如何选择合层的输出的线性组合，其计算成本为适的参数值可通过实验来进行实际测试，这部分 M×NXN×NA (9) 的内容将在下一节实验中作详细讨论。所以深度可分离卷积的计算成本为 3.5算法训练 DxxDxXMXNrXN+MXNXNrXNA (10) 最后给出本文EMCI分类算法训练的步骤，因此，深度可分离卷积的乘法次数与标准卷如下所示：积之比为 1)预处理：对rs-fMRI信号的观测值Y进行 Dk×Dx×M×Nr×Na+MXNXN-×NA1,1 DkXD&XMXNXNTXNA ND 配准、头动校正、颅骨剥离、归一化和平滑及滤波 (11) 等，并分成训练集和验证集；由式(Il)可知，由MobileNet得到瓶颈层所 2)ROI提取：由AAL图谱从预处理数据中提需计算量与相同规模网络比，可大大减少。因此取ROI时间序列Xr; 从计算量角度，选择MboileNet作为迁移网络是 3)瓶颈特征提取：由aack(wb,Xr)获取瓶颈一个较好的选择。特征； 3.4顶层分类网络 4)训练：在训练集中，通过式(6)训练得到顶将ROI时间序列经预训练的瓶颈层MobileN- 层权重w2, t就得到瓶颈特征，随后再将瓶颈特征输入到设 5)验证：由验证集，通过式(6)得到分类结

fbtneck(·) 。深度可分离卷积将标准卷积分解成一个深度卷积和一个点卷积，如图 4 所示。深度卷积将单个卷积核应用于每个输入通道，点卷积使用 1×1 卷积核来组合输出，这种分解可大幅度地减少模型大小和计算量。 M M DK DK DK DK ← N→ (b) 深度卷积 1 ← → . . . . . . . . . M 1 1 ← N→ (a) 标准卷积 (c) 1×1 点卷积图 4 深度可分离卷积 Fig. 4 Depth separable convolution NT ×NA N ×NT ×NA N DK × DK × M ×N DK 对于一个的 ROI 时间序列来说，设其输入通道为 M，经过一个标准卷积层，则将产生一个的特征图，是输出通道数。若经过一个卷积核大小为的标准卷积层，其中是卷积核维度，那么该标准卷积的计算成本为 DK × DK × M ×N ×NT ×NA (7) 在深度可分离卷积中，先使用深度卷积为每个输入通道应用单个滤波器，那么深度卷积的计算成本为 DK × DK × M ×NT ×NA (8) 然后使用点卷积 (1×1 的卷积核) 来创建深度层的输出的线性组合，其计算成本为 M ×N ×NT ×NA (9) 所以深度可分离卷积的计算成本为 DK × DK × M ×NT ×NA+M ×N ×NT ×NA (10) 因此，深度可分离卷积的乘法次数与标准卷积之比为 DK × DK × M ×NT ×NA+M ×N ×NT ×NA DK × DK × M ×N ×NT ×NA = 1 N + 1 D2 K (11) 由式 (11) 可知，由 MobileNet 得到瓶颈层所需计算量与相同规模网络比，可大大减少。因此从计算量角度，选择 MboileNet 作为迁移网络是一个较好的选择。 3.4 顶层分类网络将 ROI 时间序列经预训练的瓶颈层 MobileNet 就得到瓶颈特征，随后再将瓶颈特征输入到设 f O top(·) f O top 计的顶层就可进行分类。顶层网络 (·) 设计如图 5 所示，主要包括全局平均池化层、Dropout 层、全连接层和输出层，其中全局平均池化层可将瓶颈层特征融合，Dropout 层可避免网络出现过拟合。因此，该顶层的权重数量为   NGAP ×NGAP ×C1 + ∑m−1 i Ci ×Ci+1 +2Cm   ×(1−r) (12) NGAP ×NGAP i m r m 式中：为瓶颈特征经过全局平均池化层的融合后得到的数据维度；Ci 为第层全连接层的神经元数；为全连接层的总层数；为 Dropout 层的权重丢弃率。由于在顶层中，经提取和融合后的瓶颈层特征维度已经降至很低，且层数值较小，因此式 (12) 的权重数不会很大，保证了较少的网络训练时间。瓶颈特征顶层输出标签全局平均池化层 Dropout 层全连接层 1 全连接层 2 全连接层 m ... 输出层图 5 顶层设计 Fig. 5 Top-level design m r 另外，顶层中的一些参数设定会影响最后的分类结果，如全连接层层数、Dropout 层的权重丢弃率和全连接层的神经元数 Ci。如何选择合适的参数值可通过实验来进行实际测试，这部分的内容将在下一节实验中作详细讨论。 3.5 算法训练最后给出本文 EMCI 分类算法训练的步骤，如下所示： 1) 预处理：对 rs-fMRI 信号的观测值 Y 进行配准、头动校正、颅骨剥离、归一化和平滑及滤波等，并分成训练集和验证集； XT 2)ROI 提取：由 AAL 图谱从预处理数据中提取 ROI 时间序列； 3) 瓶颈特征提取：由 fbtneck(wb,XT ) 获取瓶颈特征; w O t 4) 训练：在训练集中，通过式 (6) 训练得到顶层权重 ; 5) 验证：由验证集，通过式 (6) 得到分类结 ·666· 智能系统学报第 16 卷

第4期孔伶旭，等：迁移学习特征提取的s-MRI早期轻度认知障碍分类 ·667· 果，并计算分类准确率， 2mm或任一方向转动超过2)的头部运动； 6)重复执行步骤4)5)至分类准确率收敛。 7)进行归一化和平滑，并将所有数据都过滤到一个频率范围(0.010.08Hz): 4实验设置及结果 8)使用AAL图谱将大脑分为116个ROL,如 4.1数据来源及预处理图6所示，每个半脑球包含58个区域，最后得到在本实验中，所采用的rs-fMRI数据均来源于一个116×130的矩阵，其中列为兴趣数，行为时间阿尔茨海默病神经影像学数据库(Alzheimer's 维度：最后根据所有被试的头动情况，图像成像 disease neuroimaging initiative,ADNI),其网址质量以及结构和功能像的配准质量对数据进行过为http:/adni.loni.usc.edu/。在该数据库中，我们选滤，最终分别得到了32个EMCI和NC图像。择了ADNI-2阶段的rs-fMRI数据，其具体参数详见表1，从中我们分别得到了32个EMCI和正常对照组(normal control,NC)的可用的被试数据，且两组被试内的年龄和性别分布没有明显差异。表1rs-fMRI数据相关参数 Table 1 rs-fMRI data related parameters 参数描述数据库 ADNI-2 图6大脑节点磁场强度T 3.0 Fig.6 Top-level design 采集设备 Philip 4.2实验方法翻转角/() 80 在实验中，采用两种方法对rs-fMRI进行降 TR/ms 300 维，一种仅通过AAL提取ROI,一种为提取 TE/ms 30 ROI后再求pearson相关系数，因为pearson相关像素大小系数通常用于衡量功能连接的强度2，因此也可 3.3mm×3.3mm 以使用它来衡量不同大脑区域之间的功能连接。切片数量 48 其具体参数详见表2。在对数据降维后，采用两 TR数 140 种方法提取特征值和分类，分别采用SAE和迁移数据预处理采用数据处理和脑成像分析(data 网络MobileNet,.具体参数也由表2列出，由此我 processing&analysis of brain imaging,DPABD）)工.具们分别得到以下4种方法的分类结果：箱7，具体过程如下： 1)SAE_ROI:由AAL得到ROI,再由SAE提 1)去除每个被试者前10帧图像，仅保留取特征值后分类： 130帧图像； 2)SAE_Corr:由AAL得到ROL,再求pear- 2)以第48帧图像为基准对所有的图像进行 son相关系数，再由SAE提取pearson相关系数的校准，使每个切片上的数据具有相同时间点；特征值后分类。 3)对所有被试进行头动校正，将头动校正到 3)Transf Corr:由AAL得到ROI,再求pear- 同一位置，并为接下来的图像质量控制提供数据； son相关系数，再由MoblieNet提取pearson相关 4)将与rS-fMRI数据匹配的MRI数据进行颅系数特征值后进入TOP层分类：骨剥离，然后同功能图像进行配准，将MRI数据 4)Transf ROI:由AAL得到ROL,再由Mob- 变换到rs-fMRI数据的空间，使得rs-fMRI数据可 lieNet提取ROI特征值后进入TOP层进行分类，以被分割成脑脊髓液、灰质和白质信号：计算步骤也可参见表1。 5)去除一些混淆因素，将全局平均信号、脑以上方法的分类方法都将采用k折交叉验证脊髓液和白质信号被作为无关变量去除，且以以防止发生过度拟合问题2，其中k取5。实验 6个头动参数（包含3个转动参数和3个平动参中分类准确率计算过程为：将总数据样本随机分数)去除头动带来的影响；成5份，选择其一作为验证集，其余4个作为训练 6)评估被试者头部的旋转和平移，发现所有集，每个子样本用作测试集一次，交叉验证重复参与者都没有表现出过度（任一方向平移超过 5次，分类准确率就为5次分类结果的平均值

果，并计算分类准确率; 6) 重复执行步骤 4)~5) 至分类准确率收敛。 4 实验设置及结果 4.1 数据来源及预处理在本实验中，所采用的 rs-fMRI 数据均来源于阿尔茨海默病神经影像学数据库 (Alzheimer’s disease neuroimaging initiative，ADNI)，其网址为 http://adni.loni.usc.edu/。在该数据库中，我们选择了 ADNI-2 阶段的 rs-fMRI 数据，其具体参数详见表 1，从中我们分别得到了 32 个 EMCI 和正常对照组 (normal control, NC) 的可用的被试数据，且两组被试内的年龄和性别分布没有明显差异。表 1 rs-fMRI 数据相关参数 Table 1 rs-fMRI data related parameters 参数描述数据库 ADNI-2 磁场强度/T 3.0 采集设备 Philip 翻转角/(°) 80 TR/ms 300 TE/ms 30 像素大小 3.3 mm×3.3 mm 切片数量 48 TR数 140 数据预处理采用数据处理和脑成像分析 (data processing & analysis of brain imaging，DPABI) 工具箱 [27] ，具体过程如下： 1) 去除每个被试者前 10 帧图像，仅保留 130 帧图像； 2) 以第 48 帧图像为基准对所有的图像进行校准，使每个切片上的数据具有相同时间点； 3) 对所有被试进行头动校正，将头动校正到同一位置，并为接下来的图像质量控制提供数据； 4) 将与 rs-fMRI 数据匹配的 MRI 数据进行颅骨剥离，然后同功能图像进行配准，将 MRI 数据变换到 rs-fMRI 数据的空间，使得 rs-fMRI 数据可以被分割成脑脊髓液、灰质和白质信号； 5) 去除一些混淆因素，将全局平均信号、脑脊髓液和白质信号被作为无关变量去除，且以 6 个头动参数 (包含 3 个转动参数和 3 个平动参数) 去除头动带来的影响； 6) 评估被试者头部的旋转和平移，发现所有参与者都没有表现出过度 (任一方向平移超过 2 mm 或任一方向转动超过 2°) 的头部运动； 7) 进行归一化和平滑，并将所有数据都过滤到一个频率范围 (0.01~0.08 Hz)； × 8) 使用 AAL 图谱将大脑分为 116 个 ROI，如图 6 所示，每个半脑球包含 58 个区域，最后得到一个 116 130 的矩阵，其中列为兴趣数，行为时间维度；最后根据所有被试的头动情况，图像成像质量以及结构和功能像的配准质量对数据进行过滤，最终分别得到了 32 个 EMCI 和 NC 图像。 L 1 6 R 图 6 大脑节点 Fig. 6 Top-level design 4.2 实验方法在实验中，采用两种方法对 rs-fMRI 进行降维，一种仅通过 A AL 提取 ROI ，一种为提取 ROI 后再求 pearson 相关系数，因为 pearson 相关系数通常用于衡量功能连接的强度[28] ，因此也可以使用它来衡量不同大脑区域之间的功能连接。其具体参数详见表 2。在对数据降维后，采用两种方法提取特征值和分类，分别采用 SAE 和迁移网络 MobileNet，具体参数也由表 2 列出，由此我们分别得到以下 4 种方法的分类结果： 1)SAE_ROI：由 AAL 得到 ROI，再由 SAE 提取特征值后分类； 2)SAE_Corr：由 AAL 得到 ROI，再求 pearson 相关系数，再由 SAE 提取 pearson 相关系数的特征值后分类。 3)Transf_Corr：由 AAL 得到 ROI，再求 pearson 相关系数，再由 MoblieNet 提取 pearson 相关系数特征值后进入 TOP 层分类； 4)Transf_ROI：由 AAL 得到 ROI，再由 MoblieNet 提取 ROI 特征值后进入 TOP 层进行分类，计算步骤也可参见表 1。 k k 以上方法的分类方法都将采用折交叉验证以防止发生过度拟合问题[29] ，其中取 5。实验中分类准确率计算过程为：将总数据样本随机分成 5 份，选择其一作为验证集，其余 4 个作为训练集，每个子样本用作测试集一次，交叉验证重复 5 次，分类准确率就为 5 次分类结果的平均值。第 4 期孔伶旭，等：迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类 ·667·

·668· 智能系统学报第16卷为了避免实验的偶然性结果，最终分类准确率结 4.3分类性能果为重复以上实验10次后的平均值。首先，给出各方法的分类准确率，如表3所表2相关实验方法参数示。从表3可以看到，SAE ROI的分类准确率为 Table 2 Related experimental method parameters 59%,其余3种方法均超过了59%，这表明利用参数描述 SAE提取ROI特征的方法分类准确率并不高。图谱 AAL 在用相关系数降维的方法中，利用迁移学习提取 ROI 区域数 116 相关系数特征值的方法要优于用SAE的方法约时间点数 130 0.17%。分类准确率最高的是利用迁移学习提取相关特征相关系数 ROI特征值的方法，它能使分类准确率达到约 Pearson 学习率 74%,与其余的SAE ROI、SAE_Corr和Transf 1 Corr3种方法的分类准确率相比，分别提升了近隐藏层数 1 14.67%、10.17%和10%。该结果也表明了，利用隐藏层激活函数 Sigm 迁移学习提取ROI特征值在分类信息的损失上 SAE 神经元数 251 要小于提取相关系数特征值，因此分类准确率也 InputZeroMaskedFraction 0.5 得到了提高。 Batchsize 2 表3分类方法的分类准确率 Numepochs 20 Table 3 Classification accuracy of classification method 迁移网络 MobileNet 分类算法准确率% 灵敏度特异度预训练权重 Imagent SAE ROI 59.00 0.583 0.597 Img_width 160 SAE_Corr 63.50 0.650 0.620 MobileNet Img height 160 Transf Corr 63.67 0.703 0.570 alpha 1 Transf_ROI 73.67 0.760 0.713 Batchsize 2 表3还给出了灵敏度和特异度的实验结果。池化层全局平均池化从该结果中可以发现，Transf ROI的灵敏度为全连接层数 3 0.760,高于Transf_Corr(0.703)、SAE_Corr 全连接层激活函数 Softplus (0.650)和SAE ROI(0.583)。而Transf ROI的特异 TOP层全连接层神经元数 20010050 度为0.713，这在所讨论的方法中也是最高的，高输出层激活函数 Sigmoid 于Transf Corr(0.570)、SAE Corr(0.620)和 Epoch 65 SAE ROI(0.597) Dropout 0 图7给出了采用Transf ROI方法所提取的特征值结果图，其中图7(a)是在TOP层分类网络的除了统计分类准确率，实验还使用敏感性和第3全连接层所提取的所有NC特征值均值，特异性来评估分类方法的性能。灵敏度为检测出图7(b)是相应所有EMCI特征值均值。从图中可真阳性数与实际真阳性数比值，越大的值检测以看到，虽然两幅特征值图的绝大部分像素值均 EMCI的性能越好。特异度为检测出真阴性数与在50左右，但是还是存在一定的差异性。例如，实际真阴性数比值，越大的值检测非EMCI的性对于EMCI组，其在第13列的3、17、35和50行能越好。的像素值一道道200左右，而NC组相应位置仍另外，文中所用的SAE基于DeepLearnTool- 在50左右。该结果也与表3的结果一致，表明利 box-master,.下载地址为https:/github.com/xiayuan/ 用迁移学习提取特征值在两个组别确实存在差异 DeepLearnToobox-master。.MobileNet采用tensor- 性，因而可以将两个组别的被试进行分类。 fiow平台中函数，下载地址为https:/github.com/ 图8给出了4种分类方法在10次实验中的 tensorflow/.models/treemaster/research/slim,使用的分类准确率波动情况，整体看，其曲线由高到低预训练权重为Imagent公开的数据，下载网址为排列大致是Transf ROI、Transf Corr、SAE Corr https://github.com/fchollet/deep-learningmodels/re- 以及SAE ROI,.与表3中的结果一致。并且在 leases/tag/v0.6。 l0次实验中，Transf ROI方法在7次实验中都取

为了避免实验的偶然性结果，最终分类准确率结果为重复以上实验 10 次后的平均值。表 2 相关实验方法参数 Table 2 Related experimental method parameters 参数描述 ROI 图谱 AAL 区域数 116 时间点数 130 相关特征相关系数 Pearson SAE 学习率 1 隐藏层数 1 隐藏层激活函数 Sigm 神经元数 251 InputZeroMaskedFraction 0.5 Batchsize 2 Numepochs 20 MobileNet 迁移网络 MobileNet 预训练权重 Imagent Img_width 160 Img_height 160 alpha 1 Batchsize 2 TOP层池化层全局平均池化全连接层数 3 全连接层激活函数 Softplus 全连接层神经元数 200 100 50 输出层激活函数 Sigmoid Epoch 65 Dropout 0 除了统计分类准确率，实验还使用敏感性和特异性来评估分类方法的性能。灵敏度为检测出真阳性数与实际真阳性数比值，越大的值检测 EMCI 的性能越好。特异度为检测出真阴性数与实际真阴性数比值，越大的值检测非 EMCI 的性能越好。另外，文中所用的 SAE 基于 DeepLearnToolbox-master，下载地址为 https://github.com/xiayuan/ DeepLearnToobox-master。MobileNet 采用 tensorflow 平台中函数，下载地址为 https://github.com/ tensorflow/models/treemaster/research/slim，使用的预训练权重为 Imagent 公开的数据，下载网址为 https://github.com/fchollet/deep-learningmodels/releases/tag/v0.6。 4.3 分类性能首先，给出各方法的分类准确率，如表 3 所示。从表 3 可以看到，SAE_ROI 的分类准确率为 59%，其余 3 种方法均超过了 59%，这表明利用 SAE 提取 ROI 特征的方法分类准确率并不高。在用相关系数降维的方法中，利用迁移学习提取相关系数特征值的方法要优于用 SAE 的方法约 0.17%。分类准确率最高的是利用迁移学习提取 ROI 特征值的方法，它能使分类准确率达到约 74%，与其余的 SAE_ROI、SAE_Corr 和 Transf_ Corr3 种方法的分类准确率相比，分别提升了近 14.67%、10.17% 和 10%。该结果也表明了，利用迁移学习提取 ROI 特征值在分类信息的损失上要小于提取相关系数特征值，因此分类准确率也得到了提高。表 3 分类方法的分类准确率 Table 3 Classification accuracy of classification method 分类算法准确率/% 灵敏度特异度 SAE_ROI 59.00 0.583 0.597 SAE_Corr 63.50 0.650 0.620 Transf_Corr 63.67 0.703 0.570 Transf_ROI 73.67 0.760 0.713 表 3 还给出了灵敏度和特异度的实验结果。从该结果中可以发现，Transf_ROI 的灵敏度为 0.760，高于 Transf_Corr(0.703)、 SAE_Corr (0.650) 和 SAE_ROI(0.583)。而 Transf_ROI 的特异度为 0.713，这在所讨论的方法中也是最高的，高于 Transf_Corr(0.570)、SAE_Corr(0.620) 和 SAE_ROI(0.597)。图 7 给出了采用 Transf_ROI 方法所提取的特征值结果图，其中图 7(a) 是在 TOP 层分类网络的第 3 全连接层所提取的所有 NC 特征值均值，图 7(b) 是相应所有 EMCI 特征值均值。从图中可以看到，虽然两幅特征值图的绝大部分像素值均在 50 左右，但是还是存在一定的差异性。例如，对于 EMCI 组，其在第 13 列的 3、17、35 和 50 行的像素值一道道 200 左右，而 NC 组相应位置仍在 50 左右。该结果也与表 3 的结果一致，表明利用迁移学习提取特征值在两个组别确实存在差异性，因而可以将两个组别的被试进行分类。图 8 给出了 4 种分类方法在 10 次实验中的分类准确率波动情况，整体看，其曲线由高到低排列大致是 Transf_ROI、Transf_Corr、SAE_Corr 以及 SAE_ROI，与表 3 中的结果一致。并且在 10 次实验中，Transf_ROI 方法在 7 次实验中都取 ·668· 智能系统学报第 16 卷

第4期孔伶旭，等：迁移学习特征提取的s-MRI早期轻度认知障碍分类 ·669· 得了最高的分类准确率，这也表明，不仅在平均 (graphics processing unit,GPU)。表4给出了在不值上Transf ROI方法分类准确率较高，而且对于同模型和不同数据输入时的提特征取和分类时单次实验，Transf ROI的方法的分类准确率也大间，从表中可以看出，与SAE方法相比，Transf方概率高于其他方法。同时，在10次实验中，法在特征提取时所用的时间减少了近80%，且所 Transf ROI和Transf Corr的分类准确率分别稳定用的分类时间也都有减少，网络总运行时间减少了约在70%~80%和60%~75%，而SAEC0rr和 60%。这都表明在相同的环境下，使用迁移学习 SAE ROI的分类准确率在10次实验中的波动较对EMCI进行分类所耗费的时间少于SAE的方法，大，可能是由于数据量不足。其原因也在于迁移学习其实具有更少的权重数量。 0 1250 表4模型性能指标 10 200 Table 4 Model performance indicators 150 分类算法特征提取时间分类时间总时间 100 50 SAE ROI 60.05 27.92 87.97 0 SAE Corr 25.71 12.66 38.37 10 1520 被试者编号 Transf Corr 5.42 8.78 14.20 (a)NC 0 5.56 8.81 14.37 250 Transf ROI 10 200 150 4.5顶层网络参数设置 100 本文主要分析Transf ROI的顶层网络的全连 40 50 接层数对分类性能的影响，其最终参数在表2列 0 10 1520 25 30 出。在这里，给出不同的顶层网络参数设置对最被试者编号终分类结果带来的不同影响。图9分别给出了采 (b)EMCI 用Transf_ROI中池化层所提取的NC组和图7 Transf ROI中第3层全连接层中提取的特征值 EMCI组特征值的结果图，从图中可以看到，两个 Fig.7 Feature values extracted from the 3rd fully connec- ted layer in Transf ROI 组别的大部分像素值均在50左右，当然，存在一部分像素值超过了150，但其所在两个组别的位 100 号% 置也没有存在明显差异性。该结果表明，仅靠池化层提取的特征还不能将两组进行区分，需要加入全连接层。足 608 0 1250 50 e-SAE ROI 200 200 -SAE Corr 40 400 米Transf ROI 150 -Transf Corr 600 100 30 23 45678910 800 50 实验组数 1000 05101520 15 30 图810次实验中的分类准确率被试者编号 Fig.8 Classification accuracy in ten experiments (a)NC 4.4分类时间 0 1250 给出在不同数据输入及不同模型的条件下提 200 200 取特征时间和分类时间，其中提取特征时间为分 400 150 600 100 别从时间序列数据及相关系数数据中提取特征以 800 供分类网络所占用的时间：分类时间是对全部的 1000 被试者，将其从时间序列数据及相关系数数据中 10 0 1520 30 被试者编号提取到的特征，送人分类网络获得分类结果所用 (b)EMCI 的时间。所有实验方法均在Inter(R)Core(TM)i5- 图9 Transf ROI中池化层中提取的特征值 6300HQ(4核)的中央处理单元(central processing Fig.9 Feature values extracted from the pooling layer in unit,CPU)环境下运行，未采用任何图形处理器 Transf ROI

得了最高的分类准确率，这也表明，不仅在平均值上 Transf_ROI 方法分类准确率较高，而且对于单次实验，Transf_ROI 的方法的分类准确率也大概率高于其他方法。同时，在 1 0 次实验中， Transf_ROI 和 Transf_Corr 的分类准确率分别稳定在 70%~80% 和 60%~75%，而 SAE_Corr 和 SAE_ROI 的分类准确率在 10 次实验中的波动较大，可能是由于数据量不足。 (a) NC 5 10 15 20 25 30 被试者编号 10 20 30 40 50 特征值 5 10 15 20 25 30 被试者编号 10 20 30 40 50 特征值 0 50 100 150 200 250 0 50 100 150 200 250 (b) EMCI 0 0 0 0 图 7 Transf_ROI 中第 3 层全连接层中提取的特征值 Fig. 7 Feature values extracted from the 3rd fully connected layer in Transf_ROI 1 2 3 4 5 6 7 8 9 10 实验组数 30 40 50 60 70 80 90 100 SAE_ROI SAE_Corr Transf_ROI Transf_Corr 准确率/% 图 8 10 次实验中的分类准确率 Fig. 8 Classification accuracy in ten experiments 4.4 分类时间给出在不同数据输入及不同模型的条件下提取特征时间和分类时间，其中提取特征时间为分别从时间序列数据及相关系数数据中提取特征以供分类网络所占用的时间；分类时间是对全部的被试者，将其从时间序列数据及相关系数数据中提取到的特征，送入分类网络获得分类结果所用的时间。所有实验方法均在 Inter(R) Core(TM) i5- 6300HQ(4 核) 的中央处理单元 (central processing unit, CPU) 环境下运行，未采用任何图形处理器 (graphics processing unit, GPU)。表 4 给出了在不同模型和不同数据输入时的提特征取和分类时间，从表中可以看出，与 SAE 方法相比，Transf 方法在特征提取时所用的时间减少了近 80%，且所用的分类时间也都有减少，网络总运行时间减少了约 60%。这都表明在相同的环境下，使用迁移学习对 EMCI 进行分类所耗费的时间少于 SAE 的方法，其原因也在于迁移学习其实具有更少的权重数量。表 4 模型性能指标 Table 4 Model performance indicators s 分类算法特征提取时间分类时间总时间 SAE_ROI 60.05 27.92 87.97 SAE_Corr 25.71 12.66 38.37 Transf_Corr 5.42 8.78 14.20 Transf_ROI 5.56 8.81 14.37 4.5 顶层网络参数设置本文主要分析 Transf_ROI 的顶层网络的全连接层数对分类性能的影响，其最终参数在表 2 列出。在这里，给出不同的顶层网络参数设置对最终分类结果带来的不同影响。图 9 分别给出了采用 Transf_RO I 中池化层所提取的 N C 组和 EMCI 组特征值的结果图，从图中可以看到，两个组别的大部分像素值均在 50 左右，当然，存在一部分像素值超过了 150，但其所在两个组别的位置也没有存在明显差异性。该结果表明，仅靠池化层提取的特征还不能将两组进行区分，需要加入全连接层。 0 50 100 150 200 250 0 50 100 150 200 250 (a) NC 5 10 15 20 25 30 被试者编号 200 400 600 800 1 000 特征值 5 10 15 20 25 30 被试者编号 200 400 600 800 1 000 特征值 (b) EMCI 0 0 0 0 图 9 Transf_ROI 中池化层中提取的特征值 Fig. 9 Feature values extracted from the pooling layer in Transf_ROI 第 4 期孔伶旭，等：迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类 ·669·

·670· 智能系统学报第16卷全连接层的层数也会对实验结果产生影响，实验中，本文方法的分类准确率为73.67%，图10和图11分别给出了在1~4层全连接层时的虽然比其他几种传统方法高，但低于文献22]给分类准确率和运行时所用的迭代次数。从图10 出的86%的分类结果，该文献采用SAE来提取中可以看出，在使用3层全连接层时，分类准确率 Pearson相关系数的特征，其主要原因在于，所使最高，且在10组实验中，有6次是最高值。如图7 用的数据集较小，被试者数为64，而文献[22]所所示的第3层全连接层中提取的特征值的组间差用被试数为170。虽然本文所采用的ADNI-2数异性明显大于如图9所示的池化层中提取的特征据库中，有关EMCI的rs-fMRI数据确实较多，但值的组间差异性，因此加入全连接层是十分有必与其对应的MRI数据却相对较少。没有对应要的。 MRI数据将无法进行良好配准，这会导致一些混 80 淆变量不能有效去除，如脑脊液和白质等，而该混淆变量又会影响分类结果。因此，最后能够满 76 足实验条件的rs-fMRI数据量就较小。当然，实验中的所采用方法无论是迁移学习还是传统方 0 法，面向的数据集是相同的，即本文方法的性能 ©1层全连接层 2层全连接层提升是在同样数据条件下所获得的。在未来的工 6 *3层全连接层作中，我们将会尝试更多的可用数据，以进一步 4层全连接层 60 来验证本文的研究。 3 4567 8910 实验组数另外，在顶层参数设置的实验中，仅给出了全图10T0P层具有1、2、3和4个全连接层时的测试精度连接层数的实验结果，而未对其他参数作进一步 Fig.10 Test accuracy when TOP layer has 1,2,3 and 4 讨论，这主要是因为相对于其他参数，全连接层 fully connected layers 数对分类结果的影响比较大。对于激活函数，我而在图11中可以看出，随着全连接层层数的们也尝试了一些常用的函数，如ReLu、Softplus等0 增多，迭代次数在相应地减少，但减少的程度在但发现这些函数的分类结果并没有较大差别，因降低。根据图10和图11综合考虑分类准确率和此选择了较为常见的Softplus。当然，还有一些参迭代次数后，我们的实验选用了3层全连接层的数对顶层性能也非常重要，例如全连接层节点设置。数。节点数量可以根据经验确定，若节点数太 160 小，网络将无法适应复杂分类，若节点数太大，会 1409 增加训练时间且可能产生过拟合。在本文的顶层 120 层连接层。网络中，将3个全连接层的节点数分别设置为200 ®-2层全连接层 100 *3层全连接层 100和50。最后还有一个重要的顶层参数是Dro- 801 4层全连接是 pout层的神经元丢弃率，将其值设为大于0时，会降低分类网络对训练数据的拟合程度，从而得到 40 较低的分类准确率，因此最后将其设置为0。 45678910 6结束语实验组数图11TOP层具有1,2,3和4个全连接层时的Epoch 针对通过rs-fMRI信号来诊断EMCI问题，本 Fig.11 Epoch when TOP layer has 1,2,3 and 4 fully con- 文提出了一种采用MobileNet的迁移网络来提取 nected layers ROI时间序列特征的方法。对于4D的rs-fMRI 5讨论信号，采用迁移学习来提取特征值可以使网络的训练时间大幅度下降，并能减少瞬时信息的丢失。针对rs-fMRI数据的EMCI分类问题，本文采本文在实验中，采用了ADNI-2的rs-fMRI数据用迁移学习MoblieNet网络对ROI时间序列进行并用DPABI工具箱对这些数据进行预处理，将本特征提取，再进入到分类网络进行分类。实验结文算法与从相关系数提取特征值的方法进行了对果表明，本文的方法较传统方法的分类准确率有比，结果显示本文算法的分类准确率比传统的相所提升，且运行时间也有较大程度的减少，但还关系数方法提高了约10%，而网络的分类时间大有以下几点需要进一步进行讨论。约只有用SAE提取相关系数特征方法的25%

全连接层的层数也会对实验结果产生影响，图 10 和图 11 分别给出了在 1~4 层全连接层时的分类准确率和运行时所用的迭代次数。从图 10 中可以看出，在使用 3 层全连接层时，分类准确率最高，且在 10 组实验中，有 6 次是最高值。如图 7 所示的第 3 层全连接层中提取的特征值的组间差异性明显大于如图 9 所示的池化层中提取的特征值的组间差异性，因此加入全连接层是十分有必要的。 1 2 3 4 5 6 7 8 9 10 实验组数 60 62 64 66 68 70 72 74 76 78 80 1 层全连接层 2 层全连接层 3 层全连接层 4 层全连接层准确率/% 图 10 TOP 层具有 1、2、3 和 4 个全连接层时的测试精度 Fig. 10 Test accuracy when TOP layer has 1, 2, 3 and 4 fully connected layers 而在图 11 中可以看出，随着全连接层层数的增多，迭代次数在相应地减少，但减少的程度在降低。根据图 10 和图 11 综合考虑分类准确率和迭代次数后，我们的实验选用了 3 层全连接层的设置。 1 2 3 4 5 6 7 8 9 10 实验组数 1 层全连接层 2 层全连接层 3 层全连接层 20 40 60 80 100 120 140 160 迭代次数 4 层全连接层图 11 TOP 层具有 1,2,3 和 4 个全连接层时的 Epoch Fig. 11 Epoch when TOP layer has 1, 2, 3 and 4 fully connected layers 5 讨论针对 rs-fMRI 数据的 EMCI 分类问题，本文采用迁移学习 MoblieNet 网络对 ROI 时间序列进行特征提取，再进入到分类网络进行分类。实验结果表明，本文的方法较传统方法的分类准确率有所提升，且运行时间也有较大程度的减少，但还有以下几点需要进一步进行讨论。实验中，本文方法的分类准确率为 73.67%，虽然比其他几种传统方法高，但低于文献 [22] 给出的 86% 的分类结果，该文献采用 SAE 来提取 Pearson 相关系数的特征，其主要原因在于，所使用的数据集较小，被试者数为 64，而文献 [22] 所用被试数为 170。虽然本文所采用的 ADNI-2 数据库中，有关 EMCI 的 rs-fMRI 数据确实较多，但与其对应的 MRI 数据却相对较少。没有对应 MRI 数据将无法进行良好配准，这会导致一些混淆变量不能有效去除，如脑脊液和白质等，而该混淆变量又会影响分类结果。因此，最后能够满足实验条件的 rs-fMRI 数据量就较小。当然，实验中的所采用方法无论是迁移学习还是传统方法，面向的数据集是相同的，即本文方法的性能提升是在同样数据条件下所获得的。在未来的工作中，我们将会尝试更多的可用数据，以进一步来验证本文的研究。另外，在顶层参数设置的实验中，仅给出了全连接层数的实验结果，而未对其他参数作进一步讨论，这主要是因为相对于其他参数，全连接层数对分类结果的影响比较大。对于激活函数，我们也尝试了一些常用的函数，如 ReLu、Softplus 等 [30] ，但发现这些函数的分类结果并没有较大差别，因此选择了较为常见的 Softplus。当然，还有一些参数对顶层性能也非常重要，例如全连接层节点数。节点数量可以根据经验确定，若节点数太小，网络将无法适应复杂分类，若节点数太大，会增加训练时间且可能产生过拟合。在本文的顶层网络中，将 3 个全连接层的节点数分别设置为 200、 100 和 50。最后还有一个重要的顶层参数是 Dropout 层的神经元丢弃率，将其值设为大于 0 时，会降低分类网络对训练数据的拟合程度，从而得到较低的分类准确率，因此最后将其设置为 0。 6 结束语针对通过 rs-fMRI 信号来诊断 EMCI 问题，本文提出了一种采用 MobileNet 的迁移网络来提取 ROI 时间序列特征的方法。对于 4D 的 rs-fMRI 信号，采用迁移学习来提取特征值可以使网络的训练时间大幅度下降，并能减少瞬时信息的丢失。本文在实验中，采用了 ADNI-2 的 rs-fMRI 数据，并用 DPABI 工具箱对这些数据进行预处理，将本文算法与从相关系数提取特征值的方法进行了对比，结果显示本文算法的分类准确率比传统的相关系数方法提高了约 10%，而网络的分类时间大约只有用 SAE 提取相关系数特征方法的 25%。 ·670· 智能系统学报第 16 卷

第4期孔伶旭，等：迁移学习特征提取的s-MRI早期轻度认知障碍分类 ·671· 该结果说明，ImageNet数据库中预训练的迁移网 [12]RUSSAKOVSKY O,DENG J,SU H,et al.ImageNet 络从ROI提取特征的分类准确率要高于从脑区网 large scale visual recognition challenge[J].International 络的功能性连接提取特征的方法，并且这种方法 Journal of Computer Vision,2015,115(3):211-252. 还可减少特征提取的时间和分类网络运行时间。 [13]BACKMAN L,JONES S,BERGER A K,et al.Multiple 参考文献： cognitive deficits during the transition to Alzheimer's dis- ease[J].Journal of internal medicine,2004,256(3): [1]BURNS A.ILIFFE S.Alzheimer's disease[J].British med- 195-204 ical journal,.2009,338(7692):467-471 [14]WEE C Y,YAP P T,DENNY K,et al.Resting-state [2]Alzheimer's Association.2018 Alzheimer's disease facts multi-spectrum functional connectivity networks for iden- and figures[J].Alzheimer's dementia,2018,14(3): tification of MCI patients[J].PLoS One,2012,7(5) 367-429. e37828. [3]DAVATZIKOS C.Baseline and longitudinal patterns of [15]GEHRING J,MIAO Y J,METZE F,et al.Extracting brain atrophy in MCI patients and their use in prediction of deep bottleneck features using stacked auto- short-term conversion to Alzheimer's disease:results from encoders[C]//Proceedings of 2013 IEEE International ADNI[J].Alzheimer's dementia,2009,5(4S):P21-P22. Conference on Acoustics,Speech and Signal Processing [4]GRUNDMAN M,PETERSEN R C,FERRIS S H.Mild Vancouver,BC,Canada,2013:3377-3381 cognitive impairment can be distinguished from Alzheimer [16]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Im- disease and normal aging for clinical trials[J].Archives of ageNet classification with deep convolutional neural net- neurology,2004,61(1):59-66. works[J].Communications of the ACM,2017,60(6): [5]BISCHKOPF J.BUSSE A.ANGERMEYER M C.Mild 84-90. cognitive impairment-a review of prevalence,incidence [17]HON M.KHAN N M.Towards Alzheimer's disease clas- and outcome according to current approaches[J].Acta psy- sification through transfer learning[C]//Proceedings of chiatrica scandinavica.2002.106(6):403-414. 2017 IEEE International Conference on Bioinformatics [6]SHARMA N,SINGH A N.Exploring biomarkers for and Biomedicine.Kansas City,MO,USA,2017: Alzheimer's disease[J].Journal of clinical and diagnostic 1166-1169. research,2016,10(7):KE01-KE06. [18]JOHNSON K A,FOX N C,SPERLING R A,et al.Brain [7]MCKAHNN G.Clinical diagnosis of Alzheimer's disease: Imaging in Alzheimer Disease[J].Cold spring harbor per- report of the NINCDS-ADRDA Work Group*under the spectives in medicine,2012,2(4):a006213. auspices of department of health and human services task [19]CUINGNET R.GERARDIN E.TESSIERAS J.et al force on Alzheimer's disease[J].Neurology,1984,34(7): Automatic classification of patients with Alzheimer's dis- 939. ease from structural MRI:a comparison of ten methods [8]SCHROETER ML.STEIN T.MASLOWSKI N.et al. using the ADNI database[J].Neuroimage,2011,56(2): Neural correlates of Alzheimer's disease and mild cognit- 766-781」 ive impairment:a systematic and quantitative meta-analys- [20]BARKHOF F,HALLER S,ROMBOUTS S A R B.Rest- is involving 1351 patients[J].Neurolmage,2009,47(4): ing-state functional MR imaging:a new window to the 1196-1206 brain[J].Radiology,2014,272(1):29-49. [9]HALLER S,BARTSCH A J.Pitfalls in fMRI[J].European [21]MACHULDA MM,WARD H A,BOROWSKI B,et al. radiology,.2009,1911)2689-2706. Comparison of memory fMRI response among Normal [10]BRIER M R,THOMAS J B,SNYDER A Z,et al.Loss of MCI,and Alzheimer's patients[J].Neurology,2003, intranetwork and internetwork resting state functional 61(4:500-506 connections with Alzheimer's disease progression[J]. [22]JU Ronghui,HU Chenhui,ZHOU Pan,et al.Early dia- Journal of neuroscience,2012,32(26):8890-8899 gnosis of Alzheimer's disease based on resting-state brain [11]STANLEY ML.MOUSSA MN.PAOLINI B M.et al. networks and deep learning[J].IEEE/ACM Transactions Defining nodes in complex brain networks[J].Frontiers in on Computational Biology and Bioinformatics,2019, computational neuroscience,2013,7:169 16(1244-257

该结果说明，ImageNet 数据库中预训练的迁移网络从 ROI 提取特征的分类准确率要高于从脑区网络的功能性连接提取特征的方法，并且这种方法还可减少特征提取的时间和分类网络运行时间。参考文献： BURNS A, ILIFFE S. Alzheimer’s disease[J]. British medical journal, 2009, 338(7692): 467–471. [1] Alzheimer’s Association. 2018 Alzheimer’s disease facts and figures[J]. Alzheimer’s & dementia, 2018, 14(3): 367–429. [2] DAVATZIKOS C. Baseline and longitudinal patterns of brain atrophy in MCI patients and their use in prediction of short-term conversion to Alzheimer’s disease: results from ADNI[J]. Alzheimer’s & dementia, 2009, 5(4S): P21–P22. [3] GRUNDMAN M, PETERSEN R C, FERRIS S H. Mild cognitive impairment can be distinguished from Alzheimer disease and normal aging for clinical trials[J]. Archives of neurology, 2004, 61(1): 59–66. [4] BISCHKOPF J, BUSSE A, ANGERMEYER M C. Mild cognitive impairment-a review of prevalence, incidence and outcome according to current approaches[J]. Acta psychiatrica scandinavica, 2002, 106(6): 403–414. [5] SHARMA N, SINGH A N. Exploring biomarkers for Alzheimer's disease[J]. Journal of clinical and diagnostic research, 2016, 10(7): KE01–KE06. [6] MCKAHNN G. Clinical diagnosis of Alzheimer's disease: report of the NINCDS-ADRDA Work Group* under the auspices of department of health and human services task force on Alzheimer's disease[J]. Neurology, 1984, 34(7): 939. [7] SCHROETER M L, STEIN T, MASLOWSKI N, et al. Neural correlates of Alzheimer’s disease and mild cognitive impairment: a systematic and quantitative meta-analysis involving 1351 patients[J]. NeuroImage, 2009, 47(4): 1196–1206. [8] HALLER S, BARTSCH A J. Pitfalls in fMRI[J]. European radiology, 2009, 19(11): 2689–2706. [9] BRIER M R, THOMAS J B, SNYDER A Z, et al. Loss of intranetwork and internetwork resting state functional connections with Alzheimer’s disease progression[J]. Journal of neuroscience, 2012, 32(26): 8890–8899. [10] STANLEY M L, MOUSSA M N, PAOLINI B M, et al. Defining nodes in complex brain networks[J]. Frontiers in computational neuroscience, 2013, 7: 169. [11] RUSSAKOVSKY O, DENG J, SU H, et al. ImageNet large scale visual recognition challenge[J]. International Journal of Computer Vision, 2015, 115(3): 211–252. [12] BÄCKMAN L, JONES S, BERGER A K, et al. Multiple cognitive deficits during the transition to Alzheimer's disease[J]. Journal of internal medicine, 2004, 256(3): 195–204. [13] WEE C Y, YAP P T, DENNY K, et al. Resting-state multi-spectrum functional connectivity networks for identification of MCI patients[J]. PLoS One, 2012, 7(5): e37828. [14] GEHRING J, MIAO Y J, METZE F, et al. Extracting deep bottleneck features using stacked autoencoders[C]//Proceedings of 2013 IEEE International Conference on Acoustics, Speech and Signal Processing. Vancouver, BC, Canada, 2013: 3377−3381. [15] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84–90. [16] HON M, KHAN N M. Towards Alzheimer's disease classification through transfer learning[C]//Proceedings of 2017 IEEE International Conference on Bioinformatics and Biomedicine. Kansas City, MO, USA, 2017: 1166−1169. [17] JOHNSON K A, FOX N C, SPERLING R A, et al. Brain Imaging in Alzheimer Disease[J]. Cold spring harbor perspectives in medicine, 2012, 2(4): a006213. [18] CUINGNET R, GERARDIN E, TESSIERAS J, et al. Automatic classification of patients with Alzheimer’s disease from structural MRI: a comparison of ten methods using the ADNI database[J]. Neuroimage, 2011, 56(2): 766–781. [19] BARKHOF F, HALLER S, ROMBOUTS S A R B. Resting-state functional MR imaging: a new window to the brain[J]. Radiology, 2014, 272(1): 29–49. [20] MACHULDA M M, WARD H A, BOROWSKI B, et al. Comparison of memory fMRI response among Normal, MCI, and Alzheimer's patients[J]. Neurology, 2003, 61(4): 500–506. [21] JU Ronghui, HU Chenhui, ZHOU Pan, et al. Early diagnosis of Alzheimer’s disease based on resting-state brain networks and deep learning[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2019, 16(1): 244–257. [22] 第 4 期孔伶旭，等：迁移学习特征提取的 rs-fMRI 早期轻度认知障碍分类 ·671·

点击进入文档下载页（PDF格式）

共11页，试读已结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录