正在加载图片...
·358· 智能系统学报 第12卷 的训练样本尤为有效。可以看出,融合思想是一种 在使用Lasso做特征选择的过程中,本文使用 综合分析的思想,因此,对于同一模态的数据的多 稳定性特征选择算法[]来避免过拟合。稳定性选 种特征进行综合分析、评判和决策处理也是某种意 择是一种基于二次抽样和选择算法相结合较新的 义上的融合方式。对于脑功能网络的研究,其所需 方法,它的主要思想是在不同的数据子集和特征子 要的数据信息可以从以上提取到的各种特征中,通 集上运行特征选择算法,不断地重复,最终汇总特 过融合得出一种贡献最大、最具有判别性的综合 征选择结果。 在本文的实验中,采用网格搜索的方法来确定 特征。 最优的聚类系数阈值和Lasso模型中的一范数 在本文的实验中,将前面提取到的两种数据特 参数。 征进行线性融合。具体计算如下,设节点的特征矩 3.2比较方法 阵为 本文选取如下的方法进行比较。 a 基于原始特征的方法:使用没有经过任何特征 选择的脑网络数据,作为基线方法。 基于边特征的方法:只使用脑网络中的边权 边特征矩阵为 重,选择出具有判别性的特征,本文的实验中使用 Lasso算法做特征选择。 B= 基于节点特征的方法:只使用脑网络中节点的 聚类系数。 则融合后的特征矩阵为 3.3实验结果 an alebul bie 本文通过对临床变量值MMSE的估计来评估回归 C= 性能。在表2、图2、图3中显示了比较方法计算得到的 ane bal … b CC和RMSE的值。从表2中可以看到没有经过特征 选择、特征提取的原始数据的回归性能最不好,这说明 式中:n表示样本个数c表示节点特征个数;e表示 特征的选择和提取对于之后的模式识别有着至关重要 边特征个数。 的影响。此外,本文所提出的融合多特征的方法在任 2.5模型训练 意一组对照实验中均优于单一特征的方法。可以看到 对于融合后的特征,使用支持向量回归机SVR 各个方法对于MMSE这一临床评分的预测性能,在 对阿尔茨海默病的临床变量值MMSE进行回归 ADvs.NC中,使用本文方法,计算得到的CC达到了 预测。 0.6922,RMSE为3.0972.而单一特征CC值最高达到了 0.6189,RMSE最小的为3.3780。在ADvs.MCI中,本 3实验结果与分析 文方法计算得到的CC值达到了0.6233,RMSE值为 3.1 实验设置 2.7767。而单一特征CC值最高达到了0.5493,RMSE 本文的实验考虑4种回归问题:ADvs.NC、AD 最小的为3.0241。本文提出的方法在MCI vs..NC和 vs.MCI,MCI vs..NC以及EMCI vs.LMCI。为了评 EMCI vs.LMCI实验中同样获得了好的预测结果。 估所有比较方法的性能,计算了预测临床评分和真 0.7 ■节点特征 0.6 ☐边特征 实的临床评分之间的相关系数(correlation ☐融合特征 coefficient,CC)和均方根误差(root mean squared eor,RMSE)。相关系数越大说明预测值和真实值 8 这两组数据之间相关性越强。均方根误差越小说 明预测模型越能更好地描述实验数据。 本文比较的所有方法均采用留一法进行交叉 0.1 验证。具体而言,在每次的实验中,选取一个样本 AD vs NC AD vs.MCI MIC vs NC EMCI vs.LMCI 作为测试样本,其余样本作为训练样本。计算出的 预测值组成的预测向量和原始标签向量做相关分 图2不同方法的相关系数 Fig.2 The correlation coefficient of the competing methods 析,来衡量该模型的性能。的训练样本尤为有效。 可以看出,融合思想是一种 综合分析的思想,因此,对于同一模态的数据的多 种特征进行综合分析、评判和决策处理也是某种意 义上的融合方式。 对于脑功能网络的研究,其所需 要的数据信息可以从以上提取到的各种特征中,通 过融合得出一种贡献最大、最具有判别性的综合 特征。 在本文的实验中,将前面提取到的两种数据特 征进行线性融合。 具体计算如下,设节点的特征矩 阵为 A = a11 … a1c ︙ ︙ an1 … anc é ë ê ê ê ê ù û ú ú ú ú 边特征矩阵为 B = b11 … b1e ︙ ︙ bn1 … bne é ë ê ê ê ê ù û ú ú ú ú 则融合后的特征矩阵为 C = a11 … a1c ︙ ︙ an1 … anc b11 … b1e ︙ ︙ bn1 … bne é ë ê ê ê ê ù û ú ú ú ú 式中:n 表示样本个数;c 表示节点特征个数;e 表示 边特征个数。 2.5 模型训练 对于融合后的特征,使用支持向量回归机 SVR 对阿尔茨海默病的临床变量值 MMSE 进行回归 预测。 3 实验结果与分析 3.1 实验设置 本文的实验考虑 4 种回归问题:AD vs. NC、AD vs. MCI、MCI vs. NC 以及 EMCI vs. LMCI。 为了评 估所有比较方法的性能,计算了预测临床评分和真 实的 临 床 评 分 之 间 的 相 关 系 数 ( correlation coefficient,CC) 和均方根 误 差 ( root mean squared error,RMSE)。 相关系数越大说明预测值和真实值 这两组数据之间相关性越强。 均方根误差越小说 明预测模型越能更好地描述实验数据。 本文比较的所有方法均采用留一法进行交叉 验证。 具体而言,在每次的实验中,选取一个样本 作为测试样本,其余样本作为训练样本。 计算出的 预测值组成的预测向量和原始标签向量做相关分 析,来衡量该模型的性能。 在使用 Lasso 做特征选择的过程中,本文使用 稳定性特征选择算法[17] 来避免过拟合。 稳定性选 择是一种基于二次抽样和选择算法相结合较新的 方法,它的主要思想是在不同的数据子集和特征子 集上运行特征选择算法,不断地重复,最终汇总特 征选择结果。 在本文的实验中,采用网格搜索的方法来确定 最优的聚类系 数 阈 值 和 Lasso 模 型 中 的 一 范 数 参数。 3.2 比较方法 本文选取如下的方法进行比较。 基于原始特征的方法:使用没有经过任何特征 选择的脑网络数据,作为基线方法。 基于边特征的方法:只使用脑网络中的边权 重,选择出具有判别性的特征,本文的实验中使用 Lasso 算法做特征选择。 基于节点特征的方法:只使用脑网络中节点的 聚类系数。 3.3 实验结果 本文通过对临床变量值 MMSE 的估计来评估回归 性能。 在表2、图2、图3 中显示了比较方法计算得到的 CC 和 RMSE 的值。 从表 2 中可以看到没有经过特征 选择、特征提取的原始数据的回归性能最不好,这说明 特征的选择和提取对于之后的模式识别有着至关重要 的影响。 此外,本文所提出的融合多特征的方法在任 意一组对照实验中均优于单一特征的方法。 可以看到 各个方法对于 MMSE 这一临床评分的预测性能,在 AD vs. NC中,使用本文方法,计算得到的 CC 达到了 0.692 2,RMSE 为3.097 2。而单一特征 CC 值最高达到了 0.618 9,RMSE 最小的为 3.378 0。 在 AD vs. MCI 中,本 文方法计算得到的 CC 值达到了0.623 3,RMSE 值为 2.776 7。 而单一特征 CC 值最高达到了 0.549 3,RMSE 最小的为 3.024 1。 本文提出的方法在 MCI vs. NC 和 EMCI vs. LMCI 实验中同样获得了好的预测结果。 图 2 不同方法的相关系数 Fig.2 The correlation coefficient of the competing methods ·358· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有