正在加载图片...
·1230 工程科学学报,第43卷,第9期 3.2性能指标 类样本标注为未分类样本,因此如何减少这类样 为了评价心跳分类方法的性能,我们使用以 本的信号变形和损失是关键,但这不在本文研究 下三个指标,分别为:准确率(Accuracy),召回率 的范围内 (Recall))和精确率(Precision).其中,准确率反映了 表2每类心跳的召回率和精确率 模型预测正确的样本占所有样本的比例,召回率 Table 2 Recall and precision for each heartbeat class 反映了在真实类为正类的样本中,模型识别为正 Heartbeat type Number of test samples Recall/%Precision/% 类样本所占的比例,精确率反映了在模型识别为 正类的所有样本中,真实类也为正类样本所占的 65270 99.58 99.43 4843 99.71 99.67 比例.它们的计算方法如下: 4353 99.61 99.34 TP+TN Accuracy=TP+TN+FP+P示×I00% (8) A 1528 86.45 94.90 4277 TP b 97.80 95.57 Recall = TP+FN X100% (9) 4216 99.69 99.41 TP 75 65.33 92.45 Precision=10% (10) 236 93.64 92.47 其中,TP、TN、N和FP分别为真阳性数(Tue 401 79.55 87.40 positive)、真阴性数(True negative)、假阴性数 97 86.60 94.38 (False negative)和假阳性数(False positive). j 115 87.83 71.13 3.3实验结果 491 91.65 96.98 实验统一采用五折交叉验证的方式进行模型 少 94.34 98.04 效果评估,抽样的方式选择分层抽样,也就是说, 灯 90.24 97.37 在训练集中,我们对于每一类心跳分别将其平均 12.50 100.00 分为五份,将每一类中的每一份样本进行组合,形 p 17 5.88 50.00 成五份样本子集.轮流选取其中的四份作为训练 Total 86021 99.02 99.02 集,一份作为验证集.重复训练及验证模型五次, 并将五次结果的平均准确率作为模型选择的评价 表4展示了所提方法与其他方法的比较结果 标准 基于融合特征的ELM算法在单导联的准确率为 表2中给出了每一个心跳类别的召回率和精 98.81%,比文献[9]中方法得到的98.72%准确率 确率.大部分类别呈现出了满意的分类性能,除了 更高.而且,基于融合特征的分类方法其效果要好 类别a、F、e和Q.表3给出了分类结果的混淆矩 于单独用手工特征或深度特征的方法.另外,基 阵(Confusion matrix),从中我们可以观察到具体的 于Bagging集成的ELM分类方法进一步提升了分 分类情况.具体地,在真实类别为a类的所有样本 类性能,达到了99.02%的最高准确率 中,26个被误分,主要为11个样本被误分为N, 4结论 4个被误分为A,还有7个被误分为V,其原因是 类别a与其他3个误分类别的形态学差异并不明 本文提出了一种基于手工特征和深度特征融 显;82个F类样本被误分,主要为54个F类样本 合的集成超限学习机心跳分类方法.手工提取的 被误分为N类,27个被误分为V类,原因在于 特征包括RR间期特征和离散小波系数特征,分别 MIT-BIH数据集编号为213的记录中,F类样本 反映了心跳信号的时域特性和时频特性.同时设 和N、V类样本具有很强的形态学相似性,这就导 计了针对心跳信号的ID CNN结构,对心跳信号 致F类很容易被错误地识别为N和V类;在所有 的深度特征进行自动提取.ELM模型融合上述特 8个类样本中仅仅分对了1例.而其他都被误分 征并进行心跳分类.由于ELM初始参数随机生 为N类,这也是归因于在MIT-BIH数据集编号为 成,这种方式会导致ELM出现分类性能不稳定的 223的记录中,e类心跳信号与N类的形态学特征 现象,因此,针对上述问题,本文采用基于Bagging 并没有明显的区别:Q类的心跳信号表现为无规 策略的多ELM集成方法,实验结果表明,将深度 则地而且幅值变化很大的震荡,心血管专家将这 特征与手工特征融合能更全面地表征心跳信号,3.2    性能指标 为了评价心跳分类方法的性能,我们使用以 下三个指标,分别为:准确率(Accuracy),召回率 (Recall)和精确率 (Precision). 其中,准确率反映了 模型预测正确的样本占所有样本的比例,召回率 反映了在真实类为正类的样本中,模型识别为正 类样本所占的比例,精确率反映了在模型识别为 正类的所有样本中,真实类也为正类样本所占的 比例. 它们的计算方法如下: Accuracy = TP+TN TP+TN+FP+FN ×100% (8) Recall = TP TP+FN ×100% (9) Precision = TP TP+FP ×100% (10) 其中 , TP、 TN、 FN 和 FP 分别为真阳性数 ( True positive) 、真阴性数 ( True  negative) 、假阴性数 (False negative)和假阳性数(False positive). 3.3    实验结果 实验统一采用五折交叉验证的方式进行模型 效果评估. 抽样的方式选择分层抽样,也就是说, 在训练集中,我们对于每一类心跳分别将其平均 分为五份,将每一类中的每一份样本进行组合,形 成五份样本子集. 轮流选取其中的四份作为训练 集,一份作为验证集. 重复训练及验证模型五次, 并将五次结果的平均准确率作为模型选择的评价 标准. 表 2 中给出了每一个心跳类别的召回率和精 确率. 大部分类别呈现出了满意的分类性能,除了 类别 a、F、e 和 Q. 表 3 给出了分类结果的混淆矩 阵(Confusion matrix),从中我们可以观察到具体的 分类情况. 具体地,在真实类别为 a 类的所有样本 中 , 26 个被误分 ,主要为 11 个样本被误分为 N, 4 个被误分为 A,还有 7 个被误分为 V,其原因是 类别 a 与其他 3 个误分类别的形态学差异并不明 显;82 个 F 类样本被误分,主要为 54 个 F 类样本 被误分 为 N 类 , 27 个被误分 为 V 类 ,原因在 于 MIT−BIH 数据集编号为 213 的记录中,F 类样本 和 N、V 类样本具有很强的形态学相似性,这就导 致 F 类很容易被错误地识别为 N 和 V 类;在所有 8 个 e 类样本中仅仅分对了 1 例,而其他都被误分 为 N 类,这也是归因于在 MIT−BIH 数据集编号为 223 的记录中,e 类心跳信号与 N 类的形态学特征 并没有明显的区别;Q 类的心跳信号表现为无规 则地而且幅值变化很大的震荡,心血管专家将这 类样本标注为未分类样本,因此如何减少这类样 本的信号变形和损失是关键,但这不在本文研究 的范围内. 表 2 每类心跳的召回率和精确率 Table 2   Recall and precision for each heartbeat class Heartbeat type Number of test samples Recall/% Precision/% N 65270 99.58 99.43 L 4843 99.71 99.67 R 4353 99.61 99.34 A 1528 86.45 94.90 V 4277 97.80 95.57 / 4216 99.69 99.41 a 75 65.33 92.45 ! 236 93.64 92.47 F 401 79.55 87.40 x 97 86.60 94.38 j 115 87.83 71.13 f 491 91.65 96.98 E 53 94.34 98.04 J 41 90.24 97.37 e 8 12.50 100.00 Q 17 5.88 50.00 Total 86021 99.02 99.02 表 4 展示了所提方法与其他方法的比较结果. 基于融合特征的 ELM 算法在单导联的准确率为 98.81%,比文献 [9] 中方法得到的 98.72% 准确率 更高. 而且,基于融合特征的分类方法其效果要好 于单独用手工特征或深度特征的方法. 另外,基 于 Bagging 集成的 ELM 分类方法进一步提升了分 类性能,达到了 99.02% 的最高准确率. 4    结论 本文提出了一种基于手工特征和深度特征融 合的集成超限学习机心跳分类方法. 手工提取的 特征包括 RR 间期特征和离散小波系数特征,分别 反映了心跳信号的时域特性和时频特性. 同时设 计了针对心跳信号的 1D CNN 结构,对心跳信号 的深度特征进行自动提取. ELM 模型融合上述特 征并进行心跳分类. 由于 ELM 初始参数随机生 成,这种方式会导致 ELM 出现分类性能不稳定的 现象,因此,针对上述问题,本文采用基于 Bagging 策略的多 ELM 集成方法. 实验结果表明,将深度 特征与手工特征融合能更全面地表征心跳信号, · 1230 · 工程科学学报,第 43 卷,第 9 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有