许越凡等:基于一维卷积特征与手工特征融合的集成超限学习机心跳分类方法 1225· designed to automatically extract deep features for heartbeat signals.These features were fused by an ELM for heartbeat classification. Because of the instability caused by the random assignment of ELM hidden layer parameters,the bagging ensemble strategy was introduced to integrate multiple ELMs to achieve stable classification performance and good generalization ability.The proposed approach was validated on the MIT-BIH arrhythmia public dataset.The classification accuracy reaches 99.02%,and the experimental results show that the performance of the proposed approach with fused features is better than those with only deep features and only handcrafted features. KEY WORDS heartbeat classification:feature fusion:ID convolutional neural network:wavelet transform:ensemble extreme learning machine 心律失常是由心脏电脉冲的频率、规律性、起 数据可直接输入到CNN中,利用CNN的逐层卷 搏位置或者传导的紊乱引起的四严重的心律失常 积操作,提取深层的特征,形成原始信号的抽象 甚至会威胁人类的生命.心电图(Electrocardiogram, 表示19 ECG)记录了人体心脏每一个心动周期所产生的 对于分类任务,往往通过在CNN网络最后一 电活动变化,是医生诊断心律失常的重要依据.由 层增加softmax层实现.CNN网络参数的训练一 于心律失常种类繁多,表现复杂,识别心律失常往 般采用反向传播(Back propagation,.BP)算法.但 往需要有丰富经验的医生.而且,常规的心电图检 是,该算法容易陷入局部最优,且非常耗时.为解 查仅仅持续几分钟,一些偶然发生的不规则心律 决上述问题,超限学习机(Extreme leaning machine, 失常并不能被检查出来.例如心源性猝死这种心 ELM)被提出,ELM是一种单隐含层前馈神经网 血管病,从发病到死亡持续时间短,基于传统的常 Single hidden layer feedforward neural network, 规心电图检查方式缺乏实时性,往往会耽误病人 SLFN),其中隐含层参数是随机生成的,不需要调 最好的治疗时间 整,而输出参数通过最小二乘法解析得到0因 动态心电图监测仪(Holter),是由Norman J. 此,其训练速度相比于BP算法是很快的.同时, Holter于1949年发明的可穿戴设备,它能够连续 ELM具有万能逼近能力,也就是说,随着隐含层节 监测病人日常生活中24h甚至更长时间的心脏电 点数的增加,网络能够以无限小的误差逼近非线 活动,这种长时程的记录有助于监测偶然发生的 性函数叫 心律失常.因此,基于动态心电图的自动心律失常 现有的心律失常分类方法往往只单独考虑手 分类方法对于及时发现和预防心血管疾病有着重 工提取的特征或者深度学习自动提取的特征,而 要的意义 融合深度卷积网络自动提取的特征和手工提取的 影响心电信号自动分类系统性能主要有两个 特征对心跳信号的表示更全面,并能产生更好的 因素,一是心电信号特征的提取,二是分类器的选 分类性能.为此,本文提出了一种融合手工特征和 择.特征提取的质量对心跳分类性能具有至关重 深度特征的集成超限学习机心跳分类方法.我们 要的影响,提取的特征对于不同类别的心律失常 设计了一种针对心跳信号分类的一维CNN结构, 应具有更好的离散性,而对同类心律失常具有相 利用其多层卷积操作提取了心电信号的深层特 似性.传统的心律失常分类方法使用手工提取的 征.另外又手工提取了心跳信号的特征,包括RR 特征,其特征是可解释的.之前的文献针对心电信 间期特征与小波系数特征.然后,我们融合这些特 号已经提取了各种各样的特征,包括相邻心跳时 征并将其作为ELM的输入,进行分类.为了弥补 间间隔特征(RR Intervals)P-引、形态学特征、小波 ELM随机生成参数而导致的分类结果不稳定的缺 特征5-6、高斯混合模型特征)和高阶统计量1等 陷,我们使用Bagging方法对多个ELM分类器进 对于心律失常分类任务,支持向量机四、k近邻© 行集成,得到更好的分类结果 等分类器已经被使用 1基本算法 近年来,由于自动提取特征的优势,学者们广 泛研究了卷积神经网络(Convolutional neural 11卷积神经网络 network,CNN),提出了各种不同结构的CNN-l, CNN是一类包含卷积计算且具有深度结构的 并成功应用于不同领域,包括人脸识别1切、语义 前馈神经网络,是深度学习的代表算法之一,不同 分割等.这种方法的特点是,具有原始结构的 维度的输入数据能够用不同类型的卷积来进行操designed to automatically extract deep features for heartbeat signals. These features were fused by an ELM for heartbeat classification. Because of the instability caused by the random assignment of ELM hidden layer parameters, the bagging ensemble strategy was introduced to integrate multiple ELMs to achieve stable classification performance and good generalization ability. The proposed approach was validated on the MIT-BIH arrhythmia public dataset. The classification accuracy reaches 99.02%, and the experimental results show that the performance of the proposed approach with fused features is better than those with only deep features and only handcrafted features. KEY WORDS heartbeat classification; feature fusion; 1D convolutional neural network; wavelet transform; ensemble extreme learning machine 心律失常是由心脏电脉冲的频率、规律性、起 搏位置或者传导的紊乱引起的[1] . 严重的心律失常 甚至会威胁人类的生命. 心电图(Electrocardiogram, ECG)记录了人体心脏每一个心动周期所产生的 电活动变化,是医生诊断心律失常的重要依据. 由 于心律失常种类繁多,表现复杂,识别心律失常往 往需要有丰富经验的医生. 而且,常规的心电图检 查仅仅持续几分钟,一些偶然发生的不规则心律 失常并不能被检查出来. 例如心源性猝死这种心 血管病,从发病到死亡持续时间短,基于传统的常 规心电图检查方式缺乏实时性,往往会耽误病人 最好的治疗时间. 动态心电图监测仪( Holter),是由 Norman J. Holter 于 1949 年发明的可穿戴设备,它能够连续 监测病人日常生活中 24 h 甚至更长时间的心脏电 活动,这种长时程的记录有助于监测偶然发生的 心律失常. 因此,基于动态心电图的自动心律失常 分类方法对于及时发现和预防心血管疾病有着重 要的意义. 影响心电信号自动分类系统性能主要有两个 因素,一是心电信号特征的提取,二是分类器的选 择. 特征提取的质量对心跳分类性能具有至关重 要的影响,提取的特征对于不同类别的心律失常 应具有更好的离散性,而对同类心律失常具有相 似性. 传统的心律失常分类方法使用手工提取的 特征,其特征是可解释的. 之前的文献针对心电信 号已经提取了各种各样的特征,包括相邻心跳时 间间隔特征(RR Intervals) [2−3]、形态学特征[4]、小波 特征[5−6]、高斯混合模型特征[7] 和高阶统计量[8] 等. 对于心律失常分类任务,支持向量机[9]、k 近邻[10] 等分类器已经被使用. 近年来,由于自动提取特征的优势,学者们广 泛 研 究 了 卷 积 神 经 网 络 ( Convolutional neural network,CNN),提出了各种不同结构的 CNN[11−14] , 并成功应用于不同领域,包括人脸识别[15−17]、语义 分割[18] 等. 这种方法的特点是,具有原始结构的 数据可直接输入到 CNN 中,利用 CNN 的逐层卷 积操作,提取深层的特征,形成原始信号的抽象 表示[19] . 对于分类任务,往往通过在 CNN 网络最后一 层增加 softmax 层实现. CNN 网络参数的训练一 般采用反向传播(Back propagation,BP)算法. 但 是,该算法容易陷入局部最优,且非常耗时. 为解 决上述问题,超限学习机(Extreme leaning machine, ELM)被提出. ELM 是一种单隐含层前馈神经网 络 ( Single hidden layer feedforward neural network, SLFN),其中隐含层参数是随机生成的,不需要调 整,而输出参数通过最小二乘法解析得到[20] . 因 此,其训练速度相比于 BP 算法是很快的. 同时, ELM 具有万能逼近能力,也就是说,随着隐含层节 点数的增加,网络能够以无限小的误差逼近非线 性函数[21] . 现有的心律失常分类方法往往只单独考虑手 工提取的特征或者深度学习自动提取的特征,而 融合深度卷积网络自动提取的特征和手工提取的 特征对心跳信号的表示更全面,并能产生更好的 分类性能. 为此,本文提出了一种融合手工特征和 深度特征的集成超限学习机心跳分类方法. 我们 设计了一种针对心跳信号分类的一维 CNN 结构, 利用其多层卷积操作提取了心电信号的深层特 征. 另外又手工提取了心跳信号的特征,包括 RR 间期特征与小波系数特征. 然后,我们融合这些特 征并将其作为 ELM 的输入,进行分类. 为了弥补 ELM 随机生成参数而导致的分类结果不稳定的缺 陷,我们使用 Bagging 方法对多个 ELM 分类器进 行集成,得到更好的分类结果. 1 基本算法 1.1 卷积神经网络 CNN 是一类包含卷积计算且具有深度结构的 前馈神经网络,是深度学习的代表算法之一. 不同 维度的输入数据能够用不同类型的卷积来进行操 许越凡等: 基于一维卷积特征与手工特征融合的集成超限学习机心跳分类方法 · 1225 ·