正在加载图片...
·1228 工程科学学报,第43卷,第9期 2.3一维卷积神经网络 15个样本点.S2是一个子采样层,由执行在C1层 在图像分类中,由于图像中蕴含的模式较为 特征映射上的最大池化操作得到.C3也是一个卷 复杂,2DCNN往往需要较深的结构.而对于 积层,包括10个特征映射.每个核的长度为4. ECG信号,其网络的输入是分割后的心跳片段,维 S4是子采样层,由执行在C3层特征映射上的最 度较低.采用过深的网络结构可能会恶化分类性 大池化操作得到.随后所有S4层的特征平铺成一 能且增加计算代价.因此,我们设计了一个具有较 个350维的特征向量,C5层的特征作为对输入 浅结构的1DCNN,总共有7层,如图3所示.模型 心跳信号的深层特征表示.全连接层F6以及输出 包括三个卷积层,两个子采样层,一个全连接层和 层共同执行分类任务,输出层的神经元个数与待 一个输出层.C1是一个卷积层,包括30个特征映 分类的心跳信号类别数量一致,即16个输出层神 射.每个核的长度是15,连接到输入信号的相邻 经元 C1:feature maps 30@220×1 Input:234×1 S2:feature maps C3:feature maps C5:350 F6:6000 30@110×1 10@107×1 S4:feature maps 10@35×1 Output:16 15 units Flatting Full connection Convolutions Subsampling Convolutions Subsampling Full connection 图3本文提出的1DCNN结构 Fig.3 Structure of the proposed 1D convolutional neural network 损失函数选用交叉嫡(Cross entropy).随机梯 也会存在一定的随机性.为了提高ELM分类性能 度下降用来训练神经网络的参数.使用三种提升 的稳定性和准确性,我们采用Bagging集成学习方 权重训练过程的方法,分别为:权值衰减(Weight 法将多个ELM分类器进行组合.集成学习的关键 decay)、动量(Momentum)和随机失活(Dropout). 在于构造具有差异性的弱分类器.因此,一方面,在 权值衰减就是在权重更新规则中加入一个项使得 构造多个训练集时采用有放回采样(Bootstrap),即 权值指数地衰减到0,这个方法可以用来避免过拟 从训练样本中随机有放回抽样.这意味着,某一个 合.Momentum是一种加速梯度下降的技术,对于 训练样本可能多次出现在新构造的训练集中,也有 那些当前的梯度方向与上一次梯度方向相同的参 可能一次都不会选中.上述方法是从数据集构造方 数进行加强,即在这些方向上更快:相反,对于那 面增加集成的多样性.另一方面,正因为ELM隐含 些当前的梯度方向与上一次梯度方向不同的参数 层参数的随机初始化,使得集成模型中每一个 进行减弱,即在这些方向上减慢.Dropout是指在 ELM模型都不相同,同样增加了集成多样性 每次训练迭代中,随机地从神经网络中消除一部 当多个不同的训练集被构造出来后,分别在 分节点,这也是一种避免过拟合的技术 这些训练集上训练不同的ELM心跳分类模型.最 2.4ELM心跳分类 后通过多数投票的方式,票数最多的心跳类别即 当手工特征和ID CNN的深度特征被提取出 为最终集成的分类结果 来后,它们被整合到一起作为ELM的输入.图4 3 实验验证 显示了基于单个ELM的心跳分类模型.其中,输 入层是由手工特征包括RR间期特征和离散小波 本文中使用麻省理工律失常公开数据集(MIT- 系数特征以及深度特征即1DCNN特征共同组 BIH arrhythmia dataset)对所提出的方法进行验证. 成,因此ELM输入层节点数等于所有这些特征的 3.1数据集 总个数.输出层节点数等于待分类的心跳类别数. MIT-BH心律失常数据库是研究心律失常分 2.5 Bagging集成方法 类算法广泛使用的数据库之一2.它包含48个0.5h 由于ELM隐含层参数的随机分配,其分类结果 的双通道动态心电图记录,其中的23份为比较常见2.3    一维卷积神经网络 在图像分类中,由于图像中蕴含的模式较为 复杂 , 2D  CNN 往往需要较深的结构 . 而 对 于 ECG 信号,其网络的输入是分割后的心跳片段,维 度较低. 采用过深的网络结构可能会恶化分类性 能且增加计算代价. 因此,我们设计了一个具有较 浅结构的 1D CNN,总共有 7 层,如图 3 所示. 模型 包括三个卷积层,两个子采样层,一个全连接层和 一个输出层. C1 是一个卷积层,包括 30 个特征映 射. 每个核的长度是 15,连接到输入信号的相邻 15 个样本点. S2 是一个子采样层,由执行在 C1 层 特征映射上的最大池化操作得到. C3 也是一个卷 积层,包括 10 个特征映射. 每个核的长度为 4. S4 是子采样层,由执行在 C3 层特征映射上的最 大池化操作得到. 随后所有 S4 层的特征平铺成一 个 350 维的特征向量 ,C5 层的特征作为对输入 心跳信号的深层特征表示. 全连接层 F6 以及输出 层共同执行分类任务. 输出层的神经元个数与待 分类的心跳信号类别数量一致,即 16 个输出层神 经元. Flatting Convolutions Convolutions Subsampling Full connection 15 units C1: feature maps 30@220×1 S4: feature maps 10@35×1 C3: feature maps 10@107×1 C5: 350 F6: 6000 Output: 16 Full connection Input: 234×1 S2: feature maps 30@110×1 Subsampling 图 3    本文提出的 1D CNN 结构 Fig.3    Structure of the proposed 1D convolutional neural network 损失函数选用交叉熵(Cross entropy). 随机梯 度下降用来训练神经网络的参数. 使用三种提升 权重训练过程的方法,分别为:权值衰减(Weight decay)、动量(Momentum)和随机失活(Dropout) . 权值衰减就是在权重更新规则中加入一个项使得 权值指数地衰减到 0,这个方法可以用来避免过拟 合. Momentum 是一种加速梯度下降的技术,对于 那些当前的梯度方向与上一次梯度方向相同的参 数进行加强,即在这些方向上更快;相反,对于那 些当前的梯度方向与上一次梯度方向不同的参数 进行减弱,即在这些方向上减慢. Dropout 是指在 每次训练迭代中,随机地从神经网络中消除一部 分节点,这也是一种避免过拟合的技术. 2.4    ELM 心跳分类 当手工特征和 1D CNN 的深度特征被提取出 来后,它们被整合到一起作为 ELM 的输入. 图 4 显示了基于单个 ELM 的心跳分类模型. 其中,输 入层是由手工特征包括 RR 间期特征和离散小波 系数特征以及深度特征即 1D CNN 特征共同组 成,因此 ELM 输入层节点数等于所有这些特征的 总个数. 输出层节点数等于待分类的心跳类别数. 2.5    Bagging 集成方法 由于 ELM 隐含层参数的随机分配,其分类结果 也会存在一定的随机性. 为了提高 ELM 分类性能 的稳定性和准确性,我们采用 Bagging 集成学习方 法将多个 ELM 分类器进行组合. 集成学习的关键 在于构造具有差异性的弱分类器. 因此,一方面,在 构造多个训练集时采用有放回采样(Bootstrap),即 从训练样本中随机有放回抽样. 这意味着,某一个 训练样本可能多次出现在新构造的训练集中,也有 可能一次都不会选中. 上述方法是从数据集构造方 面增加集成的多样性. 另一方面,正因为 ELM 隐含 层参数的随机初始化 ,使得集成模型中每一个 ELM 模型都不相同,同样增加了集成多样性. 当多个不同的训练集被构造出来后,分别在 这些训练集上训练不同的 ELM 心跳分类模型. 最 后通过多数投票的方式,票数最多的心跳类别即 为最终集成的分类结果. 3    实验验证 本文中使用麻省理工律失常公开数据集(MIT− BIH arrhythmia dataset)对所提出的方法进行验证. 3.1    数据集 MIT−BIH 心律失常数据库是研究心律失常分 类算法广泛使用的数据库之一[26] . 它包含 48 个 0.5 h 的双通道动态心电图记录,其中的 23 份为比较常见 · 1228 · 工程科学学报,第 43 卷,第 9 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有