工程科学学报 Chinese Journal of Engineering 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 邓飞跃丁浩吕浩洋郝如江刘永强 Fault diagnosis of high-speed train wheelset bearing based on a lightweight neural network DENG Fei-yue,DING Hao,L Hao-yang.HAO Ru-jiang,LIU Yong-qiang 引用本文: 邓飞跃,丁浩,吕浩洋,郝如江,刘永强.一种基于轻量级神经网络的高铁轮对轴承故障诊断方法.工程科学学报,2021, 43(111482-1490.doi:10.13374/j.issn2095-9389.2020.12.09.001 DENG Fei-yue,DING Hao,L Hao-yang.HAO Ru-jiang,LIU Yong-qiang.Fault diagnosis of high-speed train wheelset bearing based on a lightweight neural network[J].Chinese Journal of Engineering,2021,43(11):1482-1490.doi:10.13374/j.issn2095- 9389.2020.12.09.001 在线阅读View online:https::/oi.org10.13374.issn2095-9389.2020.12.09.001 您可能感兴趣的其他文章 Articles you may be interested in 形态分量分析在滚动轴承故障诊断中的应用 Application of morphological component analysis for rolling element bearing fault diagnosis 工程科学学报.2017,39(6:909htps:/ldoi.org10.13374.issn2095-9389.2017.06.014 基于全局优化支持向量机的多类别高炉故障诊断 Multi-class fault diagnosis of BF based on global optimization LS-SVM 工程科学学报.2017,391):39 https::/1doi.org/10.13374斩.issn2095-9389.2017.01.005 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019,41(10):1229 https:/1doi.org/10.13374.issn2095-9389.2019.03.27.002 基于小波包的开关电流电路故障诊断 Fault detection in switched current circuits based on preferred wavelet packet 工程科学学报.2017,39(7):1101 https:/1doi.org/10.13374.issn2095-9389.2017.07.017 基于周期势系统随机共振的轴承故障诊断 Bearing fault diagnosis by stochastic resonance method in periodical potential system 工程科学学报.2018,40(8):989htps:/oi.org/10.13374.issn2095-9389.2018.08.013 迭代广义短时Fourier?变换在行星齿轮箱故障诊断中的应用 Application of iterative generalized short-time Fourier transform to fault diagnosis of planetary gearboxes 工程科学学报.2017,394:604htps:/1doi.org/10.13374j.issn2095-9389.2017.04.016
一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 邓飞跃 丁浩 吕浩洋 郝如江 刘永强 Fault diagnosis of high-speed train wheelset bearing based on a lightweight neural network DENG Fei-yue, DING Hao, L Hao-yang, HAO Ru-jiang, LIU Yong-qiang 引用本文: 邓飞跃, 丁浩, 吕浩洋, 郝如江, 刘永强. 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法[J]. 工程科学学报, 2021, 43(11): 1482-1490. doi: 10.13374/j.issn2095-9389.2020.12.09.001 DENG Fei-yue, DING Hao, L Hao-yang, HAO Ru-jiang, LIU Yong-qiang. Fault diagnosis of high-speed train wheelset bearing based on a lightweight neural network[J]. Chinese Journal of Engineering, 2021, 43(11): 1482-1490. doi: 10.13374/j.issn2095- 9389.2020.12.09.001 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.12.09.001 您可能感兴趣的其他文章 Articles you may be interested in 形态分量分析在滚动轴承故障诊断中的应用 Application of morphological component analysis for rolling element bearing fault diagnosis 工程科学学报. 2017, 39(6): 909 https://doi.org/10.13374/j.issn2095-9389.2017.06.014 基于全局优化支持向量机的多类别高炉故障诊断 Multi-class fault diagnosis of BF based on global optimization LS-SVM 工程科学学报. 2017, 39(1): 39 https://doi.org/10.13374/j.issn2095-9389.2017.01.005 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 基于小波包的开关电流电路故障诊断 Fault detection in switched current circuits based on preferred wavelet packet 工程科学学报. 2017, 39(7): 1101 https://doi.org/10.13374/j.issn2095-9389.2017.07.017 基于周期势系统随机共振的轴承故障诊断 Bearing fault diagnosis by stochastic resonance method in periodical potential system 工程科学学报. 2018, 40(8): 989 https://doi.org/10.13374/j.issn2095-9389.2018.08.013 迭代广义短时Fourier变换在行星齿轮箱故障诊断中的应用 Application of iterative generalized short-time Fourier transform to fault diagnosis of planetary gearboxes 工程科学学报. 2017, 39(4): 604 https://doi.org/10.13374/j.issn2095-9389.2017.04.016
工程科学学报.第43卷.第11期:1482-1490.2021年11月 Chinese Journal of Engineering,Vol.43,No.11:1482-1490,November 2021 https://doi.org/10.13374/j.issn2095-9389.2020.12.09.001;http://cje.ustb.edu.cn 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 邓飞跃2)四,丁浩2),吕浩洋),郝如江2,刘永强2) 1)石家庄铁道大学省部共建交通工程结构力学行为与系统安全国家重点实验室,石家庄0500432)石家庄铁道大学机械工程学院,石家 庄,050043 区通信作者,E-mail:dengfy(@stdu.edu.cn 摘要深度神经网络技术用于机械设备故障诊断展现出了巨大潜力,但繁重复杂的计算量对计算机硬件提出了严苛的要 求,严重限制了其在实际工程中的应用.基于此提出一种新型的轻量级神经网络ShuffleNet,.用于高速列车轮对轴承故障诊断 研究.该网络模型基于模块化设计思想,包含多个高效率的ShuffleNet单元,通过运用分组卷积与深度可分离卷积技术极大 改善了传统卷积操作的运算效率:同时使用通道混洗方法克服了通道分组带来的约束,改进了网络的损失精度.实验分析表 明,所提网络模型可有效用于复杂工况下高速列车轮对轴承故障诊断,相比传统卷积神经网络、残差网络和Xceptio等当前 深度神经网络模型,在保证诊断精度的同时,运行效率得到大幅提升.这为深度神经网络技术应用于工程实际,克服计算机 硬件条件限制提供了一条新的途径 关键词轮对轴承;高速列车;故障诊断:深度神经网络:ShuffleNet单元 分类号TG142.71 Fault diagnosis of high-speed train wheelset bearing based on a lightweight neural network DENG Fei-yue,DING Hao)LU Hao-yang,HAO Ru-jiang.LIU Yong-qiang 1)China State Key Laboratory of Mechanical Behavior in Traffic Engineering Structure and System Safety,Shijiazhuang Tiedao University,Shijiazhuang 050043,China 2)School of Mechanical Engineering,Shijiazhuang Tiedao University,Shijiazhuang 050043,China Corresponding author,E-mail:dengfy @stdu.edu.cn ABSTRACT Deep learning is gaining attention in the field of mechanical equipment fault diagnosis.With the help of deep learning techniques,deep neural networks (DNNs)have great potential for machinery fault diagnosis.Deep learning is a subset of machine learning that uses artificial neural networks with multiple layers to deliver state-of-the-art accuracy in various classifications of mechanical rotating parts.Convolutional neural networks(CNNs)are able to automatically learn multiple levels of representations from raw input datawithout introducing hand-coded rules or domain knowledge.Because of this powerful representation learning ability,deep learning has achieved great success in many fields.Although deep learning has achieved promising results in the field of machinery fault diagnosis,existing neural networks suffer from many limitations.The heavy and complex calculation amount puts forward strict requirements for computer hardware,which severely limits its application in actual engineering.To address this issue,this paper proposed a novel lightweight neural network model,ShuffleNet,for high-speed train wheelset bearing fault diagnosis.Based on the thought of module design,this model comprised several ShuffleNet units.Group convolution(GC)and deep separable convolution were 收稿日期:2020-12-09 基金项目:国家自然科学基金资助项目(11802184.11790282):河北省自然科学基金资助项目(E2019210049):河北省科技计划项目资助项 目(20310803D):河北省“三三三人才工程"资助项目(A202101017):北京市重点实验室研究基金资助课题(PGU2020K009)
一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 邓飞跃1,2) 苣,丁 浩2),吕浩洋2),郝如江2),刘永强2) 1) 石家庄铁道大学省部共建交通工程结构力学行为与系统安全国家重点实验室, 石家庄 050043 2) 石家庄铁道大学机械工程学院, 石家 庄, 050043 苣通信作者, E-mail:dengfy@stdu.edu.cn 摘 要 深度神经网络技术用于机械设备故障诊断展现出了巨大潜力,但繁重复杂的计算量对计算机硬件提出了严苛的要 求,严重限制了其在实际工程中的应用. 基于此提出一种新型的轻量级神经网络 ShuffleNet,用于高速列车轮对轴承故障诊断 研究. 该网络模型基于模块化设计思想,包含多个高效率的 ShuffleNet 单元,通过运用分组卷积与深度可分离卷积技术极大 改善了传统卷积操作的运算效率;同时使用通道混洗方法克服了通道分组带来的约束,改进了网络的损失精度. 实验分析表 明,所提网络模型可有效用于复杂工况下高速列车轮对轴承故障诊断,相比传统卷积神经网络、残差网络和 Xception 等当前 深度神经网络模型,在保证诊断精度的同时,运行效率得到大幅提升. 这为深度神经网络技术应用于工程实际,克服计算机 硬件条件限制提供了一条新的途径. 关键词 轮对轴承;高速列车;故障诊断;深度神经网络;ShuffleNet 单元 分类号 TG142.71 Fault diagnosis of high-speed train wheelset bearing based on a lightweight neural network DENG Fei-yue1,2) 苣 ,DING Hao2) ,LÜ Hao-yang2) ,HAO Ru-jiang2) ,LIU Yong-qiang2) 1) China State Key Laboratory of Mechanical Behavior in Traffic Engineering Structure and System Safety, Shijiazhuang Tiedao University, Shijiazhuang 050043, China 2) School of Mechanical Engineering, Shijiazhuang Tiedao University, Shijiazhuang 050043, China 苣 Corresponding author, E-mail:dengfy@stdu.edu.cn ABSTRACT Deep learning is gaining attention in the field of mechanical equipment fault diagnosis. With the help of deep learning techniques, deep neural networks (DNNs) have great potential for machinery fault diagnosis. Deep learning is a subset of machine learning that uses artificial neural networks with multiple layers to deliver state-of-the-art accuracy in various classifications of mechanical rotating parts. Convolutional neural networks (CNNs) are able to automatically learn multiple levels of representations from raw input datawithout introducing hand-coded rules or domain knowledge. Because of this powerful representation learning ability, deep learning has achieved great success in many fields. Although deep learning has achieved promising results in the field of machinery fault diagnosis, existing neural networks suffer from many limitations. The heavy and complex calculation amount puts forward strict requirements for computer hardware, which severely limits its application in actual engineering. To address this issue, this paper proposed a novel lightweight neural network model, ShuffleNet, for high-speed train wheelset bearing fault diagnosis. Based on the thought of module design, this model comprised several ShuffleNet units. Group convolution (GC) and deep separable convolution were 收稿日期: 2020−12−09 基金项目: 国家自然科学基金资助项目(11802184,11790282);河北省自然科学基金资助项目(E2019210049);河北省科技计划项目资助项 目(20310803D);河北省“三三三人才工程”资助项目(A202101017);北京市重点实验室研究基金资助课题(PGU2020K009) 工程科学学报,第 43 卷,第 11 期:1482−1490,2021 年 11 月 Chinese Journal of Engineering, Vol. 43, No. 11: 1482−1490, November 2021 https://doi.org/10.13374/j.issn2095-9389.2020.12.09.001; http://cje.ustb.edu.cn
邓飞跃等:一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 ·1483 used to improve the operation efficiency of traditional convolution in the ShuffleNet unit.Meanwhile,channel shuffle(CS)technology was adopted to overcome the grouping constraint caused by GC and improved the loss accuracy ofthenetwork model.CS operation makes it possible to build more powerful structures with multiple GC layers.Experimental results show that the proposed network model canbe applied in wheelset bearing fault diagnosis underacomplex working condition.Compared to the traditional CNN,ResNets,and Xception,the proposed method can greatly reducethecomputation cost while maintaining diagnosis accuracy.It is clear that the proposed lightweight neural network model,ShuffleNet,is superior to the above comparison models.This provides a new way forengineering applications of DNN technology and overcoming the limitations of computer hardware. KEY WORDS wheelset bearing;high-speed train;fault diagnosis;deep neural network;ShuffleNet unit 近年来,中国高速铁路飞速发展,运营里程位 了旋转机械不同故障模式的识别;Zhang等刀则 居世界第一.与此同时,高速列车运行带来的安全 提出了另一个CNN模型用于轴承故障诊断,针对 问题愈发引人关注.轮对轴承作为高速列车走行 强噪声干扰和变工况负载具有较高的识别准确 部关键旋转部件之一,工作环境非常恶劣,极易发 率;Peng等l1采用残差神经网络用于列车轮对轴 生各类故障,但是其故障诊断较为困难,运行维护 承故障诊断,达到了很高的诊断精度.由于历时 一直处于一种定期拆解、强制报废的过度维修状 长、测点多,采样频率高等原因,轮对轴承监测系 态-),造成了资源的大量浪费.因此,准确诊断与 统获取的是海量数据I9.传统深度神经网络(Deep 检测轮对轴承故障是一个亟待解决的突出问题 neural network,DNN)分析时模型复杂度会大幅增 目前,“特征提取+机器学习”的智能诊断方法 加,不仅对计算机硬件配置提出了更高要求,而且 在轴承故障诊断中得到了广泛应用.Dong等通 运行效率也大打折扣,这严重限制了其在实际工 过局部均值分解方法分解轴承故障信号,计算每 程中的应用 个分量的香农嫡输入K-最近邻(K-nearest neighbor,, 为解决上述问题,本文提出了一种新的轻量 KNN)模型识别轴承不同故障损伤程度;Shao等 化神经网络ShuffleNet模型,用于轮对轴承故障诊 使用变分模态分解方法处理信号,提取多尺度故 断研究.该模型基于模块化设计思想,在卷积网络 障特征信息后输入支持向量机(Support vector 基础上设计了多个高效的ShuffleNet单元,通过综 machine,SVM)对轴承复杂故障类型进行智能识 合运用分组卷积(Group convolution,GC)、深度可 别.上述方法多使用浅层机器学习模型,面对大量 分离卷积(Depthwise separable onvolution,DSC)与 且复杂的监测数据时无法准确表征特征信息与健 通道混洗(Channel shuffle,CS)技术,在保证网络诊 康状态之间的映射关系 断精度准确率的同时,极大地提升了模型的运算 随着人工智能技术不断进步,基于深度学习 效率,减少了网络运行对计算力的需求.实验结果 的轴承故障诊断方法蓬勃发展.该类方法基于数 表明,该模型可有效用于高速列车轮对轴承故障 据驱动模型,将特征学习与智能识别同时嵌入网 诊断,具有较好的工程应用价值 络模型内部,在深人挖掘特征信息的基础上,能较 为准确地识别轴承健康状态,不需要复杂的信号 1背景理论 处理技术69.Zou等1o采用离散小波变换处理信 号,建立了改进的深度信念网络模型(Deep belief 1.1标准卷积 network,DBN),对高速列车牵引电机轴承故障进 CNN提取特征信息主要是通过卷积层操作完 行了诊断和识别.Shao等叫提出了一种基于双树 成的.卷积层通过卷积核对上一层网络输出特征 复小波包的自适应DBN模型用于轴承故障诊断. 进行反复的局部卷积操作,将学习到的特征信息 Wang等a提出了一种新的激活函数ReLTanh,并 提取到下一层,其过程表示为: 通过构建自编码(Auto-encoder,,AE)网络模型来诊 y=f(U*x+b) (1) 断齿轮箱各类故障.相比上述网络模型,卷积神经 其中,x为卷积层输人,y是卷积层输出,U为当前 网络(Convolutional neural network,CNN)采用了局 层的权重矩阵,*为卷积操作,b为卷积核的偏置 部感受野和权值共享策略,网络结构及训练优化 0为激活函数,用于增强学习特征的非线性表达 更为简单、效率更高-Chen等构建了一个 能力 深度CNN模型,通过输入传感器多通道信号实现 标准卷积过程中,每个通道的输人特征信息
used to improve the operation efficiency of traditional convolution in the ShuffleNet unit. Meanwhile, channel shuffle (CS) technology was adopted to overcome the grouping constraint caused by GC and improved the loss accuracy ofthenetwork model. CS operation makes it possible to build more powerful structures with multiple GC layers. Experimental results show that the proposed network model canbe applied in wheelset bearing fault diagnosis underacomplex working condition. Compared to the traditional CNN, ResNets, and Xception, the proposed method can greatly reducethecomputation cost while maintaining diagnosis accuracy. It is clear that the proposed lightweight neural network model, ShuffleNet, is superior to the above comparison models. This provides a new way forengineering applications of DNN technology and overcoming the limitations of computer hardware. KEY WORDS wheelset bearing;high-speed train;fault diagnosis;deep neural network;ShuffleNet unit 近年来,中国高速铁路飞速发展,运营里程位 居世界第一. 与此同时,高速列车运行带来的安全 问题愈发引人关注. 轮对轴承作为高速列车走行 部关键旋转部件之一,工作环境非常恶劣,极易发 生各类故障,但是其故障诊断较为困难,运行维护 一直处于一种定期拆解、强制报废的过度维修状 态[1−3] ,造成了资源的大量浪费. 因此,准确诊断与 检测轮对轴承故障是一个亟待解决的突出问题. 目前,“特征提取+机器学习”的智能诊断方法 在轴承故障诊断中得到了广泛应用. Dong 等[4] 通 过局部均值分解方法分解轴承故障信号,计算每 个分量的香农熵输入 K−最近邻(K-nearest neighbor, KNN)模型识别轴承不同故障损伤程度;Shao 等[5] 使用变分模态分解方法处理信号,提取多尺度故 障特征信息后输入支持向量机 ( Support vector machine, SVM)对轴承复杂故障类型进行智能识 别. 上述方法多使用浅层机器学习模型,面对大量 且复杂的监测数据时无法准确表征特征信息与健 康状态之间的映射关系. 随着人工智能技术不断进步,基于深度学习 的轴承故障诊断方法蓬勃发展. 该类方法基于数 据驱动模型,将特征学习与智能识别同时嵌入网 络模型内部,在深入挖掘特征信息的基础上,能较 为准确地识别轴承健康状态,不需要复杂的信号 处理技术[6−9] . Zou 等[10] 采用离散小波变换处理信 号,建立了改进的深度信念网络模型 (Deep belief network,DBN),对高速列车牵引电机轴承故障进 行了诊断和识别. Shao 等[11] 提出了一种基于双树 复小波包的自适应 DBN 模型用于轴承故障诊断. Wang 等[12] 提出了一种新的激活函数 ReLTanh,并 通过构建自编码 (Auto-encoder,AE) 网络模型来诊 断齿轮箱各类故障. 相比上述网络模型,卷积神经 网络(Convolutional neural network, CNN)采用了局 部感受野和权值共享策略,网络结构及训练优化 更为简单、效率更高[13−15] . Chen 等[16] 构建了一个 深度 CNN 模型,通过输入传感器多通道信号实现 了旋转机械不同故障模式的识别;Zhang 等[17] 则 提出了另一个 CNN 模型用于轴承故障诊断,针对 强噪声干扰和变工况负载具有较高的识别准确 率;Peng 等[18] 采用残差神经网络用于列车轮对轴 承故障诊断,达到了很高的诊断精度. 由于历时 长、测点多,采样频率高等原因,轮对轴承监测系 统获取的是海量数据[19] . 传统深度神经网络(Deep neural network, DNN)分析时模型复杂度会大幅增 加,不仅对计算机硬件配置提出了更高要求,而且 运行效率也大打折扣,这严重限制了其在实际工 程中的应用. 为解决上述问题,本文提出了一种新的轻量 化神经网络 ShuffleNet 模型,用于轮对轴承故障诊 断研究. 该模型基于模块化设计思想,在卷积网络 基础上设计了多个高效的 ShuffleNet 单元,通过综 合运用分组卷积(Group convolution, GC)、深度可 分离卷积 (Depthwise separable onvolution, DSC) 与 通道混洗(Channel shuffle, CS)技术,在保证网络诊 断精度准确率的同时,极大地提升了模型的运算 效率,减少了网络运行对计算力的需求. 实验结果 表明,该模型可有效用于高速列车轮对轴承故障 诊断,具有较好的工程应用价值. 1 背景理论 1.1 标准卷积 CNN 提取特征信息主要是通过卷积层操作完 成的. 卷积层通过卷积核对上一层网络输出特征 进行反复的局部卷积操作,将学习到的特征信息 提取到下一层,其过程表示为: y = f(U ∗ x+b) (1) ∗ 其中,x 为卷积层输入,y 是卷积层输出,U 为当前 层的权重矩阵, 为卷积操作,b 为卷积核的偏置. f() 为激活函数,用于增强学习特征的非线性表达 能力. 标准卷积过程中,每个通道的输入特征信息 邓飞跃等: 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 · 1483 ·
1484 工程科学学报,第43卷,第11期 通过卷积核都可以输出到每个输出特征.设定输 入特征通道数为W,卷积核通道数与输入特征通 道数相同,卷积核个数为B,与对应输出特征通道 数相同.卷积核尺寸大小为D×D,对应参数为 DxDx3x2 MxMx2 DxD×W×B,.经过计算,此次卷积过程的参数量 WxW×3 如下: 图2标准卷积操作 Q=DXDXWxB (2) Fig.2 Classical convolution operation 1.2分组卷积 DWConv中,卷积核数量与输入特征通道数相同, GC将输入特征进行了分组,然后再进行卷积 一个卷积核只与一个通道的输入特征进行卷积操 操作,过程如图1所示.基于上述相同输入与输出 作,因此输出特征通道数与输人特征通道数相同 特征的设定,若输人特征分为G组,则每组输入特 需要指出的是,当GC中分组数与输入特征通道 征数量为WG,相应卷积核分组后,每组中卷积核 数、卷积核个数相同时,GC就是DWConv.PWConv 只与同组的输入特征进行卷积操作,卷积核数量 与标准卷积操作相同,但卷积核采用尺寸大小为 与输出特征数量相同,均为BG.计算参数量为: 1×1的单位卷积.相同参数条件下,上述两个步骤 的操作分别如图3(a)和3(b)所示,从图中可知 DSC先考虑卷积区域,再考虑输入特征通道,实现 了通道与卷积区域的分离.DSC操作过程中参数 量大小为: QDsC=DXD×3+3×1 (5) Group G (a) 图1分组卷积 D×Dx1×3 MxMx3 Fig.I Group convolution NxNx3 (b) Qcc=DxDx W xB (3) GC后参数量变为原来标准卷积的1/G,随着 分组数增加,参数量会明显减少.此外,Krizhevsky 1×1×3×2 MxMx2 等20指出GC除能够减少训练参数外,不易产生 图3深度可分离卷积操作.(a)DWCnov操作:(b)PWConv操作 过拟合,具有正则化的效果 Fig.3 Depthwise separable convolutionoperation:(a)DWCnov 1.3深度可分离卷积 operation;(b)PWConv operation 标准卷积操作过程中,卷积层中每个卷积核 通过对比式(4)和式(5)可知,DSC的参数量 分别与每个通道的输入特征进行卷积操作,卷积 要小于标准卷积,尤其当卷积核的数量及输入输 结果线性叠加后即为相应的输出特征.标准卷积 出通道数大幅增加时,参数量的减少将相当可观 操作如图2所示,其中输入特征尺寸大小NxN,通 此外,Howard等2通过研究进一步证实:DSC所 道数为3:输出特征通道数为2,尺寸大小为MxM: 需要的计算量也远小于标准卷积.因此,相比标准 卷积核参数为DxD×3×2,尺寸大小为DxD.从图 卷积,使用DSC的计算力将大为节省 中可知,标准卷积过程中同时考虑了输入特征的 1.4通道混洗 通道数与卷积区域.卷积过程中参数量大小为: GC虽然具备诸多优点,但是分组后由于每组 Oclassical=D×Dx3×2 (4) 卷积核只与同组输入特征进行卷积操作,如 与标准卷积操作不同,DSC卷积操作分为深 图4(a)所示.在分组约束下,各组之间是相互孤立 度卷积(Depthwiseconvolution,DWConv)和逐点卷 的,没有信息的交互流通,输出特征仅从一小部分 积(Pointwise convolution,.PWConv)两个步骤.在 输入通道组中导出,降低了卷积过程中信息的表
通过卷积核都可以输出到每个输出特征. 设定输 入特征通道数为 W,卷积核通道数与输入特征通 道数相同,卷积核个数为 B,与对应输出特征通道 数相同 . 卷积核尺寸大小 为 D×D,对应参数 为 D×D×W×B,. 经过计算,此次卷积过程的参数量 如下: Q = D× D× W × B (2) 1.2 分组卷积 W/G B/G GC 将输入特征进行了分组,然后再进行卷积 操作,过程如图 1 所示. 基于上述相同输入与输出 特征的设定,若输入特征分为 G 组,则每组输入特 征数量为 ,相应卷积核分组后,每组中卷积核 只与同组的输入特征进行卷积操作,卷积核数量 与输出特征数量相同,均为 . 计算参数量为: 1 2 3 4 W Group 1 … … Group G 图 1 分组卷积 Fig.1 Group convolution QGC = D× D× W G × B (3) GC 后参数量变为原来标准卷积的 1/G ,随着 分组数增加,参数量会明显减少. 此外,Krizhevsky 等[20] 指出 GC 除能够减少训练参数外,不易产生 过拟合,具有正则化的效果. 1.3 深度可分离卷积 标准卷积操作过程中,卷积层中每个卷积核 分别与每个通道的输入特征进行卷积操作,卷积 结果线性叠加后即为相应的输出特征. 标准卷积 操作如图 2 所示,其中输入特征尺寸大小 N×N,通 道数为 3;输出特征通道数为 2,尺寸大小为 M×M; 卷积核参数为 D×D×3×2,尺寸大小为 D×D. 从图 中可知,标准卷积过程中同时考虑了输入特征的 通道数与卷积区域. 卷积过程中参数量大小为: Qclassical = D× D×3×2 (4) 与标准卷积操作不同,DSC 卷积操作分为深 度卷积(Depthwiseconvolution,DWConv)和逐点卷 积 ( Pointwise convolution, PWConv)两个步骤. 在 DWConv 中,卷积核数量与输入特征通道数相同, 一个卷积核只与一个通道的输入特征进行卷积操 作,因此输出特征通道数与输入特征通道数相同. 需要指出的是,当 GC 中分组数与输入特征通道 数、卷积核个数相同时,GC 就是 DWConv. PWConv 与标准卷积操作相同,但卷积核采用尺寸大小为 1×1 的单位卷积. 相同参数条件下,上述两个步骤 的操作分别如图 3( a)和 3( b)所示,从图中可知 DSC 先考虑卷积区域,再考虑输入特征通道,实现 了通道与卷积区域的分离. DSC 操作过程中参数 量大小为: QDSC = D× D×3+3×1 (5) (a) N×N×3 D×D×1×3 M×M×3 (b) M×M×3 1×1×3×2 M×M×2 图 3 深度可分离卷积操作. (a)DWCnov 操作;(b)PWConv 操作 Fig.3 Depthwise separable convolutionoperation: (a) DWCnov operation; (b) PWConv operation 通过对比式(4)和式(5)可知,DSC 的参数量 要小于标准卷积,尤其当卷积核的数量及输入输 出通道数大幅增加时,参数量的减少将相当可观. 此外,Howard 等[21] 通过研究进一步证实:DSC 所 需要的计算量也远小于标准卷积. 因此,相比标准 卷积,使用 DSC 的计算力将大为节省. 1.4 通道混洗 GC 虽然具备诸多优点,但是分组后由于每组 卷积核只与同组输入特征进行卷积操作 ,如 图 4(a)所示. 在分组约束下,各组之间是相互孤立 的,没有信息的交互流通,输出特征仅从一小部分 输入通道组中导出,降低了卷积过程中信息的表 N×N×3 D×D×3×2 M×M×2 图 2 标准卷积操作 Fig.2 Classical convolution operation · 1484 · 工程科学学报,第 43 卷,第 11 期
邓飞跃等:一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 ·1485 示能力.为此,我们通过C$技术对输入层特征进 题.基于残差块结构,Zhang等2]构建了如图6(a) 行混洗操作,将不同组输入特征重新分组,打破各 所示的ShuffleNet单元.从图中可知.ShuffleNet单 组之间的约束,过程如图4(b)所示.假设输出层特 元采用了跨层恒等映射连接的两分支结构,主分 征图分为G组,每组包含w个通道输入特征,CS 支上首先是逐点GC,然后进行CS,之后是卷积核 具体实现步骤如下: 大小为3×3的DWConv和逐点GC操作,两分支输 (a)Input (b)Input 出特征线性叠加后即为最后输出特征.这里需要 指出的是主分支最后的逐点GC可以看做是一个 GCI GCI 分组的PWConv过程,因此3x3 DWConv和1×1GC Output Output 操作结合其实是一个DSC操作.图6(b)是一个降 采样后的ShuffleNet单元,与图6(a)相比主要有两 GC2 GC2 点不同:一是在辅分支上加入了步长为2、尺寸大 小为3×3的平均池化(AVG pool),相应主分支上 图4(a)通道孤立与(b)通道混洗的区别 的3x3 DWConv步长也由1改为2;二是ShuffleNet Fig.4 Differencebetween(a)channel isolation and (b)channel shuffle 单元最终输出为两个分支的通道级联而线性叠 步骤一:将具有Gxw通道的输出特征reshape 加.通道级联设计使得ShuffleNet单元最终输出特 为(G,w)格式; 征通道数为输入特征的2倍,通过扩大输出特征 步骤二:将(G,w)格式的输出特征转置为(w,G) 的宽度,进一步增强网络模型的特征学习能力.需 格式; 要说明的是,ShuffleNet单元中每一个卷积层后都 步骤三:对(w,G)格式的输出特征进行平坦化 加入了批量归一化操作(Batch normalization,BN) 处理,再次分为G组,作为下一层输入特征 来防止梯度消失、加快训练速度,在部分层后还加 为了能更清楚地描述CS过程,假设G=w=3, 人了使用激活函数ReLU的激活层 CS操作过程如图5所示.从图中可知,输出特征 层虽然分为了3组.但GS后组与组之间的约束被 (a) (b) Input 打破,不同组之间的特征通道是关联的,每组内包 含了不同通道的特征信息.在本文分析过程中,为 1×1GC 1×1GC BN+ReLU BN+ReLU 保证通道混洗的效果,设置G与w数值相同, CS B×3 AVG Pool Stride=2 etp BN BN IxI GC 1×IGC BN BN Add Concat ReLU Setp 2: utpu 图6 ShuffleNet单元结构.(a)ShuffleNet单元l;(b)ShuffleNet单元2 Fig.6 Architecture ofShuffleNetunit:(a)ShuffleNet unit 1:(b)ShuffleNet Setp 3: unit 2 2.2 ShuffleNet网络模型 因5通道混洗操作 基于模块化设计思想,本文以ShuffleNet单元 Fig.5 Channel shuffle operation 为基本模块,构建轻量级ShuffleNet网络模型,如 2 ShuffleNet模型 图7所示.由于所分析数据格式是一维的,无法与 所提二维网络模型兼容,本文参考文献[24]中的 2.1 ShuffleNet单元 方法,将一维数据转化为二维图像格式后再输入 残差网络(ResNets)由He等2mI在20l5年首次 网络.网络首层采用了一个尺寸大小为3×3的标 提出.ResNets在残差块中通过引入跨层恒等映射 准卷积操作,然后是4个ShuffleNet单元.ShuffleNet 连接,有效解决了网络层数增加时的梯度消失问 单元数量过少会无法充分提取数据特征信息,而
示能力. 为此,我们通过 CS 技术对输入层特征进 行混洗操作,将不同组输入特征重新分组,打破各 组之间的约束,过程如图 4(b)所示. 假设输出层特 征图分为 G 组,每组包含 w 个通道输入特征,CS 具体实现步骤如下: Input GC1 Output GC2 (a) Input GC1 Output GC2 (b) 图 4 (a)通道孤立与(b)通道混洗的区别 Fig.4 Differencebetween (a) channel isolation and (b) channel shuffle 步骤一:将具有 G×w 通道的输出特征 reshape 为(G, w)格式; 步骤二:将(G, w)格式的输出特征转置为(w, G) 格式; 步骤三:对(w, G)格式的输出特征进行平坦化 处理,再次分为 G 组,作为下一层输入特征. 为了能更清楚地描述 CS 过程,假设 G=w=3, CS 操作过程如图 5 所示. 从图中可知,输出特征 层虽然分为了 3 组,但 GS 后组与组之间的约束被 打破,不同组之间的特征通道是关联的,每组内包 含了不同通道的特征信息. 在本文分析过程中,为 保证通道混洗的效果,设置 G 与 w 数值相同. Setp 1: Setp 2: Setp 3: 图 5 通道混洗操作 Fig.5 Channel shuffle operation 2 ShuffleNet 模型 2.1 ShuffleNet 单元 残差网络(ResNets)由 He 等[22] 在 2015 年首次 提出. ResNets 在残差块中通过引入跨层恒等映射 连接,有效解决了网络层数增加时的梯度消失问 题. 基于残差块结构,Zhang 等[23] 构建了如图 6(a) 所示的 ShuffleNet 单元. 从图中可知,ShuffleNet 单 元采用了跨层恒等映射连接的两分支结构,主分 支上首先是逐点 GC,然后进行 CS,之后是卷积核 大小为 3×3 的 DWConv 和逐点 GC 操作,两分支输 出特征线性叠加后即为最后输出特征. 这里需要 指出的是主分支最后的逐点 GC 可以看做是一个 分组的 PWConv 过程,因此 3×3DWConv 和 1×1GC 操作结合其实是一个 DSC 操作. 图 6(b)是一个降 采样后的 ShuffleNet 单元,与图 6(a)相比主要有两 点不同:一是在辅分支上加入了步长为 2、尺寸大 小为 3×3 的平均池化(AVG pool),相应主分支上 的 3×3DWConv 步长也由 1 改为 2;二是 ShuffleNet 单元最终输出为两个分支的通道级联而线性叠 加. 通道级联设计使得 ShuffleNet 单元最终输出特 征通道数为输入特征的 2 倍,通过扩大输出特征 的宽度,进一步增强网络模型的特征学习能力. 需 要说明的是,ShuffleNet 单元中每一个卷积层后都 加入了批量归一化操作(Batch normalization, BN) 来防止梯度消失、加快训练速度,在部分层后还加 入了使用激活函数 ReLU 的激活层. 3×3 DSC BN 1×1 GC 1×1 GC Add CS Input BN+ReLU BN+ReLU BN Concat CS Input Output Output ReLU RelU BN BN (a) (b) 3×3 AVG Pool Stride=2 1×1 GC 3×3 DSC Stride=2 1×1 GC 图 6 ShuffleNet 单元结构. (a)ShuffleNet 单元 1; (b)ShuffleNet 单元 2 Fig.6 Architecture of ShuffleNetunit: (a) ShuffleNet unit 1; (b) ShuffleNet unit 2 2.2 ShuffleNet 网络模型 基于模块化设计思想,本文以 ShuffleNet 单元 为基本模块,构建轻量级 ShuffleNet 网络模型,如 图 7 所示. 由于所分析数据格式是一维的,无法与 所提二维网络模型兼容,本文参考文献 [24] 中的 方法,将一维数据转化为二维图像格式后再输入 网络. 网络首层采用了一个尺寸大小为 3×3 的标 准卷积操作,然后是 4 个 ShuffleNet 单元. ShuffleNet 单元数量过少会无法充分提取数据特征信息,而 邓飞跃等: 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 · 1485 ·
1486 工程科学学报,第43卷,第11期 数量过多又会导致网络结构复杂,运行效率下降 的,实验台结构如图8所示,实验台一端为连接电 本文通过分析对比,选择4个ShuffleNet单元构建 机的支撑轴承,另一端为测试用轮对轴承.实验台 模型,后面会通过t一分布式随机邻域嵌入(t-SNE) 通过液压加载装置可以对轮对轴承施加径向和轴 操作对模型中特征信息的聚类效果进行可视化处 向静态加载,还可以模拟轨道谱激励进行动态加 理,来进一步验证其合理性.之后,对每个通道的 载.因此通过该实验台能够模拟高速列车实际运 输出特征进行全局平均池化(Global average pooling, 行过程中轮对轴承较为真实的载荷工况,满足不 GAP),添加Dropout层减缓过拟合的影响.最后, 同速度等级和负载工况下的高速列车轮对轴承跑 使用全连接层并进行Softmax分类输出,对轮对轴 合实验.实验对象为CRH380B型高速动车组中采 承不同健康状态进行智能识别.网络模型的具体 用的FAG系列双列圆锥滚子轮对轴承,通过线切 参数设置如表1所示. 割方式在轴承内圈和外圈表面加工出长为5mm、 宽为lmm、深为0.7mm的微小凹痕故障,如图9 Data input 所示.加速度传感器安装在轴承端盖处,采样频率 ShuffleNet unitl 2D image data 为51200Hz. conversion ShuffleNet unit2 实验中共进行了4种不同速度等级的高速列 64@3*3 车轮对轴承跑合试验,获得的具体实验数据如 convolution GAP BN+ReLU 表2所示,每种测试包含无载荷、静载和动载3种 ShuffleNet unitl Dropout=0.5 载荷工况,每种工况下分别进行了轮对轴承内圈 ShuffleNet unit2 Fully connected 故障、外圈故障及正常状态3种不同健康状态的 layer output 测试.针对每一类健康状态,我们分别采集了 图7 ShuffleNet网络模型结构 1000组信号样本,每组样本包含1024个数据点, Fig.7 Architecture of ShuffleNet model 共计1000×36=36000组信号样本.每类健康状态 3实验分析与讨论 中,随机选取200组样本作为测试样本,其余作为 训练样本.采用五折交叉验证方法对网络进行训 3.1实验介绍 练,确定最优网络模型后,输入测试集进行测试分 实验是在高速列车轴承综合实验台上完成 析,测试过程重复5次,最终结果取均值 表1网络参数设置 Table 1 Parameter settings of network Sequencenumber Structure name Parameter values Output 1 Standard convolution layer Conw(3,3,1,64) 32×32 GConv(1,1,1,64) ShuffleNet unitl DWConv(3,3,1,64) 32×32 GConv(1,1,1,64) GConv(1,1,1,64) ShuffleNet unit2 AVG pool(3,3.,2,64) DWConv(3,3,2,64) 16×16 GConv(1,1,1,64) GConv1,1,1,128) ShuffleNet unit1 DWConv3,3,1,128) 16×16 GConv(1,1,1,128) GConv(1,1,1,128) ShuffleNet unit2 AVG pool(3,3,2,128) DWConv3,3,2,128) 8×8 GConv(1,1,1,128) 6 GAP 256×1 7 Dropout 256×1 Fully connected output layer 3
数量过多又会导致网络结构复杂,运行效率下降. 本文通过分析对比,选择 4 个 ShuffleNet 单元构建 模型,后面会通过 t−分布式随机邻域嵌入(t−SNE) 操作对模型中特征信息的聚类效果进行可视化处 理,来进一步验证其合理性. 之后,对每个通道的 输出特征进行全局平均池化(Global average pooling, GAP),添加 Dropout 层减缓过拟合的影响. 最后, 使用全连接层并进行 Softmax 分类输出,对轮对轴 承不同健康状态进行智能识别. 网络模型的具体 参数设置如表 1 所示. Data input Fully connected layer output ShuffleNet unitl 2D image data conversion ShuffleNet unit2 64@3*3 convolution GAP BN+ReLU ShuffleNet unitl Dropout=0.5 ShuffleNet unit2 图 7 ShuffleNet 网络模型结构 Fig.7 Architecture of ShuffleNet model 3 实验分析与讨论 3.1 实验介绍 实验是在高速列车轴承综合实验台上完成 的,实验台结构如图 8 所示,实验台一端为连接电 机的支撑轴承,另一端为测试用轮对轴承. 实验台 通过液压加载装置可以对轮对轴承施加径向和轴 向静态加载,还可以模拟轨道谱激励进行动态加 载. 因此通过该实验台能够模拟高速列车实际运 行过程中轮对轴承较为真实的载荷工况,满足不 同速度等级和负载工况下的高速列车轮对轴承跑 合实验. 实验对象为 CRH380B 型高速动车组中采 用的 FAG 系列双列圆锥滚子轮对轴承,通过线切 割方式在轴承内圈和外圈表面加工出长为 5mm、 宽为 1mm、深为 0.7mm 的微小凹痕故障,如图 9 所示. 加速度传感器安装在轴承端盖处,采样频率 为 51200 Hz. 实验中共进行了 4 种不同速度等级的高速列 车轮对轴承跑合试验,获得的具体实验数据如 表 2 所示,每种测试包含无载荷、静载和动载 3 种 载荷工况,每种工况下分别进行了轮对轴承内圈 故障、外圈故障及正常状态 3 种不同健康状态的 测试. 针对每一类健康状态 ,我们分别采集了 1000 组信号样本,每组样本包含 1024 个数据点, 共计 1000×36=36000 组信号样本. 每类健康状态 中,随机选取 200 组样本作为测试样本,其余作为 训练样本. 采用五折交叉验证方法对网络进行训 练,确定最优网络模型后,输入测试集进行测试分 析,测试过程重复 5 次,最终结果取均值. 表 1 网络参数设置 Table 1 Parameter settings of network Sequencenumber Structure name Parameter values Output 1 Standard convolution layer Conv(3,3,1,64) 32×32 2 ShuffleNet unit1 GConv(1,1,1,64) DWConv(3,3,1,64) 32×32 GConv(1,1,1,64) 3 ShuffleNet unit2 AVG pool(3,3,2,64) GConv(1,1,1,64) DWConv(3,3,2,64) 16×16 GConv(1,1,1,64) 4 ShuffleNet unit1 GConv(1,1,1,128) DWConv(3,3,1,128) 16×16 GConv(1,1,1,128) 5 ShuffleNet unit2 AVG pool(3,3,2,128) GConv(1,1,1,128) DWConv(3,3,2,128) 8×8 GConv(1,1,1,128) 6 GAP 256×1 7 Dropout 256×1 8 Fully connected output layer 3 · 1486 · 工程科学学报,第 43 卷,第 11 期
邓飞跃等:一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 ·1487 达到有效收敛并保持稳定.结果显示,我们通过本 文方法可以准确地识别轮对轴承在不同速度等级 及不同载荷状态下的健康状态 1.000 0.995 Testing Training 0.990 0.985 0.980 图8高速列车轴承综合实验台 0.975 Fig.8 Wheelset bearing comprehensive test rig of high-speed train 0.970 0.965 0.960 5 10152025303540 Epoch 图10所提网络的分类准确度 Fig.10 Classification accuracy of the proposed network 3.3分析讨论 首先分析不同分组数对本文所提方法的影 响,设置分组数G分别为2、4和8,分析数据为实 图9故障轮对轴承(a)内图故障:(b)外图故障 验室原始数据,模型分析结果如表3所示.表中, Fig.9 Wheelset bearing:(a)inner race fault;(b)outer race fault 浮点运算次数(Floating point operations,Flops)指标 表2实验数据 用于衡量网络模型的复杂度.从表中可知,3种不 Table 2 Experimental data 同分组数情况下,测试精度都接近100%.随着分 Sequence Rotational Speed/ Inner race Outer race 组数增加,网络模型的参数量和Flops都明显减 Normal number speed/ (kmh) Load (rmin fault fault 少,这与公式(3)相对应.但是,模型运算时间却 C1 No 1000 1000 1000 是G=2时最少,究其原因,Zhang等21指出分组数 C2 1200 200 Static 1000 1000 1000 的增加虽然会减少模型的计算量和参数量,但随 C3 Dynamic 1000 1000 1000 之带来的密集操作会使计算机的计算及存储访问 9 No 1000 1000 1000 效率更差,实际运行时间更长,因此,实际应用中, C5 1500 250 Static 1000 1000 1000 分组数并不是越大越好,在后面分析中设置网络 C6 Dynamic 1000 1000 1000 模型的分组数为G=2. C7 No 1000 1000 1000 C8 1800 300 Static 1000 1000 1000 表3不同分组数的对比结果 Table 3 Comparison result of different groups C9 Dynamic 1000 1000 1000 Time/s Number of C10 No 1000 1000 1000 Group Test accuracy/ number 完 model Flops C11 2100 350 Training Testing parameters Static 1000 1000 1000 G=2 99.99 30991874 C12 1014610.87 50627 Dynamic 1000 1000 1000 G=4 99.99 1026611.33 30147 17360386 3.2实验结果 G=8 99.99 1046511.83 20035 10806786 样本信号输入网络模型前,统一进行了归一 化处理.实验过程采用了Adam优化算法更新网 为了更符合实际工况,我们在原信号基础上 络参数.网络训练过程中,初始学习率为0.001,每 添加了不同信噪比(Signal noise ratio,SNR)的高斯 10个迭代步学习率减小到原来的1/10,共进行 白噪声,SNR分别为-20dB、-15dB和-10dB.通 40个迭代步训练,批量大小为64.网络模型训练 过对含噪信号进行分析,来进一步验证所提方法 和测试的分类准确度如图10所示.从图中可知, 的有效性我们选取传统CNN、ResNets和Xception 网络训练和测试过程中,分类准确率均接近 3种网络模型与本文所提出的网络模型进行对比 100%,损失值接近0,两者在20个迭代步后都能够 其中,传统CNN中卷积层数与本文模型中卷积层
3.2 实验结果 样本信号输入网络模型前,统一进行了归一 化处理. 实验过程采用了 Adam 优化算法更新网 络参数. 网络训练过程中,初始学习率为 0.001,每 10 个迭代步学习率减小到原来 的 1/10,共进 行 40 个迭代步训练,批量大小为 64. 网络模型训练 和测试的分类准确度如图 10 所示. 从图中可知, 网 络 训 练 和 测 试 过 程 中 , 分 类 准 确 率 均 接 近 100%,损失值接近 0,两者在 20 个迭代步后都能够 达到有效收敛并保持稳定. 结果显示,我们通过本 文方法可以准确地识别轮对轴承在不同速度等级 及不同载荷状态下的健康状态. 0 5 10 15 20 25 30 35 40 Epoch 0.960 0.965 0.970 0.975 0.980 0.985 0.990 0.995 1.000 Accuracy Testing Training 图 10 所提网络的分类准确度 Fig.10 Classification accuracy of the proposed network 3.3 分析讨论 首先分析不同分组数对本文所提方法的影 响,设置分组数 G 分别为 2、4 和 8,分析数据为实 验室原始数据,模型分析结果如表 3 所示. 表中, 浮点运算次数(Floating point operations, Flops)指标 用于衡量网络模型的复杂度. 从表中可知,3 种不 同分组数情况下,测试精度都接近 100%. 随着分 组数增加,网络模型的参数量和 Flops 都明显减 少,这与公式(3)相对应. 但是,模型运算时间却 是 G=2 时最少,究其原因,Zhang 等[23] 指出分组数 的增加虽然会减少模型的计算量和参数量,但随 之带来的密集操作会使计算机的计算及存储访问 效率更差,实际运行时间更长. 因此,实际应用中, 分组数并不是越大越好,在后面分析中设置网络 模型的分组数为 G=2. 表 3 不同分组数的对比结果 Table 3 Comparison result of different groups Group number Test accuracy/ % Time/s Number of model parameters Flops Training Testing G=2 99.99 10146 10.87 50627 30991874 G=4 99.99 10266 11.33 30147 17360386 G=8 99.99 10465 11.83 20035 10806786 为了更符合实际工况,我们在原信号基础上 添加了不同信噪比(Signal noise ratio, SNR)的高斯 白噪声,SNR 分别为−20 dB、−15 dB 和−10 dB. 通 过对含噪信号进行分析,来进一步验证所提方法 的有效性. 我们选取传统CNN、ResNets 和Xception[25] 3 种网络模型与本文所提出的网络模型进行对比. 其中,传统 CNN 中卷积层数与本文模型中卷积层 表 2 实验数据 Table 2 Experimental data Sequence number Rotational speed/ (r·min−1) Speed/ (km·h−1) Load Inner race fault Outer race fault Normal C1 1200 200 No 1000 1000 1000 C2 Static 1000 1000 1000 C3 Dynamic 1000 1000 1000 C4 1500 250 No 1000 1000 1000 C5 Static 1000 1000 1000 C6 Dynamic 1000 1000 1000 C7 1800 300 No 1000 1000 1000 C8 Static 1000 1000 1000 C9 Dynamic 1000 1000 1000 C10 2100 350 No 1000 1000 1000 C11 Static 1000 1000 1000 C12 Dynamic 1000 1000 1000 图 8 高速列车轴承综合实验台 Fig.8 Wheelset bearing comprehensive test rig of high-speed train (a) (b) 图 9 故障轮对轴承. (a)内圈故障;(b)外圈故障 Fig.9 Wheelset bearing: (a) inner race fault; (b) outer race fault 邓飞跃等: 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 · 1487 ·
·1488 工程科学学报,第43卷,第11期 数量相同,ResNets中残差块数量与本文模型中 Xception方法,模型参数量和Floaps也远小于其 ShuffleNet单元数量相同.针对不同信噪比的含噪 他3种对比方法.需要指出的是,随着网络模型深 信号及原信号,4种方法的诊断结果如图11所示 度及所分析数据量的进一步增加,所提方法的运 从图中可知,随着噪声的减少,所有方法的诊断精 行效率优势会更为明显.由于添加噪声信号相比 度均有所提升.总体来看,本文方法在分析不同信 原始信号更为复杂,网络模型分析含噪信号的运 噪比信号及原信号时,诊断精度要优于传统CNN 算时间要稍显增加 方法,与ResNets和Xception结果基本相同,均能 表4不同方法的运行效率对比 保证较高的诊断准确度 Table 4 Comparison of operation efficiency of different methods The proposed methodCNN□ResNets Time/s 100 Number of model Xception Model parameters Flops Training Testing 90 Proposed model 10232 11.14 50627 30991874 CNN 13363 12.36 668675 567444224 70 ResNets 14726 15.44 677251 571835136 14310 13.66 92739 115999488 60 Xception 50 -20 -15 -10 Original signal T-SNE作为一种用于挖掘高维数据的非线性 SNR/dB 降维算法,能够很好地将高维数据映射到二维 图11不同方法的分类准确度 空间.基于此,我们通过T-SNE对本文所提网络 Fig.11 Classificationaccuracy of different methods 不同阶段的特征聚类结果进行了可视化分析,进 我们以SNR=-20dB的含噪信号为分析对象, 而观察网络内部的特征学习过程.图12显示了 进一步分析了上述4种方法的运行效率,结果如 网络模型包含4个ShuffleNet单元时不同阶段的 表4所示.从表中可知,本文所提模型的训练时 特征分布情况.通过观察可知,在网络输入端,不 间和测试时间要明显少于传统CNN、ResNets与 同健康状态的轮对轴承特征信息混在一起;标准 (a)100 (b)150 (c)150 (d)80 100 100 60 40 50 50 20 0 0 -20 -50 -50 0 -100 60 -100 100 0 100200 00 100 00 100 (e) 60 (g)100 40 50 20 Inner race fault -20 0 o Outer race fualt Normal 40 -20 -60 -8 -60 -100 -1000100200 100 00 50 50 100 图I24个ShuffleNet单元网络模型不同阶段的可视化结果.(a)网络输入端:(b)卷积后:(c)首个ShuffleNet单元后:(d)第二个ShuffleNet单元 后:(e)第三个ShuffleNet.单元后:(f)第四个ShuffleNet.单元后:(g)GAP后 Fig.12 Visualization results of the proposed network with 4 ShuffleNet units at different stages:(a)model input;(b)after convolution operation;(c)after the first ShuffleNet unit;(d)after the second ShuffleNet unit,(e)after the third ShuffleNet unit,(f)after the fourth ShuffleNet unit,(g)after the GAP
数量相同,ResNets 中残差块数量与本文模型中 ShuffleNet 单元数量相同. 针对不同信噪比的含噪 信号及原信号,4 种方法的诊断结果如图 11 所示. 从图中可知,随着噪声的减少,所有方法的诊断精 度均有所提升. 总体来看,本文方法在分析不同信 噪比信号及原信号时,诊断精度要优于传统 CNN 方法,与 ResNets 和 Xception 结果基本相同,均能 保证较高的诊断准确度. −20 −15 −10 Original signal SNR/dB 50 60 70 80 90 100 Accuracy/ % The proposed method CNN ResNets Xception 图 11 不同方法的分类准确度 Fig.11 Classificationaccuracy of different methods 我们以 SNR=−20 dB 的含噪信号为分析对象, 进一步分析了上述 4 种方法的运行效率,结果如 表 4 所示. 从表中可知,本文所提模型的训练时 间和测试时间要明显少于传统 CNN、ResNets 与 Xception 方法,模型参数量和 Floaps 也远小于其 他 3 种对比方法. 需要指出的是,随着网络模型深 度及所分析数据量的进一步增加,所提方法的运 行效率优势会更为明显. 由于添加噪声信号相比 原始信号更为复杂,网络模型分析含噪信号的运 算时间要稍显增加. 表 4 不同方法的运行效率对比 Table 4 Comparison of operation efficiency of different methods Model Time/s Number of model parameters Flops Training Testing Proposed model 10232 11.14 50627 30991874 CNN 13363 12.36 668675 567444224 ResNets 14726 15.44 677251 571835136 Xception 14310 13.66 92739 115999488 T−SNE 作为一种用于挖掘高维数据的非线性 降维算法,能够很好地将高维数据映射到二维 空间. 基于此,我们通过 T−SNE 对本文所提网络 不同阶段的特征聚类结果进行了可视化分析,进 而观察网络内部的特征学习过程. 图 12 显示了 网络模型包含 4 个 ShuffleNet 单元时不同阶段的 特征分布情况. 通过观察可知,在网络输入端,不 同健康状态的轮对轴承特征信息混在一起;标准 −100 0 100 200 −80 −60 −40 −20 0 20 (e) 40 −100 0 100 −60 −40 −20 0 20 40 (f) 60 −50 0 50 100 −100 −50 0 50 (g) 100 Inner race fault Outer race fualt Normal x x x y y y −100 0 100 −100 −50 0 50 (a) 100 −100 0 100 200 −100 −50 0 50 100 (b) 150 −100 0 100 −100 −50 0 50 100 (c) 150 −100 0 100 −60 −40 −20 0 20 40 60 (d) 80 x x x x y y y y 图 12 4 个 ShuffleNet 单元网络模型不同阶段的可视化结果. (a)网络输入端;(b)卷积后;(c)首个 ShuffleNet 单元后;(d)第二个 ShuffleNet 单元 后;(e)第三个 ShuffleNet 单元后;(f)第四个 ShuffleNet 单元后;(g)GAP 后 Fig.12 Visualization results of the proposed network with 4 ShuffleNet units at different stages: (a) model input; (b) after convolution operation; (c) after the first ShuffleNet unit; (d) after the second ShuffleNet unit; (e) after the third ShuffleNet unit; (f)after the fourth ShuffleNet unit; (g) after the GAP · 1488 · 工程科学学报,第 43 卷,第 11 期
邓飞跃等:一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 ·1489 卷积层后,特征信息开始出现聚类趋势:随着网络 不同阶段的可视化结果如图13所示.从图中可 深度增加,聚类效果逐渐清晰;第4个ShuffleNet 知,第3个ShuffleNet单元处理后,不同类型的特 单元处理后,不同类型的特征信息已经完全分离 征信息仍有零星混叠,不能彼此完全分离,这说明本 为了进一步对比分析,选取3个ShuffleNet单元构 文选用4个ShuffleNet单元构建网络是较为合理 建的网络模型,并对原始信号进行分析处理,模型 的,可以准确识别轮对轴承不同类型的健康状态 Inner race fault o Outer race fault Normal (a)100 (b)60 (c)60 40 40 50 20 0 -20 -20 -50 -40 40 -60 0 -60 -100. -100 -50 50 100 -8000-50050100530 -80100-5005010050 (d) 60 (e)150 (f)100 100 50 20 50 0 0 50 40 100 60100-500 50 100 -15 -10 2000200400600800 100-50050100150 图133个ShuffleNet单元网络模型的不同阶段可视化结果.(a)网络输入端;(b)卷积后:(c)首个ShuffleNet单元后:(d)第二个ShuffleNet单元 后:(e)第三个ShuffleNet单元后:(f)GAP后 Fig.13 Visualization results of the proposed network with 3 ShuffleNet units at different stages:(a)model input;(b)after convolution operation;(c)after the first ShuffleNet unit;(d)after the second ShuffleNet unit;(e)after the third ShuffleNet unit;(f)after the GAP 4结论 parametric impulsive dictionary design for bearing fault diagnosis. Mech Syst Signal Process,2019,122:737 (I)本文采用模块化设计思想,基于ShuffleNet [2] Wang B,Lei Y G,Yan T,et al.Recurrent convolutional neural 单元,构建了一种新型轻量化ShuffleNet网络模 network:A new framework for remaining useful life prediction of 型,在ShuffleNet单元中综合使用了分组卷积、深 machinery.Neurocomputing,2020,379:117 度可分离卷积及通道混洗技术 [3] Zhang L J,Rong Y L,Liu K,et al.State pre-warning and optimization for rotating-machinery maintenance.Chin J Eng, (2)实验分析表明,本文所提的ShuffleNet网 2017,39(7):1094 络可有效用于各种复杂负载工况下高速列车轮对 (章立军,荣银龙,刘凯,等.旋转机械设备状态预警与维修优化 轴承的故障诊断,并在各种噪声工况下显示了较 工程科学学报,2017,39(7):1094) 好的诊断精度,验证了网络模型的可靠性 [4] Dong S J,Luo T H,Zhong L,et al.Fault diagnosis of bearing (3)相比当前的CNN、ResNets和Xception等 based on the kernel principal component analysis and optimized k- 模型,本文提出的ShuffleNet网络在运算时间、模 nearest neighbour model.J Low Freq Noise Vib Active Conrol, 型参数量和复杂度等方面均有明显提升,对于计 2017,36(4:354 [5] Shao K X,Fu WL,Tan J W,et al.Coordinated approach fusing 算机硬件配置的依赖更小,为深度网络技术走向 time-shift multiscale dispersion entropy and vibrational Harris 轨道交通工程应用提供了一条新的途径 Hawks optimization-based SVM for fault diagnosis of rolling bearing.Measurement,2021,173:108580 参考文献 [6]Wang D.Tsui K L.Two novel mixed effects models for [1]Sun R B,Yang Z B,Zhai Z,et al.Sparse representation based on prognostics of rolling element bearings.MechSyst Signal Process
卷积层后,特征信息开始出现聚类趋势;随着网络 深度增加,聚类效果逐渐清晰;第 4 个 ShuffleNet 单元处理后,不同类型的特征信息已经完全分离. 为了进一步对比分析,选取 3 个 ShuffleNet 单元构 建的网络模型,并对原始信号进行分析处理,模型 不同阶段的可视化结果如图 13 所示. 从图中可 知 ,第 3 个 ShuffleNet 单元处理后,不同类型的特 征信息仍有零星混叠,不能彼此完全分离,这说明本 文选用 4 个 ShuffleNet 单元构建网络是较为合理 的,可以准确识别轮对轴承不同类型的健康状态. −100 −50 0 50 100 x −100 −50 0 50 100 y (a) −100 −50 0 50 100 150 x −80 −60 −40 −20 0 20 40 60 y (b) −100 −50 0 50 100 150 x −80 −60 −40 −20 0 20 40 60 y (c) −100 −50 0 50 100 x −60 −40 −20 0 20 40 60 y (d) −200 0 200 400 600 800 x −150 −100 −50 0 50 100 150 y (e) −100 −50 0 50 100 150 x −100 −50 0 50 100 y (f ) Inner race fault Outer race fault Normal 图 13 3 个 ShuffleNet 单元网络模型的不同阶段可视化结果. (a)网络输入端;(b)卷积后;(c)首个 ShuffleNet 单元后;(d)第二个 ShuffleNet 单元 后;(e)第三个 ShuffleNet 单元后;(f)GAP 后 Fig.13 Visualization results of the proposed network with 3 ShuffleNet units at different stages: (a) model input; (b) after convolution operation; (c) after the first ShuffleNet unit; (d) after the second ShuffleNet unit; (e) after the third ShuffleNet unit; (f) after the GAP 4 结论 (1)本文采用模块化设计思想,基于 ShuffleNet 单元,构建了一种新型轻量化 ShuffleNet 网络模 型,在 ShuffleNet 单元中综合使用了分组卷积、深 度可分离卷积及通道混洗技术. (2)实验分析表明,本文所提的 ShuffleNet 网 络可有效用于各种复杂负载工况下高速列车轮对 轴承的故障诊断,并在各种噪声工况下显示了较 好的诊断精度,验证了网络模型的可靠性. ( 3)相比当前的 CNN、ResNets 和 Xception 等 模型,本文提出的 ShuffleNet 网络在运算时间、模 型参数量和复杂度等方面均有明显提升,对于计 算机硬件配置的依赖更小,为深度网络技术走向 轨道交通工程应用提供了一条新的途径. 参 考 文 献 [1] Sun R B, Yang Z B, Zhai Z, et al. Sparse representation based on parametric impulsive dictionary design for bearing fault diagnosis. Mech Syst Signal Process, 2019, 122: 737 Wang B, Lei Y G, Yan T, et al. Recurrent convolutional neural network: A new framework for remaining useful life prediction of machinery. Neurocomputing, 2020, 379: 117 [2] Zhang L J, Rong Y L, Liu K, et al. State pre-warning and optimization for rotating-machinery maintenance. Chin J Eng, 2017, 39(7): 1094 (章立军, 荣银龙, 刘凯, 等. 旋转机械设备状态预警与维修优化. 工程科学学报, 2017, 39(7):1094) [3] Dong S J, Luo T H, Zhong L, et al. Fault diagnosis of bearing based on the kernel principal component analysis and optimized knearest neighbour model. J Low Freq Noise Vib Active Control, 2017, 36(4): 354 [4] Shao K X, Fu W L, Tan J W, et al. Coordinated approach fusing time-shift multiscale dispersion entropy and vibrational Harris Hawks optimization-based SVM for fault diagnosis of rolling bearing. Measurement, 2021, 173: 108580 [5] Wang D, Tsui K L. Two novel mixed effects models for prognostics of rolling element bearings. MechSyst Signal Process, [6] 邓飞跃等: 一种基于轻量级神经网络的高铁轮对轴承故障诊断方法 · 1489 ·
·1490 工程科学学报.第43卷第11期 2018,99:1 for health state identification of planetary gearboxes. [7]Wang B,Lei Y G,Li N P,et al.Deep separable convolutional Measurement,2019,146:268 network for remaining useful life prediction of machinery [17]Zhang W,Li C H,Peng G L,et al.A deep convolutional neural MechSystSignal Process,2019,134:106330 network with new training methods for bearing fault diagnosis [8]Li X,Zhang W,Ding Q.Deep leaming-based remaining useful life under noisy environment and different working load.Mech Syst estimation of bearings using multi-scale feature extraction. Signal Process,2018,100:439 ReliabEngSystSaf,2019,182:208 [18]Peng DD,Liu Z L,Wang H,et al.A novel deeper one- [9] Dong X F,Lian JJ,Wang HJ.Vibration source identification of dimensional CNN with residual learning for fault diagnosis of offshore wind turbine structure based on optimized spectral wheelset bearings in high-speed trains.IEEE Access,2019,7: kurtosis and ensemble empirical mode decomposition.Ocean Eng, 10278 2019,172:199 [19]Hoang DT,Kang H J.A survey on Deep Learning based bearing [10]Zou YY,de Zhang Y,Mao HC.Fault diagnosis on the bearing of fault diagnosis.Neurocomputing.2019,335:327 traction motor in high-speed trains based on deep learning.Alex [20]KrizhevskyA,Sutskeverl,HintonGE.ImageNet classification with EgJ,2021,60(1):1209 deep convolutional neural networks.Commun 4CM,2017,60(6): [11]Shao H D,Jiang H K,Wang F A,et al.Rolling bearing fault 84 diagnosis using adaptive deep belief network with dual-tree [21]Howard A G,Zhu M L,Chen B,et al.Mobilenets:Efficient complex wavelet packet./S4 Trans,2017,69:187 convolutional neural networks for mobile vision [12]Wang X,Qin Y,Wang Y,et al.ReLTanh:An activation function applications[J/OL].arXiv preprint online (2017-4-17)[2020-12- with vanishing gradient resistance for SAE-based DNNs and its 09].https://arxiv.org/abs/1704.04861 application to rotating machinery fault diagnosis.Neurocompuring, [22]He K M,Zhang X Y,Ren S Q,et al.Delving deep into rectifiers: 2019,363:88 Surpassing human-level performance on ImageNet classification / [13]Deng F Y.Ding H.Yang S P.et al.An improved deep residual 2015 IEEE International Conference on Computer Vision (ICCV). network with multiscale feature fusion for rotating machinery fault Santiago,2015:1026 diagnosis.Meas Sci Technol,2021,32(2):024002 [23]Zhang X Y,Zhou X Y,Lin M X,et al.ShuffleNet:an extremely [14]Wang F T,Liu X F,Deng G,et al.Remaining life prediction efficient convolutional neural network for mobile devices //2018 method for rolling bearing based on the long short-term memory IEEE/CVF Conference on Computer Vision and Pattern network.Neural Process Lett,2019,50(3):2437 Recognition.Salt Lake City,2018:6848 [15]Zhang X,Wan ST.He YL,et al.Teager energy spectral kurtosis [24]Hoang D T.Kang H J.Rolling element bearing fault diagnosis of wavelet packet transform and its application in locating the using convolutional neural network and vibration image sound source of fault bearing of belt conveyor.Measurement. CognSystRes,2019,53:42 2021,173:108367 [25]Chollet F.Xception:deep learning with depthwise separable [16]Chen H P,Hu N Q,Cheng Z,et al.A deep convolutional neural convolutions /2017 IEEE Conference on Computer Vision and network based fusion method of two-direction vibration signal data Pattern Recognition (CVPR).Honolulu,2017:1800
2018, 99: 1 Wang B, Lei Y G, Li N P, et al. Deep separable convolutional network for remaining useful life prediction of machinery. MechSystSignal Process, 2019, 134: 106330 [7] Li X, Zhang W, Ding Q. Deep learning-based remaining useful life estimation of bearings using multi-scale feature extraction. ReliabEngSystSaf, 2019, 182: 208 [8] Dong X F, Lian J J, Wang H J. Vibration source identification of offshore wind turbine structure based on optimized spectral kurtosis and ensemble empirical mode decomposition. Ocean Eng, 2019, 172: 199 [9] Zou Y Y, de Zhang Y, Mao H C. Fault diagnosis on the bearing of traction motor in high-speed trains based on deep learning. Alex Eng J, 2021, 60(1): 1209 [10] Shao H D, Jiang H K, Wang F A, et al. Rolling bearing fault diagnosis using adaptive deep belief network with dual-tree complex wavelet packet. ISA Trans, 2017, 69: 187 [11] Wang X, Qin Y, Wang Y, et al. ReLTanh: An activation function with vanishing gradient resistance for SAE-based DNNs and its application to rotating machinery fault diagnosis. Neurocomputing, 2019, 363: 88 [12] Deng F Y, Ding H, Yang S P, et al. An improved deep residual network with multiscale feature fusion for rotating machinery fault diagnosis. Meas Sci Technol, 2021, 32(2): 024002 [13] Wang F T, Liu X F, Deng G, et al. Remaining life prediction method for rolling bearing based on the long short-term memory network. Neural Process Lett, 2019, 50(3): 2437 [14] Zhang X, Wan S T, He Y L, et al. Teager energy spectral kurtosis of wavelet packet transform and its application in locating the sound source of fault bearing of belt conveyor. Measurement, 2021, 173: 108367 [15] Chen H P, Hu N Q, Cheng Z, et al. A deep convolutional neural network based fusion method of two-direction vibration signal data [16] for health state identification of planetary gearboxes. Measurement, 2019, 146: 268 Zhang W, Li C H, Peng G L, et al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load. Mech Syst Signal Process, 2018, 100: 439 [17] Peng D D, Liu Z L, Wang H, et al. A novel deeper onedimensional CNN with residual learning for fault diagnosis of wheelset bearings in high-speed trains. IEEE Access, 2019, 7: 10278 [18] Hoang D T, Kang H J. A survey on Deep Learning based bearing fault diagnosis. Neurocomputing, 2019, 335: 327 [19] KrizhevskyA, SutskeverI, HintonGE. ImageNet classification with deep convolutional neural networks. Commun ACM, 2017, 60(6): 84 [20] Howard A G, Zhu M L, Chen B, et al. Mobilenets: Efficient convolutional neural networks for mobile vision applications[J/OL]. arXiv preprint online (2017-4-17) [2020-12- 09].https://arxiv.org/abs/1704.04861 [21] He K M, Zhang X Y, Ren S Q, et al. Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification // 2015 IEEE International Conference on Computer Vision (ICCV). Santiago, 2015: 1026 [22] Zhang X Y, Zhou X Y, Lin M X, et al. ShuffleNet: an extremely efficient convolutional neural network for mobile devices //2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, 2018: 6848 [23] Hoang D T, Kang H J. Rolling element bearing fault diagnosis using convolutional neural network and vibration image. CognSystRes, 2019, 53: 42 [24] Chollet F. Xception: deep learning with depthwise separable convolutions //2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, 2017: 1800 [25] · 1490 · 工程科学学报,第 43 卷,第 11 期