第16卷第3期 智能系统学报 Vol.16 No.3 2021年5月 CAAI Transactions on Intelligent Systems May 2021 D0L:10.11992tis.202005013 融合迁移学习的AlexNet神经网络不锈钢焊缝缺陷分类 陈立潮,闫耀东,张睿,傅留虎2,曹建芳3 (1,太原科技大学计算机科学与技术学院,山西太原030024,2.山西省机电设计研究院机械产品质量监督检 验站,山西太原030009:3.忻州师范学院计算机科学与技术系,山西忻州034000) 摘要:针对不锈钢焊缝缺陷特征提取存在主观单一性和客观不充分性等问题,提出一种融合迁移学习的 AlexNet卷积神经网络模型,用于不锈钢焊缝缺陷的自动分类。首先,由于不锈钢焊缝缺陷数据较为缺乏,通过采 用迁移学习对网络前3层冻结,减少网络对输入数据量的要求:对后2层卷积层提取的特征信息批量归一化 (batch normalization,BN),以加快网络的收敛速度;并使用带泄露线性整流(leaky rectified linear unit,. LeakyReLU)函数对抑制神经元进行激活,从而提高模型的鲁棒性和特征提取能力。结果表明,该模型最终达到 了9512%的准确率,相比原结构识别精度提高了9.8%。验证了改进后方法能够对裂纹、气孔、夹渣、未熔合和 未焊透5类不锈钢焊缝缺陷实现高精度分类。相比现有方法,其识别面更广,精度更高,具有一定的工程实践意义。 关键词:不锈钢焊缝缺陷分类;卷积神经网络;图像预处理;AlexNet模型;迁移学习:数据增强;焊缝数据集;深 度学习 中图分类号:TP391.4文献标志码:A文章编号:1673-4785(2021)03-0537-07 中文引用格式:陈立潮,闫耀东,张睿,等.融合迁移学习的AlxNεt神经网络不锈钢焊缝缺陷分类J.智能系统学报,2021, 16(3):537-543. 英文引用格式:CHEN Lichao,YAN Yaodong,.ZHANG Rui,etal.Welding defect classification of stainless steel based on AlexNet neural network combined with transfer learning[Jl.CAAI transactions on intelligent systems,2021,16(3):537-543. Welding defect classification of stainless steel based on AlexNet neural network combined with transfer learning CHEN Lichao',YAN Yaodong',ZHANG Rui',FU Liuhu',CAO Jianfang3 (1.School of Computer Science and Technology,Taiyuan University of Science and Technology,Taiyuan 030024,China;2.Mech- anical Product Quality Supervision and Inspection Station,Shanxi Mechanical and Electrical Design&Research Institute,Taiyuan 030009,China:3.Department of Computer Science and Technology,Xinzhou Teachers University,Xinzhou 034000,China) Abstract:In order to solve the problems of subjectivity and objectivity in feature extraction of stainless steel weld de- fects,an AlexNet convolutional neural network model based on transfer learning is proposed for automatic classifica- tion of stainless steel weld defects.First,due to the lack of stainless steel weld defect data,the first three layers of the network are frozen by transfer learning,which reduces the requirement of the network on the input data.In order to speed up the convergence of the network,the batch normalization(BN)of the feature information extracted from the two latter layers of convolution is carried out.The LeakyReLU function is used to activate the features in the negative interval so as to improve the robustness of the model and the ability of feature extraction.The results show that the ac- curacy of the model is 95.12%,and the recognition accuracy is 9.8%higher than that of the original structure.It has been verified that the improved method can classify five kinds of stainless steel weld defects such as crack,blowhole, slag inclusion,incomplete fusion,and incomplete penetration with high precision.Compared to the existing methods, this method has a wider recognition area,higher accuracy,and certain engineering significance. Keywords:classification of weld defects in stainless steel;convolutional neural network,image preprocessing;AlexNet model;the migration study;data enhancement;weld data set;deep learning 收稿日期:2020-05-10. 不锈钢材料因具有良好的抗氧化性、抗腐蚀 基金项目:先进控制与装备智能化山西省重点实验室开放课 题(ACEI202002):山西省高等学校科技创新项目 性和易焊接等特点逐渐被推广到储存输送、加工 (2019L0653):山西省应用基础研究项目 201801D221179). 生产、机械制造等行业。不锈钢工件是利用焊接 通信作者:张容.E-mail:zhangrui(@yust.edu.cn. 来实现两两结合,由于焊接存在局部不可见性
DOI: 10.11992/tis.202005013 融合迁移学习的 AlexNet 神经网络不锈钢焊缝缺陷分类 陈立潮1 ,闫耀东1 ,张睿1 ,傅留虎2 ,曹建芳1,3 (1. 太原科技大学 计算机科学与技术学院,山西 太原 030024; 2. 山西省机电设计研究院 机械产品质量监督检 验站,山西 太原 030009; 3. 忻州师范学院 计算机科学与技术系,山西 忻州 034000) 摘 要 :针对不锈钢焊缝缺陷特征提取存在主观单一性和客观不充分性等问题,提出一种融合迁移学习的 AlexNet 卷积神经网络模型,用于不锈钢焊缝缺陷的自动分类。首先,由于不锈钢焊缝缺陷数据较为缺乏,通过采 用迁移学习对网络前 3 层冻结,减少网络对输入数据量的要求;对后 2 层卷积层提取的特征信息批量归一化 (batch normalization, BN),以加快网络的收敛速度;并使用带泄露线性整流 (leaky rectified linear unit, LeakyReLU) 函数对抑制神经元进行激活,从而提高模型的鲁棒性和特征提取能力。结果表明,该模型最终达到 了 95.12% 的准确率, 相比原结构识别精度提高了 9.8%。验证了改进后方法能够对裂纹、气孔、夹渣、未熔合和 未焊透 5 类不锈钢焊缝缺陷实现高精度分类。相比现有方法,其识别面更广,精度更高,具有一定的工程实践意义。 关键词:不锈钢焊缝缺陷分类;卷积神经网络;图像预处理;AlexNet 模型;迁移学习;数据增强;焊缝数据集;深 度学习 中图分类号:TP391.4 文献标志码:A 文章编号:1673−4785(2021)03−0537−07 中文引用格式:陈立潮, 闫耀东, 张睿, 等. 融合迁移学习的 AlexNet 神经网络不锈钢焊缝缺陷分类[J]. 智能系统学报, 2021, 16(3): 537–543. 英文引用格式:CHEN Lichao, YAN Yaodong, ZHANG Rui, et al. Welding defect classification of stainless steel based on AlexNet neural network combined with transfer learning[J]. CAAI transactions on intelligent systems, 2021, 16(3): 537–543. Welding defect classification of stainless steel based on AlexNet neural network combined with transfer learning CHEN Lichao1 ,YAN Yaodong1 ,ZHANG Rui1 ,FU Liuhu2 ,CAO Jianfang1,3 (1. School of Computer Science and Technology, Taiyuan University of Science and Technology, Taiyuan 030024, China; 2. Mechanical Product Quality Supervision and Inspection Station, Shanxi Mechanical and Electrical Design & Research Institute, Taiyuan 030009, China; 3. Department of Computer Science and Technology, Xinzhou Teachers University, Xinzhou 034000, China) Abstract: In order to solve the problems of subjectivity and objectivity in feature extraction of stainless steel weld defects, an AlexNet convolutional neural network model based on transfer learning is proposed for automatic classification of stainless steel weld defects. First, due to the lack of stainless steel weld defect data, the first three layers of the network are frozen by transfer learning, which reduces the requirement of the network on the input data. In order to speed up the convergence of the network, the batch normalization (BN) of the feature information extracted from the two latter layers of convolution is carried out. The LeakyReLU function is used to activate the features in the negative interval so as to improve the robustness of the model and the ability of feature extraction. The results show that the accuracy of the model is 95.12%, and the recognition accuracy is 9.8% higher than that of the original structure. It has been verified that the improved method can classify five kinds of stainless steel weld defects such as crack, blowhole, slag inclusion, incomplete fusion, and incomplete penetration with high precision. Compared to the existing methods, this method has a wider recognition area, higher accuracy, and certain engineering significance. Keywords: classification of weld defects in stainless steel; convolutional neural network; image preprocessing; AlexNet model; the migration study; data enhancement; weld data set; deep learning 不锈钢材料因具有良好的抗氧化性、抗腐蚀 性和易焊接等特点逐渐被推广到储存输送、加工 生产、机械制造等行业。不锈钢工件是利用焊接 来实现两两结合,由于焊接存在局部不可见性, 收稿日期:2020−05−10. 基金项目:先进控制与装备智能化山西省重点实验室开放课 题 (ACEI202002);山西省高等学校科技创新项目 (2019L0653) ;山西省应用基础研究项 目 (201801D221179). 通信作者:张睿. E-mail:zhangrui@tyust.edu.cn. 第 16 卷第 3 期 智 能 系 统 学 报 Vol.16 No.3 2021 年 5 月 CAAI Transactions on Intelligent Systems May 2021
·538· 智能系统学报 第16卷 作为完整构件最薄弱区域的焊缝常会产生裂纹、 入层、池化层、卷积层、分类层、全连接层和输出 气孔、夹渣、未熔合和未焊透等问题,难以实现质 层。卷积神经网络通过一系列卷积核实现图片关 量可靠的两两焊接;并随着钢件的使用寿命增多 键信息的提取:池化层位于卷积层之后,对卷积 和操作环境影响,钢板焊缝也会产生新的缺陷。 层提取的特征进行压缩,在简化网络的同时提取 忽视焊接产品质量造成的事故屡见不鲜,这就要 卷积层得到的主要特征;全连接层最后对卷积层 求必须加强对不锈钢焊缝进行严格的质量检测, 提取的特征进行组合分类。 并在发现缺陷时能及时报警,对产生缺陷的原因 AlexNet网络是KrizhevskyA等在2012年 进行分析,及时修复缺陷或停止生产,最大限度 提出并在当年的LSVRC比赛中获得冠军的卷积 地降低经济损失,减少危险事故。 神经网络。AlexNet卷积神经网络由5层卷积层、 传统的不锈钢焊缝缺陷检测方法如X射线检 3层池化层和3层全连接层组成,池化层位于卷 测等由于操作复杂不易推广和对人体具有辐射等原 积层之后,并使用线性整流(rectified linear unit,, 因,对缺陷的检测精度和效率都相对较低。目前, RLU)激活函数进行非线性运算,反向传播算法 大多研究采用超声技术进行焊缝缺陷检测。2014 实现网络参数的更新,在李飞飞等人构建的Im- 年西安石油大学的蔡晓龙对不锈钢焊缝X射线 ageNet图像分类数据库上得到训练。 图像进行均值滤波、sin增强、ostu分割和边缘检 1.2迁移学习网络模型 测等方法对气孔和裂纹分别达到了83.908%和 训练复杂的卷积神经网络需要大量的标注数 89.4737%的分类准确率:2017年Fan等1使用支 据和训练时间,并且大量的待训练参数,也容易 持向量机对提取的焊缝缺陷特征进行分类,获得 导致网络收敛效果差和过拟合的问题。在图像识 了97%的分类精确度;2018年Chen等对不锈 别任务中,由于大多数图像特征具有相关性,如 钢焊缝缺陷A扫信号进行特征提取,通过模式识 物体边缘、纹理等特征高度一致,迁移学习可以 别方法实现了对不锈钢焊缝4类缺陷95.8%的分 将卷积神经网络在像ImageNet等大型图片数据 类精度;2018年长安大学的刘梦溪等构建了一 库上训练得到的模型迁移,使用在相似性较高的 个由3层受限玻尔兹曼机叠加成的深度置信网 图像分类任务上,从而加快并优化模型的学习效 络(deep belife networks,DBN)对裂纹、气f孔、夹 率。在新的图像分类任务中进行迁移学习时, 渣、未焊透和未融合5类不锈钢焊缝缺陷达到了 需要对之前的卷积神经网络结构进行微调,从而 平均88%的分类准确率;2019年Wang等6通过 更好地服务于本次任务。使用迁移学习后的图像 提取不锈钢焊缝缺陷超声信号时频信息并使用 分类任务结果表明,要比重新训练的效果还要 PSO-SVM方法实现了4类缺陷95%的平均分类 好,泛化能力也更强山。 精度;2019年侯怀书等7将傅里叶变换应用于金 迁移学习网络和传统深度神经网络传递过程 属管道焊缝中的缺陷类型识别,成功地将未焊透、 略有不同。若I表示网络的原始输入图像,传统 气孔、未熔合和裂纹4种常见缺陷进行了分类。 深度神经网络通过多次的卷积和池化操作可对原 综上所述,目前国内外研究主要集中在夹渣、 始图像Ⅰ进行关键信息提取;而迁移学习则是直 气孔、未焊透3类缺陷上,且多采用“特征提 接利用预训练模型完成关键信息提取过程。 取+机器学习”的分析方法,造成提取的特征主观 性强、经验性强、缺陷分类边界模糊等问题。为 2融合迁移学习的AlexNet神经网络 了进一步优化不锈钢焊缝缺陷识别技术,本文提 出一种融合迁移学习的AlexNet神经网络不锈钢 2.1批量归一化层改进 焊缝缺陷分类方法,以期克服传统识别方法中存 Iof等回针对神经网络中数据分布不一致的 在的上述问题,以及“小”样本导致卷积神经网络 问题提出一种正则化的方法一批量归一化。批 陷入过拟合状态的问题,在保证低计算成本的同 量归一化的实质是一种预处理操作,也就是对神 时,能够有效提高5类焊缝缺陷识别性能。 经网络中上一层的特征输出进行归一化处理), 然后再作为下一层的输入。这种预处理操作可以 1网络模型 很好地减少参数过拟合问题,提高网络运算效率: l.1 AlexNet网络模型 1 (1) 1989年Waibel!提出第一个卷积神经网络, m号 1 随着卷积神经网络的不断发展,在图像识别领域 1 0← (2) 显示出了优异的性能。卷积神经网络主要包括输 名
作为完整构件最薄弱区域的焊缝常会产生裂纹、 气孔、夹渣、未熔合和未焊透等问题,难以实现质 量可靠的两两焊接;并随着钢件的使用寿命增多 和操作环境影响,钢板焊缝也会产生新的缺陷[1]。 忽视焊接产品质量造成的事故屡见不鲜,这就要 求必须加强对不锈钢焊缝进行严格的质量检测, 并在发现缺陷时能及时报警,对产生缺陷的原因 进行分析,及时修复缺陷或停止生产,最大限度 地降低经济损失,减少危险事故。 传统的不锈钢焊缝缺陷检测方法如 X 射线检 测等由于操作复杂不易推广和对人体具有辐射等原 因,对缺陷的检测精度和效率都相对较低。目前, 大多研究采用超声技术进行焊缝缺陷检测。2014 年西安石油大学的蔡晓龙[2] 对不锈钢焊缝 X 射线 图像进行均值滤波、sin 增强、ostu 分割和边缘检 测等方法对气孔和裂纹分别达到了 83.908% 和 89.473 7% 的分类准确率;2017 年 Fan 等 [3] 使用支 持向量机对提取的焊缝缺陷特征进行分类,获得 了 97% 的分类精确度;2018 年 Chen 等 [4] 对不锈 钢焊缝缺陷 A 扫信号进行特征提取,通过模式识 别方法实现了对不锈钢焊缝 4 类缺陷 95.8% 的分 类精度;2018 年长安大学的刘梦溪等[5] 构建了一 个由 3 层受限玻尔兹曼机叠加成的深度置信网 络 (deep belife networks, DBN) 对裂纹、气孔、夹 渣、未焊透和未融合 5 类不锈钢焊缝缺陷达到了 平均 88% 的分类准确率;2019 年 Wang 等 [6] 通过 提取不锈钢焊缝缺陷超声信号时频信息并使用 PSO-SVM 方法实现了 4 类缺陷 95% 的平均分类 精度;2019 年侯怀书等[7] 将傅里叶变换应用于金 属管道焊缝中的缺陷类型识别,成功地将未焊透、 气孔、未熔合和裂纹 4 种常见缺陷进行了分类。 综上所述, 目前国内外研究主要集中在夹渣、 气孔、未焊 透 3 类缺陷上,且多采用 “ 特征提 取+机器学习”的分析方法,造成提取的特征主观 性强、经验性强、缺陷分类边界模糊等问题。为 了进一步优化不锈钢焊缝缺陷识别技术,本文提 出一种融合迁移学习的 AlexNet 神经网络不锈钢 焊缝缺陷分类方法,以期克服传统识别方法中存 在的上述问题,以及“小”样本导致卷积神经网络 陷入过拟合状态的问题,在保证低计算成本的同 时,能够有效提高 5 类焊缝缺陷识别性能。 1 网络模型 1.1 AlexNet 网络模型 1989 年 Waibel[8] 提出第一个卷积神经网络, 随着卷积神经网络的不断发展,在图像识别领域 显示出了优异的性能。卷积神经网络主要包括输 入层、池化层、卷积层、分类层、全连接层和输出 层。卷积神经网络通过一系列卷积核实现图片关 键信息的提取;池化层位于卷积层之后,对卷积 层提取的特征进行压缩,在简化网络的同时提取 卷积层得到的主要特征;全连接层最后对卷积层 提取的特征进行组合分类。 AlexNet 网络是 KrizhevskyA 等 [9] 在 2012 年 提出并在当年的 ILSVRC 比赛中获得冠军的卷积 神经网络。AlexNet 卷积神经网络由 5 层卷积层、 3 层池化层和 3 层全连接层组成,池化层位于卷 积层之后,并使用线性整流 (rectified linear unit, ReLU) 激活函数进行非线性运算,反向传播算法 实现网络参数的更新,在李飞飞等人构建的 ImageNet 图像分类数据库上得到训练。 1.2 迁移学习网络模型 训练复杂的卷积神经网络需要大量的标注数 据和训练时间,并且大量的待训练参数,也容易 导致网络收敛效果差和过拟合的问题。在图像识 别任务中,由于大多数图像特征具有相关性,如 物体边缘、纹理等特征高度一致,迁移学习可以 将卷积神经网络在像 ImageNet 等大型图片数据 库上训练得到的模型迁移,使用在相似性较高的 图像分类任务上,从而加快并优化模型的学习效 率 [10]。在新的图像分类任务中进行迁移学习时, 需要对之前的卷积神经网络结构进行微调,从而 更好地服务于本次任务。使用迁移学习后的图像 分类任务结果表明,要比重新训练的效果还要 好,泛化能力也更强[11]。 迁移学习网络和传统深度神经网络传递过程 略有不同。若 I 表示网络的原始输入图像,传统 深度神经网络通过多次的卷积和池化操作可对原 始图像 I 进行关键信息提取;而迁移学习则是直 接利用预训练模型完成关键信息提取过程。 2 融合迁移学习的 AlexNet 神经网络 2.1 批量归一化层改进 Ioffe 等 [12] 针对神经网络中数据分布不一致的 问题提出一种正则化的方法−批量归一化。批 量归一化的实质是一种预处理操作,也就是对神 经网络中上一层的特征输出进行归一化处理[13] , 然后再作为下一层的输入。这种预处理操作可以 很好地减少参数过拟合问题,提高网络运算效率: µβ ← 1 m ∑m i=1 xi (1) σ 2 β ← 1 m ∑m i=1 (xi −µβ) 2 (2) ·538· 智 能 系 统 学 报 第 16 卷
第3期 陈立潮,等:融合迁移学习的AlexNet神经网络不锈钢焊缝缺陷分类 ·539· 元←专 (3) 但RLU激活函数可能会存在某些神经元永远不 V后+E 会被使用,导致某些参数永远不会被更新的问 y←yx+B≡BN,B(x) (4) 题。LeakyReLU函数输出对小于0的值有一个很 在网络训练过程中,BN层以mini-batch为最 小的取值区间(图2),使静默神经元的出现得到 小单位不断更新,假设第1层有N个特征响应图, 大大缓解,对ReLU激活函数在负半轴神经元不 每个特征响应图的大小为MM。BN层的工作原 学习的问题是一个较好的解决方法。因此本文 理如式(1)~(4)所示。其中,m表示mini-batch 对ReLU激活函数进行改进,采用LeakyReLU激 的大小,是特征图里面的值,丫和B是2个可学习 活函数对静默神经元进行更新。 的变量,BN层通过计算mini-batch中数据的均值 与方差,标准化每一层的特征分布。考虑到AlexNet 原结构中并没有BN层,且批量归一化作为一种 新的数据处理操作在多种网络中显示出了良好效 果。因此,本文设计如图1所示的2种卷积提取 x=0.01x 结构(A-AlexNet和B-AlexNet)。A-AlexNet、B- AlexNet分别在激活函数前后添加批量归一化层, 来对AlexNet网络卷积层信息进行批量归一化 操作。 图2 LeakyReLU函数曲线 Fig.2 LeakyReLU function curve 2.3改进AlexNet迁移学习网络结构 Conv Conv 采用美国MathWorks公司预训练AlexNet卷 积神经网络模型作为本文网络的预训练模型。该 BN Relu Relu BN 模型是由ImageNet大型数据库的一个子集上训 Conv Conv 练得来,该子集通常用于LSVRC。通过对100万 张图片的预训练,使用该预训练模型的网络已经 能够对1000类的图片进行分类16。使用预训练 (a)A-AlexNet (b)B-AlexNet 模型可以减少网络训练参数,加快网络收敛获得 图1两种卷积提取结构 更高的精度。经过实验,本文采用迁移学习的方 Fig.1 Two convolution extraction structures 法对网络的前3层进行封装,保存前3层卷积层 2.2激活函数改进 在ImageNet.上更新的参数,将后2层卷积层进行 不锈钢焊缝缺陷分类是一个非线性问题,在 剥离并调整卷积核的个数,使图像输入时仅对后 神经网络中需要引入非线性激活函数实现整个网 2层卷积层参数进行更新,减小卷积神经网络对 络的非线性。常用激活函数有Sigmoid函数、 输入数据量限制的同时又能使网络提取到图像的 Tanh函数和ReLU函数l。其中ReLU激活函数 深层特征,以使网络能够更好地适应于不锈钢焊 增加了网络的非线性拟合能力,加快了网络的收 缝缺陷分类。如图3所示为改进的AlexNet迁移 敛速度,因此ReLU作为大多数网络的激活函数阿, 学习网络结构。 冻结层 ● 输入层卷积层L卷积层2_卷积层b卷积层4卷积层5全连接层Softmax 图3改进AlexNet迁移学习网络结构 Fig.3 Improve the AlexNet transfer learning network structure
xˆi ← xi −µβ √ σ 2 β +ε (3) yi ← γbxi +β ≡ BNγ,β(xi) (4) 在网络训练过程中,BN 层以 mini-batch 为最 小单位不断更新,假设第 l 层有 N 个特征响应图, 每个特征响应图的大小为 M×M。BN 层的工作原 理如式 (1)~(4) 所示。其中,m 表示 mini-batch 的大小,是特征图里面的值,ϒ 和 β 是 2 个可学习 的变量,BN 层通过计算 mini-batch 中数据的均值 与方差,标准化每一层的特征分布。考虑到 AlexNet 原结构中并没有 BN 层,且批量归一化作为一种 新的数据处理操作在多种网络中显示出了良好效 果。因此,本文设计如图 1 所示的 2 种卷积提取 结构 (A-AlexNet 和 B-AlexNet)。A-AlexNet、BAlexNet 分别在激活函数前后添加批量归一化层, 来对 AlexNet 网络卷积层信息进行批量归一化 操作。 Conv Conv Conv Conv (a) A-AlexNet (b) B-AlexNet BN Relu Relu BN 图 1 两种卷积提取结构 Fig. 1 Two convolution extraction structures 2.2 激活函数改进 不锈钢焊缝缺陷分类是一个非线性问题,在 神经网络中需要引入非线性激活函数实现整个网 络的非线性。常用激活函数有 Sigmoid 函数、 Tanh 函数和 ReLU 函数[14]。其中 ReLU 激活函数 增加了网络的非线性拟合能力,加快了网络的收 敛速度,因此 ReLU 作为大多数网络的激活函数[15] , 但 ReLU 激活函数可能会存在某些神经元永远不 会被使用,导致某些参数永远不会被更新的问 题。LeakyReLU 函数输出对小于 0 的值有一个很 小的取值区间 (图 2),使静默神经元的出现得到 大大缓解,对 ReLU 激活函数在负半轴神经元不 学习的问题是一个较好的解决方法。因此本文 对 ReLU 激活函数进行改进,采用 LeakyReLU 激 活函数对静默神经元进行更新。 x y f(x)=x f(x)=0.01x 图 2 LeakyReLU 函数曲线 Fig. 2 LeakyReLU function curve 2.3 改进 AlexNet 迁移学习网络结构 采用美国 MathWorks 公司预训练 AlexNet 卷 积神经网络模型作为本文网络的预训练模型。该 模型是由 ImageNet 大型数据库的一个子集上训 练得来,该子集通常用于 ILSVRC。通过对 100 万 张图片的预训练,使用该预训练模型的网络已经 能够对 1 000 类的图片进行分类[16]。使用预训练 模型可以减少网络训练参数,加快网络收敛获得 更高的精度。经过实验,本文采用迁移学习的方 法对网络的前 3 层进行封装,保存前 3 层卷积层 在 ImageNet 上更新的参数,将后 2 层卷积层进行 剥离并调整卷积核的个数,使图像输入时仅对后 2 层卷积层参数进行更新,减小卷积神经网络对 输入数据量限制的同时又能使网络提取到图像的 深层特征,以使网络能够更好地适应于不锈钢焊 缝缺陷分类。如图 3 所示为改进的 AlexNet 迁移 学习网络结构。 输入层 冻结层 卷积层 1 卷积层 2 卷积层 3 卷积层 4 卷积层 5 全连接层 Softmax 图 3 改进 AlexNet 迁移学习网络结构 Fig. 3 Improve the AlexNet transfer learning network structure 第 3 期 陈立潮,等:融合迁移学习的 AlexNet 神经网络不锈钢焊缝缺陷分类 ·539·
·540· 智能系统学报 第16卷 3实验与结果分析 为每30个Epoch衰减10%。 3.2实验结果分析 3.1实验环境与数据集 3.2.1卷积提取结构选择 硬件环境:i5-8300h,GTX1050Ti4GB, 为了更好地选择卷积提取结构,本文将前期 8GB内存。软件环境:Windows10,Matlab2019b, (见图lI)构建的A-AlexNet、.B-AlexNet与AlexNet CUDA-10.0.cuDNN-v7.6.2.24. 网络原结构进行实验对比,精度对比结果如图5 通过与山西省机电设计研究院合作,在该单 所示。从图5可以看出,A-AlexNet较AlexNet原 位搭建实验平台,制备包含裂纹、气孔、夹渣、未 结构验证精度更高且收敛更快。B-AlexNet收敛 熔合和未焊透5类缺陷类型的试样。使用KARL 较慢,但精度在不断上升。从实验可以看出,迭 DEUTSCH(ECHOGRAPH)探伤仪、Tektronix DPO 代次数达到1000时,A-AlexNet精度为90.48%, 2024B示波器和2.5P9x9K2.5斜探头对缺陷试样 B-AlexNet精度为80.89%,AlexNet原结构精度为 进行数据采集。实验共采集了未熔合、夹渣、未 85.01%。出现此结果的原因为:AlexNet原结构卷 焊透、裂纹和气孔5种超声A扫缺陷数据(见图4)。 积之后没有进行BN操作,使用激活函数导致小 于零的参数静默;B-AlexNet在ReLU激活函数后 进行BN操作,精度没有提高,说明实验中存在一 部分处于负区间的参数,而该结构同AlexNet原 (a)实验平台 结构一样没有对静默的神经元产生影响;A- AlexNet在卷积之后进行BN操作,使用激活函数 (b)裂纹试样X射线图 使无用神经元静默,有效地加快了网络收敛速 度,提高了网络识别精度。可知,A-AlexNet卷积 提取结构明显好于B-AlexNet和AlexNet原结 构。因此,本文网络采用A-AlexNet卷积提取结 裂纹 气孔 夹渣 未熔合 未焊透 (©)5种不锈钢焊缝缺陷超声时域图 构,接下来的对比实验中均采用在卷积操作之后 添加BN层的结构。 图4实验平台及数据采集 Fig.4 Experimental platform and data acquisition 100 深度学习与传统的机器学习方法相比,可以 从海量数据中学习到更多的高级特征,因而在深 70 60 度学习中最严峻的挑战之一就是数据依赖性。由 50 于不锈钢焊缝缺陷图像的特殊性,导致了不锈钢 40 焊缝缺陷图像数据库并不能像ImageNet等自然 30 ◆-A-AlexNet 20 B-AlexNet 图像数据库那样充足,相对于自然图像数据库来 10 。-AlexNet 说,不锈钢焊缝缺陷数据库数据量往往非常少。 345678910 为了缓解这一矛盾,本文采用数据增强方式,增 训练选代次数/10? 大训练数据量,使模型能接受到更多缺陷特征信 图5原结构与卷积提取结构提取精度对比 息,从而提升模型在本文数据集上的表现力”。 Fig.5 Comparison of extraction accuracy between origin- 采用的数据增强方法主要包括小角度随机旋转、 al structure and convolution extraction structure 添加高斯噪声等方式对原始数据进行处理。通过 32.2验证激活函数改进效果 数据增强操作,共获得了包含未熔合、夹渣、未焊 图6是采用LeakyReLU与ReLU激活函数验 透、裂纹和气孔5类缺陷数据共7824张,按7:2:1 证精度对比图,展示了训练迭代次数达到1000次 随机分割为训练集5634张,验证集1408张和测 时的验证精度变化曲线,虚线为A-AlexNet算法 试集782张。 的精度变化,实线为在A-AlexNet算法基础上进一 本文网络优化器采用Adam算法,Adam的优 步对激活函数LeakyReLU改进后的C-AlexNet算 点主要在于经过偏置校正后每一次迭代学习率都 法精度变化。实验表明.在迭代次数达到1000次 有个确定范围,使得参数比较平稳。MiniBatchS- 时,网络已经基本收敛,改进后的算法在验证精 ize设置为128,初始学习率为0.0001,学习率衰减 度方面相比原结构提高了135%
3 实验与结果分析 3.1 实验环境与数据集 硬件环境: i5-8300h, GTX 1050Ti 4 GB, 8 GB 内存。软件环境:Windows10,Matlab2019b, CUDA-10.0,cuDNN-v7.6.2.24。 通过与山西省机电设计研究院合作,在该单 位搭建实验平台,制备包含裂纹、气孔、夹渣、未 熔合和未焊透 5 类缺陷类型的试样。使用 KARL DEUTSCH(ECHOGRAPH) 探伤仪、Tektronix DPO 2 024B 示波器和 2.5P 9x9 K2.5 斜探头对缺陷试样 进行数据采集。实验共采集了未熔合、夹渣、未 焊透、裂纹和气孔 5 种超声 A 扫缺陷数据 (见图 4)。 裂纹 气孔 夹渣 未熔合 未焊透 (a) 实验平台 (b) 裂纹试样 X 射线图 (c) 5 种不锈钢焊缝缺陷超声时域图 图 4 实验平台及数据采集 Fig. 4 Experimental platform and data acquisition 深度学习与传统的机器学习方法相比,可以 从海量数据中学习到更多的高级特征,因而在深 度学习中最严峻的挑战之一就是数据依赖性。由 于不锈钢焊缝缺陷图像的特殊性,导致了不锈钢 焊缝缺陷图像数据库并不能像 ImageNet 等自然 图像数据库那样充足,相对于自然图像数据库来 说,不锈钢焊缝缺陷数据库数据量往往非常少。 为了缓解这一矛盾,本文采用数据增强方式,增 大训练数据量,使模型能接受到更多缺陷特征信 息,从而提升模型在本文数据集上的表现力[17]。 采用的数据增强方法主要包括小角度随机旋转、 添加高斯噪声等方式对原始数据进行处理。通过 数据增强操作,共获得了包含未熔合、夹渣、未焊 透、裂纹和气孔 5 类缺陷数据共 7824 张,按 7:2:1 随机分割为训练集 5 634 张,验证集 1 408 张和测 试集 782 张。 本文网络优化器采用 Adam 算法,Adam 的优 点主要在于经过偏置校正后每一次迭代学习率都 有个确定范围,使得参数比较平稳。MiniBatchSize 设置为 128,初始学习率为 0.000 1,学习率衰减 为每 30 个 Epoch 衰减 10%。 3.2 实验结果分析 3.2.1 卷积提取结构选择 为了更好地选择卷积提取结构,本文将前期 (见图 1) 构建的 A-AlexNet、B-AlexNet 与 AlexNet 网络原结构进行实验对比,精度对比结果如图 5 所示。从图 5 可以看出,A-AlexNet 较 AlexNet 原 结构验证精度更高且收敛更快。B-AlexNet 收敛 较慢,但精度在不断上升。从实验可以看出,迭 代次数达到 1 000 时,A-AlexNet 精度为 90.48%, B-AlexNet 精度为 80.89%,AlexNet 原结构精度为 85.01%。出现此结果的原因为:AlexNet 原结构卷 积之后没有进行 BN 操作,使用激活函数导致小 于零的参数静默;B-AlexNet 在 ReLU 激活函数后 进行 BN 操作,精度没有提高,说明实验中存在一 部分处于负区间的参数,而该结构同 AlexNet 原 结构一样没有对静默的神经元产生影响; A - AlexNet 在卷积之后进行 BN 操作,使用激活函数 使无用神经元静默,有效地加快了网络收敛速 度,提高了网络识别精度。可知,A-AlexNet 卷积 提取结构明显好于 B-AlexNet 和 AlexNet 原结 构。因此,本文网络采用 A-AlexNet 卷积提取结 构,接下来的对比实验中均采用在卷积操作之后 添加 BN 层的结构。 A-AlexNet B-AlexNet AlexNet 100 90 80 70 60 50 40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 验证精度/% 训练选代次数/102 图 5 原结构与卷积提取结构提取精度对比 Fig. 5 Comparison of extraction accuracy between original structure and convolution extraction structure 3.2.2 验证激活函数改进效果 图 6 是采用 LeakyReLU 与 ReLU 激活函数验 证精度对比图,展示了训练迭代次数达到 1 000 次 时的验证精度变化曲线,虚线为 A-AlexNet 算法 的精度变化,实线为在 A-AlexNet 算法基础上进一 步对激活函数 LeakyReLU 改进后的 C-AlexNet 算 法精度变化。实验表明,在迭代次数达到 1 000 次 时,网络已经基本收敛,改进后的算法在验证精 度方面相比原结构提高了 1.35%。 ·540· 智 能 系 统 学 报 第 16 卷
第3期 陈立潮,等:融合迁移学习的AlexNet神经网络不锈钢焊缝缺陷分类 ·541· 100 型9和Inception V3模型2o进行对比,分析各实 90 晚 验在运行1000次后的准确率和运行时间情况以 70 及运行1500次后的精度变化,对比结果如表2和 0 5 图8所示。 0 表1性能评价 30 Table 1 Performance evaluation ◆A-Alexnet 10 C-Alexnet 指标类别 精度% 召回率% F值% 2 345678910 裂纹 93.8 92.7 93.3 训练选代次数10 气孔 96.2 96.2 96.2 图6不同激活函数验证精度对比 Fig.6 Comparison of verification accuracy of different ac- 夹渣 92.8 91.6 92.2 tivation functions 未熔合 95.7 98.5 97.1 这是因为卷积层进行特征提取后,网络中的 未焊透 92.3 92.3 92.3 一些参数小于零,RLU激活函数由于在负半轴 表2迭代次数相同时各模型性能对比 导数为零,造成了这些神经元静默。改进后的激 Table 2 Performance comparison of each model with the 活函数LeakyReLU由于在负半轴永不为零,所以 same number of iterations 能够对这一部分神经元进行激活,从而参加下一 网络模型 准确率/% 运行时间min 卷积层的运算,提高网络精度。 CNN 63.64 23 3.2.3本文算法性能验证 VGG 23.65 35 本文网络采用3.1节设置实验环境进行训 Inception_V3 25.08 38 练,当迭代次数达到1000次时结束训练,网络识 别精度达到95.12%,并在验证集中随机选取6张 本文 95.12 45 图片对模型进行测试,测试结果如图7。 100r % CNN 80 -VGG Inception V3 本文 ★★ (a)未熔合,100% (b)未焊透,99.5% (c)裂纹,100% 50 20 10 15 训练迭代次数/10 (d)夹渣,99.7% (e)裂纹,100% 图8不同模型验证精度对比 (①气孔,89.6% Fig.8 Comparison of verification accuracy of different 图7模型测试结果 models Fig.7 Model test results 从表2和图8可以看出:本文模型在迭代1000 为了进一步验证改进后的AlexNet迁移学习 次时运行时间为45min,是CNN、VGG和Incep- 网络在不锈钢焊缝缺陷数据集上的表现,本文分 tion_V3模型运行时间的1.9、1.2和1.1倍,主要是 别统计了未熔合、夹渣、未焊透、裂纹和气孔5类 由于本文模型参数较多,计算量较大,迭代相同 不锈钢焊缝缺陷的识别精度、召回率和F,值来评 次数所需时间较长;准确率达到了95%左右,较 价模型性能,实验结果如表1所示。从表1可以 CNN、VGG和Inception V3模型分别提高了 看出,气孔和未熔合的识别效果相对较高,裂纹、 32%、72%和70%,究其原因主要是CNN比本文 夹渣和未焊透3类缺陷识别效果相对较低,这是 网络层次浅,不能提取到图像的深层特征,但参 因为这3类缺陷图像相似性较高,识别过程中有 数较少,所以耗时较本文模型有一个很大的优 较大难度,因此识别效果相对较低。为了验证本 势。从图8可以看出,由于VGG和Inception V3 文方法在不锈钢焊缝缺陷数据集上的性能,将本 都属于大型的深度提取网络,对图像数量有较严 文模型与未经预训练的CNN模型II、VGGNet模 格的标准,当数据集较小时提取不到充分的缺陷
A-Alexnet C-Alexnet 100 90 80 70 60 50 40 30 20 10 0 1 2 3 4 5 6 7 8 9 10 验证精度/% 训练选代次数/102 图 6 不同激活函数验证精度对比 Fig. 6 Comparison of verification accuracy of different activation functions 这是因为卷积层进行特征提取后,网络中的 一些参数小于零,ReLU 激活函数由于在负半轴 导数为零,造成了这些神经元静默。改进后的激 活函数 LeakyReLU 由于在负半轴永不为零,所以 能够对这一部分神经元进行激活,从而参加下一 卷积层的运算,提高网络精度。 3.2.3 本文算法性能验证 本文网络采用 3.1 节设置实验环境进行训 练,当迭代次数达到 1 000 次时结束训练,网络识 别精度达到 95.12%,并在验证集中随机选取 6 张 图片对模型进行测试,测试结果如图 7。 (a) 未熔合, 100% (b) 未焊透, 99.5% (c) 裂纹, 100% (d) 夹渣, 99.7% (e) 裂纹, 100% (f) 气孔, 89.6% 图 7 模型测试结果 Fig. 7 Model test results 为了进一步验证改进后的 AlexNet 迁移学习 网络在不锈钢焊缝缺陷数据集上的表现,本文分 别统计了未熔合、夹渣、未焊透、裂纹和气孔 5 类 不锈钢焊缝缺陷的识别精度、召回率和 F1 值来评 价模型性能,实验结果如表 1 所示。从表 1 可以 看出,气孔和未熔合的识别效果相对较高,裂纹、 夹渣和未焊透 3 类缺陷识别效果相对较低,这是 因为这 3 类缺陷图像相似性较高,识别过程中有 较大难度,因此识别效果相对较低。为了验证本 文方法在不锈钢焊缝缺陷数据集上的性能,将本 文模型与未经预训练的 CNN 模型[18] 、VGGNet 模 型 [19] 和 Inception_V3 模型[20] 进行对比,分析各实 验在运行 1 000 次后的准确率和运行时间情况以 及运行 1 500 次后的精度变化,对比结果如表 2 和 图 8 所示。 表 1 性能评价 Table 1 Performance evaluation 指标类别 精度/% 召回率/% F1值/% 裂纹 93.8 92.7 93.3 气孔 96.2 96.2 96.2 夹渣 92.8 91.6 92.2 未熔合 95.7 98.5 97.1 未焊透 92.3 92.3 92.3 表 2 迭代次数相同时各模型性能对比 Table 2 Performance comparison of each model with the same number of iterations 网络模型 准确率/% 运行时间/min CNN 63.64 23 VGG 23.65 35 Inception_V3 25.08 38 本文 95.12 45 100 90 80 70 60 50 40 30 20 0 5 10 15 验证精度/% 训练迭代次数/102 CNN VGG Inception_V3 本文 图 8 不同模型验证精度对比 Fig. 8 Comparison of verification accuracy of different models 从表 2 和图 8 可以看出:本文模型在迭代 1000 次时运行时间为 45 min,是 CNN、VGG 和 Inception_V3 模型运行时间的 1.9、1.2 和 1.1 倍,主要是 由于本文模型参数较多,计算量较大,迭代相同 次数所需时间较长;准确率达到了 95% 左右,较 CNN、VGG 和 Inception_V3 模型分别提高了 32%、72% 和 70%,究其原因主要是 CNN 比本文 网络层次浅,不能提取到图像的深层特征,但参 数较少,所以耗时较本文模型有一个很大的优 势。从图 8 可以看出,由于 VGG 和 Inception_V3 都属于大型的深度提取网络,对图像数量有较严 格的标准,当数据集较小时提取不到充分的缺陷 第 3 期 陈立潮,等:融合迁移学习的 AlexNet 神经网络不锈钢焊缝缺陷分类 ·541·
·542· 智能系统学报 第16卷 信号特征,对准确率有一个较大的影响。 nition of weld defects[J].Measurement control techno- 10gy,2018,37(8):5-9,15. 4结束语 [6]WANG Xiaokai,GUAN Shanyue,HUA Lin,et al.Classi- fication of spot-welded joint strength using ultrasonic sig- 本文针对传统人工提取信号特征+机器学习 nal time-frequency features and PSO-SVM method[J].Ul- 方法存在操作人员主观随意性强、提取特征不充 trasonics,2019,91:161-169 分等问题,选择采用卷积神经网络自动提取不锈 [7]侯怀书,任慧霞.金属管道对接焊缝超声检测缺陷类型 钢焊缝缺陷数据特征进行分类。针对不锈钢焊缝 识别研究.热加工工艺,2019,48(21):143-146,152 缺陷数据较少的特点,采用数据增强的方式对原 HOU Huaishu,REN Huixia.Research on defect type re- 始数据进行扩充。然后对AlexNet网络结构进行 cognition of metal pipeline butt weld by ultrasound detec- 调整,使用迁移学习的方法冻结网络的前3层减 tion[J].Hot working technology,2019,48(21):143-146, 小网络对输入数据量的限制,之后采用批量归一 152 化加快网络运算效率,并使用LeakyReLU函数对 [8]WAIBEL A.Modular construction of time-delay neural 抑制神经元进行重新激活,从而提出一种融合迁 networks for speech recognition[J].Neuralcomput,1989. 移学习的AlexNet神经网络不锈钢焊缝缺陷分类 1:39-46. 模型。最后通过实验不断优化网络参数,本文模 [9]KRIZHEVSKY A,SUTSKEVER I,HINTON G E.Im- 型最终达到95.12%的准确率,验证了本文模型在 ageNet classification with deep convolutional neural net- 不锈钢焊缝缺陷分类上的有效性。本文是基于 works[J].Communications of the ACM,2017,60(6): AlexNet改进的卷积神经网络模型,相比于现有模 84-90. 型,参数量较多,训练时间相对较长,还需要继续 [IO]刘思洋,黄坚,刘桂雄,等.AlexNet两光照下多类别法 对VGG和Inception V3网络进行研究,通过与不 定货币识别技术[.中国测试,2019,45(9):118-122. 锈钢焊缝缺陷分类任务相结合,使改进后的网络 LIU Siyang,HUANG Jian,LIU Guixiong,et al.Techno- 不仅可以获得较高的准确率,而且还可以缩短收 logy of multi-category legal currency identification under 敛速度,以适应现代化工业生产。 multi-light conditions based on AlexNet[J].China meas- urement&test,2019,45(9)118-122. 参考文献: [11]张根保,李浩,冉琰,等.一种用于轴承故障诊断的迁移 学习模型[J].吉林大学学报(工学版),2020,50(5): [1]MUNIR N.KIM H J,PARK J,et al.Convolutional neural 1617-1626 network for ultrasonic weldment flaw classification in ZHANG Genbao,LI Hao,RAN Yan,et al.A transfer noisy conditions[J.Ultrasonics,2019,94:74-81. learning model for bearing fault diagnosis[J].Journal of [2]蔡晓龙.基于支持向量机的焊缝缺陷建模及其识别算法 Jilin University(engineering and technology edition), 研究D].西安:西安石油大学,2014:1-75 2020,50(5:1617-1626. CAI Xiaolong.Welding defects modeling and recognition [12]IOFFE S,SZEGEDY C.Batch normalization:accelerat- algorithm reasearching based on Support Vector ing deep network training by reducing internal covariate Machine[D].Xi'an:Xi'an Shiyou University,2014:1-75. shif[C]//Proceedings of the 32nd International Confer- [3]FAN Junfeng,JING Fengshui,FANG Zaojun,et al.Auto- ence on International Conference on Machine Learning. matic recognition system of welding seam type based on Lile,France,.2015:448-456. SVM method[J].The international journal of advanced [13]JIANG Xianwei,CHANG Liang,ZHANG Yudong.Clas- manufacturing technology,2017,92(1/2/3/4):989-999. sification of alzheimer's disease via eight-layer convolu- [4]CHEN Yuan,MA Hongwei,DONG Ming.Automatic clas- tional neural network with batch normalization and dro- sification of welding defects from ultrasonic signals using pout techniques[J].Journal of medical imaging and health an SVM-based RBF neural network approach[J].Insight- informatics,2020,10(5):1040-1048 non-destructive testing and condition monitoring,2018, [14]陈波,张华,王姮,等.基于迁移学习的坝面表观缺陷智 60(4):194199. 能检测方法研究[].水利水电技术,2020,51(4) [5]刘梦溪,巨永锋,高炜欣,等.焊缝缺陷图像分类识别的 106-112 深度置信网络研究).测控技术,2018,37(8):5-9,15. CHEN Bo,ZHANG Hua,WANG Heng,et al.Transfer LIU Mengxi,JU Yongfeng,GAO Weixin,et al.Research learning-based study on method of intelligent detection of on deep belief network for images classification and recog- dam surface apparent defect[J].Water resources and hy-
信号特征,对准确率有一个较大的影响。 4 结束语 本文针对传统人工提取信号特征+机器学习 方法存在操作人员主观随意性强、提取特征不充 分等问题,选择采用卷积神经网络自动提取不锈 钢焊缝缺陷数据特征进行分类。针对不锈钢焊缝 缺陷数据较少的特点,采用数据增强的方式对原 始数据进行扩充。然后对 AlexNet 网络结构进行 调整,使用迁移学习的方法冻结网络的前 3 层减 小网络对输入数据量的限制,之后采用批量归一 化加快网络运算效率,并使用 LeakyReLU 函数对 抑制神经元进行重新激活,从而提出一种融合迁 移学习的 AlexNet 神经网络不锈钢焊缝缺陷分类 模型。最后通过实验不断优化网络参数,本文模 型最终达到 95.12% 的准确率,验证了本文模型在 不锈钢焊缝缺陷分类上的有效性。本文是基于 AlexNet 改进的卷积神经网络模型,相比于现有模 型,参数量较多,训练时间相对较长,还需要继续 对 VGG 和 Inception_V3 网络进行研究,通过与不 锈钢焊缝缺陷分类任务相结合,使改进后的网络 不仅可以获得较高的准确率,而且还可以缩短收 敛速度,以适应现代化工业生产。 参考文献: MUNIR N, KIM H J, PARK J, et al. Convolutional neural network for ultrasonic weldment flaw classification in noisy conditions[J]. Ultrasonics, 2019, 94: 74–81. [1] 蔡晓龙. 基于支持向量机的焊缝缺陷建模及其识别算法 研究 [D]. 西安: 西安石油大学, 2014: 1−75. CAI Xiaolong. Welding defects modeling and recognition algorithm reasearching based on Support Vector Machine[D]. Xi’an: Xi’an Shiyou University, 2014: 1−75. [2] FAN Junfeng, JING Fengshui, FANG Zaojun, et al. Automatic recognition system of welding seam type based on SVM method[J]. The international journal of advanced manufacturing technology, 2017, 92(1/2/3/4): 989–999. [3] CHEN Yuan, MA Hongwei, DONG Ming. Automatic classification of welding defects from ultrasonic signals using an SVM-based RBF neural network approach[J]. Insight - non-destructive testing and condition monitoring, 2018, 60(4): 194–199. [4] 刘梦溪, 巨永锋, 高炜欣, 等. 焊缝缺陷图像分类识别的 深度置信网络研究 [J]. 测控技术, 2018, 37(8): 5–9, 15. LIU Mengxi, JU Yongfeng, GAO Weixin, et al. Research on deep belief network for images classification and recog- [5] nition of weld defects[J]. Measurement & control technology, 2018, 37(8): 5–9, 15. WANG Xiaokai, GUAN Shanyue, HUA Lin, et al. Classification of spot-welded joint strength using ultrasonic signal time-frequency features and PSO-SVM method[J]. Ultrasonics, 2019, 91: 161–169. [6] 侯怀书, 任慧霞. 金属管道对接焊缝超声检测缺陷类型 识别研究 [J]. 热加工工艺, 2019, 48(21): 143–146, 152. HOU Huaishu, REN Huixia. Research on defect type recognition of metal pipeline butt weld by ultrasound detection[J]. Hot working technology, 2019, 48(21): 143–146, 152. [7] WAIBEL A. Modular construction of time-delay neural networks for speech recognition[J]. Neuralcomput, 1989, 1: 39–46. [8] KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84–90. [9] 刘思洋, 黄坚, 刘桂雄, 等. AlexNet 两光照下多类别法 定货币识别技术 [J]. 中国测试, 2019, 45(9): 118–122. LIU Siyang, HUANG Jian, LIU Guixiong, et al. Technology of multi-category legal currency identification under multi-light conditions based on AlexNet[J]. China measurement & test, 2019, 45(9): 118–122. [10] 张根保, 李浩, 冉琰, 等. 一种用于轴承故障诊断的迁移 学习模型 [J]. 吉林大学学报(工学版), 2020, 50(5): 1617–1626. ZHANG Genbao, LI Hao, RAN Yan, et al. A transfer learning model for bearing fault diagnosis[J]. Journal of Jilin University (engineering and technology edition), 2020, 50(5): 1617–1626. [11] IOFFE S, SZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shif[C]//Proceedings of the 32nd International Conference on International Conference on Machine Learning. Lille, France, 2015: 448−456. [12] JIANG Xianwei, CHANG Liang, ZHANG Yudong. Classification of alzheimer’s disease via eight-layer convolutional neural network with batch normalization and dropout techniques[J]. Journal of medical imaging and health informatics, 2020, 10(5): 1040–1048. [13] 陈波, 张华, 王姮, 等. 基于迁移学习的坝面表观缺陷智 能检测方法研究 [J]. 水利水电技术, 2020, 51(4): 106–112. CHEN Bo, ZHANG Hua, WANG Heng, et al. Transfer learning-based study on method of intelligent detection of dam surface apparent defect[J]. Water resources and hy- [14] ·542· 智 能 系 统 学 报 第 16 卷
第3期 陈立潮,等:融合迁移学习的AlexNet神经网络不锈钢焊缝缺陷分类 ·543· dropower engineering,2020,51(4):106-112 BAI Lin,WEI Xin,LIU Yu,et al.Rock thin section im- [15]龚震霆,陈光喜,曹建收.卷积神经网络在脑脊液图像 age recognition and classification based on VGG 分类上的应用[J].计算机工程与设计,2017,38(4): model[J].Geological bulletin of China,2019,38(12): 1056-1061. 2053-2058. GONG Zhenting,CHEN Guangxi,CAO Jianshou. [20]詹翔,张婷,林聪,等.基于深度学习的乳腺病理图像分 Cerebrospinal fluid images classification based on convo- 类实验方法U.计算机应用,2019,39(S2少:118-121 lution neural network[J].Computer engineering and ZHAN Xiang,ZHANG Ting,LIN Cong,et al.Classifica- design,2017,38(4):1056-1061. tion method of breast pathological images based on deep [l6]戎辉,华一丁,张小俊,等.基于迁移学习和AlexNet的 learning[J].Journal of computer applications,2019, 驾驶员行为状态识别方法).科学技术与工程,2019, 39(S2:118-121. 19(28):208-216. 作者简介: RONG Hui,HUA Yiding,ZHANG Xiaojun,et al.Driver 陈立潮,教授,博士,主要研究方 behavior recognition method based on migration learning 向为人工智能、图像信息处理。主持 and AlexNet[J].Science technology and engineering, 山西省自然科学基金等项目12项。 2019,19(28):208-216. 发表学术论文180余篇。 [17刀周奇才,刘星辰,赵炯,等.旋转机械一维深度卷积神经 网络故障诊断研究】.振动与冲击,2018,37(23): 31-37. ZHOU Qicai,LIU Xingchen,ZHAO Jiong,et al.Fault 闫耀东,硕士研究生,主要研究方 diagnosis for rotating machinery based on ID depth con- 向为图像信息处理。 volutional neural network[J].Journal of vibration and shock,2018,37(23:31-37. [18]张安安,黄晋英,冀树伟,等.基于卷积神经网络图像分 类的轴承故障模式识别[几.振动与冲击,2020,39(4): 165-171 ZHANG An'an,HUANG Jinying,JI Shuwei,et al.Bear- 张睿,副教授,博土,主要研究方 向为智能信息处理。主持山西省应用 ing fault pattern recognition based on image classifica- 基础研究等项目5项。发表学术论文 tion with CNN[J].Journal of vibration and shock,2020, 10余篇。 39(4):165-171. [19]白林,魏昕,刘禹,等.基于VGG模型的岩石薄片图像 识别U.地质通报,2019,38(12)2053-2058
dropower engineering, 2020, 51(4): 106–112. 龚震霆, 陈光喜, 曹建收. 卷积神经网络在脑脊液图像 分类上的应用 [J]. 计算机工程与设计, 2017, 38(4): 1056–1061. GONG Zhenting, CHEN Guangxi, CAO Jianshou. Cerebrospinal fluid images classification based on convolution neural network[J]. Computer engineering and design, 2017, 38(4): 1056–1061. [15] 戎辉, 华一丁, 张小俊, 等. 基于迁移学习和 AlexNet 的 驾驶员行为状态识别方法 [J]. 科学技术与工程, 2019, 19(28): 208–216. RONG Hui, HUA Yiding, ZHANG Xiaojun, et al. Driver behavior recognition method based on migration learning and AlexNet[J]. Science technology and engineering, 2019, 19(28): 208–216. [16] 周奇才, 刘星辰, 赵炯, 等. 旋转机械一维深度卷积神经 网络故障诊断研究 [J]. 振动与冲击, 2018, 37(23): 31–37. ZHOU Qicai, LIU Xingchen, ZHAO Jiong, et al. Fault diagnosis for rotating machinery based on 1D depth convolutional neural network[J]. Journal of vibration and shock, 2018, 37(23): 31–37. [17] 张安安, 黄晋英, 冀树伟, 等. 基于卷积神经网络图像分 类的轴承故障模式识别 [J]. 振动与冲击, 2020, 39(4): 165–171. ZHANG An’an, HUANG Jinying, JI Shuwei, et al. Bearing fault pattern recognition based on image classification with CNN[J]. Journal of vibration and shock, 2020, 39(4): 165–171. [18] 白林, 魏昕, 刘禹, 等. 基于 VGG 模型的岩石薄片图像 识别 [J]. 地质通报, 2019, 38(12): 2053–2058. [19] BAI Lin, WEI Xin, LIU Yu, et al. Rock thin section image recognition and classification based on VGG model[J]. Geological bulletin of China, 2019, 38(12): 2053–2058. 詹翔, 张婷, 林聪, 等. 基于深度学习的乳腺病理图像分 类实验方法 [J]. 计算机应用, 2019, 39(S2): 118–121. ZHAN Xiang, ZHANG Ting, LIN Cong, et al. Classification method of breast pathological images based on deep learning[J]. Journal of computer applications, 2019, 39(S2): 118–121. [20] 作者简介: 陈立潮,教授,博士,主要研究方 向为人工智能、图像信息处理。主持 山西省自然科学基金等项目 12 项。 发表学术论文 180 余篇。 闫耀东,硕士研究生,主要研究方 向为图像信息处理。 张睿,副教授,博士,主要研究方 向为智能信息处理。主持山西省应用 基础研究等项目 5 项。发表学术论文 10 余篇。 第 3 期 陈立潮,等:融合迁移学习的 AlexNet 神经网络不锈钢焊缝缺陷分类 ·543·