第14卷第4期 智能系统学报 Vol.14 No.4 2019年7月 CAAI Transactions on Intelligent Systems Jul.2019 D0:10.11992/tis.201806001 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20181214.1434.006html 密集堆叠下的高相似度木块横截面检测 魏文戈2,谭晓阳2 (1.南京航室航天大学计算机科学与技术学院,江苏南京211106,2.软件新技术与产业化协同创新中心,江苏 南京211106) 摘要:快速有效地检测和获取木块横截面信息,是提升木块生产交易效率的关键。由于木块往往被密集堆 叠、木块横截面相似度高且边界不明显,给检测木块横截面信息带来了较大的挑战。针对密集堆叠下的高相似 度木块横截面检测困难,本文提出了简单高效的Nood R-CNN网络模型,通过改进模型的损失函数和非极大值 抑制算法来提升检测精度,简化网络结构和改进特征金字塔网络来保证检测速度。实验证明:该模型可在密集 堆叠情况下精确地检测高相似度木块横截面,检测速度较快且鲁棒性良好,可实际运用于木块生产和交易中。 关键词:密集堆叠:高相似度;木块横截面:检测:木块生产交易;损失函数;鲁棒性 中图分类号:TP181文献标志码:A文章编号:1673-4785(2019)04-0642-08 中文引用格式:魏文戈,谭晓阳.密集堆叠下的高相似度木块横截面检测.智能系统学报,2019,14(4):642-649. 英文引用格式:VEI Wen'ge,TAN Xiaoyang.Highly similar wood blocks detection under dense stackingJ.CAAI transactions on intelligent systems,2019,14(4):642-649. Highly similar wood blocks detection under dense stacking WEI Wen'ge2,TAN Xiaoyang2 (1.College of Computer Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China; 2.Collaborative Innovation Center of Novel Software Technology and Industrialization,Nanjing 211106,China) Abstract:Quick and effective detection of wood blocks cross section and acquisition of the required information are the key to improving the efficiency of wood block production and transactions.However,since wood blocks are often densely stacked,their cross sections have high similarity,while their boundaries are not obvious;this poses a great chal- lenge in detecting the cross sections and acquiring the required information.Considering the difficulty in detecting the cross section of highly similar wood blocks under dense stacking,a simple and efficient wood R-CNN network model is proposed in this paper.The detection accuracy is increased by improving the model loss function and the non-maximum suppression algorithm,and detection speed is ensured by simplifying the network structure and modifying the feature pyramid network.A series of experiments prove that the algorithm model can precisely detect the cross sections of blocks with high similarity under dense stacking.Moreover,it can guarantee fast detection speed and good robustness and can be actually used in the production and transaction of wood blocks. Keywords:dense stacking;highly similar;cross section of wood:detection:production of wood block:loss function; robustness 木材是林业主产物,对于人类生活起着重要 主要体现为木块横截面尺寸信息以及木块横截面 的支持作用。实际生产过程中,工人们经常将木 数量信息。在木块交易时,往往通过木块横截面 材制成横截面各异的矩形木块。木块横截面信息 的数量信息直接决定总体售价:或根据木块横截 面的尺寸信息来决定木块用途,进而间接影响售 收稿日期:2018-06-01.网络出版日期:2018-12-18. 基金项目:国家自然科学基金项目(61672280.61373060.61732006). 价。因此,木块的横截面信息尤为重要。然而由 通信作者:谭晓阳.E-mail:x.tan@nuaa.edu.cn. 于木块往往被批量地密集堆叠,使得木块横截面
DOI: 10.11992/tis.201806001 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20181214.1434.006.html 密集堆叠下的高相似度木块横截面检测 魏文戈1,2,谭晓阳1,2 (1. 南京航空航天大学 计算机科学与技术学院,江苏 南京 211106; 2. 软件新技术与产业化协同创新中心,江苏 南京 211106) 摘 要:快速有效地检测和获取木块横截面信息,是提升木块生产交易效率的关键。由于木块往往被密集堆 叠、木块横截面相似度高且边界不明显,给检测木块横截面信息带来了较大的挑战。针对密集堆叠下的高相似 度木块横截面检测困难,本文提出了简单高效的 Wood R-CNN 网络模型,通过改进模型的损失函数和非极大值 抑制算法来提升检测精度,简化网络结构和改进特征金字塔网络来保证检测速度。实验证明:该模型可在密集 堆叠情况下精确地检测高相似度木块横截面,检测速度较快且鲁棒性良好,可实际运用于木块生产和交易中。 关键词:密集堆叠;高相似度;木块横截面;检测;木块生产交易;损失函数;鲁棒性 中图分类号:TP181 文献标志码:A 文章编号:1673−4785(2019)04−0642−08 中文引用格式:魏文戈, 谭晓阳. 密集堆叠下的高相似度木块横截面检测 [J]. 智能系统学报, 2019, 14(4): 642–649. 英文引用格式:WEI Wen’ge, TAN Xiaoyang. Highly similar wood blocks detection under dense stacking[J]. CAAI transactions on intelligent systems, 2019, 14(4): 642–649. Highly similar wood blocks detection under dense stacking WEI Wen’ge1,2 ,TAN Xiaoyang1,2 (1. College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China; 2. Collaborative Innovation Center of Novel Software Technology and Industrialization, Nanjing 211106, China) Abstract: Quick and effective detection of wood blocks cross section and acquisition of the required information are the key to improving the efficiency of wood block production and transactions. However, since wood blocks are often densely stacked, their cross sections have high similarity, while their boundaries are not obvious; this poses a great challenge in detecting the cross sections and acquiring the required information. Considering the difficulty in detecting the cross section of highly similar wood blocks under dense stacking, a simple and efficient wood R-CNN network model is proposed in this paper. The detection accuracy is increased by improving the model loss function and the non-maximum suppression algorithm, and detection speed is ensured by simplifying the network structure and modifying the feature pyramid network. A series of experiments prove that the algorithm model can precisely detect the cross sections of blocks with high similarity under dense stacking. Moreover, it can guarantee fast detection speed and good robustness and can be actually used in the production and transaction of wood blocks. Keywords: dense stacking; highly similar; cross section of wood; detection; production of wood block; loss function; robustness 木材是林业主产物,对于人类生活起着重要 的支持作用。实际生产过程中,工人们经常将木 材制成横截面各异的矩形木块。木块横截面信息 主要体现为木块横截面尺寸信息以及木块横截面 数量信息。在木块交易时,往往通过木块横截面 的数量信息直接决定总体售价;或根据木块横截 面的尺寸信息来决定木块用途,进而间接影响售 价。因此,木块的横截面信息尤为重要。然而由 于木块往往被批量地密集堆叠,使得木块横截面 收稿日期:2018−06−01. 网络出版日期:2018−12−18. 基金项目:国家自然科学基金项目 (61672280,61373060,61732006). 通信作者:谭晓阳. E-mail:x.tan@nuaa.edu.cn. 第 14 卷第 4 期 智 能 系 统 学 报 Vol.14 No.4 2019 年 7 月 CAAI Transactions on Intelligent Systems Jul. 2019
第4期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·643· 之间的分布高度密集且缝隙极小;外观较相似、 Faster R-CNN:为了改进Fast R-CNN较为耗 边界不明显,易导致漏检和误检;且拍摄时光照、 时的候选区域生成过程,Faster R-CNN算法提出 亮度变化范围较大,进一步加大了检测难度,给 区域候选网络(RPN),将区域候选功能块也交 有效检测木块横截面信息带来了较大的挑战。现 由CNN实现,提高了检测速度。通过该设计,区 有的目标检测算法)均不能很好地解决该问 域候选网络可与Fast R-CNN共享前半部分的卷 题。本文为此提出了Wood R-CNN模型,在模型 积提取结果。 损失函数和非极大值抑制算法上进行了改进以提 Mask R-CNN:该算法在Faster R-CNN基础上 升检测精度,同时简化网络结构并改进特征金字 并行添加了一个目标掩膜分支,用于对每一个候 塔网络以保证检测速度。实验结果表明:该模型 选区域预测目标掩膜。3个任务分支并行设计不 保证了较快的检测速度,且对密集程度、亮度、光 仅简化了网络结构,也提升了灵活性便于做进一 照、纹理的变化具有良好的鲁棒性。 步修改。Mask R-CNN能够对图像中的目标精准 木块检测相关工作 地检测,并精细分割出每个实例。 1.2木块检测领域 目标检测作为计算机视觉领域的一个重要分 目前业界针对木块检测的研究主要集中于木 支,一直是专家们研究的热点之一。然而,鉴于 块缺陷检测6、木块含水率检测)、木块年轮检 传统目标检测算法依赖人为设计特征的局限性, 测、木块性质检测四、木块密度检测四及木块 检测效果较差、算法较为复杂、且检测速度也较 腐朽检测等领域。 慢。因此传统目标检测算法并没有被广泛运用。 文献[10]通过超声波实现木块缺陷检测;文 之后,基于深度学习的目标检测算法的出现 献[11]总结了木块缺陷的理论方法,指明接下来 在检测精度、检测速度和实现成本上均优于传统 的发展方向;文献[12]将基于RGB彩色空间的木 的目标检测算法。目标检测算法因此逐渐转向以 块图像作为一个整体,由四元数矩阵奇异值分解 深度学习为主流。其中最具有代表性的是R- 完成检测分析;文献[13]侧重研究木块无损检 CNN系列-目标检测算法,此外还有SPP-Net 测;文献[14-16]将人工神经网络技术引人木块缺 SSD阿、YOLOT以及YOLO2阁等经典算法。 陷检测并取得较大影响;文献[17]首次在木材含 1.1R-CNN系列目标检测算法 水率检测中使用深度学习技术;文献[18-19]将图 R-CNN网络是一种基于区域候选的卷积神 像处理技术应用于木块检测;文献[20]对模态分 经网络算法,是CNN在检测问题上的首次尝试。 析技术进行研究,为木块检测提供新思路;文献21-22] 其通过提取一系列的区域候选框送入卷积神经网 通过应力波技术及应力波传播模型实现木块检 络,将检测问题转化为分类问题。R-CNN 测;文献[23]研究了计算机断层扫描技术在木块 首先通过选择性搜索算法,使用不同大小的滑 密度检测上的可行性;文献[24]侧重对木材腐朽 动窗口来感受输入图像并生成候选区域。每张图 情况进行检测,该研究对后续的防治工作起到了 像大慨会生成近2k个候选区域。这些候选区域 辅助作用。 经过扭曲变换,统一缩放成相同尺寸的方形区 但目前业内并没有针对木材横截面检测这一 域,并输入卷积神经网络,进行进一步的特征抽 取。最后对各候选区域进行标签分类以达到目标 特定任务的先行研究。本文创新性地设计并提出 了Wood R-CNN网络模型,将深度学习成功运用 检测的效果。 Fast R-CNN:为了省去R-CNN算法中重叠 到木块横截面检测中,在该复杂场景下通过卷积 区域被反复特征提取,Fast R-CNN首先记录下 神经网络学得网络模型,实现了对木块横截面的 选择性搜索所得的区间,并对整张输入图片进行 有效检测。 卷积操作得到特征图,然后将先前记录的区间映 2 Wood R-CNN模型设计 射到特征图以生成各块候选区域。Fast R-CNN提 出了RolPooling层结构以保证映射后的候选区 2.1 Wood R-CNN网络结构 域尺寸一致,并输人全连接层提取更高级的特 如图1,Wood R-CNN分为以下3部分: 征。最后将结果数据送入分类器和边界框回归 前半部分以ResNet-5021组合FPN26作为卷 器,前者用于识别候选区域的类别标签,后者用 积神经网络结构的主体,对输入的图像进行了特 于微调边界框的坐标位置。 征提取
之间的分布高度密集且缝隙极小;外观较相似、 边界不明显,易导致漏检和误检;且拍摄时光照、 亮度变化范围较大,进一步加大了检测难度,给 有效检测木块横截面信息带来了较大的挑战。现 有的目标检测算法[ 1 - 8 ] 均不能很好地解决该问 题。本文为此提出了 Wood R-CNN 模型,在模型 损失函数和非极大值抑制算法上进行了改进以提 升检测精度,同时简化网络结构并改进特征金字 塔网络以保证检测速度。实验结果表明:该模型 保证了较快的检测速度,且对密集程度、亮度、光 照、纹理的变化具有良好的鲁棒性。 1 木块检测相关工作 目标检测作为计算机视觉领域的一个重要分 支,一直是专家们研究的热点之一。然而,鉴于 传统目标检测算法依赖人为设计特征的局限性, 检测效果较差、算法较为复杂、且检测速度也较 慢。因此传统目标检测算法并没有被广泛运用。 之后,基于深度学习的目标检测算法的出现 在检测精度、检测速度和实现成本上均优于传统 的目标检测算法。目标检测算法因此逐渐转向以 深度学习为主流。其中最具有代表性的是 RCNN 系列[1-4] 目标检测算法,此外还有 SPP-Net[5] 、 SSD[6] 、YOLO[7] 以及 YOLO2[8] 等经典算法。 1.1 R-CNN 系列目标检测算法 R-CNN[1] 网络是一种基于区域候选的卷积神 经网络算法,是 CNN 在检测问题上的首次尝试。 其通过提取一系列的区域候选框送入卷积神经网 络,将检测问题转化为分类问题。 R-CNN 首先通过选择性搜索[9] 算法,使用不同大小的滑 动窗口来感受输入图像并生成候选区域。每张图 像大概会生成近 2k 个候选区域。这些候选区域 经过扭曲变换,统一缩放成相同尺寸的方形区 域,并输入卷积神经网络,进行进一步的特征抽 取。最后对各候选区域进行标签分类以达到目标 检测的效果。 Fast R-CNN:为了省去 R-CNN[1] 算法中重叠 区域被反复特征提取,Fast R-CNN[2] 首先记录下 选择性搜索所得的区间,并对整张输入图片进行 卷积操作得到特征图,然后将先前记录的区间映 射到特征图以生成各块候选区域。Fast R-CNN 提 出了 RoIPooling[2] 层结构以保证映射后的候选区 域尺寸一致,并输入全连接层提取更高级的特 征。最后将结果数据送入分类器和边界框回归 器,前者用于识别候选区域的类别标签,后者用 于微调边界框的坐标位置。 Faster R-CNN:为了改进 Fast R-CNN[2] 较为耗 时的候选区域生成过程,Faster R-CNN[3] 算法提出 区域候选网络 (RPN)[3] ,将区域候选功能块也交 由 CNN 实现,提高了检测速度。通过该设计,区 域候选网络可与 Fast R-CNN 共享前半部分的卷 积提取结果。 Mask R-CNN:该算法在 Faster R-CNN 基础上 并行添加了一个目标掩膜分支,用于对每一个候 选区域预测目标掩膜。3 个任务分支并行设计不 仅简化了网络结构,也提升了灵活性便于做进一 步修改。Mask R-CNN 能够对图像中的目标精准 地检测,并精细分割出每个实例。 1.2 木块检测领域 目前业界针对木块检测的研究主要集中于木 块缺陷检测[10-16] 、木块含水率检测[17] 、木块年轮检 测 [18] 、木块性质检测[19-22] 、木块密度检测[23] 及木块 腐朽检测[24] 等领域。 文献 [10] 通过超声波实现木块缺陷检测;文 献 [11] 总结了木块缺陷的理论方法,指明接下来 的发展方向;文献 [12] 将基于 RGB 彩色空间的木 块图像作为一个整体,由四元数矩阵奇异值分解 完成检测分析;文献 [13] 侧重研究木块无损检 测;文献 [14-16] 将人工神经网络技术引入木块缺 陷检测并取得较大影响;文献 [17] 首次在木材含 水率检测中使用深度学习技术;文献 [18-19] 将图 像处理技术应用于木块检测;文献 [20] 对模态分 析技术进行研究,为木块检测提供新思路;文献 [21-22] 通过应力波技术及应力波传播模型实现木块检 测;文献 [23] 研究了计算机断层扫描技术在木块 密度检测上的可行性;文献 [24] 侧重对木材腐朽 情况进行检测,该研究对后续的防治工作起到了 辅助作用。 但目前业内并没有针对木材横截面检测这一 特定任务的先行研究。本文创新性地设计并提出 了 Wood R-CNN 网络模型,将深度学习成功运用 到木块横截面检测中,在该复杂场景下通过卷积 神经网络学得网络模型,实现了对木块横截面的 有效检测。 2 Wood R-CNN 模型设计 2.1 Wood R-CNN 网络结构 如图 1,Wood R-CNN 分为以下 3 部分: 前半部分以 ResNet-50[25] 组合 FPN[26] 作为卷 积神经网络结构的主体,对输入的图像进行了特 征提取。 第 4 期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·643·
·644· 智能系统学报 第14卷 可以看出,该算法中分类损失和回归损失只 RPN 候选框 是简单地按相同权重进行处理,这样的设计不利 回归器 ResNet+FPN 特征图 于边框准确率要求较高的检测任务。 分类器 Mask R-CNN算法中3个任务平行,且同样 图1 Wood R-CNN网络结构 为相同的权重分配。该算法设计的训练损失函 Fig.1 Structure of Wood R-CNN 数为 中间部分负责生成候选区域。由区域候选网 L=L+L (4) 其中: 络(RPN)2对得到的多层不同尺度的特征图进行 候选区域提取,生成不同尺寸和形状的候选框 Li=Les+Lreg+Lmask (5) L2 Lrpn_cs +Lrp_reg (6) (anchor),同步进行类别评分和边界框回归。再 式中Lmk表示网络尾部的分割任务损失。 根据结果通过剔除越界候选框和非极大值抑制算 通过仔细分析问题需求并对比文献[3-4]的 法NMS)2啊来降低候选框数量。并将候选框映射 损失函数设计,考虑到具体的算法运用场景下的 回原图像得到对应区域,通过RolAlign结构将 分类任务较简单但回归任务较难且精度要求较 所有区域映射为相同尺寸。 高,因此Wood R-CNN算法模型的重点在于其中 后半部分负责分类和边框回归。主要为全连 的回归任务。重新设计了更具灵活性的损失函数 接层及互相平行的分类器和边框回归器,最终输 计算式为 出检测结果。 L=L"+L" (7) 2.2检测精度的提升 其中: 由于木块密集堆叠、木块横截面相似度高且 L”=Ls+2L (8) 边界不明显,因此对检测的精度和准度要求极 L2=Lrpe cls+Lam_reg (9) 高。然而现有的检测算法并不能很好地应对该挑 在实验中,发现该改进操作明显提升了模型 战。目前主流的检测算法所设置的损失函数简单 算法的检测精度。 地将分类任务和检测任务按相同的权重进行分 2.2.2非极大值抑制算法的改进 配,往往不够灵活;区域伸缩功能一般交由Ro- 非极大值抑制可算法用来选取邻域边界框中 Pooling来实现,该结构基于最近邻插值,通过四 分数最高的边界框,并抑制那些分数较低的边界 舍五入来选取距离目标最近邻点进行填充,容易 框,能有效去除边界框重叠现象,从而提升目标 丢失较多的位置对称信息;非极大值抑制算法往 检测精度。该算法在Faster R-CNN和Mask R-CNN 往被设定较大的算法阈值以减少重叠,但并不适 用于低重叠度的木块横截面检测问题。 等目标检测算法中均有着广泛的运用。非极大值 若直接使用这些现有的检测算法,会不可避 抑制的算法阈值在文献[3]中被设定为0.7,在文 免地存在检测精度低和误检的情况。对此通过修 献[4]中被设定为0.5,并在常规数据集上取得了 改模型损失函数和改用RoIAlign进行Rol池化来 很好的去重效果。通过仔细观察木块横截面检测 提升检测准确率,并通过改进非极大值抑制算法 这一特定任务的检测对象图像样本特征,发现样 来降低误检率。 本中的木块横截面实例重叠度较低,但是对漏检 2.2.1损失函数的改进 率较敏感。因此在Wood R-CNN中,新设定非极 在训练过程中,Faster R-CNN)针对感兴趣区 大值抑制的算法阈值为0.3。经过实验表明,这种 域(RoI)和区域候选网络(RPN)设计的训练损失 改进在一定程度上减少了误检率,从而明显改善 函数为 了最终的检测效果。 L=L+L (1) 2.2.3Rol池化的改进 其中: RolPooling结构在20l5年于Fast R-CNN)论 LI Lels +Lreg (2) 文中提出,其作用旨在替换掉R-CNN网络中的区 L2=Lrpncls+Lrpn n (3) 域伸缩结构,使之满足在一次性特征抽取的情况 式中:L,表示网络尾部的计算损失:L2表示 下实现多目标检测。但RolPooling结构使用的是 RPN的计算损失。Ls和L分别表示网络尾部 最近邻插值算法,在调整特征图尺寸时存在缺 的分类损失和回归损失;Lpm山和Lm分别表示 陷,当出现缩放后坐标无法刚好为整数的特殊情 RPN的分类损失和回归损失。 况时,简单地通过四舍五入来处理,相当于直接
ResNet+FPN RPN 回归器 特征图 分类器 候选框 图 1 Wood R-CNN 网络结构 Fig. 1 Structure of Wood R-CNN 中间部分负责生成候选区域。由区域候选网 络 (RPN)[26] 对得到的多层不同尺度的特征图进行 候选区域提取,生成不同尺寸和形状的候选框 (anchor)[3] ,同步进行类别评分和边界框回归。再 根据结果通过剔除越界候选框和非极大值抑制算 法 (NMS)[27] 来降低候选框数量。并将候选框映射 回原图像得到对应区域,通过 RoIAlign[4] 结构将 所有区域映射为相同尺寸。 后半部分负责分类和边框回归。主要为全连 接层及互相平行的分类器和边框回归器,最终输 出检测结果。 2.2 检测精度的提升 由于木块密集堆叠、木块横截面相似度高且 边界不明显,因此对检测的精度和准度要求极 高。然而现有的检测算法并不能很好地应对该挑 战。目前主流的检测算法所设置的损失函数简单 地将分类任务和检测任务按相同的权重进行分 配,往往不够灵活;区域伸缩功能一般交由 RoIPooling 来实现,该结构基于最近邻插值,通过四 舍五入来选取距离目标最近邻点进行填充,容易 丢失较多的位置对称信息;非极大值抑制算法往 往被设定较大的算法阈值以减少重叠,但并不适 用于低重叠度的木块横截面检测问题。 若直接使用这些现有的检测算法,会不可避 免地存在检测精度低和误检的情况。对此通过修 改模型损失函数和改用 RoIAlign 进行 RoI 池化来 提升检测准确率,并通过改进非极大值抑制算法 来降低误检率。 2.2.1 损失函数的改进 在训练过程中,Faster R-CNN[3] 针对感兴趣区 域 (RoI) 和区域候选网络 (RPN) 设计的训练损失 函数为 L = L1 + L2 (1) 其中: L1 = Lcls + Lreg (2) L2 = Lrpn_cls + Lrpn_reg (3) L1 L2 Lcls Lreg Lrpn_cls Lrpn_reg 式中: 表示网络尾部的计算损失; 表 示 RPN 的计算损失。 和 分别表示网络尾部 的分类损失和回归损失; 和 分别表示 RPN 的分类损失和回归损失。 可以看出,该算法中分类损失和回归损失只 是简单地按相同权重进行处理,这样的设计不利 于边框准确率要求较高的检测任务。 Mask R-CNN[4] 算法中 3 个任务平行,且同样 为相同的权重分配。该算法设计的训练损失函 数为 L = L ′ 1 + L ′ 2 (4) 其中: L ′ 1 = Lcls + Lreg + Lmask (5) L ′ 2 = Lrpn_cls + Lrpn_reg (6) 式中 Lmask 表示网络尾部的分割任务损失。 通过仔细分析问题需求并对比文献 [3-4] 的 损失函数设计,考虑到具体的算法运用场景下的 分类任务较简单但回归任务较难且精度要求较 高,因此 Wood R-CNN 算法模型的重点在于其中 的回归任务。重新设计了更具灵活性的损失函数 计算式为 L = L ′′ 1 + L ′′ 2 (7) 其中: L ′′ 1 = λ1 · Lcls +λ2 · Lreg (8) L ′′ 2 = Lrpn_cls + Lrpn_reg (9) 在实验中,发现该改进操作明显提升了模型 算法的检测精度。 2.2.2 非极大值抑制算法的改进 非极大值抑制[27] 算法用来选取邻域边界框中 分数最高的边界框,并抑制那些分数较低的边界 框,能有效去除边界框重叠现象,从而提升目标 检测精度。该算法在 Faster R-CNN 和 Mask R-CNN 等目标检测算法中均有着广泛的运用。非极大值 抑制的算法阈值在文献 [3] 中被设定为 0.7,在文 献 [4] 中被设定为 0.5,并在常规数据集上取得了 很好的去重效果。通过仔细观察木块横截面检测 这一特定任务的检测对象图像样本特征,发现样 本中的木块横截面实例重叠度较低,但是对漏检 率较敏感。因此在 Wood R-CNN 中,新设定非极 大值抑制的算法阈值为 0.3。经过实验表明,这种 改进在一定程度上减少了误检率,从而明显改善 了最终的检测效果。 2.2.3 RoI 池化的改进 RoIPooling 结构在 2015 年于 Fast R-CNN[3] 论 文中提出,其作用旨在替换掉 R-CNN 网络中的区 域伸缩结构,使之满足在一次性特征抽取的情况 下实现多目标检测。但 RoIPooling 结构使用的是 最近邻插值算法,在调整特征图尺寸时存在缺 陷,当出现缩放后坐标无法刚好为整数的特殊情 况时,简单地通过四舍五入来处理,相当于直接 ·644· 智 能 系 统 学 报 第 14 卷
第4期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·645· 选取距离目标位置最近的像素点而没有考虑空间 一次创建。为了减少计算量同时降低内存负载, 对称性。文献[4]中发现了这种算法可能在一定 本文将滑窗移动步长改进为2,候选框的数量因 范围内损失空间上的对称性,因此提出了o 此缩小到了原来的1/4,而检测精度并没有出现下 Align,具体表现在将最近邻插值替换为了更合 降。由于减少了候选框数量所带来的计算量降 理的双线性插值。 低,算法检测速度明显加快。在一块8GB显存的 考虑到具体的问题需求,通过仔细分析本文 显卡上,Wood R-CNN对输入大小为1024×1024 任务的数据集样本特性发现,由于木块密集堆 的木块横截面图片进行检测,检测速度相比改进 叠、木块横截面相似度高且边界不明显,因此木 前的模型平均提高了0.47fs。 块横截面检测得到的边界框必须具有很高的位置 2.4实现细节 精确度。因此,Wood R-CNN受文献[4]启发,改 2.4.1数据扩充 用RoIAlign结构以替代传统的RoIPooling结 由于公共网络上未提供开源的木块横截面数 构,保证了在池化感兴趣区域(Ro)的过程中不 据集,因此本文采用某木材厂提供的一批木块横 丢失位置对称信息,从而提高了模型算法的检测 截面拍摄图像作为数据集。但由于拍摄成本较 精度。 高,图像数据数量有限。深度卷积神经网络需要 2.3检测速度的提升 大量有效数据来驱动模型的正常训练,否则往往 直接使用现有的目标检测算法,由于结构的 会陷人过拟合的困境。通过仔细观察图像样本, 复杂性,会不可避免地存在检测速度慢的问题。 注意到木块横截面多为轮廓简单且形状方正的长 如何有效提升检测速度,是保证模型算法性能所 矩形,因此原图像经过翻转或抠取之后依然会符 需要克服的挑战。在Wood R-CNN中,通过简化 合该检测任务的常规数据特性。根据这一数据特 网络结构和改进特征金字塔网络,成功地提升了 性,本文采用了图像水平翻转、图像垂直翻转、图 模型算法的检测速度。 像水平垂直翻转、随机抠取和尺度变换等一系列 2.3.1网络结构的简化 数据扩充手段,成功地将图像样本数量扩充至原 考虑到本任务针对木块横截面进行检测,主 有数量的数倍,同时增加了训练样本的多样性。 要提取的特征为木块横截面的自然纹理、轮廓 不仅可以很好地降低过拟合风险,也使模型性能 等,属于比较低级的特征,因而并不需要太深的 得到一定程度上的提升。 网络结构去提取过于高级的目标特征。但同时太 2.4.2数据标记 浅的网络结构又无法满足该任务的高精度要求。 在标记过程中,通过标记工具记录图片中每 基于这些考量,选择了ResNet--50P作为Wood R- 个木块横截面实例4个角点的二维坐标并生成坐 CNN前半部分的卷积神经网络主体,主要任务是 标列表,由该表可以生成该图片中每个木块横截 进行图像的特征提取。相比ResNeXt-.l0121这种 面实例的边界框分布图。 更深的网络结构,ResNet-.502可以在保证检测精 2.4.3实际训练 度的同时,减少计算量和内存要求,并加快模型 在实际训练过程中,将木块横截面图像数据 在训练时的收敛速度。 集分为训练集、验证集及测试集,分配比例为 2.3.2特征金字塔网络的改进 8:1:I。由于该任务与Mask R-CNN的多目标检测 目标检测算法中,往往只在卷积结构提取的 任务具有一定的相似度,Wood R-CNN模型训练 最后一层特征图上生成候选区域,该设计易造成 采用在Mask R-CNN已收敛的成熟模型上做进 小尺度目标的漏检。而特征金字塔网络(FPN)2 步的迁移学习。学习率初始设置为0.002,经过 则在多层不同尺度的特征图上进行生成候选区域 10个训练周期降为0.0002,30个周期后结束 的操作,充分降低了对小目标的漏检率。考虑到 训练。 本任务图像样本中多为狭长形的小尺度目标,因 卷积神经网络输入原始图片,得到预测结果 此Wood R-CNN采用特征金字塔网络以生成候选 并与真实分布计算误差损失,对网络参数进行负 区域。但在研究中发现,该结构生成的候选框数 反馈调节,引导神经网络学习到对木块横截面的 量过多且过密,计算量较大,影响了检测速度。 特征提取能力和检测能力。 所以本文在特征金字塔网络(RPN)上进行了改进。 经过一定轮数训练,在最终的收敛模型上进 特征金字塔的最低层级相对于图像具有4像 行木块横截面检测的测试。测试结果表明Wood 素的跨度,因此候选框是每隔4个像素间隔进行 R-CNN模型在测试集上取得了较佳的木块横截
选取距离目标位置最近的像素点而没有考虑空间 对称性。文献 [4] 中发现了这种算法可能在一定 范围内损失空间上的对称性,因此提出了 RoIAlign[4] ,具体表现在将最近邻插值替换为了更合 理的双线性插值。 考虑到具体的问题需求,通过仔细分析本文 任务的数据集样本特性发现,由于木块密集堆 叠、木块横截面相似度高且边界不明显,因此木 块横截面检测得到的边界框必须具有很高的位置 精确度。因此,Wood R-CNN 受文献 [4] 启发,改 用 RoIAlign[4] 结构以替代传统的 RoIPooling[3] 结 构,保证了在池化感兴趣区域 (RoI) 的过程中不 丢失位置对称信息,从而提高了模型算法的检测 精度。 2.3 检测速度的提升 直接使用现有的目标检测算法,由于结构的 复杂性,会不可避免地存在检测速度慢的问题。 如何有效提升检测速度,是保证模型算法性能所 需要克服的挑战。在 Wood R-CNN 中,通过简化 网络结构和改进特征金字塔网络,成功地提升了 模型算法的检测速度。 2.3.1 网络结构的简化 考虑到本任务针对木块横截面进行检测,主 要提取的特征为木块横截面的自然纹理、轮廓 等,属于比较低级的特征,因而并不需要太深的 网络结构去提取过于高级的目标特征。但同时太 浅的网络结构又无法满足该任务的高精度要求。 基于这些考量,选择了 ResNet-50[25] 作为 Wood RCNN 前半部分的卷积神经网络主体,主要任务是 进行图像的特征提取。相比 ResNeXt-101[28] 这种 更深的网络结构,ResNet-50[25] 可以在保证检测精 度的同时,减少计算量和内存要求,并加快模型 在训练时的收敛速度。 2.3.2 特征金字塔网络的改进 目标检测算法中,往往只在卷积结构提取的 最后一层特征图上生成候选区域,该设计易造成 小尺度目标的漏检。而特征金字塔网络 (FPN)[26] 则在多层不同尺度的特征图上进行生成候选区域 的操作,充分降低了对小目标的漏检率。考虑到 本任务图像样本中多为狭长形的小尺度目标,因 此 Wood R-CNN 采用特征金字塔网络以生成候选 区域。但在研究中发现,该结构生成的候选框数 量过多且过密,计算量较大,影响了检测速度。 所以本文在特征金字塔网络 (RPN) 上进行了改进。 特征金字塔的最低层级相对于图像具有 4 像 素的跨度,因此候选框是每隔 4 个像素间隔进行 一次创建。为了减少计算量同时降低内存负载, 本文将滑窗移动步长改进为 2,候选框的数量因 此缩小到了原来的 1/4,而检测精度并没有出现下 降。由于减少了候选框数量所带来的计算量降 低,算法检测速度明显加快。在一块 8 GB 显存的 显卡上,Wood R-CNN 对输入大小为 1 024×1 024 的木块横截面图片进行检测,检测速度相比改进 前的模型平均提高了 0.47 f/s。 2.4 实现细节 2.4.1 数据扩充 由于公共网络上未提供开源的木块横截面数 据集,因此本文采用某木材厂提供的一批木块横 截面拍摄图像作为数据集。但由于拍摄成本较 高,图像数据数量有限。深度卷积神经网络需要 大量有效数据来驱动模型的正常训练,否则往往 会陷入过拟合的困境。通过仔细观察图像样本, 注意到木块横截面多为轮廓简单且形状方正的长 矩形,因此原图像经过翻转或抠取之后依然会符 合该检测任务的常规数据特性。根据这一数据特 性,本文采用了图像水平翻转、图像垂直翻转、图 像水平垂直翻转、随机抠取和尺度变换等一系列 数据扩充手段,成功地将图像样本数量扩充至原 有数量的数倍,同时增加了训练样本的多样性。 不仅可以很好地降低过拟合风险,也使模型性能 得到一定程度上的提升。 2.4.2 数据标记 在标记过程中,通过标记工具记录图片中每 个木块横截面实例 4 个角点的二维坐标并生成坐 标列表,由该表可以生成该图片中每个木块横截 面实例的边界框分布图。 2.4.3 实际训练 在实际训练过程中,将木块横截面图像数据 集分为训练集、验证集及测试集,分配比例为 8:1:1。由于该任务与 Mask R-CNN 的多目标检测 任务具有一定的相似度,Wood R-CNN 模型训练 采用在 Mask R-CNN 已收敛的成熟模型上做进一 步的迁移学习。学习率初始设置为 0.002,经过 10 个训练周期降为 0.000 2,30 个周期后结束 训练。 卷积神经网络输入原始图片,得到预测结果 并与真实分布计算误差损失,对网络参数进行负 反馈调节,引导神经网络学习到对木块横截面的 特征提取能力和检测能力。 经过一定轮数训练,在最终的收敛模型上进 行木块横截面检测的测试。测试结果表明 Wood R-CNN 模型在测试集上取得了较佳的木块横截 第 4 期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·645·
·646. 智能系统学报 第14卷 面检测效果,验证了模型的有效性。 3实验分析 2.5 Wood R-CNN的扩展运用 由于Wood R-CNN网络模型具有较好的实用 3.1检测效果对比实验 性,故其可在多个子任务场景下使用。例如,可 本文采用不同的目标检测算法,在相同数据 以利用木块横截面检测算法的输出结果,实现对 集上进行同等训练,并对比模型的测试效果。具体 木块尺寸的测量。 地,选取了目前学界用于目标检测任务的主流网络 具体方法为,先通过Wood R-CNN对木块图 模型Faster R-CNN和前沿网络模型Mask R-CNN, 片进行横截面检测以得到每个边界框的尺寸数 分别与本文提出的Wood R-CNN网络模型进行实 据,并乘上图片一实际场景比例尺,计算出真实场 验对比。在相同的图像样本训练集上进行训练,采 景下每个木块横截面的真实尺寸数据。 用相同的超参数设置,各自训练了30个周期,并 还可根据其他特定需求对输出的真实尺寸数 在相同的图像样本测试集上进行最终的检测效果 据进行筛选,对于尺寸符合特定需求(例如宽度、 对比。从图2可以看出,在木块横截面检测这一 高度大于指定阈值)的木块横截面实例进行单独 特定任务上,Wood R-CNN有着比Faster R-CNN 输出,或加上星标以突出显示。 Mask R-CNN更好的检测效果及更低的漏检率。 (a)原图像 (b)Faster R-CNN (c)Mask R-CNN (d)Wood R-CNN 图2不同网络结构下的检测结果 Fig.2 Test results under different network structures 3.2算法性能对比实验 CNN和Mask R-CNN能够更快地收敛。图3为 由于检测算法的性能主要取决于检测精度和 模型收敛情况折线图,可以看出Wood R-CNN 检测速度,本文选取了业内用于目标检测任务的 模型收敛速度快于Faster R-CNN和Mask R-CNN, 主流网络模型YOLOI、Faster R-CNNI及Mask R- 意味着降低了模型训练成本,具有更好的实 CNN,与本文的Wood R-CNN网络模型在木块 用性。 横截面数据集上对比检测精度和检测速度,并选 4.0 AP(average precision)FPS(frame per second) 3.5 衡量算法精度和速度。经过实验,得到各检测算 数3.0 Mask R-CNN 法在木块横截面数据集上的性能对比如表1。从 2.5 Wood R-CNN 表中可以看出,Wood R-CNN具有最高的检测精 2.0 1.5 Faster R-CNN 度和较快的检测速度,算法性能最优。 1.0 0. 5 1015202530 表1检测算法性能对比 训练周期/轮 Table 1 Detection algorithm performance comparison 图3不同网络模型训练时的收敛情况 平均精度% Fig.3 Convergence of training different network models 检测方法 检测速度/fs) 验证集测试集 3.4鲁棒性对比实验 YOLO 59.8461.45 20.16 在实际检测中,木块图像往往存在光照明暗 Faster R-CNN(ZF) 70.9071.72 3.67 程度不一、木块颜色各异等专有特性。为了保证 Mask R-CNN(Res-50) 82.1784.93 0.55 模型算法的实用性,本文还额外设置了模型鲁棒 Wood R-CNN 性对比实验。经过仔细对比,发现在木块横截面 89.6790.15 1.02 检测这一任务下,Wood R-CNN网络模型相比 3.3模型收敛对比试验 Faster R-CNN和Mask R-CNN具有更好的鲁棒 实验中还发现,Wood R-CNN相比Faster R- 性。图4分别为光照不足情况下木块横截面检测
面检测效果,验证了模型的有效性。 2.5 Wood R-CNN 的扩展运用 由于 Wood R-CNN 网络模型具有较好的实用 性,故其可在多个子任务场景下使用。例如,可 以利用木块横截面检测算法的输出结果,实现对 木块尺寸的测量。 具体方法为,先通过 Wood R-CNN 对木块图 片进行横截面检测以得到每个边界框的尺寸数 据,并乘上图片——实际场景比例尺,计算出真实场 景下每个木块横截面的真实尺寸数据。 还可根据其他特定需求对输出的真实尺寸数 据进行筛选,对于尺寸符合特定需求 (例如宽度、 高度大于指定阈值) 的木块横截面实例进行单独 输出,或加上星标以突出显示。 3 实验分析 3.1 检测效果对比实验 本文采用不同的目标检测算法,在相同数据 集上进行同等训练,并对比模型的测试效果。具体 地,选取了目前学界用于目标检测任务的主流网络 模型 Faster R-CNN 和前沿网络模型 Mask R-CNN, 分别与本文提出的 Wood R-CNN 网络模型进行实 验对比。在相同的图像样本训练集上进行训练,采 用相同的超参数设置,各自训练了 30 个周期,并 在相同的图像样本测试集上进行最终的检测效果 对比。从图 2 可以看出,在木块横截面检测这一 特定任务上,Wood R-CNN 有着比 Faster R-CNN、 Mask R-CNN 更好的检测效果及更低的漏检率。 (a) 原图像 (b) Faster R-CNN (c) Mask R-CNN (d) Wood R-CNN 图 2 不同网络结构下的检测结果 Fig. 2 Test results under different network structures 3.2 算法性能对比实验 由于检测算法的性能主要取决于检测精度和 检测速度,本文选取了业内用于目标检测任务的 主流网络模型 YOLO[7] 、Faster R-CNN[3] 及 Mask RCNN[4] ,与本文的 Wood R-CNN 网络模型在木块 横截面数据集上对比检测精度和检测速度,并选 取 AP(average precision) 和 FPS(frame per second) 衡量算法精度和速度。经过实验,得到各检测算 法在木块横截面数据集上的性能对比如表 1。从 表中可以看出,Wood R-CNN 具有最高的检测精 度和较快的检测速度,算法性能最优。 表 1 检测算法性能对比 Table 1 Detection algorithm performance comparison 检测方法 平均精度/% 检测速度/(f·s−1) 验证集 测试集 YOLO 59.84 61.45 20.16 Faster R-CNN(ZF) 70.90 71.72 3.67 Mask R-CNN(Res-50) 82.17 84.93 0.55 Wood R-CNN 89.67 90.15 1.02 3.3 模型收敛对比试验 实验中还发现,Wood R-CNN 相比 Faster RCNN 和 Mask R-CNN 能够更快地收敛。图 3 为 模型收敛情况折线图,可以看出 Wood R-CNN 模型收敛速度快于 Faster R-CNN 和 Mask R-CNN, 意味着降低了模型训练成本,具有更好的实 用性。 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0 5 10 15 20 25 30 Faster R-CNN Mask R-CNN 训练周期/轮 Wood R-CNN 误差损失 图 3 不同网络模型训练时的收敛情况 Fig. 3 Convergence of training different network models 3.4 鲁棒性对比实验 在实际检测中,木块图像往往存在光照明暗 程度不一、木块颜色各异等专有特性。为了保证 模型算法的实用性,本文还额外设置了模型鲁棒 性对比实验。经过仔细对比,发现在木块横截面 检测这一任务下,Wood R-CNN 网络模型相比 Faster R-CNN 和 Mask R-CNN 具有更好的鲁棒 性。图 4 分别为光照不足情况下木块横截面检测 ·646· 智 能 系 统 学 报 第 14 卷
第4期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·647· 效果对比图以及特殊颜色木块横截面检测效果对 Faster R-CNN以及Mask R-CNN,因而具有更好的 比图。可以看出,Wood R-CNN的鲁棒性优于 泛化性能和更强的实用性。 环境较暗 颜色较白 (a)原图像 (b)Faster R-CNN (c)Mask R-CNN (d)Wood R-CNN 图4检测算法的鲁棒性对比 Fig.4 Robust comparisons of detection algorithms 3.5损失函数设定实验 分配相应权重,使模型可以根据问题需求有所侧 考虑到密集堆叠下高相似度木块横截面检测 重地训练。 这一任务的特殊性,灵活设计了损失函数,如式 本文对入和2的设置进行了一系列实验,实 (7)(9)。该损失函数对分类任务和检测任务灵活 验效果如图5。 示例1 示例2 (a)原图像 (b)1:1 (c)1:1.5 (d)1:2 图5权重损失函数实验 Fig.5 Weight loss function experiment 经过实验对比,设置1=1.0、12=2.0为损失函4结束语 数最佳参数配置。从损失函数设定实验的对比结 果可以看出,Wood R-CNN网络模型的损失函数 在密集堆叠下的高相似度木块横截面检测问 改进对提升木块横截面检测精度具有关键性的 题中,由于木块密集堆叠、木块横截面相似度极 作用。 高且边界不明显,导致传统的检测算法不能有效 通过以上一系列实验,可以看出,Wood R- 地发挥作用。为此,本文设计了Wood R-CNN网 CNN在密集堆叠下的高相似度木块横截面检测 络模型。通过改进模型损失函数和非极大值抑制 这一任务上具有较高的检测精度和检测速度,同 算法来提升检测精度;简化网络结构和改进特征 时兼具良好的鲁棒性和实用性,能切实解决实际 金字塔网铬来保证检测速度。该模型结构简单高 生产过程中的木块横截面检测问题,节省人力成 效。经过实验结果表明:在木块横截面数据集 本,节约物力开销,有效提高生产率。 上,本文所提模型优于目前主流的目标检测算
效果对比图以及特殊颜色木块横截面检测效果对 比图。可以看出,Wood R-CNN 的鲁棒性优于 Faster R-CNN 以及 Mask R-CNN,因而具有更好的 泛化性能和更强的实用性。 环境较暗 颜色较白 (a) 原图像 (b) Faster R-CNN (c) Mask R-CNN (d) Wood R-CNN 图 4 检测算法的鲁棒性对比 Fig. 4 Robust comparisons of detection algorithms 3.5 损失函数设定实验 考虑到密集堆叠下高相似度木块横截面检测 这一任务的特殊性,灵活设计了损失函数,如式 (7)~(9)。该损失函数对分类任务和检测任务灵活 分配相应权重,使模型可以根据问题需求有所侧 重地训练。 本文对 λ1 和 λ2 的设置进行了一系列实验,实 验效果如图 5。 (a) 原图像 (b) 1:1 (c) 1:1.5 (d) 1:2 示例 1 示例 2 图 5 权重损失函数实验 Fig. 5 Weight loss function experiment 经过实验对比,设置 λ1=1.0、λ2=2.0 为损失函 数最佳参数配置。从损失函数设定实验的对比结 果可以看出,Wood R-CNN 网络模型的损失函数 改进对提升木块横截面检测精度具有关键性的 作用。 通过以上一系列实验,可以看出,Wood RCNN 在密集堆叠下的高相似度木块横截面检测 这一任务上具有较高的检测精度和检测速度,同 时兼具良好的鲁棒性和实用性,能切实解决实际 生产过程中的木块横截面检测问题,节省人力成 本,节约物力开销,有效提高生产率。 4 结束语 在密集堆叠下的高相似度木块横截面检测问 题中,由于木块密集堆叠、木块横截面相似度极 高且边界不明显,导致传统的检测算法不能有效 地发挥作用。为此,本文设计了 Wood R-CNN 网 络模型。通过改进模型损失函数和非极大值抑制 算法来提升检测精度;简化网络结构和改进特征 金字塔网络来保证检测速度。该模型结构简单高 效。经过实验结果表明:在木块横截面数据集 上,本文所提模型优于目前主流的目标检测算 第 4 期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·647·
·648· 智能系统学报 第14卷 法,在检测精度和检测速度上均具有较好的表 材缺陷检测分析.森林工程,2014,30(1):52-55,59. 现。鉴于其良好的鲁棒性和实用性,可在实际生 DAI Tianhong,LI Lin,XIE Meng.Wood defect detec- 产过程中被广泛使用。 tion and analysis based on quaternion matrix singular value decomposition[J].Forest engineering,2014,30(1): 参考文献: 52-55.59. [1]GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich [13】梁善庆,蔡智勇,王喜平,等.北美木材无损检测技术的 feature hierarchies for accurate object detection and se- 研究与应用).木材工业,2008,22(35-8. mantic segmentation[Cl//Proceedings of the IEEE Confer- LIANG Shanqing,CAI Zhiyong,WANG Xiping,et al. ence on Computer Vision and Pattern Recognition.Colum- Developments and applications of nondestructive tests for bus,USA,2014:580-587 wood in North America[J].China wood industry,2008. [2]GIRSHICK R.Fast R-CNN[C]//Proceedings of the IEEE 22(3:5-8. [14]戚大伟,牟洪波.基于Hu不变矩和BP神经网络的木 International Conference on Computer Vision.Santiago, Chile,.2015:1440-1448. 材缺陷检测.东南大学学报(自然科学版),2013 [3]REN Shaoging,HE Kaiming,GIRSHICK R,et al.Faster 43(S1):63-66. R-CNN:Towards real-time object detection with region QI Dawei,Mu Hongbo.Detection of wood defects types proposal networks[Cl//Proceedings of the 28th Internation- based on Hu invariant moments and BP neural network al Conference on Neural Information Processing Systems. [J].Journal of Southeast University (natural science edi- Montreal,Canada,2015:91-99 tion),2013,43(S1):63-66. [4]HE Kaiming.GKIOXARI G.DOLLAR P.et al.Mask R- [15]戚大伟,牟洪波.人工神经网络在木材缺陷检测中的应 CNN[C]//2017 IEEE International Conference on Com- 用).森林工程,2006,22(1):21-23 puter Vision.Venice,Italy,2017:2980-2988. QI Dawei,MU Hongbo.Application of artificial neural [5]HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al.Spa- networks in the testing of wood defects[J].Forest engin- tial pyramid pooling in deep convolutional networks for eering,2006,22(1y21-23. visual recognition[C]//European Conference on Computer [16]牟洪波.基于人工神经网络的木材缺陷检测研究[D] Vision.Zurich,Switzerland,2014:346-361. 哈尔滨:东北林业大学,2006 [6]LIU Wei,ANGUELOV D,ERHAN D,et al.SSD:Single MU Hongbo.Study on wood defects testing based on arti- shot multibox detector[C //European Conference on Com- ficial neural network[D].Harbin:Northeast Forestry Uni- puter Vision.Amsterdam.The Netherlands,2016:21-37. versity,2006. [7]REDMON J.DIVVALA S,GIRSHICK R,et al.You only [17刀夏春江,王培良,张媛.基于深度学习的木材含水率预 look once:Unified,real-time object detection[Cl//Proceed- 测】.杭州电子科技大学学报(自然科学版),2015, ings of the IEEE Conference on Computer Vision and Pat- 35(1):31-35. tern Recognition.Las Vegas,USA,2016:779-788 XIA Chunjiang,WANG Peiliang,ZHANG Yuan.Predic- [8]REDMON J,FARHADI A.YOLO9000:better,faster, tion of moisture content of wood based on deep learning stronger[J.arXiv:1612.08242,2016. [J].Journal of Hangzhou Dianzi University (natural sci- [9]UIJLINGS JR R,VAN DE SANDE K E A,GEVERS T, ences),2015,35(1)31-35, et al.Selective search for object recognition[J].Internation- [18]崔金刚.图像处理技术在木材检测方面的应用[D].哈 al journal of computer vision,2013,104(2):154-171. 尔滨:东北林业大学,2007 [10]于文勇,王立海,杨慧敏,等.超声波木材缺陷检测若干 CUI Jingang.The digital image processing using on wood 问题的探讨[).森林工程,2006,22(6):7-9. detests testing[D].Harbin:Northeast Forestry University, YU Wenyong,WANG Lihai,YANG Huimin,et al.The 2007. study of wood defects detection based on ultrasonic tech- [19]戚大伟,乔景禄,张杰.图象处理技术在木材年轮检测 niques[J].Forest engineering,2006,22(6):7-9. 中的应用[.东北林业大学学报,1994,22(2):106-111. [11]杨春梅,胡万义,白帆,等.木材缺陷检测理论及方法的 QI Dawei,QIAO Jinglu,ZHANG Jie.Image processing 发展)林业机械与木工设备,2004,32(3)8-10. technique on wooden annual rings x-ray picture[J].Journ- YANG Chunmei,HU Wanyi,BAI Fan,et al.The devel- al of Northeast Forestry University,1994,22(2): opment of theory and method in assaying wood 106-111. defection[J].Forestry machinery and woodworking equip- [20]徐华东,王立海,倪松远.模态分析技术在木材性质检 ment.2004,32(3:8-10. 测中应用的研究进展[.森林工程,2007,23(6):15-17. [12]戴天虹,李琳,解朦.基于四元数矩阵奇异值分解的木 XU Huadong,WANG Lihai,NI Songyuan.Literature re-
法,在检测精度和检测速度上均具有较好的表 现。鉴于其良好的鲁棒性和实用性,可在实际生 产过程中被广泛使用。 参考文献: GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Columbus, USA, 2014: 580–587. [1] GIRSHICK R. Fast R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision. Santiago, Chile, 2015: 1440–1448. [2] REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems. Montreal, Canada, 2015: 91–99. [3] HE Kaiming, GKIOXARI G, DOLLÁR P, et al. Mask RCNN[C]//2017 IEEE International Conference on Computer Vision. Venice, Italy, 2017: 2980–2988. [4] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[C]//European Conference on Computer Vision. Zurich, Switzerland, 2014: 346–361. [5] LIU Wei, ANGUELOV D, ERHAN D, et al. SSD: Single shot multibox detector[C]//European Conference on Computer Vision. Amsterdam, The Netherlands, 2016: 21–37. [6] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: Unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA, 2016: 779–788. [7] REDMON J, FARHADI A. YOLO9000: better, faster, stronger[J]. arXiv:1612.08242, 2016. [8] UIJLINGS J R R, VAN DE SANDE K E A, GEVERS T, et al. Selective search for object recognition[J]. International journal of computer vision, 2013, 104(2): 154–171. [9] 于文勇, 王立海, 杨慧敏, 等. 超声波木材缺陷检测若干 问题的探讨 [J]. 森林工程, 2006, 22(6): 7–9. YU Wenyong, WANG Lihai, YANG Huimin, et al. The study of wood defects detection based on ultrasonic techniques[J]. Forest engineering, 2006, 22(6): 7–9. [10] 杨春梅, 胡万义, 白帆, 等. 木材缺陷检测理论及方法的 发展 [J]. 林业机械与木工设备, 2004, 32(3): 8–10. YANG Chunmei, HU Wanyi, BAI Fan, et al. The development of theory and method in assaying wood defection[J]. Forestry machinery and woodworking equipment, 2004, 32(3): 8–10. [11] [12] 戴天虹, 李琳, 解朦. 基于四元数矩阵奇异值分解的木 材缺陷检测分析 [J]. 森林工程, 2014, 30(1): 52–55, 59. DAI Tianhong, LI Lin, XIE Meng. Wood defect detection and analysis based on quaternion matrix singular value decomposition[J]. Forest engineering, 2014, 30(1): 52–55, 59. 梁善庆, 蔡智勇, 王喜平, 等. 北美木材无损检测技术的 研究与应用 [J]. 木材工业, 2008, 22(3): 5–8. LIANG Shanqing, CAI Zhiyong, WANG Xiping, et al. Developments and applications of nondestructive tests for wood in North America[J]. China wood industry, 2008, 22(3): 5–8. [13] 戚大伟, 牟洪波. 基于 Hu 不变矩和 BP 神经网络的木 材缺陷检测 [J]. 东南大学学报 (自然科学版), 2013, 43(S1): 63–66. QI Dawei, Mu Hongbo. Detection of wood defects types based on Hu invariant moments and BP neural network [J]. Journal of Southeast University (natural science edition), 2013, 43(S1): 63–66. [14] 戚大伟, 牟洪波. 人工神经网络在木材缺陷检测中的应 用 [J]. 森林工程, 2006, 22(1): 21–23. QI Dawei, MU Hongbo. Application of artificial neural networks in the testing of wood defects[J]. Forest engineering, 2006, 22(1): 21–23. [15] 牟洪波. 基于人工神经网络的木材缺陷检测研究 [D]. 哈尔滨: 东北林业大学, 2006. MU Hongbo. Study on wood defects testing based on artificial neural network[D]. Harbin: Northeast Forestry University, 2006. [16] 夏春江, 王培良, 张媛. 基于深度学习的木材含水率预 测 [J]. 杭州电子科技大学学报 (自然科学版), 2015, 35(1): 31–35. XIA Chunjiang, WANG Peiliang, ZHANG Yuan. Prediction of moisture content of wood based on deep learning [J]. Journal of Hangzhou Dianzi University (natural sciences), 2015, 35(1): 31–35. [17] 崔金刚. 图像处理技术在木材检测方面的应用 [D]. 哈 尔滨: 东北林业大学, 2007. CUI Jingang. The digital image processing using on wood detests testing[D]. Harbin: Northeast Forestry University, 2007. [18] 戚大伟, 乔景禄, 张杰. 图象处理技术在木材年轮检测 中的应用 [J]. 东北林业大学学报, 1994, 22(2): 106–111. QI Dawei, QIAO Jinglu, ZHANG Jie. Image processing technique on wooden annual rings x-ray picture[J]. Journal of Northeast Forestry University, 1994, 22(2): 106–111. [19] 徐华东, 王立海, 倪松远. 模态分析技术在木材性质检 测中应用的研究进展 [J]. 森林工程, 2007, 23(6): 15–17. XU Huadong, WANG Lihai, NI Songyuan. Literature re- [20] ·648· 智 能 系 统 学 报 第 14 卷
第4期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·649· view on application of modal analysis technology in the amid networks for object detection[C]//2017 IEEE Con- wood testing[J].Forest engineering,2007,23(6):15-17. ference on Computer Vision and Pattern Recognition [21]杨学春,王立海.应力波技术在木材性质检测中的研究 Honolulu.USA.2017:936-944. 进展.森林工程,2002,18(6):11-12. [27]NEUBECK A,VAN GOOL L.Efficient non-maximum YANG Xuechun,WANG Lihai.Research progress of suppression[C]//18th International Conference on Pattern testing timber characteristics by using stress wave tech- Recognition.Hong Kong,China,2006:850-855. nique[J].Forest engineering,2002,18(6):11-12. [28]XIE Saining,GIRSHICK R,DOLLAR P,et al.Aggreg- [22]冯海林,李光辉,方益明,等.应力波传播模型及其在木 ated residual transformations for deep neural networks 材检测中的应用[J】.系统仿真学报,2010,22(6): [C]//2017 IEEE Conference on Computer Vision and Pat- 1490-1493. tern Recognition.Honolulu,USA,2017:5987-5995. FENG Hailin,LI Guanghui,FANG Yiming,et al.Stress 作者简介: wave propagation modeling and application in wood test- 魏文戈,男,1993年生,硕土研究 ing[J].Journal of system simulation,2010,22(6): 生,主要研究方向为图像识别和深度 1490-1493 学习。 [23]韩书霞,于雷,孔超,等.基于计算机断层扫描技术的木 材密度检测研究).森林工程,2007,23(1)少:19-23. HAN Shuxia.YU Lei.KONG Chao,et al.Research on wood density testing based on computer tomography tech- nology[J].Forest engineering,2007,23(1):19-23. 谭晓阳,男,1971年生,教授,主要研 [24]王立海,孙天用.木材腐朽检测及防治的研究进展。 究方向为模式识别、计算机视觉和机 黑龙江大学工程学报,2011,2(2:6369. 器学习。中国计算机学会会员,中国计 WANG Lihai.SUN Tianyong.Research on progressing 算机学会计算机视觉专业组委员,中国 of testing and prevention of wood decay[J].Journal of En- 计算机学会人工智能与模式识别专委 会委员,江苏省计算机协会人工智能专 gineering of Heilongjiang University,2011,2(2):63-69. 委会委员。主持多项科研项目,曾获国 [25]HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al. 际电气与电子工程师协会信号处理协会最佳论文奖、教育部 Deep residual learning for image recognition[C]//Proceed- 自然科学奖二等奖、国家自然科学奖二等奖、教育部自然科 ings of the IEEE Conference on Computer Vision and 学奖一等奖、国际学术期刊《Pattern Recognition》2006- Pattern Recognition.Las Vegas,USA,2016:770-778. 2010年度高引用论文奖等。发表学术论文50余篇,被引用 [26]LIN T Y,DOLLAR P,GIRSHICK R,et al.Feature pyr- 近5000次
view on application of modal analysis technology in the wood testing[J]. Forest engineering, 2007, 23(6): 15–17. 杨学春, 王立海. 应力波技术在木材性质检测中的研究 进展 [J]. 森林工程, 2002, 18(6): 11–12. YANG Xuechun, WANG Lihai. Research progress of testing timber characteristics by using stress wave technique[J]. Forest engineering, 2002, 18(6): 11–12. [21] 冯海林, 李光辉, 方益明, 等. 应力波传播模型及其在木 材检测中的应用 [J]. 系统仿真学报, 2010, 22(6): 1490–1493. FENG Hailin, LI Guanghui, FANG Yiming, et al. Stress wave propagation modeling and application in wood testing[J]. Journal of system simulation, 2010, 22(6): 1490–1493. [22] 韩书霞, 于雷, 孔超, 等. 基于计算机断层扫描技术的木 材密度检测研究 [J]. 森林工程, 2007, 23(1): 19–23. HAN Shuxia, YU Lei, KONG Chao, et al. Research on wood density testing based on computer tomography technology[J]. Forest engineering, 2007, 23(1): 19–23. [23] 王立海, 孙天用. 木材腐朽检测及防治的研究进展 [J]. 黑龙江大学工程学报, 2011, 2(2): 63–69. WANG Lihai, SUN Tianyong. Research on progressing of testing and prevention of wood decay[J]. Journal of Engineering of Heilongjiang University, 2011, 2(2): 63–69. [24] HE Kaiming, ZHANG Xiangyu, REN Shaoqing, et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA, 2016: 770–778. [25] [26] LIN T Y, DOLLÁR P, GIRSHICK R, et al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA, 2017: 936–944. NEUBECK A, VAN GOOL L. Efficient non-maximum suppression[C]//18th International Conference on Pattern Recognition. Hong Kong, China, 2006: 850–855. [27] XIE Saining, GIRSHICK R, DOLLÁR P, et al. Aggregated residual transformations for deep neural networks [C]//2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA, 2017: 5987–5995. [28] 作者简介: 魏文戈,男,1993 年生,硕士研究 生,主要研究方向为图像识别和深度 学习。 谭晓阳,男,1971 年生,教授,主要研 究方向为模式识别、计算机视觉和机 器学习。中国计算机学会会员,中国计 算机学会计算机视觉专业组委员,中国 计算机学会人工智能与模式识别专委 会委员,江苏省计算机协会人工智能专 委会委员。主持多项科研项目,曾获国 际电气与电子工程师协会信号处理协会最佳论文奖、教育部 自然科学奖二等奖、国家自然科学奖二等奖、教育部自然科 学奖一等奖、国际学术期刊《Pattern Recognition》 2006- 2010 年度高引用论文奖等。发表学术论文 50 余篇,被引用 近 5000 次。 第 4 期 魏文戈,等:密集堆叠下的高相似度木块横截面检测 ·649·