存在差异，因此，武夷岩茶叶片是识别茶树品种的首要特征。然而不同品种的武夷

正在加载图片...

·920· 智能系统学报第15卷存在差异，因此，武夷岩茶叶片是识别茶树品种 et模型及其后续版本9在ILSVRC比赛中将Top- 的首要特征。然而不同品种的武夷岩茶鲜茶叶叶 5错误率降低至4.8%。从上述CNN模型发展过片大小、形状、颜色区别细微，在没有丰富经验的程看，采用越来越深的网络结构是发展趋势。因情况下，仅凭肉眼不易分辨茶叶所属品种，因此为从AlexNet、VGGNet到GoogLeNet,网络模型的研究自动化的茶叶品种识别方法是必要且有意义深度越来越深，同时在ILSVRC比赛上取得的成的工作。绩也越来越好。当前，深度学习已成为解决图像分类问题的种重要方法1，尤其是基于卷积神经网络 2 ResNet模型+迁移学习 (convolutional neural network,CNN)的深度学习。在CNN模型中，常通过增加网络深度来提升该方法能得到更准确且接近图像高级语义的特模型的表达能力。但随着网络深度的增加，梯度征，已在图像分类方面取得了突破性进展6。目消失等问题导致网络参数的寻优过程变得愈发困前，有不少研究者尝试将CNN应用于植物分类难。为此，何恺明等2o提出了深度残差网络(re- 问题。Yalcin等9提出了一种改进的CNN结构， sidual network,ResNet),并在2015年的ILS- 并在植物图像的分类问题上取得了比基于LBP、 VRC比赛中将Top-5错误率降至3.57%。Res- GIST等特征描述方法更高的分类准确率。Lee Net模型的核心思想是引人输入到输出的捷径连等采用基于解卷积网络的方法识别植物叶片接（图1），以降低数据中信息的冗余度2。Res- 特征，展示了植物叶片特征从低层抽象到高层抽 Net模型有不同的网络层数，常用的有l8层深度象的层次转换。Grinblat等使用深度CNN模的ResNet18和50层深度的ResNet50. 型自动提取植物叶脉特征，证明通过增加模型深度可提高植物分类的准确率。Pawara等l使用基于CNN的方法在多种植物图像数据集上进行分类实验，结果表明深度CNN方法优于人工特单层网络征提取方法。 F(X) 在武夷岩茶鲜茶叶叶片图像分类问题上，目单层网络前还未见到基于CNN的相关研究工作，已有方法仍然采用人工提取特征的技术路线。例如，林丽惠等)人工提取武夷岩茶鲜茶叶叶片图像的14种形状和纹理图像特征，然后使用支持向量机进行分类，取得了91%的分类准确率。总体上，基于 F(x)H+x 人工提取特征的鲜茶叶叶片图像分类方法的分类图1 ResNet中的捷径连接准确率都在90%左右41。 Fig.1 Shortcut connection in ResNet 本研究针对武夷岩茶鲜茶叶叶片图像分类问将深度CNN模型应用于图像分类问题的困题，在现有CNN模型的基础上，提出了一个融合难之一是需要庞大的图像数据集，否则其分类准整体与局部信息的两分支并行卷积神经网络模确率不佳。迁移学习2是一种把源领域知识迁型。该模型在武夷岩茶的9个茶叶品种共计7330 移到目标领域的方法，适用于源领域数据量充足张鲜茶叶叶片图像数据集上的分类准确率显著超而目标领域数据量较小的情况。因此在图像数据过已有方法。量较小的情况下，可将CNN模型和迁移学习相结 1常见的CNN模型合。这样做有3个益处：I)CNN模型能充分利用源领域的大数据来预训练网络的参数；2)CNN模 2012年，由Alex等提出的AlexNet!)模型赢型在训练过程中性能提升的速率更快；3)CNN模得了2012年ImageNet项目的大规模视觉识别挑型训练过程能更平稳地收敛到局部最优值。战(ILSVRC)的第一名，取得Top-5错误率为 3整体与局部信息融合的CNN模型 16.4%的成绩。2014年，牛津大学视觉几何组提出的VGGNet模型I在ILSVRC比赛中将Top 针对武夷岩茶鲜茶叶叶片分类问题，本研究 5错误率降到7.32%。Google提出的GoogLeN- 构建了一个如图2所示的整体与局部信息融合存在差异，因此，武夷岩茶叶片是识别茶树品种的首要特征。然而不同品种的武夷岩茶鲜茶叶叶片大小、形状、颜色区别细微，在没有丰富经验的情况下，仅凭肉眼不易分辨茶叶所属品种，因此研究自动化的茶叶品种识别方法是必要且有意义的工作。当前，深度学习已成为解决图像分类问题的一种重要方法[ 2 - 5 ] ，尤其是基于卷积神经网络 (convolutional neural network,CNN) 的深度学习。该方法能得到更准确且接近图像高级语义的特征，已在图像分类方面取得了突破性进展[6-8]。目前，有不少研究者尝试将 CNN 应用于植物分类问题。Yalcin 等 [9] 提出了一种改进的 CNN 结构，并在植物图像的分类问题上取得了比基于 LBP、 GIST 等特征描述方法更高的分类准确率。Lee 等 [10] 采用基于解卷积网络的方法识别植物叶片特征，展示了植物叶片特征从低层抽象到高层抽象的层次转换。Grinblat 等 [11] 使用深度 CNN 模型自动提取植物叶脉特征，证明通过增加模型深度可提高植物分类的准确率。Pawara 等 [12] 使用基于 CNN 的方法在多种植物图像数据集上进行分类实验，结果表明深度 CNN 方法优于人工特征提取方法。在武夷岩茶鲜茶叶叶片图像分类问题上，目前还未见到基于 CNN 的相关研究工作，已有方法仍然采用人工提取特征的技术路线。例如，林丽惠等[13] 人工提取武夷岩茶鲜茶叶叶片图像的 14 种形状和纹理图像特征，然后使用支持向量机进行分类，取得了 91% 的分类准确率。总体上，基于人工提取特征的鲜茶叶叶片图像分类方法的分类准确率都在 90% 左右[14-16]。本研究针对武夷岩茶鲜茶叶叶片图像分类问题，在现有 CNN 模型的基础上，提出了一个融合整体与局部信息的两分支并行卷积神经网络模型。该模型在武夷岩茶的 9 个茶叶品种共计 7330 张鲜茶叶叶片图像数据集上的分类准确率显著超过已有方法。 1 常见的 CNN 模型 2012 年，由 Alex 等提出的 AlexNet[17] 模型赢得了 2012 年 ImageNet 项目的大规模视觉识别挑战 (ILSVRC) 的第一名，取得 Top-5 错误率为 16.4% 的成绩。2014 年，牛津大学视觉几何组提出的 VGGNet 模型[18] 在 ILSVRC 比赛中将 Top- 5 错误率降到 7.32%。Google 提出的 GoogLeNet 模型及其后续版本[19] 在 ILSVRC 比赛中将 Top- 5 错误率降低至 4.8%。从上述 CNN 模型发展过程看，采用越来越深的网络结构是发展趋势。因为从 AlexNet、VGGNet 到 GoogLeNet，网络模型的深度越来越深，同时在 ILSVRC 比赛上取得的成绩也越来越好。 2 ResNet 模型 + 迁移学习在 CNN 模型中，常通过增加网络深度来提升模型的表达能力。但随着网络深度的增加，梯度消失等问题导致网络参数的寻优过程变得愈发困难。为此，何恺明等[20] 提出了深度残差网络 (residual network，ResNet)，并在 2015 年的 ILSVRC 比赛中将 Top-5 错误率降至 3.57%。ResNet 模型的核心思想是引入输入到输出的捷径连接 (图 1)，以降低数据中信息的冗余度[21]。ResNet 模型有不同的网络层数，常用的有 18 层深度的 ResNet18 和 50 层深度的 ResNet50。单层网络单层网络 F(x) F(x)+x 图 1 ResNet 中的捷径连接 Fig. 1 Shortcut connection in ResNet 将深度 CNN 模型应用于图像分类问题的困难之一是需要庞大的图像数据集，否则其分类准确率不佳。迁移学习[22] 是一种把源领域知识迁移到目标领域的方法，适用于源领域数据量充足而目标领域数据量较小的情况。因此在图像数据量较小的情况下，可将 CNN 模型和迁移学习相结合。这样做有 3 个益处:1) CNN 模型能充分利用源领域的大数据来预训练网络的参数；2) CNN 模型在训练过程中性能提升的速率更快；3) CNN 模型训练过程能更平稳地收敛到局部最优值。 3 整体与局部信息融合的 CNN 模型针对武夷岩茶鲜茶叶叶片分类问题，本研究构建了一个如图 2 所示的整体与局部信息融合 ·920· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】融合整体与局部信息的武夷岩茶叶片分类方法