正在加载图片...
·920· 智能系统学报 第15卷 存在差异,因此,武夷岩茶叶片是识别茶树品种 et模型及其后续版本9在ILSVRC比赛中将Top- 的首要特征。然而不同品种的武夷岩茶鲜茶叶叶 5错误率降低至4.8%。从上述CNN模型发展过 片大小、形状、颜色区别细微,在没有丰富经验的 程看,采用越来越深的网络结构是发展趋势。因 情况下,仅凭肉眼不易分辨茶叶所属品种,因此 为从AlexNet、VGGNet到GoogLeNet,网络模型的 研究自动化的茶叶品种识别方法是必要且有意义 深度越来越深,同时在ILSVRC比赛上取得的成 的工作。 绩也越来越好。 当前,深度学习已成为解决图像分类问题的 种重要方法1,尤其是基于卷积神经网络 2 ResNet模型+迁移学习 (convolutional neural network,CNN)的深度学习。 在CNN模型中,常通过增加网络深度来提升 该方法能得到更准确且接近图像高级语义的特 模型的表达能力。但随着网络深度的增加,梯度 征,已在图像分类方面取得了突破性进展6。目 消失等问题导致网络参数的寻优过程变得愈发困 前,有不少研究者尝试将CNN应用于植物分类 难。为此,何恺明等2o提出了深度残差网络(re- 问题。Yalcin等9提出了一种改进的CNN结构, sidual network,ResNet),并在2015年的ILS- 并在植物图像的分类问题上取得了比基于LBP、 VRC比赛中将Top-5错误率降至3.57%。Res- GIST等特征描述方法更高的分类准确率。Lee Net模型的核心思想是引人输入到输出的捷径连 等采用基于解卷积网络的方法识别植物叶片 接(图1),以降低数据中信息的冗余度2。Res- 特征,展示了植物叶片特征从低层抽象到高层抽 Net模型有不同的网络层数,常用的有l8层深度 象的层次转换。Grinblat等使用深度CNN模 的ResNet18和50层深度的ResNet50. 型自动提取植物叶脉特征,证明通过增加模型深 度可提高植物分类的准确率。Pawara等l使用 基于CNN的方法在多种植物图像数据集上进行 分类实验,结果表明深度CNN方法优于人工特 单层网络 征提取方法。 F(X) 在武夷岩茶鲜茶叶叶片图像分类问题上,目 单层网络 前还未见到基于CNN的相关研究工作,已有方法 仍然采用人工提取特征的技术路线。例如,林丽 惠等)人工提取武夷岩茶鲜茶叶叶片图像的14种 形状和纹理图像特征,然后使用支持向量机进行 分类,取得了91%的分类准确率。总体上,基于 F(x)H+x 人工提取特征的鲜茶叶叶片图像分类方法的分类 图1 ResNet中的捷径连接 准确率都在90%左右41。 Fig.1 Shortcut connection in ResNet 本研究针对武夷岩茶鲜茶叶叶片图像分类问 将深度CNN模型应用于图像分类问题的困 题,在现有CNN模型的基础上,提出了一个融合 难之一是需要庞大的图像数据集,否则其分类准 整体与局部信息的两分支并行卷积神经网络模 确率不佳。迁移学习2是一种把源领域知识迁 型。该模型在武夷岩茶的9个茶叶品种共计7330 移到目标领域的方法,适用于源领域数据量充足 张鲜茶叶叶片图像数据集上的分类准确率显著超 而目标领域数据量较小的情况。因此在图像数据 过已有方法。 量较小的情况下,可将CNN模型和迁移学习相结 1常见的CNN模型 合。这样做有3个益处:I)CNN模型能充分利用 源领域的大数据来预训练网络的参数;2)CNN模 2012年,由Alex等提出的AlexNet!)模型赢 型在训练过程中性能提升的速率更快;3)CNN模 得了2012年ImageNet项目的大规模视觉识别挑 型训练过程能更平稳地收敛到局部最优值。 战(ILSVRC)的第一名,取得Top-5错误率为 3整体与局部信息融合的CNN模型 16.4%的成绩。2014年,牛津大学视觉几何组提 出的VGGNet模型I在ILSVRC比赛中将Top 针对武夷岩茶鲜茶叶叶片分类问题,本研究 5错误率降到7.32%。Google提出的GoogLeN- 构建了一个如图2所示的整体与局部信息融合存在差异,因此,武夷岩茶叶片是识别茶树品种 的首要特征。然而不同品种的武夷岩茶鲜茶叶叶 片大小、形状、颜色区别细微,在没有丰富经验的 情况下,仅凭肉眼不易分辨茶叶所属品种,因此 研究自动化的茶叶品种识别方法是必要且有意义 的工作。 当前,深度学习已成为解决图像分类问题的 一种重要方法[ 2 - 5 ] ,尤其是基于卷积神经网络 (convolutional neural network,CNN) 的深度学习。 该方法能得到更准确且接近图像高级语义的特 征,已在图像分类方面取得了突破性进展[6-8]。目 前,有不少研究者尝试将 CNN 应用于植物分类 问题。Yalcin 等 [9] 提出了一种改进的 CNN 结构, 并在植物图像的分类问题上取得了比基于 LBP、 GIST 等特征描述方法更高的分类准确率。Lee 等 [10] 采用基于解卷积网络的方法识别植物叶片 特征,展示了植物叶片特征从低层抽象到高层抽 象的层次转换。Grinblat 等 [11] 使用深度 CNN 模 型自动提取植物叶脉特征,证明通过增加模型深 度可提高植物分类的准确率。Pawara 等 [12] 使用 基于 CNN 的方法在多种植物图像数据集上进行 分类实验,结果表明深度 CNN 方法优于人工特 征提取方法。 在武夷岩茶鲜茶叶叶片图像分类问题上,目 前还未见到基于 CNN 的相关研究工作,已有方法 仍然采用人工提取特征的技术路线。例如,林丽 惠等[13] 人工提取武夷岩茶鲜茶叶叶片图像的 14 种 形状和纹理图像特征,然后使用支持向量机进行 分类,取得了 91% 的分类准确率。总体上,基于 人工提取特征的鲜茶叶叶片图像分类方法的分类 准确率都在 90% 左右[14-16]。 本研究针对武夷岩茶鲜茶叶叶片图像分类问 题,在现有 CNN 模型的基础上,提出了一个融合 整体与局部信息的两分支并行卷积神经网络模 型。该模型在武夷岩茶的 9 个茶叶品种共计 7330 张鲜茶叶叶片图像数据集上的分类准确率显著超 过已有方法。 1 常见的 CNN 模型 2012 年,由 Alex 等提出的 AlexNet[17] 模型赢 得了 2012 年 ImageNet 项目的大规模视觉识别挑 战 (ILSVRC) 的第一名,取得 Top-5 错误率为 16.4% 的成绩。2014 年,牛津大学视觉几何组提 出的 VGGNet 模型[18] 在 ILSVRC 比赛中将 Top- 5 错误率降到 7.32%。Google 提出的 GoogLeN￾et 模型及其后续版本[19] 在 ILSVRC 比赛中将 Top- 5 错误率降低至 4.8%。从上述 CNN 模型发展过 程看,采用越来越深的网络结构是发展趋势。因 为从 AlexNet、VGGNet 到 GoogLeNet,网络模型的 深度越来越深,同时在 ILSVRC 比赛上取得的成 绩也越来越好。 2 ResNet 模型 + 迁移学习 在 CNN 模型中,常通过增加网络深度来提升 模型的表达能力。但随着网络深度的增加,梯度 消失等问题导致网络参数的寻优过程变得愈发困 难。为此,何恺明等[20] 提出了深度残差网络 (re￾sidual network,ResNet),并在 2015 年的 ILS￾VRC 比赛中将 Top-5 错误率降至 3.57%。Res￾Net 模型的核心思想是引入输入到输出的捷径连 接 (图 1),以降低数据中信息的冗余度[21]。Res￾Net 模型有不同的网络层数,常用的有 18 层深度 的 ResNet18 和 50 层深度的 ResNet50。 单层网络 单层网络 F(x) F(x)+x 图 1 ResNet 中的捷径连接 Fig. 1 Shortcut connection in ResNet 将深度 CNN 模型应用于图像分类问题的困 难之一是需要庞大的图像数据集,否则其分类准 确率不佳。迁移学习[22] 是一种把源领域知识迁 移到目标领域的方法,适用于源领域数据量充足 而目标领域数据量较小的情况。因此在图像数据 量较小的情况下,可将 CNN 模型和迁移学习相结 合。这样做有 3 个益处:1) CNN 模型能充分利用 源领域的大数据来预训练网络的参数;2) CNN 模 型在训练过程中性能提升的速率更快;3) CNN 模 型训练过程能更平稳地收敛到局部最优值。 3 整体与局部信息融合的 CNN 模型 针对武夷岩茶鲜茶叶叶片分类问题,本研究 构建了一个如图 2 所示的整体与局部信息融合 ·920· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有