正在加载图片...
第4期 李亚飞,等:基于卷积神经网络的遥感图像分类研究 ·553· 最后对图像进行K-T变换,提取亮度、绿度 3.3实验结果及分析 和湿度3个分量的数据组成特征矩阵D。 为了验证本文方法的有效性,实验将与其他 按照图3所描述的多源多特征融合方法,将 文献中的方法进行对比,如SVM、NN、RF、DBN A、B、C、D按照[ABCD]组成一个大小为 和CNN(Patch)。其中CNN(Patch)方法是一种基 9×13×3的特征融合矩阵,并将此矩阵输入CNN 于区域块的CNN模型,该模型是以像素点周围 中进行特征学习,最后进行分类处理。 5×5大小的邻域块作为单个样本的输入,可看作 是为样本加入了邻域信息。除此之外,在本文方 3实验与分析 法的基础上,又设计了另外两种对比实验模型,一 种是只将光谱特征作为CNN的输入(CNN(ST), 3.1实验环境 该模型是为了验证本文的多源多特征融合方法的 本文采用TensorFlowl.1.0开源框架,搭建环 有效性;另外一种是不采用PCA的多源多特征融 境为个人PC,操作系统为Ubuntul6.04,处理器为 合模型(CNN(SST),该模型主要是为了验证PCA Intel(R)Core(TM)i5-4440CPU@3.10GHz,运行内 是否能够缩短模型的训练时间,加快收敛速度。 存为8GB。 表1展示了本文方法分类结果的混淆矩阵,由 3.2实验数据及样本选取 此可知,CNN(PCA)最终取得了97.83%的总体正 研究区域选择位于黑龙江省松嫩平原西部, 确率,Kappa系数达到了0.9736。对于单类地物, 乌裕尔河下游的扎龙湿地自然保护区(46°52'~ PA和UA都超过了90%,某些地物的分类精度达 47°32'N,123°47'~12437'E)。根据该地区实际 到了最优,例如水域和裸地,两者的PA和UA都 地物分布情况,分为耕地、草地、湿地、水域、居 达到了99%以上。但是对于耕地类别来说,分类精 民区以及裸地共6类。本文使用2016年9月的 度相对差一些,本文模型将其错分为湿地类别的 Landsat-8卫星遥感图像,共选择16160个像素级 样本数量较多,分析原因是农作物的光谱值范围 训练样本,其中每类地物中随机选择1/4的数据 和湿地的光谱值范围存在重叠,即所谓的“异物同 样本作为验证集,剩余数据样本作为训练集。 谱”现象严重,导致模型难以有效区分耕地和湿地。 表1CNN(PCA)分类结果的混淆矩阵 Table 1 Confusion matrix of CNN(PCA)classification results 类别 耕地 草地 湿地 水域 居民区 裸地 总和 PA/ UA/ 耕地 647 11 39 0 3 0 700 92.43 98.33 草地 3 596 1 0 0 0 600 99.33 97.70 湿地 1 576 0 0 0 580 99.31 93.51 水域 0 0 0 520 0 0 520 100.00 100.00 居民区 6 0 0 593 1 600 98.83 99.33 裸地 1 0 0 0 1 230 232 99.14 99.57 总和 658 610 616 520 597 231 表2展示了本文方法与其他分类方法的实验 度。而浅层分类算法却不能在信息不充分或信息 结果对比,从表中可知,本文方法取得了最优的 量少时从原始样本中获得更多更有用的信息。 分类效果。相比于SVM、NN和RF,CNN(PCA) 同样,相比于其他深度学习方法,CNN(PCA) 总体精度分别提高了约13.61%、9.34%和7.3%, 的分类精度也要高于DBN和CNN(Patch)。分析 Kappa系数提高了约20.42%、13.16%和10.02%, 原因是DBN采用的是无监督的方式逐层训练网 这说明CNN的分类效果要远远优于浅层分类算 络,最后采用有监督的方式进行微调,这种逐层 法,这得益于CNN独特的结构,如局部连接、权 训练方式使得网络参数存在更大的随机性,不利 值共享、池化等。这些特点使得CNN拥有某种 于网络的整体优化。而对于CNN(PCA),该方法 尺度的位移、尺度和形变不变性,其强大的学习 虽然也是采用CNN模型,但是输入的信息只考虑 能力和容错能力使得CNN能够自动学习到更抽 了样本周围的光谱信息,而没有考虑图像的纹理 象、更具代表性的特征,从而获得更高的分类精 特征,恰恰纹理特征最能反映不同类别之间的差最后对图像进行 K-T 变换,提取亮度、绿度 和湿度 3 个分量的数据组成特征矩阵 D。 [ A B C D ] 按照图 3 所描述的多源多特征融合方法,将 A、B、C、D 按照 组成一个大小为 9×13×3 的特征融合矩阵,并将此矩阵输入 CNN 中进行特征学习,最后进行分类处理。 3 实验与分析 3.1 实验环境 本文采用 TensorFlow1.1.0 开源框架,搭建环 境为个人 PC,操作系统为 Ubuntu16.04,处理器为 Intel(R) Core(TM) i5-4440 CPU@3.10 GHz,运行内 存为 8 GB。 3.2 实验数据及样本选取 研究区域选择位于黑龙江省松嫩平原西部, 乌裕尔河下游的扎龙湿地自然保护区 (46°52′~ 47°32′N,123°47′~124°37′E)。根据该地区实际 地物分布情况,分为耕地、草地、湿地、水域、居 民区以及裸地共 6 类。本文使用 2016 年 9 月的 Landsat-8 卫星遥感图像,共选择 16 160 个像素级 训练样本,其中每类地物中随机选择 1/4 的数据 样本作为验证集,剩余数据样本作为训练集。 3.3 实验结果及分析 为了验证本文方法的有效性,实验将与其他 文献中的方法进行对比,如 SVM、NN、RF、DBN 和 CNN(Patch)。其中 CNN(Patch) 方法是一种基 于区域块的 CNN 模型,该模型是以像素点周围 5×5 大小的邻域块作为单个样本的输入,可看作 是为样本加入了邻域信息。除此之外,在本文方 法的基础上,又设计了另外两种对比实验模型,一 种是只将光谱特征作为 CNN 的输入 (CNN(ST)), 该模型是为了验证本文的多源多特征融合方法的 有效性;另外一种是不采用 PCA 的多源多特征融 合模型 (CNN(SST)),该模型主要是为了验证 PCA 是否能够缩短模型的训练时间,加快收敛速度。 表 1 展示了本文方法分类结果的混淆矩阵,由 此可知,CNN(PCA) 最终取得了 97.83% 的总体正 确率,Kappa 系数达到了 0.973 6。对于单类地物, PA 和 UA 都超过了 90%,某些地物的分类精度达 到了最优,例如水域和裸地,两者的 PA 和 UA 都 达到了 99% 以上。但是对于耕地类别来说,分类精 度相对差一些,本文模型将其错分为湿地类别的 样本数量较多,分析原因是农作物的光谱值范围 和湿地的光谱值范围存在重叠,即所谓的“异物同 谱”现象严重,导致模型难以有效区分耕地和湿地。 表 2 展示了本文方法与其他分类方法的实验 结果对比,从表中可知,本文方法取得了最优的 分类效果。相比于 SVM、NN 和 RF,CNN(PCA) 总体精度分别提高了约 13.61%、9.34% 和 7.3%, Kappa 系数提高了约 20.42%、13.16% 和 10.02%, 这说明 CNN 的分类效果要远远优于浅层分类算 法,这得益于 CNN 独特的结构,如局部连接、权 值共享、池化等。这些特点使得 CNN 拥有某种 尺度的位移、尺度和形变不变性,其强大的学习 能力和容错能力使得 CNN 能够自动学习到更抽 象、更具代表性的特征,从而获得更高的分类精 度。而浅层分类算法却不能在信息不充分或信息 量少时从原始样本中获得更多更有用的信息。 同样,相比于其他深度学习方法,CNN(PCA) 的分类精度也要高于 DBN 和 CNN(Patch)。分析 原因是 DBN 采用的是无监督的方式逐层训练网 络,最后采用有监督的方式进行微调,这种逐层 训练方式使得网络参数存在更大的随机性,不利 于网络的整体优化。而对于 CNN(PCA),该方法 虽然也是采用 CNN 模型,但是输入的信息只考虑 了样本周围的光谱信息,而没有考虑图像的纹理 特征,恰恰纹理特征最能反映不同类别之间的差 表 1 CNN(PCA) 分类结果的混淆矩阵 Table 1 Confusion matrix of CNN(PCA) classification results 类别 耕地 草地 湿地 水域 居民区 裸地 总和 PA/% UA/% 耕地 647 11 39 0 3 0 700 92.43 98.33 草地 3 596 1 0 0 0 600 99.33 97.70 湿地 1 3 576 0 0 0 580 99.31 93.51 水域 0 0 0 520 0 0 520 100.00 100.00 居民区 6 0 0 0 593 1 600 98.83 99.33 裸地 1 0 0 0 1 230 232 99.14 99.57 总和 658 610 616 520 597 231 — — — 第 4 期 李亚飞,等:基于卷积神经网络的遥感图像分类研究 ·553·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有