第10卷第2期 智能系统学报 Vol.10 No.2 2015年4月 CAAI Transactions on Intelligent Systems Apr.2015 D0:10.3969/j.issn.1673-4785.201410040 网络出版地址:htp:/www.cmki.net/kcms/detail/23.1538.TP.20150317.1025.001.html 基于谱域-空域结合特征和图割原理的高光谱图像分类 尤雅萍3,成运2,苏松志3,曹冬林,3,李绍滋3 (1.厦门大学信息科学与技术学院,福建厦门361005:2.湖南人文科技学院信息科学与工程系,湖南娄底417000: 3.福建省仿脑智能系统重点实验室,福建厦门361005) 摘要:高光谱图像中存在着特征维度高而训练集小的问题。为解决该问题,提出了一种2步走的分类方法:1)通 过支持向量机对图像进行初步分类,根据分类结果计算出每个类别的均值特征:2)使用1)计算出来的均值特征作为 能量函数的数据项,然后利用图割原理对图像做二次分类。实验中发现:空间上相近的像素点往往具有相似的特 征,且属于同一个类别。针对这种现象,提取一个将谱域特征和空域特征相结合的新特征。该特征既包含了光谱信 息也包含了空间信息,具有较好的分类性能和鲁棒性。在Indian Pine数据集和Pavia University数据集进行实验,实 验结果表明了本文提出方法的有效性。 关键词:高光谱:图像分类:谱域特征;空域特征:谱域-空域结合特征:均值特征;支持向量机:图割原理 中图分类号:TP391.4文献标志码:A文章编号:1673-4785(2015)02-0201-08 中文引用格式:尤雅萍,成运,苏松志,等.基于谱域-空域结合特征和图割原理的高光谱图像分类[J].智能系统学报,2015,10 (2):201-208. 英文引用格式:YOU Yaping,CHENG Yun,SU Songzhi,etal.Hyperspectral image classification based on spectral--spatial combi- nation features and graph cut[J].CAAI Transactions on Intelligent Systems,2015,10(2):201-208. Hyperspectral image classification based on spectral-spatial combination features and graph cut YOU Yaping'.3,CHENG Yun2,SU Songzhi'.3,CAO Donglin'.3,LI Shaozi'.3 (1.School of Information Science and Technology,Xiamen University,Xiamen 361005,China;2.Department of Information Science and Engineering,Hunan University of Humanities,Science and Technology,Loudi 417000,China;3.Fujian Key Laboratory of the Brain-Like Intelligent Systems,Xiamen 361005,China) Abstract:The high-dimension of the feature vs.small-size of training set is an unsolved problem in the hyperspectral image classification task.To solve this problem a two-step classification method is proposed.Firstly,a preliminary classification is performed by the support vector machine (SVM)and the classification results are used to calculate the mean feature (MF)of each class.Secondly,a classification based on the graph cut theory is applied with the MFs as an input of the energy function.The experimental results showed that spatially nearby pixels have large possibilities of having the same label and similar features.Therefore,a new feature called spectral-spatial combination(SSC)is extracted that combines the spectral-based feature and spatial-based feature.The SSC feature contains the related spectral and spatial information of each pixel and provides better classification performance and robustness.Experi- ment results on the Indian Pine dataset and the Pavia University dataset demonstrated the effectiveness of the pro- posed method. Keywords:hyperspectral image classification spectral feature;spatial feature;spectral-spatial combination fea- ture;mean features;support vector machines;graph cut 收稿日期:2014-10-29.网络出版日期:2015-03-17. 自20世纪80年代以来,高光谱遥感图像的光 基金项目:国家自然科学基金资助项目(61202143):福建省自然科学 基金资助项目(2013J05100,2010J01345,2011J01367):湖 谱分辨率已达到纳米级别,设备获取到的光谱信息 南省自然科学基金资助项目(12JJ2040) 比较准确和丰富。因此,人们开创了高光谱遥感对 通信作者:李绍滋.E-mail:szlig(@xmu.cdu.cm
第 10 卷第 2 期 智 能 系 统 学 报 Vol.10 №.2 2015 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2015 DOI:10.3969 / j.issn.1673⁃4785.201410040 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20150317.1025.001.html 基于谱域-空域结合特征和图割原理的高光谱图像分类 尤雅萍1, 3 ,成运2 , 苏松志1, 3 ,曹冬林1, 3 ,李绍滋1, 3 (1.厦门大学 信息科学与技术学院,福建 厦门 361005; 2. 湖南人文科技学院 信息科学与工程系,湖南 娄底 417000; 3. 福建省仿脑智能系统重点实验室,福建 厦门 361005) 摘 要:高光谱图像中存在着特征维度高而训练集小的问题。 为解决该问题,提出了一种 2 步走的分类方法:1)通 过支持向量机对图像进行初步分类,根据分类结果计算出每个类别的均值特征;2)使用 1)计算出来的均值特征作为 能量函数的数据项,然后利用图割原理对图像做二次分类。 实验中发现:空间上相近的像素点往往具有相似的特 征,且属于同一个类别。 针对这种现象,提取一个将谱域特征和空域特征相结合的新特征。 该特征既包含了光谱信 息也包含了空间信息,具有较好的分类性能和鲁棒性。 在 Indian Pine 数据集和 Pavia University 数据集进行实验,实 验结果表明了本文提出方法的有效性。 关键词:高光谱;图像分类;谱域特征;空域特征;谱域-空域结合特征;均值特征;支持向量机;图割原理 中图分类号: TP391.4 文献标志码:A 文章编号:1673⁃4785(2015)02⁃0201⁃08 中文引用格式:尤雅萍,成运, 苏松志,等. 基于谱域-空域结合特征和图割原理的高光谱图像分类[ J]. 智能系统学报, 2015, 10 (2): 201⁃208. 英文引用格式:YOU Yaping, CHENG Yun, SU Songzhi, et al. Hyperspectral image classification based on spectral-spatial combi⁃ nation features and graph cut[J]. CAAI Transactions on Intelligent Systems, 2015, 10(2): 201⁃208. Hyperspectral image classification based on spectral⁃spatial combination features and graph cut YOU Yaping 1, 3 , CHENG Yun 2 , SU Songzhi 1, 3 , CAO Donglin 1, 3 , LI Shaozi 1, 3 (1. School of Information Science and Technology, Xiamen University , Xiamen 361005, China; 2 .Department of Information Science and Engineering, Hunan University of Humanities, Science and Technology, Loudi 417000, China;3. Fujian Key Laboratory of the Brain⁃Like Intelligent Systems, Xiamen 361005, China) Abstract:The high⁃dimension of the feature vs. small⁃size of training set is an unsolved problem in the hyperspectral image classification task. To solve this problem a two⁃step classification method is proposed. Firstly, a preliminary classification is performed by the support vector machine (SVM) and the classification results are used to calculate the mean feature (MF) of each class. Secondly, a classification based on the graph cut theory is applied with the MFs as an input of the energy function. The experimental results showed that spatially nearby pixels have large possibilities of having the same label and similar features. Therefore, a new feature called spectral⁃spatial combination (SSC) is extracted that combines the spectral⁃based feature and spatial⁃based feature. The SSC feature contains the related spectral and spatial information of each pixel and provides better classification performance and robustness. Experi⁃ ment results on the Indian Pine dataset and the Pavia University dataset demonstrated the effectiveness of the pro⁃ posed method. Keywords:hyperspectral ; image classification ; spectral feature; spatial feature; spectral⁃spatial combination fea⁃ ture; mean features; support vector machines; graph cut 收稿日期:2014⁃10⁃29. 网络出版日期:2015⁃03⁃17. 基金项目:国家自然科学基金资助项目( 61202143 );福建省自然科学 基金资助项目( 2013J05100, 2010J01345, 2011J01367 );湖 南省自然科学基金资助项目(12JJ2040). 通信作者:李绍滋. E⁃mail:szlig@ xmu.edu.cn. 自 20 世纪 80 年代以来,高光谱遥感图像的光 谱分辨率已达到纳米级别,设备获取到的光谱信息 比较准确和丰富。 因此,人们开创了高光谱遥感对
·202. 智能系统学报 第10卷 地观测技术来识别地物类别,这是传统RGB图像和 形态信息,根据得到的空域特征,与原始光谱特征相 多光谱图像所不能完成的。虽然高光谱遥感图像分 结合得到最终的组合特征。 类技术目前已经取得了一定进展,但依然存在着一 以上的方法更多的是将原始光谱特征信息和空 些挑战:1)特征维度高而训练集小,高光谱图像上 间信息分成2个独立的部分,本文提出一种将两者 每个像素点的原始光谱特征多达百维,而且,高光谱 相结合的方法,将空间信息加入到原始光谱特征当 图像的样本标注往往需要有技巧的专家人工地进行 中,提取一个新的基于谱域-空域相结合的特征 分类,代价昂贵,使得获取一个足够大的训练样本集 spectral-spatial combination feature,SSC),SVM 变得不可行,从而影响分类器模型的性能:2)以像 训练分类器模型,对图像进行初步分类:然后,基于 素为单位的分类具有空间相似特性。所谓的空间相 图割(graph cut,GC)原理对初步分类结果进行修 似特性指的是:空间上相邻的像素点属于同一个类 改,做一个二次分类,进一步考虑空间相似特性,提 别的概率更大。如何更好地利用空间信息,将这一 高分类性能。 特性应用到高光谱图像分类当中,以提高分类结果 1谱域-空域结合的特征提取 的准确率,是当前的一个研究方向。目前国内外对 高光谱图像分类技术的研究方法可以归纳为特征研 1.1基于谱域的特征 究的方法和空间信息利用的方法。 高光谱图像是通过遥感设备在一条连续的 由于光谱通道数量的剧增,高光谱图像中存 光谱窄波段上抓取光谱信息成像而得,图像上的 在着冗余现象,因此可通过特征提取[1]来获取 每个像素点在各个波段上都会有一个对应的光 有用特征,将原始高维数据映射到低维空间,构 谱强度值,由此可以构成一条具有上百个波段光 建新的特征,降低数据的维度。其中,无监督学 谱值的光谱曲线。通过早期的实验发现,现实生 习的方法包括经典的PCA)、IDA[2]等。有监督 活当中相同的物质,光谱曲线相同或相近;不同 方法包括LDA[)以及针对LDA在高光谱图像中 的物质,则光谱曲线有所区别。因此,使用光谱 的应用的几种改进方法,如NDA、NWFE和 曲线上的光谱强度值作为特征,可以用来描述不 DNP[),这几种方法都是根据最大化类间距、最 同类别标签,作为目标分类的一个判断依据,将 小化类内距原理来实现的。半监督方法是当前 这种特征称为基于谱域的特征。本文为了避免 高光谱图像分类技术当中比较适用的一种方法, 特征选取和特征提取过程中可能造成的信息丢 在一定程度上缓解了小训练集带来的问题。浙 失,将使用所有波段的光谱强度值来构成基于谱 江大学的钱云涛教授提出了一种三维离散小波 域的特征。假设有像素点A,那么它的谱域特征 变换纹理特征[6),从多个不同的尺度、频域、方向 可以表示为xA,且被归一化到[-1,1]。 对高光谱图像数据立方体进行分解。文献[7]提 1.2基于空域的特征 出了基于谱聚类的波段选择技术,以波段图像为 本文中空域特征描述的是空间邻域像素点的总 样本点生成相似度矩阵,通过谱聚类,将所有数 体加权特征。首先定义一个空间邻域,然后根据邻 据分成k类,从中选择k个有代表性的波段参与 域点与中心像素点的距离设定权值,最后计算整个 后续分类工作。 空间邻域像素点的加权特征和,所得结果即为中心 不管是特征选取,还是特征提取,都没有考虑到 像素点的空域特征。空间邻域范围可包括一阶邻 像素空间之间的相关性。通过对高光谱图像伪成像 域、二阶邻域、3×3、5×5等,如图1所示。本文采 图的分析观察,发现空间位置相邻的像素点有很大 用3×3的空间邻域范围。 的概率是同一类别。基于这个特性,谱域-空域结 合的高光谱图像分类技术开始发展8山。比如文献 [10]中构建超图,图中有2种超边,一种是基于特 征的超边,通过在特征空间中,寻找距离最近的k个 0dbaD。。Dh0m0m0b。0000金 像素点来生成的:另一种是基于空间的超边,通过连 (a)一阶邻域(b)二阶邻域(c)3×3 (d)5×5 接空间位置上k个相邻的像素点来生成的。文献 图14种不同空间邻域 [11]首先利用最大噪声分量方法和虚拟维数估计 Fig.I Four types of spatial neighbors for centroid pixel 算法对高维图像进行特征提取和主分量数目计算, 对于像素点A,N(A)表示其空间邻域点的集 并且用数学形态学操作方法提取主分量图像的目标 合,那么,基于空域的特征x4计算公式为
地观测技术来识别地物类别,这是传统 RGB 图像和 多光谱图像所不能完成的。 虽然高光谱遥感图像分 类技术目前已经取得了一定进展,但依然存在着一 些挑战:1)特征维度高而训练集小,高光谱图像上 每个像素点的原始光谱特征多达百维,而且,高光谱 图像的样本标注往往需要有技巧的专家人工地进行 分类,代价昂贵,使得获取一个足够大的训练样本集 变得不可行,从而影响分类器模型的性能;2) 以像 素为单位的分类具有空间相似特性。 所谓的空间相 似特性指的是:空间上相邻的像素点属于同一个类 别的概率更大。 如何更好地利用空间信息,将这一 特性应用到高光谱图像分类当中,以提高分类结果 的准确率,是当前的一个研究方向。 目前国内外对 高光谱图像分类技术的研究方法可以归纳为特征研 究的方法和空间信息利用的方法。 由于光谱通道数量的剧增,高光谱图像中存 在着冗余现象,因此可通过特征提取[ 1⁃5] 来获取 有用特征,将原始高维数据映射到低维空间,构 建新的特征,降低数据的维度。 其中,无监督学 习的方法包括经典的 PCA [ 1] 、IDA [ 2] 等。 有监督 方法包括 LDA [ 3] 以及针对 LDA 在高光谱图像中 的 应 用 的 几 种 改 进 方 法, 如 NDA、 NWFE 和 DNP [ 3] ,这几种方法都是根据最大化类间距、最 小化类内距原理来实现的。 半监督方法是当前 高光谱图像分类技术当中比较适用的一种方法, 在一定程度上缓解了小训练集带来的问题。 浙 江大学的钱云涛教授提出了一种三维离散小波 变换纹理特征[ 6] ,从多个不同的尺度、频域、方向 对高光谱图像数据立方体进行分解。 文献[ 7] 提 出了基于谱聚类的波段选择技术,以波段图像为 样本点生成相似度矩阵,通过谱聚类,将所有数 据分成 k 类,从中选择 k 个有代表性的波段参与 后续分类工作。 不管是特征选取,还是特征提取,都没有考虑到 像素空间之间的相关性。 通过对高光谱图像伪成像 图的分析观察,发现空间位置相邻的像素点有很大 的概率是同一类别。 基于这个特性,谱域-空域结 合的高光谱图像分类技术开始发展[8⁃11] 。 比如文献 [10]中构建超图,图中有 2 种超边,一种是基于特 征的超边,通过在特征空间中,寻找距离最近的 k 个 像素点来生成的;另一种是基于空间的超边,通过连 接空间位置上 k 个相邻的像素点来生成的。 文献 [11]首先利用最大噪声分量方法和虚拟维数估计 算法对高维图像进行特征提取和主分量数目计算, 并且用数学形态学操作方法提取主分量图像的目标 形态信息,根据得到的空域特征,与原始光谱特征相 结合得到最终的组合特征。 以上的方法更多的是将原始光谱特征信息和空 间信息分成 2 个独立的部分,本文提出一种将两者 相结合的方法,将空间信息加入到原始光谱特征当 中,提取一个新的基于谱域 - 空域相结合的特征 (spectral⁃spatial combination feature,SSC),通过 SVM 训练分类器模型,对图像进行初步分类;然后,基于 图割( graph cut,GC) 原理对初步分类结果进行修 改,做一个二次分类,进一步考虑空间相似特性,提 高分类性能。 1 谱域-空域结合的特征提取 1.1 基于谱域的特征 高光谱图像是通过遥感设备在一条连续的 光谱窄波段上抓取光谱信息成像而得,图像上的 每个像素点在各个波段上都会有一个对应的光 谱强度值,由此可以构成一条具有上百个波段光 谱值的光谱曲线。 通过早期的实验发现,现实生 活当中相同的物质,光谱曲线相同或相近;不同 的物质,则光谱曲线有所区别。 因此,使用光谱 曲线上的光谱强度值作为特征,可以用来描述不 同类别标签,作为目标分类的一个判断依据,将 这种特征称为基于谱域的特征。 本文为了避免 特征选取和特征提取过程中可能造成的信息丢 失,将使用所有波段的光谱强度值来构成基于谱 域的特征。 假设有像素点 A ,那么它的谱域特征 可以表示为 xspe_A ,且被归一化到 [ -1,1] 。 1.2 基于空域的特征 本文中空域特征描述的是空间邻域像素点的总 体加权特征。 首先定义一个空间邻域,然后根据邻 域点与中心像素点的距离设定权值,最后计算整个 空间邻域像素点的加权特征和,所得结果即为中心 像素点的空域特征。 空间邻域范围可包括一阶邻 域、二阶邻域、 3 × 3、 5 × 5 等,如图 1 所示。 本文采 用 3 × 3 的空间邻域范围。 图 1 4 种不同空间邻域 Fig.1 Four types of spatial neighbors for centroid pixel 对于像素点 A ,N(A) 表示其空间邻域点的集 合,那么,基于空域的特征 xspa_A 计算公式为 ·202· 智 能 系 统 学 报 第 10 卷
第2期 尤雅萍,等:基于谱域-空域结合特征和图割原理的高光谱图像分类 ·203· xmA= ∑ew” o(x)Xx (1) 过训练得到的分类器模型,对像素点进行分类,最终 式中:x是A的邻域点x的基于谱域的特征, 得到一个SVM初步分类结果Y。 w(x)是权值,该值的大小与两像素点间的欧拉距离 2.2类别均值特征 d(A,x)成反比: 已知同一类别的样本具有相同或相近的光谱特 1 征,那么可以通过将同一类别的样本的特征进行求 w()=dAsh.∑w(x)=1(2) 和取平均,得到一个特征向量,作为这个类别的均值 1.3基于谱域-空域结合的特征 特征。有了这个均值特征,就可以计算测试样本与 目前在大部分的高光谱图像分类技术方法当 各个类别的特征相似度,作为基于GC原理进行二 中,普遍使用的是原始光谱特征,或者基于原始特征 次分类的一个分类代价判断依据。 的一个特征提取。由于高光谱图像具有空间相似特 高光谱图像分类技术当中现存的小训练集因 性,可以利用空间邻域像素点的特征来平滑噪点特 素,导致了样本集存在信息不足等问题,本文利用整 征。当中心像素点为噪点,周围空间邻域点都属于 个高光谱图像的SVM初步分类结果来计算类别均 同一个类别的时候,那么加入空域特征,可以一定程 值特征m。 度上改变噪点的特征,趋于同类化,使其正确分类。 ∑u·l,= 因此,本文提出了SSC,该特征由2部分特征组成: m;= (6) 中心像素点自身的谱域特征及其空间邻域点权值计 ∑14= 算得到的空域特征。由于自身的谱域特征和周围空 式中:m:是标签为j的像素点的均值特征,n为高光 间特征的重要性并不是同等的,所以通过特征权值 谱图像的像素点总数,l,为像素点i的SVM分类结 修正量的设置来实现对两部分特征在组合当中的贡 果,I{l:=》是指示函数,表示:等于标签j。 献率的调整。对于像素点A,最终提取得到的SSC 2.3基于GC的二次分类 特征为xsCA,计算公式为 在以像素为单位的图像分类当中,空间位置上 XSscA=keA+kpm¥md 相近的像素直观上更可能是属于同一类的,所以无 (3) s.t.hape+hsp =1 论是基于光谱信息还是空间信息的分类代价在分类 式中:k和k都是非负整数,取值范围为[0,1]。 的过程中都应该被考虑进去。根据MRF可知,一个 像素的分类仅仅依赖于像素本身以及空间上相邻的 2 图像分类 像素。而GC算法的基本原理就是受MRF启发而 2.1SVM初步分类 来。因此,在SVM初步分类的结果上,本文使用GC 通常情况下,支持向量机在多分类问题上有优 算法来进行第2次的分类,目的在于修正自身分类 势[26]。而高光谱图像分类技术正好是多类别的 标签和空间邻域像素标签差别很大的像素点。 分类问题,因此本文采用SVM来训练分类器模型。 在将GC算法应用到高光谱图像的过程中,V 分类结果是通过决策函数f(x)来判断,如式(4): 是高光谱图像的像素集,E是上述像素集中空间 fx)=∑aK(x)+b 相邻的像素点之间的边集合。二次分类目标在 (4) 于找到一个分类结果1:V→L,使损失函数(7)的 在训练阶段,本文先通过一个有限大小的训练 值最小。 样本集得到SVM分类器模型。由于训练样本是离 散存在的,没有空间邻域,并且样本本身是由人工精 C(0=∑C_spe4+∑aD.eC_spaw4 确标注,噪点的可能性很低,所以将训练样本基于谱 (7) 域的特征x直接作为训练的输入特征,采用基于 式中:C()表示对全部像素进行分类的损失函数, RBF核函数的支持向量机训练出分类器模型,如式 它是光谱分类代价和空间分割代价之和。其中 (5)所示: C_spe是每个像素点基于光谱信息进行分类的光谱 K(x,x)=〈p(x:)·p(x)〉= 分类代价;C_spa是每个像素点基于空间信息进行 ep(-- 分类的空间分割代价。 (5) 2o2 式(7)是一个NP困难问题,本文采用 在测试阶段,对高光谱图像上的每个像素点依 Boykov【提出的方法来求解这个方程,式(8)~ 次提取基于谱域-空域相结合的特征作为输入,通 (11)是式(7)当中各个项的详细展开解释
xspa_A = ∑x∈N(A) w(x) × xspe (1) 式中: xspe 是 A 的邻域点 x 的基于谱域的特征, w(x) 是权值,该值的大小与两像素点间的欧拉距离 d(A,x) 成反比: w(x) = 1 d(A,x) , s.t. ∑x∈N(A) w(x) = 1 (2) 1.3 基于谱域-空域结合的特征 目前在大部分的高光谱图像分类技术方法当 中,普遍使用的是原始光谱特征,或者基于原始特征 的一个特征提取。 由于高光谱图像具有空间相似特 性,可以利用空间邻域像素点的特征来平滑噪点特 征。 当中心像素点为噪点,周围空间邻域点都属于 同一个类别的时候,那么加入空域特征,可以一定程 度上改变噪点的特征,趋于同类化,使其正确分类。 因此,本文提出了 SSC,该特征由 2 部分特征组成: 中心像素点自身的谱域特征及其空间邻域点权值计 算得到的空域特征。 由于自身的谱域特征和周围空 间特征的重要性并不是同等的,所以通过特征权值 修正量的设置来实现对两部分特征在组合当中的贡 献率的调整。 对于像素点 A ,最终提取得到的 SSC 特征为 xSSC_A ,计算公式为 xSSC_A = kspe xspe_A + kspa xspa_A s.t. kspe + kspa = 1 (3) 式中: kspe 和 kspa 都是非负整数,取值范围为[0,1]。 2 图像分类 2.1 SVM 初步分类 通常情况下,支持向量机在多分类问题上有优 势[12⁃16] 。 而高光谱图像分类技术正好是多类别的 分类问题,因此本文采用 SVM 来训练分类器模型。 分类结果是通过决策函数 f(x)来判断,如式(4): f(x) = ∑i∈S ai yiK(xi,x) + b (4) 在训练阶段,本文先通过一个有限大小的训练 样本集得到 SVM 分类器模型。 由于训练样本是离 散存在的,没有空间邻域,并且样本本身是由人工精 确标注,噪点的可能性很低,所以将训练样本基于谱 域的特征 xspe 直接作为训练的输入特征,采用基于 RBF 核函数的支持向量机训练出分类器模型,如式 (5)所示: K(xi,xj) = 〈φ(xi)·φ(xj)〉 = exp( - ‖xi - xj‖2 2σ 2 ) (5) 在测试阶段,对高光谱图像上的每个像素点依 次提取基于谱域-空域相结合的特征作为输入,通 过训练得到的分类器模型,对像素点进行分类,最终 得到一个 SVM 初步分类结果 Ytest 。 2.2 类别均值特征 已知同一类别的样本具有相同或相近的光谱特 征,那么可以通过将同一类别的样本的特征进行求 和取平均,得到一个特征向量,作为这个类别的均值 特征。 有了这个均值特征,就可以计算测试样本与 各个类别的特征相似度,作为基于 GC 原理进行二 次分类的一个分类代价判断依据。 高光谱图像分类技术当中现存的小训练集因 素,导致了样本集存在信息不足等问题,本文利用整 个高光谱图像的 SVM 初步分类结果来计算类别均 值特征 m 。 mj = ∑ n i = 1 xSSC_i·I l i { = j} ∑ n i = 1 I l i { = j} (6) 式中: mj 是标签为 j 的像素点的均值特征,n 为高光 谱图像的像素点总数, l i 为像素点 i 的 SVM 分类结 果, I l i { = j} 是指示函数,表示 l i 等于标签 j。 2.3 基于 GC 的二次分类 在以像素为单位的图像分类当中,空间位置上 相近的像素直观上更可能是属于同一类的,所以无 论是基于光谱信息还是空间信息的分类代价在分类 的过程中都应该被考虑进去。 根据 MRF 可知,一个 像素的分类仅仅依赖于像素本身以及空间上相邻的 像素。 而 GC 算法的基本原理就是受 MRF 启发而 来。 因此,在 SVM 初步分类的结果上,本文使用 GC 算法来进行第 2 次的分类,目的在于修正自身分类 标签和空间邻域像素标签差别很大的像素点。 在将 GC 算法应用到高光谱图像的过程中,V 是高光谱图像的像素集,E 是上述像素集中空间 相邻的像素点之间的边集合。 二次分类目标在 于找到一个分类结果 l:V → L ,使损失函数( 7)的 值最小。 C(l) = ∑i∈V C_spei,l i + ∑(i,j) ∈E C_spai,l i ,j,l j (7) 式中: C(l) 表示对全部像素进行分类的损失函数, 它是光谱分类代价和空间分割代价之和。 其中 C_spe 是每个像素点基于光谱信息进行分类的光谱 分类代价; C_spa 是每个像素点基于空间信息进行 分类的空间分割代价。 式 ( 7 ) 是 一 个 NP 困 难 问 题, 本 文 采 用 Boykov [17]提出的方法来求解这个方程,式( 8) ~ (11)是式(7)当中各个项的详细展开解释。 第 2 期 尤雅萍,等:基于谱域-空域结合特征和图割原理的高光谱图像分类 ·203·
·204. 智能系统学报 第10卷 d(xsc,m,),l≠y 表1 Indian Pine数据集信息 C_spel,=y: (8) Table 1 Information about the Indian Pine data set 标签 类别 颜色 d(xe,m,)=√xsc-m,了 (9) 1 Corn-notill 255.255.0 式中对于像素i,l是它在GC二次分类中的分 2 Com-mintill 0,255.0 类结果标签。当二次分类结果与SVM初步分类结 3 Grass-pasture 184.92.0 果一样时,光谱分类代价C_spe4为0;当2次分类 Grass-trees 192,192,192 结果不一样,通过计算像素点i与类别l:的标准特 5 Hay-windowed 255,102,0 征之间的相似度来决定光谱分类代价C_spe.大 6 Soybean-notill 255.0.0 > Soybean-mintill 200.100.200 小,相似度由欧拉距离公式计算得到。 8 Soybean-clean 0,255,255 C_sp.w表示将2个相邻的像素分为2个类 9 Woods 85,100,255 的空间分割代价。在现实的应用中,有2个问题必 表2 Pavia University数据集信息 须考虑。1)当2个相邻的像素点被分为同类的时 Table 2 Information about the PaviaU data set 候,不存在分割,所以分割代价应该为0:2)当2个 标签 类别 颜色 处在同质区的相邻像素点被分为不同类的时候,分 1 Asphalt 192,192,192 割代价应该较大;而当处在非同质区的相邻像素点 3 Meadows 0,255,0 被分为不同类的时候,分割代价应该趋于0。于是 3 Gravel 0.255.255 式(7)中的第2个项就可以展开成式(10)、(11): ¥ Trees 0.128.0 C_spawd() (10) J Metal Sheets 255.0.255 1,4≠ 6 Soil 165.82,41 d(:,)= -10,4=4 (11) 个 Bitumen 128.0.128 8 Bricks 255,0,0 式中对于任意一个像素点对(i,),”,可以被看做 9 Shadow 255.255,0 是像素点i,j之间的边缘权重。根据MRF可知当i 3.2评价指标 和j空间相邻的时候,边的权重是一个非0值。同 在高光谱图像分类技术研究中有4个常用的评 时权重0也负比于i和j的特征相似度。同时又可 价指标[:生产者精度(producer's accuracy,.PA), 以通过计算SSC的特征欧式距离来衡量像素点间 用户精度(user's accuracy,UA),总体精度(overall 的相似性。于是得到权重W:的表达式: accuracy,OA)和K统计值(Kappa coefficient)。其 中OA和K属于综合指标。 w=d(x:x) i,j相邻 (12) 3.3参数设定 0,其他 实验过程中,衡量空域和谱域特征贡献率的参数 3 实验结果及分析 k的取值,可以使用自适应算法进行计算,本文只是 通过简单的步长设定,在[0,1]循环调参,找出分类准 3.1数据集 确率最高的较优值。SVM分类器的惩罚因子C在 实验采用了高光谱图像的2个典型数据集,一 [103,103]上通过对数等分函数,寻找较优值。 是用AVIRIS遥感设备抓取的Indian Pine数据集, 3.4对比方法 图像的宽度和高度均为145像素,波段数为220。 为了证明所提出方法的有效性,将本文最终的 该数据集中包含16个类别和10366个已标注的样 方法(SSC/SVMGC)与其他3种方法进行对比。第 本点,除去一些样本数很少的类别,留下9个类别用 1种是原始特征的简单SVM分类方法(SVM),第2 于实验。表l给出了ndian Pine数据集的信息。 种是本文提出的SSC特征加上SVM分类器(SSC/ 另一个数据集是用ROSS-03遥感设备在帕维亚上 SVM),第3种是文献[18]中提出的方法,该方法首 空拍摄的Pavia University数据集。它包含有6l0× 先采用原始光谱特征加SVM分类,然后用GC算法 340个像素点和115个波段,去除12个噪声波段 进行优化(SVM/GC18)。 后,剩下103个波段用于实验。数据集中包含9个3.5实验对比结果 类别和42776个标注样本点。表2给出了Pavia U- 3.5.1不同大小的训练集 niversity数据集的相关信息。 该组实验主要是通过对多组大小不同的训练样
C_spei,l i = d(xSSC_i,ml i ),l i ≠ yi 0,l i = yi { . (8) d(xSSC_i,ml i ) = ‖xSSC_i - ml i‖2 (9) 式中对于像素 i, l i 是它在 GC 二次分类中的分 类结果标签。 当二次分类结果与 SVM 初步分类结 果一样时,光谱分类代价 C_spei,l i 为 0;当 2 次分类 结果不一样,通过计算像素点 i 与类别 l i 的标准特 征之间的相似度来决定光谱分类代价 C_spei,l i 大 小,相似度由欧拉距离公式计算得到。 C_spai,l i ,j,l j 表示将 2 个相邻的像素分为 2 个类 的空间分割代价。 在现实的应用中,有 2 个问题必 须考虑。 1)当 2 个相邻的像素点被分为同类的时 候,不存在分割,所以分割代价应该为 0;2)当 2 个 处在同质区的相邻像素点被分为不同类的时候,分 割代价应该较大;而当处在非同质区的相邻像素点 被分为不同类的时候,分割代价应该趋于 0。 于是 式(7)中的第 2 个项就可以展开成式(10)、(11): C_spai,l i ,j,l j = wijd l i,l j ( ) (10) d l i,l j ( ) = 1 , l i ≠ l j 0 , l i = l j { (11) 式中对于任意一个像素点对 (i,j) , wij 可以被看做 是像素点 i,j 之间的边缘权重。 根据 MRF 可知当 i 和 j 空间相邻的时候,边的权重是一个非 0 值。 同 时权重 wij 也负比于 i 和 j 的特征相似度。 同时又可 以通过计算 SSC 的特征欧式距离来衡量像素点间 的相似性。 于是得到权重 wij 的表达式: wij = 1 d(xi,xj) ,i,j 相邻 0,其他 ì î í ï ï ïï (12) 3 实验结果及分析 3.1 数据集 实验采用了高光谱图像的 2 个典型数据集,一 是用 AVIRIS 遥感设备抓取的 Indian Pine 数据集, 图像的宽度和高度均为 145 像素,波段数为 220。 该数据集中包含 16 个类别和 10 366 个已标注的样 本点,除去一些样本数很少的类别,留下 9 个类别用 于实验。 表 1 给出了 Indian Pine 数据集的信息。 另一个数据集是用 ROSIS⁃03 遥感设备在帕维亚上 空拍摄的 Pavia University 数据集。 它包含有 610× 340 个像素点和 115 个波段,去除 12 个噪声波段 后,剩下 103 个波段用于实验。 数据集中包含 9 个 类别和 42 776 个标注样本点。 表 2 给出了 Pavia U⁃ niversity 数据集的相关信息。 表 1 Indian Pine 数据集信息 Table 1 Information about the Indian Pine data set 标签 类别 颜色 1 Corn⁃notill 255,255,0 2 Com⁃mintill 0,255,0 3 Grass⁃pasture 184,92,0 4 Grass⁃trees 192,192,192 5 Hay⁃windowed 255,102,0 6 Soybean⁃notill 255,0,0 7 Soybean⁃mintill 200,100,200 8 Soybean⁃clean 0,255,255 9 Woods 85,100,255 表 2 Pavia University 数据集信息 Table 2 Information about the PaviaU data set 标签 类别 颜色 1 Asphalt 192,192,192 2 Meadows 0,255,0 3 Gravel 0,255,255 4 Trees 0,128,0 5 Metal Sheets 255,0,255 6 Soil 165,82,41 7 Bitumen 128,0,128 8 Bricks 255,0,0 9 Shadow 255,255,0 3.2 评价指标 在高光谱图像分类技术研究中有 4 个常用的评 价指标[18] :生产者精度(producer′s accuracy, PA), 用户精度( user′s accuracy, UA),总体精度( overall accuracy, OA)和 κ 统计值( Kappa coefficient)。 其 中 OA 和 κ 属于综合指标。 3.3 参数设定 实验过程中,衡量空域和谱域特征贡献率的参数 kspe 的取值,可以使用自适应算法进行计算,本文只是 通过简单的步长设定,在[0,1]循环调参,找出分类准 确率最高的较优值。 SVM 分类器的惩罚因子 C 在 [10 -3 ,10 3 ]上通过对数等分函数,寻找较优值。 3.4 对比方法 为了证明所提出方法的有效性,将本文最终的 方法(SSC / SVMGC)与其他 3 种方法进行对比。 第 1 种是原始特征的简单 SVM 分类方法( SVM),第 2 种是本文提出的 SSC 特征加上 SVM 分类器( SSC / SVM),第 3 种是文献[18]中提出的方法,该方法首 先采用原始光谱特征加 SVM 分类,然后用 GC 算法 进行优化(SVM/ GC [18] )。 3.5 实验对比结果 3.5.1 不同大小的训练集 该组实验主要是通过对多组大小不同的训练样 ·204· 智 能 系 统 学 报 第 10 卷
第2期 尤雅萍,等:基于谱域-空域结合特征和图割原理的高光谱图像分类 ·205· 本的分类效果进行对比,选取合适的训练集。在In- 从实验结果中可以发现:当训练集相对较小时, dian Pine数据集中每个类别的训练样本数为:3、5、 分类效果会相对较差。随着训练数据集的增大,准 10、20、50和100,kpe=0.8。在Pavia University数 确率会相应提高,直到接近一个饱和点。当有足够 据集中,每个类别的训练样本数为:25、50、100、200、 的训练样本数时,分类效果会趋于稳定。因此本文 300和400,k=0.1。图2给出了实验结果。 之后的实验,都是在50×9个训练样本的Indian Pine 1.0m 数据集和3O0x9个训练样例的Pavia University数据 .△ 0.8 集上进行。 0.6 、米-6--8----8 4…4 可以看到在不同大小的训练集情况下,本文提 -o-SVM 出的方法效果通常都比别的方法好,证实了所提出 --x-.SVM/GC 通 SSC/SVM 方法的有效性和鲁棒性。 0.4 ·△.SSC/SVMGC 3.5.2参数k和kpa 0.2 3 5 10 20 30 50 100 参数k和k用于调节谱域特征和空域特征 训练样本数/个 在SSC特征中所占的比例。实验发现通过调整光 (a)Indian Pine数据集总体精度 谱特征和空间特征的贡献率,可以有效优化分类结 1.0 果,如图3所示。ndian Pine数据集的最佳kce是 .△ 0.8,Pavia University数据集是0.l。 0.8 1.00 △ 0.6 0 8- 3--8 △ 0.95 0 20.4 --SVM -x-SVM/GC 花0.90 0-0000-0 0.2 SSC/SVM ·△:·SSC/SVMGC 越0.85 10 20 30 50 100 .…w·PaviaU总体精度 训练样本数/个 渔0.80 --O--PaviaU x统计值 (b)Indian Pine数据集k统计值 △一IndianPine总体精度 ·-T:-IndianPine K统计值 1.0 0.75 0 0.2 0.40.6 0.81.0 型0.8 8---0--0---0---0 图3不同k设定值下的分类结果 接 -o-SVM --×-.SVM/GC Fig.3 Classification results with different k 的0.6 平-SSC/SVM ·△·.SSC/SVMGC 3.5.3不同方法的对比 该组实验对4种方法的分类结果进行了详细的 0.4 25 50 100200300 400500 训练样本数/个 比较。图4~5和表3~6表明,在50x9个训练样本的 Indian Pine数据集和300x9个训练样例的Pavia Uni- (c)Pavia University数据集总体精度 versity数据集上,所有的方法都取得了不错的效果。 1.0 然而相比于简单SVM分类的方法,SSC/SVM在Indi- 坦0.8 0--0-0--0 an Pine和Pavia University数据集上准确率分别提升 -o-SVM 了1.77%和7.16%。这说明SSC特征胜过原始光谱 号06 -0 --x-SVM/GC SSC/SVM 特征。而方法SSC/SVMGC相比SSC/SVM,其准确率 ·△SSC/SVMGC 在Indian Pine和Pavia University数据集上分别提升 0.4 了11.85%和6.08%。这表明将GC理论应用于高光 25 50 100200300400500 训练样本数/个 谱图像分类中是有效的。在Indian Pine数据集上,本 (d)Pavia University数据集K统计值 文最终所提出的SSC/SVMGC方法的总体精度相对 图2不同大小训练集下的分类结果 于SVM、SSC/SVM和SVM/GCu]分别提升了 Fig.2 Classification results with different training sizes 13.62%、11.85%和6.33%,而在Pavia University数据 集中分别提升了13.24%、6.08%和8.09%
本的分类效果进行对比,选取合适的训练集。 在 In⁃ dian Pine 数据集中每个类别的训练样本数为:3、5、 10、20、50 和 100, kspe = 0.8。 在 Pavia University 数 据集中,每个类别的训练样本数为:25、50、100、200、 300 和 400, kspe = 0.1。 图 2 给出了实验结果。 (a) Indian Pine 数据集总体精度 (b)Indian Pine 数据集 κ 统计值 (c)Pavia University 数据集总体精度 (d)Pavia University 数据集 κ 统计值 图 2 不同大小训练集下的分类结果 Fig.2 Classification results with different training sizes 从实验结果中可以发现:当训练集相对较小时, 分类效果会相对较差。 随着训练数据集的增大,准 确率会相应提高,直到接近一个饱和点。 当有足够 的训练样本数时,分类效果会趋于稳定。 因此本文 之后的实验,都是在 50×9 个训练样本的 Indian Pine 数据集和 300×9 个训练样例的 Pavia University 数据 集上进行。 可以看到在不同大小的训练集情况下,本文提 出的方法效果通常都比别的方法好,证实了所提出 方法的有效性和鲁棒性。 3.5.2 参数 kspe 和 kspa 参数 kspe 和 kspa 用于调节谱域特征和空域特征 在 SSC 特征中所占的比例。 实验发现通过调整光 谱特征和空间特征的贡献率,可以有效优化分类结 果,如图 3 所示。 Indian Pine 数据集的最佳 kspe 是 0.8,Pavia University 数据集是 0.1。 图 3 不同 kspe 设定值下的分类结果 Fig.3 Classification results with different kspe 3.5.3 不同方法的对比 该组实验对 4 种方法的分类结果进行了详细的 比较。 图 4~5 和表 3~6 表明,在 50×9 个训练样本的 Indian Pine 数据集和 300×9 个训练样例的 Pavia Uni⁃ versity 数据集上,所有的方法都取得了不错的效果。 然而相比于简单 SVM 分类的方法,SSC/ SVM 在 Indi⁃ an Pine 和 Pavia University 数据集上准确率分别提升 了 1.77%和 7.16%。 这说明 SSC 特征胜过原始光谱 特征。 而方法 SSC/ SVMGC 相比 SSC/ SVM,其准确率 在 Indian Pine 和 Pavia University 数据集上分别提升 了 11.85%和 6.08%。 这表明将 GC 理论应用于高光 谱图像分类中是有效的。 在 Indian Pine 数据集上,本 文最终所提出的 SSC/ SVMGC 方法的总体精度相对 于 SVM、 SSC/ SVM 和 SVM/ GC [18] 分 别 提 升 了 13.62%、11.85%和 6.33%,而在 Pavia University 数据 集中分别提升了 13.24%、6.08%和8.09%。 第 2 期 尤雅萍,等:基于谱域-空域结合特征和图割原理的高光谱图像分类 ·205·
.206 智能系统学报 第10卷 (a)Ground-truth (b)SVM (c)SSC/SVM (d)SVM/GC (e)SSC/SVMGC 图5不同分类方法下的Pavia University数据集分类结果 Fig.5 Classification results of the Pavia University da- ta set by different methods 表3 ndian Pine数据集的总体精度和k统计值 (e)SSC/SVM (d)SVM/GC (e)SSC/SVMGC Table 3 Overall accuracy and Kappa coefficient of the In- 图4不同分类方法下的ndian Pine数据集分类结果 dian Pine Fig.4 Classification results of the Indian Pine data set 指标 SVM SSC/SVM SVM/GC SSC/SVMGC by different methods 总体精度 0.7329 0.7506 0.8058 0.8691 K统计值0.6930 0.7138 0.7726 0.8479 表4 Pavia University数据集的总体精度和K统计值 Table 4 Overall accuracy and Kappa coefficient of the Pavia University 指标 SVM SSC/SVM SVM/GC SSC/SVMGC 总体精度0.83480.9064 0.8863 0.9672 K统计值0.7873 0.8784 0.8517 0.9566 使用GC算法进行二次分类需要增加一定的时 间,其中,大小为610×340的Pavia University数据集 (a)Ground-truth (b)SVM 在SVM测试分类阶段所需分类时间为28.91s,GC二 分类阶段所需时间为6.03s,准确率提高了6%,这在 高光谱图像分类非实时应用领域是可以接受的。 表5训练样本集大小为50x9的Indian Pine数据集的生产者精度和用户精度(kp=0.8) Table 5 Producer's Accuracy and User's Accuracy of the Indian Pine with 50 training samples per class(=0.8) 生产者精度 用户精度 Class SVM SSC/SVM SVM/GC SSC/SVMGC SVM SSC/SVM SVM/GC SSC/SVMGC 0.5679 0.5812 0.7486 0.6015 0.6896 0.7137 0.5922 0.9378 2 0.7133 0.7880 0.6373 0.9916 0.3814 0.3904 0.7633 0.5436 3 0.9337 0.9545 0.9400 0.9441 0.8740 0.8934 0.9680 0.9325 4 0.9877 0.9904 1.0000 0.9836 0.9413 0.9526 0.9733 0.9690 5 1.0000 1.0000 1.0000 1.0000 0.9815 0.9835 0.9657 0.9958 6 0.6996 0.7233 0.7593 0.8056 0.6199 0.6601 0.8522 0.7507 > 0.5369 0.5409 0.7332 0.8391 0.8126 0.8557 0.8119 0.9590 0.8078 0.8516 0.6408 0.9848 0.6237 0.6627 0.5697 0.9450 0.9787 0.9874 0.9984 0.9992 0.9904 0.9944 0.9929 0.9837
图 4 不同分类方法下的 Indian Pine 数据集分类结果 Fig.4 Classification results of the Indian Pine data set by different methods 图 5 不同分类方法下的 Pavia University 数据集分类结果 Fig.5 Classification results of the Pavia University da⁃ ta set by different methods 表 3 Indian Pine 数据集的总体精度和 k 统计值 Table 3 Overall accuracy and Kappa coefficient of the In⁃ dian Pine 指标 SVM SSC/ SVM SVM/ GC SSC/ SVMGC 总体精度 0.732 9 0.750 6 0.805 8 0.869 1 κ 统计值 0.693 0 0.713 8 0.772 6 0.847 9 表 4 Pavia University 数据集的总体精度和 κ 统计值 Table 4 Overall accuracy and Kappa coefficient of the Pavia University 指标 SVM SSC/ SVM SVM/ GC SSC/ SVMGC 总体精度 0.834 8 0.906 4 0.886 3 0.967 2 κ 统计值 0.787 3 0.878 4 0.851 7 0.956 6 使用 GC 算法进行二次分类需要增加一定的时 间,其中,大小为 610×340 的 Pavia University 数据集 在 SVM 测试分类阶段所需分类时间为 28.91 s,GC 二 分类阶段所需时间为 6.03 s,准确率提高了 6%,这在 高光谱图像分类非实时应用领域是可以接受的。 表 5 训练样本集大小为 50×9 的 Indian Pine 数据集的生产者精度和用户精度( kspe = 0.8) Table 5 Producer’s Accuracy and User’s Accuracy of the Indian Pine with 50 training samples per class( kspe = 0.8) Class 生产者精度 SVM SSC/ SVM SVM/ GC SSC/ SVMGC 用户精度 SVM SSC/ SVM SVM/ GC SSC/ SVMGC 1 0.567 9 0.581 2 0.748 6 0.601 5 0.689 6 0.713 7 0.592 2 0.937 8 2 0.713 3 0.788 0 0.637 3 0.991 6 0.381 4 0.390 4 0.763 3 0.543 6 3 0.933 7 0.954 5 0.940 0 0.944 1 0.874 0 0.893 4 0.968 0 0.932 5 4 0.987 7 0.990 4 1.000 0 0.983 6 0.941 3 0.952 6 0.973 3 0.969 0 5 1.000 0 1.000 0 1.000 0 1.000 0 0.981 5 0.983 5 0.965 7 0.995 8 6 0.699 6 0.723 3 0.759 3 0.805 6 0.619 9 0.660 1 0.852 2 0.750 7 7 0.536 9 0.540 9 0.733 2 0.839 1 0.812 6 0.855 7 0.811 9 0.959 0 8 0.807 8 0.851 6 0.640 8 0.984 8 0.623 7 0.662 7 0.569 7 0.945 0 9 0.978 7 0.987 4 0.998 4 0.999 2 0.990 4 0.994 4 0.992 9 0.983 7 ·206· 智 能 系 统 学 报 第 10 卷
第2期 尤雅萍,等:基于谱域-空域结合特征和图割原理的高光谱图像分类 .207. 表6训练样本集大小为300x9的Pavia University数据集的生产者精度和用户精度(k,e=0.l) Table 6 Producer's Accuracy and User's Accuracy of the PaviaU with 300 training samples per class (=0.1) 生产者精度 用户精度 Class SVM SSC/SVM SVM/GC SSC/SVMGC SVM SSC/SVM SVM/GC SSC/SVMGC 1 0.8153 0.9655 0.8171 0.9700 0.9528 0.9296 0.9610 0.9423 0.8137 0.8755 0.9000 0.9890 0.9390 0.9830 0.9602 0.9976 3 0.8056 0.8242 0.8347 0.8480 0.7138 0.9212 0.7617 0.9658 4 0.9556 0.9217 0.9824 0.9308 0.7996 0.8545 0.7772 0.9360 0.9978 1.0000 0.9978 1.0000 0.9948 1.0000 0.9948 1.0000 6 0.8029 0.9405 0.8485 0.9853 0.5890 0.6986 0.8039 0.9623 0.9083 0.9346 0.9143 0.9451 0.7123 0.9952 0.7161 0.9952 0.8126 0.8835 0.8666 0.9174 0.7607 0.8558 0.7871 0.8720 9 0.9831 0.9715 0.9831 0.9820 0.8652 0.9882 0.8652 0.9883 4 结论 ence and Remote Sensing,2006,44(6):1586-1600. [3]HUANG H Y,KUO B C.Double nearest proportion feature 为了解决高光谱图像分类特征维度高、训练集 extraction for hyperspectral image classification[J].IEEE 小的问题,并且合理利用像素类别标签空间相似性 Transactions on Geoscience and Remote Sensing,2010,48 高的特性,提出了谱域和空域相结合的特征SSC,并 (11):4034-4046. 应用GC原理对SVM的初步分类结果进行二次优 [4]苏红军,杜培军,盛业华.高光谱遥感数据光谱特征提取 化。通过对实验结果的分析,可以得出以下结论: 算法与分类研究[J].计算机应用研究,2008,25(2): 390-394. 1)基于谱域和空域相结合的SSC特征分类效 SU Hongjun,DU Peijun,SHENG Yesheng.Study on feature 果好于基于原始光谱特征,S$C特征较好地利用空 extraction and experiment of hyperspectral data[J].Applica- 间邻域信息,减少了噪点数量; tion Research of Computers,2008,25(2):390-394. 2)将高光谱图像分类看做是一个机器学习问 [5]赵春晖,齐滨,YOUN E.基于蒙特卡罗特征降维算法的 题,然后用GC算法来解决,是一种非常有效的方 小样本高光谱图像分类[J].红外与毫米波学报,2013 法。GC算法的使用对处于边缘轮廓的像素点的分 32(1):62-67. 类起到较好的作用,对边缘点除了考虑光谱分类代 ZHAO Chun Hui,QI Bin,YOUN E.Hyperspectral image 价,还实际性地考虑了分割代价。 classification based on Monte Carlo feature reduction method 本文提出的方法虽然已经取得了很好的实验效 [J].J Infrared Millim Waves,2013,32(1):62-67. 果,但是仍有一些有待解决的问题。首先,文中参数 [6]QIAN Y T,YE M,ZHOU J.Hyperspectral image classifica- k是通过一个简单的循环实验来设置的,在未来工 tion based structured sparse logistic regression and three-di- 作中要思考怎样通过机器学习算法来寻求其最优 mensional wavelet texture features[].IEEE Transactions on 值。其次,各个类别的标准特征作为GC的一个参 Geoscience and Remote Sensing,2013,51(4):2276-2291. [7]彭艳斌,艾解清.基于谱聚类波段选择的高光谱图像分 数,它的准确率是非常重要的。之后的实验当中可 类[J].光电工程,2012,39(2):63-67 以考虑加入主动学习方法,从SVM初步分类结果中 PENG Yanbin,AI Jieqing.Hyperspectral imagery classifica- 选出具有价值的样本,作为新样本加入到样本集中, tion based on spectral clustering band selection[J].Opto-E- 扩充样本集,提升SVM分类器性能。 lectronic Engineering,2012,39(2):63-67. 参考文献: [8]王国立,孙杰,肖倩.结合空-谱信息的高光谱图像分类 方法[J].黑龙江大学自然科学学报,2010,27(6):788- [1]FONG M.Dimension reduction on hyperspectral images[R]. 791. Los Angeles:University of California,2007. WANG Guoli,SUN Jie,XIAO Qian.Combination of spatial [2]WANG J,CHANG C I.Independent component analysis information and spectral information for hyperspectral image- based dimensionality reduction with applications in hyper- ry classification J].Journal of Natural Science of Hei- spectral image analysis[J].IEEE Transactions on Geosci- LongJiang University,2010,27(6):788-791
表 6 训练样本集大小为 300×9 的 Pavia University 数据集的生产者精度和用户精度( kspe = 0.1) Table 6 Producer’s Accuracy and User’s Accuracy of the PaviaU with 300 training samples per class ( kspe = 0.1) Class 生产者精度 SVM SSC/ SVM SVM/ GC SSC/ SVMGC 用户精度 SVM SSC/ SVM SVM/ GC SSC/ SVMGC 1 0.815 3 0.965 5 0.817 1 0.970 0 0.952 8 0.929 6 0.961 0 0.942 3 2 0.813 7 0.875 5 0.900 0 0.989 0 0.939 0 0.983 0 0.960 2 0.997 6 3 0.805 6 0.824 2 0.834 7 0.848 0 0.713 8 0.921 2 0.761 7 0.965 8 4 0.955 6 0.921 7 0.982 4 0.930 8 0.799 6 0.854 5 0.777 2 0.936 0 5 0.997 8 1.000 0 0.997 8 1.000 0 0.994 8 1.000 0 0.994 8 1.000 0 6 0.802 9 0.940 5 0.848 5 0.985 3 0.589 0 0.698 6 0.803 9 0.962 3 7 0.908 3 0.934 6 0.914 3 0.945 1 0.712 3 0.995 2 0.716 1 0.995 2 8 0.812 6 0.883 5 0.866 6 0.917 4 0.760 7 0.855 8 0.787 1 0.872 0 9 0.983 1 0.971 5 0.983 1 0.982 0 0.865 2 0.988 2 0.865 2 0.988 3 4 结论 为了解决高光谱图像分类特征维度高、训练集 小的问题,并且合理利用像素类别标签空间相似性 高的特性,提出了谱域和空域相结合的特征 SSC,并 应用 GC 原理对 SVM 的初步分类结果进行二次优 化。 通过对实验结果的分析,可以得出以下结论: 1) 基于谱域和空域相结合的 SSC 特征分类效 果好于基于原始光谱特征,SSC 特征较好地利用空 间邻域信息,减少了噪点数量; 2) 将高光谱图像分类看做是一个机器学习问 题,然后用 GC 算法来解决,是一种非常有效的方 法。 GC 算法的使用对处于边缘轮廓的像素点的分 类起到较好的作用,对边缘点除了考虑光谱分类代 价,还实际性地考虑了分割代价。 本文提出的方法虽然已经取得了很好的实验效 果,但是仍有一些有待解决的问题。 首先,文中参数 kspe 是通过一个简单的循环实验来设置的,在未来工 作中要思考怎样通过机器学习算法来寻求其最优 值。 其次,各个类别的标准特征作为 GC 的一个参 数,它的准确率是非常重要的。 之后的实验当中可 以考虑加入主动学习方法,从 SVM 初步分类结果中 选出具有价值的样本,作为新样本加入到样本集中, 扩充样本集,提升 SVM 分类器性能。 参考文献: [1]FONG M. Dimension reduction on hyperspectral images[R]. Los Angeles: University of California, 2007. [2] WANG J, CHANG C I. Independent component analysis based dimensionality reduction with applications in hyper⁃ spectral image analysis[ J]. IEEE Transactions on Geosci⁃ ence and Remote Sensing, 2006, 44(6): 1586⁃1600. [3]HUANG H Y, KUO B C. Double nearest proportion feature extraction for hyperspectral image classification [ J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48 (11): 4034⁃4046. [4]苏红军,杜培军,盛业华. 高光谱遥感数据光谱特征提取 算法与分类研究[ J]. 计算机应用研究, 2008, 25( 2): 390⁃394. SU Hongjun, DU Peijun, SHENG Yesheng. Study on feature extraction and experiment of hyperspectral data[J]. Applica⁃ tion Research of Computers, 2008, 25(2): 390⁃394. [5]赵春晖, 齐滨, YOUN E. 基于蒙特卡罗特征降维算法的 小样本高光谱图像分类[ J]. 红外与毫米波学报, 2013, 32(1): 62⁃67. ZHAO Chun Hui, QI Bin, YOUN E. Hyperspectral image classification based on Monte Carlo feature reduction method [J]. J Infrared Millim Waves, 2013, 32(1): 62⁃67. [6]QIAN Y T, YE M, ZHOU J. Hyperspectral image classifica⁃ tion based structured sparse logistic regression and three⁃di⁃ mensional wavelet texture features[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(4): 2276⁃2291. [7]彭艳斌,艾解清. 基于谱聚类波段选择的高光谱图像分 类[J]. 光电工程, 2012, 39(2): 63⁃67. PENG Yanbin, AI Jieqing. Hyperspectral imagery classifica⁃ tion based on spectral clustering band selection[J]. Opto⁃E⁃ lectronic Engineering, 2012, 39(2): 63⁃67. [8]王国立,孙杰,肖倩. 结合空-谱信息的高光谱图像分类 方法[J]. 黑龙江大学自然科学学报, 2010, 27(6): 788⁃ 791. WANG Guoli, SUN Jie, XIAO Qian. Combination of spatial information and spectral information for hyperspectral image⁃ ry classification [ J ]. Journal of Natural Science of Hei⁃ LongJiang University, 2010, 27(6): 788⁃791. 第 2 期 尤雅萍,等:基于谱域-空域结合特征和图割原理的高光谱图像分类 ·207·
.208. 智能系统学报 第10卷 [9]吴见,彭道黎.基于空间信息的高光谱遥感植被分类技 [16]BRUZZONE L,CHI M,MARCONCINI M.A novel trans- 术[J].农业工程学报,2012,28(5):150-153. ductive SVM for semisupervised classification of remote WU Jian,PENG Daoli.Vegetation classification technology sensing images[J].IEEE Geoscience Remote and Sensing of hyperspectral remote sensing based on spatial information Letters,2006,44(11):3363-3373. [J].Transactions of the Chinese Society of Agricultural En- [17]BOYKOV Y,VEKSLER O,ZABIH R.Fast approximate gineering,2012,28(5):150-153. energy minimization via graph cuts[J].IEEE Transactions [10]JI RR,GAO Y,HONG R,et al.Spectral-spatial con- on Pattern Analysis and Machine Inteligence,2001,23 straint hyperspectral image classification[J].IEEE Trans- (11):1222-1239. actions on Geoscience and Remote Sensing,2014,52(3): [18]BAI J,XIANG S M,PAN C H.A graph based classifica- 1811-1824. tion method for hyperspectral images[J].IEEE Transac- [11]高恒振,万建伟,粘永健,等.一种基于谱域-空域组合特 tions on Geoscience and Remote Sensing,2012,51(2): 征支持向量机的高光谱图像分类算法[J].宇航学报, 803-817. 2011,32(4):917-921. 作者简介: GAO Hengzhen,WAN Jianwei,NIAN Yongjian,et al. 尤雅萍,女,1990年生,顶士研究生。 Hyeprspectral image classification algorithm based on spec- 主要研究方向为高光谱图像分类技术。 tral-spatial hybird features and SVM[J].Journal of Astro- nautics,2011,32(4):917-921. [12]BENEDIKTSSON A,PALMASON J A,SVEINSSON J R. Classification of hyperspectral data from urban areas based on extended morphological profiles[J].IEEE Transactions 苏松志,1982年生,男,博士,助理教 on Geoscience and Remote Sensing,2005,43(3):480- 授,主要研究方向为人体行为分析与理 491. 解。主持国家青年基金一项,主持省青年 [13]FREUND Y and SCHAPIRE R E.A decision theoretic gen- 基金一项,参与多项国家级基金项目,发 eralization of online learning and an application to boosting 表学术论文多篇,其中被SCI检索7篇。 [J].Journal of Computer and System Sciences,1997,55 (1):119-139. 李绍滋,1963年生,男,教授,博士生 [14]MARCONCINI M,CAMPS-VALLS G,BRUZZONE L.A 导师,博士,福建省人工智能学会副理事 composite semisupervised SVM for classification of hyper- 长,主要研究方向为运动目标检测与识 spectral images[J].IEEE Geoscience Remote and Sensing 别、自然语言处理与多媒体信息检等。 Letters,2009,6(2):234-238. 发表学术论文200余篇,其中被$CI检索 [15]ARCHIBALD R,FANN G.Feature selection and classifi- 26篇、被EI检素170篇。 cation of hyperspectral images with support vector machines [J].IEEE Geoscience Remote and Sensing Letters,2007, 4(4):674-677
[9]吴见, 彭道黎. 基于空间信息的高光谱遥感植被分类技 术[J]. 农业工程学报, 2012, 28(5): 150⁃153. WU Jian, PENG Daoli. Vegetation classification technology of hyperspectral remote sensing based on spatial information [J]. Transactions of the Chinese Society of Agricultural En⁃ gineering, 2012, 28(5): 150⁃153. [10] JI R R, GAO Y, HONG R, et al. Spectral⁃spatial con⁃ straint hyperspectral image classification[ J]. IEEE Trans⁃ actions on Geoscience and Remote Sensing, 2014, 52(3): 1811⁃1824. [11]高恒振,万建伟,粘永健,等. 一种基于谱域⁃空域组合特 征支持向量机的高光谱图像分类算法[ J]. 宇航学报, 2011, 32(4): 917⁃921. GAO Hengzhen, WAN Jianwei, NIAN Yongjian, et al. Hyeprspectral image classification algorithm based on spec⁃ tral⁃spatial hybird features and SVM[ J]. Journal of Astro⁃ nautics, 2011, 32(4):917⁃921. [12]BENEDIKTSSON A, PALMASON J A, SVEINSSON J R. Classification of hyperspectral data from urban areas based on extended morphological profiles[ J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43( 3): 480⁃ 491. [13]FREUND Y and SCHAPIRE R E. A decision theoretic gen⁃ eralization of online learning and an application to boosting [J]. Journal of Computer and System Sciences, 1997, 55 (1): 119⁃139. [14] MARCONCINI M, CAMPS⁃VALLS G, BRUZZONE L. A composite semisupervised SVM for classification of hyper⁃ spectral images[J]. IEEE Geoscience Remote and Sensing Letters, 2009, 6(2): 234⁃238. [15]ARCHIBALD R, FANN G. Feature selection and classifi⁃ cation of hyperspectral images with support vector machines [J]. IEEE Geoscience Remote and Sensing Letters, 2007, 4(4): 674⁃677. [16]BRUZZONE L, CHI M, MARCONCINI M. A novel trans⁃ ductive SVM for semisupervised classification of remote sensing images[ J]. IEEE Geoscience Remote and Sensing Letters, 2006, 44(11): 3363⁃3373. [17] BOYKOV Y, VEKSLER O, ZABIH R. Fast approximate energy minimization via graph cuts[ J]. IEEE Transactions on Pattern Analysis and Machine Inteligence, 2001, 23 (11): 1222⁃1239. [18]BAI J, XIANG S M, PAN C H. A graph based classifica⁃ tion method for hyperspectral images [ J]. IEEE Transac⁃ tions on Geoscience and Remote Sensing, 2012, 51( 2): 803⁃817. 作者简介: 尤雅萍,女,1990 年生,硕士研究生, 主要研究方向为高光谱图像分类技术。 苏松志,1982 年生,男,博士,助理教 授,主要研究方向为人体行为分析与理 解。 主持国家青年基金一项,主持省青年 基金一项,参与多项国家级基金项目,发 表学术论文多篇,其中被 SCI 检索 7 篇。 李绍滋,1963 年生,男,教授,博士生 导师,博士,福建省人工智能学会副理事 长,主要研究方向为运动目标检测与识 别、自然语言处理与多媒体信息检等。 发表学术论文 200 余篇,其中被 SCI 检索 26 篇、被 EI 检索 170 篇。 ·208· 智 能 系 统 学 报 第 10 卷