第1期 赵春晖,等:一种改进的多类支持向量机超光谱图像分类方法 ·79· 会出现某两类或某几类植被的光谱特性极为相似的 max 情况,它们在分类时往往会产生严重混淆的现象,导 致整体分类效果不够理想.这种现象产生的原因是 由于植物种类的分类精度很大程度上取决于植物长 0≤a≤C,ya=0,1=1,2,m8 势和叶面叶绿素含量,当不同物种叶面叶绿素的含 式中:C为惩罚因子,用来对错分样本进行条件控 量相近时,容易错分,这就取决于实际拍摄图片的时 制,根据经验和多次实验得到最佳惩罚因子C°,设 间和地点等各种因素.针对此现象文中提出了一种 此时的拉格朗日乘子α为不等式约束的最优解,由 二次分类的多类支持向量机,它是在1-a1SVM算 此得到权向量系数为 法的基础上改进的多类支持向量机分类方法 w°= 采用1-1SVM进行分类时,训练阶段需要在 yix (9) 每两类之间训练一个分类器,对于一个k类问题需 把这个最佳惩罚因子C和最优的权系数向量 要构造C个两类分类器.对于第i类和第j类之间 x反馈到1a1SVM算法中重新分类 的训练,需要解决下列两类分类问题 4 实验结果与分析 wwcw 为了验证所提方法的有效性,采用AVIRIS超 光谱遥感图像进行实验.该图像取自1992年6月拍 (w)Tx+b≥1-9,fy=i, 摄的美国印第安纳州西北部印第安遥感试验区的一 (w)Tx)+9≤1+g,fy=j, 部分],它包含了农作物和森林植被的混合区 9≥0 (6) 文中实验分析共有3组分类实验,利用自适应 在测试时采用最大投票法,判断符号函数: 波段选择的方法1从原始图像的220个波段中选取 f(x)=sign((w)(x+) 7 3个波段图像:9波段、18波段和50波段作为研究 若未知样本x属于第i类则第1类的票数加一, 对象,对照真实地物图,进行玉米、大豆、干草、林地、 反之第j类加一,x属于最后票数最多的那一类 牧场和草地这6类地物的分类实验 两类分类的支持向量机在训练阶段需要寻找最 文中采用混淆矩阵和总体分类精度来分析分类 佳惩罚因子C.如果惩罚因子选择的不恰当,分类精 效果,混淆矩阵定义如下6] 度将会受到不良影响.采用1~a1SVM算法进行分 11 类时,若类别数k较大时,需要构造大量的两类分类 M 10 器.在实际应用中不可能做到把每个两类分类问题 都做多次实验来寻找最佳惩罚因子,因此提出了二 式中:mg表示实验区内应属于第1类的样本被分到 次分类的方法,分析采用1x1SVM进行第1次分 第j类中去的样本总数,n为类别数.如果混淆矩阵 类的结果,找出混淆最严重的组合,对它们进行二次 中对角线上的元素值愈大,则表示分类结果的可靠 分类,寻找最佳惩罚因子重新分类,这样就可以减小 性愈高,如果混淆矩阵中非对角线上的元素值愈大 这些类别之间的混淆程度.二次分类算法在训练阶 则表示错误分类的现象愈严重,文中实验结果的混 段的模型如图1所示 淆矩阵采用表格的形式进行描述.像素的总体分类 训练样本 分类器1 最终判决 精度OA)的定义如下: 函数 最住惩罚 因子C OA 11) 严重混淆 的组合 分类器2 式中:N为参与分类的总样本数,m为第i类正确 分类的样本数 将1a1SVM和改进的二次分类算法应用到3 图1二次分类的训练阶段模型 组波段的地物分类中,并从灰度图和混淆矩阵2个 Fig.I Training stage model of secondary classification 方面来比较它们的分类效果 进行二次分类时需要单独解决这个组合的两类 1)9波段的地物分类 分类问题.对于k类问题,假设有一对混淆严重的组 基于1a1SVM的分类灰度图和混淆矩阵如 合为第i类和第j类,其相应的对偶问题为 图2、表1所示 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net会出现某两类或某几类植被的光谱特性极为相似的 情况 ,它们在分类时往往会产生严重混淆的现象 ,导 致整体分类效果不够理想. 这种现象产生的原因是 由于植物种类的分类精度很大程度上取决于植物长 势和叶面叶绿素含量 ,当不同物种叶面叶绿素的含 量相近时 ,容易错分 ,这就取决于实际拍摄图片的时 间和地点等各种因素. 针对此现象文中提出了一种 二次分类的多类支持向量机 ,它是在 12a21 SVM 算 法的基础上改进的多类支持向量机分类方法. 采用 12a21 SVM 进行分类时 ,训练阶段需要在 每两类之间训练一个分类器 ,对于一个 k 类问题需 要构造 C 2 k 个两类分类器. 对于第 i 类和第 j 类之间 的训练 ,需要解决下列两类分类问题 : min w ij , b ij ,εij 1 2 (w ij ) T w ij + C ∑t εij t (w ij ) T , (w ij ) T <( xt) + b ij ≥1 - εij t , If yt = i , (w ij ) T <( xt) + b ij ≤- 1 +εij t , If yt = j , εij t ≥0. (6) 在测试时采用最大投票法 ,判断符号函数 : f ( x) = sign ( (w ij ) T <( x) + b ij ) . (7) 若未知样本 x 属于第 i 类则第 i 类的票数加一, 反之第 j 类加一 , x属于最后票数最多的那一类. 两类分类的支持向量机在训练阶段需要寻找最 佳惩罚因子 C. 如果惩罚因子选择的不恰当 ,分类精 度将会受到不良影响. 采用 12a21 SVM 算法进行分 类时 ,若类别数 k 较大时 ,需要构造大量的两类分类 器. 在实际应用中不可能做到把每个两类分类问题 都做多次实验来寻找最佳惩罚因子 ,因此提出了二 次分类的方法 ,分析采用 12a21 SVM 进行第 1 次分 类的结果 ,找出混淆最严重的组合 ,对它们进行二次 分类 ,寻找最佳惩罚因子重新分类 ,这样就可以减小 这些类别之间的混淆程度. 二次分类算法在训练阶 段的模型如图 1 所示. 图 1 二次分类的训练阶段模型 Fig. 1 Training stage model of secondary classification 进行二次分类时需要单独解决这个组合的两类 分类问题. 对于 k 类问题 ,假设有一对混淆严重的组 合为第 i 类和第 j 类 ,其相应的对偶问题为 max ∑ n i =1 αi - 1 2 ∑ n i , j = 1 ααi j y i y j K ( xi ·xj) , 0 ≤αi ≤C, ∑ n i =1 yαi i = 0 , i = 1 ,2 , …, n. (8) 式中 : C 为惩罚因子 ,用来对错分样本进行条件控 制 ,根据经验和多次实验得到最佳惩罚因子 C 3 ,设 此时的拉格朗日乘子α3 为不等式约束的最优解 ,由 此得到权向量系数为 w 3 = ∑ n i = 1 α3 i y i xi . (9) 把这个最佳惩罚因子 C 3 和最优的权系数向量 x 3 反馈到 12a21 SVM 算法中重新分类. 4 实验结果与分析 为了验证所提方法的有效性 ,采用 AVIRIS 超 光谱遥感图像进行实验. 该图像取自 1992 年 6 月拍 摄的美国印第安纳州西北部印第安遥感试验区的一 部分[4 ] ,它包含了农作物和森林植被的混合区. 文中实验分析共有 3 组分类实验 ,利用自适应 波段选择的方法[5 ]从原始图像的 220 个波段中选取 3 个波段图像 :9 波段、18 波段和 50 波段作为研究 对象 ,对照真实地物图 ,进行玉米、大豆、干草、林地、 牧场和草地这 6 类地物的分类实验. 文中采用混淆矩阵和总体分类精度来分析分类 效果 ,混淆矩阵定义如下[ 6 ] : M = m11 … m1 n … ω … mn1 … mnn . (10) 式中 : mij表示实验区内应属于第 i 类的样本被分到 第 j 类中去的样本总数 , n 为类别数. 如果混淆矩阵 中对角线上的元素值愈大 ,则表示分类结果的可靠 性愈高 ,如果混淆矩阵中非对角线上的元素值愈大 , 则表示错误分类的现象愈严重 ,文中实验结果的混 淆矩阵采用表格的形式进行描述. 像素的总体分类 精度(OA) 的定义如下 : OA = ∑ n i =1 mii N . (11) 式中 : N 为参与分类的总样本数 , mii 为第 i 类正确 分类的样本数. 将 12a21 SVM 和改进的二次分类算法应用到 3 组波段的地物分类中 ,并从灰度图和混淆矩阵 2 个 方面来比较它们的分类效果. 1) 9 波段的地物分类. 基于 12a21 SVM 的分类灰度图和混淆矩阵如 图 2、表 1 所示. 第 1 期 赵春晖 ,等 :一种改进的多类支持向量机超光谱图像分类方法 · 97 ·