【机器学习】多视图主动学习的多样性样本选择方法研究

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：4.81MB

第16卷第6期智能系统学报 Vol.16 No.6 2021年11月 CAAI Transactions on Intelligent Systems Now.2021 D0:10.11992/tis.202007037 网络出版地址：https:/kns.cnki.net/kcms/detail/23.1538.TP.20210922.1140.002.html 多视图主动学习的多样性样本选择方法研究陈立伟，房赫，朱海峰 (哈尔滨工程大学信息与通信工程学院，黑龙江哈尔滨150001) 摘要：为了去除高光谱图像多视图主动学习分类中的所选样本的冗余，降低人工标记成本，本文提出了两种用于多视图主动学习分类中的多样性样本选择方法。将高光谱图像进行超像素分割，将所选样本中属于不同的超像素的样本加入训练集，其余样本加入候选集；比较各视图对样本的预测标签，将所选样本中预测标签不完全相同的样本加入训练集，其余样本加入候选集。本文分别用这两种方法对传统多视图主动学习的样本选择方法进行改进，并用两组高光谱图像数据进行实验。实验结果表明：使用这两种方法改进后，所得分类精度不变，使用的训练样本数量大幅诚少。关键词：高光谱图像分类：多视图主动学习：多样性；样本选择：超像素：训练样本数量：预测标签：分类精度中图分类号：TP753文献标志码：A文章编号：1673-4785(2021)06-1007-08 中文引用格式：陈立伟，房赫，朱海峰.多视图主动学习的多样性样本选择方法研究J,智能系统学报，2021,16(6)： 1007-1014. 英文引用格式：CHEN Liwei,.FANG He,ZHU Haifeng.Diversity sample selection method of multiview active learning classifica- tion[J.CAAI transactions on intelligent systems,2021,16(6):1007-1014. Diversity sample selection method of multiview active learning classification CHEN Liwei,FANG He,ZHU Haifeng (College of Information and Communication Engineering,Harbin Engineering University,Harbin 150001,China) Abstract:To remove the redundancy of selected samples in the multiview active learning classification of hyperspec- tral images and reduce the cost of manual marking,this paper proposes two methods for the selection of diverse samples in the multiview active learning classification.First,hyperspectral images are divided into superpixel segments, then samples belonging to different superpixel segments are added to the training set,and the remaining samples are put back into the candidate set.Second,the prediction labels of the samples from each view are compared,then the samples with different prediction labels are added into the training set,and the remaining samples are put back into the candidate set.In this study,the two methods are used to improve the sample selection method in the traditional multiview active learning classification,and experiments are conducted in two groups of hyperspectral image data.The results show that the accuracy of classification is unchanged,yet the number of training samples is greatly reduced after using the two methods. Keywords:hyperspectral image classification;multiview active learning;diversity;sample selection;superpixel;num- ber of training samples,prediction labels;accuracy of classification 随着遥感技术的迅速发展，高光谱图像(hy-贵又费时。主动学习(active learning,.AL)方法 perspectral image,.HSI)在土地覆盖物分类中得到可以有效解决HSI标记样本少的问题s-刀。在AL 了广泛的应用1。训练一个HSI分类器，通常需方法中，多视图主动学习(multiview active learning,. 要大量的标记样本，而标记样本的采集过程既昂 MVAL)方法可以从多个视图中提取互补信息，大大减少训练样本的数量⑧-o。收稿日期：2020-07-23.网络出版日期：2021-09-23. 基金项目：国家自然科学基金项目(61675051). 学者们对MVAL的样本选择方法展开了广通信作者：朱海峰.E-mail:zhuhaifeng(@hrbeu..edu.cn. 泛研究：文献[1l]提出了自适应最大不一致(ad-

DOI: 10.11992/tis.202007037 网络出版地址: https://kns.cnki.net/kcms/detail/23.1538.TP.20210922.1140.002.html 多视图主动学习的多样性样本选择方法研究陈立伟，房赫，朱海峰（哈尔滨工程大学信息与通信工程学院, 黑龙江哈尔滨 150001）摘要：为了去除高光谱图像多视图主动学习分类中的所选样本的冗余，降低人工标记成本，本文提出了两种用于多视图主动学习分类中的多样性样本选择方法。将高光谱图像进行超像素分割，将所选样本中属于不同的超像素的样本加入训练集，其余样本加入候选集；比较各视图对样本的预测标签，将所选样本中预测标签不完全相同的样本加入训练集，其余样本加入候选集。本文分别用这两种方法对传统多视图主动学习的样本选择方法进行改进，并用两组高光谱图像数据进行实验。实验结果表明：使用这两种方法改进后，所得分类精度不变，使用的训练样本数量大幅减少。关键词：高光谱图像分类；多视图主动学习；多样性；样本选择；超像素；训练样本数量；预测标签；分类精度中图分类号：TP753 文献标志码：A 文章编号：1673−4785(2021)06−1007−08 中文引用格式：陈立伟, 房赫, 朱海峰. 多视图主动学习的多样性样本选择方法研究 [J]. 智能系统学报, 2021, 16(6): 1007–1014. 英文引用格式：CHEN Liwei, FANG He, ZHU Haifeng. Diversity sample selection method of multiview active learning classification[J]. CAAI transactions on intelligent systems, 2021, 16(6): 1007–1014. Diversity sample selection method of multiview active learning classification CHEN Liwei，FANG He，ZHU Haifeng (College of Information and Communication Engineering, Harbin Engineering University, Harbin 150001, China) Abstract: To remove the redundancy of selected samples in the multiview active learning classification of hyperspectral images and reduce the cost of manual marking, this paper proposes two methods for the selection of diverse samples in the multiview active learning classification. First, hyperspectral images are divided into superpixel segments, then samples belonging to different superpixel segments are added to the training set, and the remaining samples are put back into the candidate set. Second, the prediction labels of the samples from each view are compared, then the samples with different prediction labels are added into the training set, and the remaining samples are put back into the candidate set. In this study, the two methods are used to improve the sample selection method in the traditional multiview active learning classification, and experiments are conducted in two groups of hyperspectral image data. The results show that the accuracy of classification is unchanged, yet the number of training samples is greatly reduced after using the two methods. Keywords: hyperspectral image classification; multiview active learning; diversity; sample selection; superpixel; number of training samples; prediction labels; accuracy of classification 随着遥感技术的迅速发展，高光谱图像 (hyperspectral image，HSI) 在土地覆盖物分类中得到了广泛的应用[1-3]。训练一个 HSI 分类器，通常需要大量的标记样本，而标记样本的采集过程既昂贵又费时[4-5]。主动学习 (active learning，AL) 方法可以有效解决 HSI 标记样本少的问题[6-7]。在 AL 方法中，多视图主动学习 (multiview active learning, MVAL) 方法可以从多个视图中提取互补信息，大大减少训练样本的数量[8-10]。学者们对 MVAL 的样本选择方法展开了广泛研究：文献 [11] 提出了自适应最大不一致 (ad- 收稿日期：2020−07−23. 网络出版日期：2021−09−23. 基金项目：国家自然科学基金项目（61675051）. 通信作者：朱海峰. E-mail：zhuhaifeng@hrbeu.edu.cn. 第 16 卷第 6 期智能系统学报 Vol.16 No.6 2021 年 11 月 CAAI Transactions on Intelligent Systems Nov. 2021

·1008· 智能系统学报第16卷 aptive maximum disagreement,AMD)的样本选择方图1所示。法，该方法利用各分类器对样本预测结果的不一训练分类器预测所有样本输出致性选择样本；文献[12]提出了加权投票熵 HSI数据输 (weighted voting entropy,WVE)的样本选择方法，候选集迭代样本选择由于不同视图对于不同类别的区分能力不同，该训练集选出部分样本模型分类精方法通过各视图的权重体现了不同视图对样本的样本预测标签辨别能力的差异；文献[13]提出了一种EUE样本选择方法，该方法综合考虑了视图内和视图间图1基于MVAL的HSI分类的基本流程的不确定性。这些方法均取得了良好的分类结 Fig.1 Basic flow chart of HSI classification based on MVAL 果，但是这些方法只考虑了样本的不确定性，没 1.2视图生成方法有考虑样本的多样性，导致所选样本中存在冗本文使用了3D-Gabor滤波视图生成方法，通过余。并且，随着迭代次数的增加，不同视图训练使用不同频率和方向的3D-Gabor滤波器将原始HSl 的分类器会趋同，具有相同的分歧程度的样本越转换成多个具有不同频谱空间特征的数据集。来越多，样本冗余问题会进一步加剧。利用这些数据集提供的频谱空间信息，将HSI的目前，学者们对MVAL中所选样本的多样性光谱和空间信息结合起来。3D-Gabor内核为研究较少。文献[I5]提出了一种用于MVAL的 Go.e.o(x,y,A)=g(x,y,A)explj(x@:+ywy+@) 基于聚类的多样性样本选择方法，该方法采用局式中：ω为波向量的中心频率；9为波向量和光谱部聚类密度度量方法对H$I样本进行聚类，采用维度的夹角；w、、w分别是样本的特征向量光谱角距离作为聚类的距离准则。然而，该方法在高光谱图像的横纵坐标轴x、y和光谱方向d上在聚类过程中只使用了光谱信息，没有考虑样本的投影；O是样本的特征向量在地面x、y上的投影的空间信息，由此选出的相似样本会产生同谱异与x轴的夹角：g(x,y,)是在(x,y,)域的三维高斯包物的问题6-17”。本文提出了一种基于超像素分割图的MVAL 络线。频率和方向的参数设置为：u∈{日J 14'8121 11 多样性样本选择方法。H$I的超像素分割方法同 G动以=0登}。当。=0时，液向量与时基于样本的光谱特性和空间特性，可以有效地不同的矢量方向相同，共13个方向。HSI经3D- 避免样本选择过程中的同谱异物问题。 Gabor滤波后，得到65个不同频率和方向的在MVAL中，多个视图训练的多个分类器， Gabor立方体，得到的Gabor立方体与原始HSI大彼此独立并互相补充，共同对样本选择过程和得小相同。到最终分类结果起作用。分类器对不同样本的然后，采用文献[13]中提出的FR准则衡量视预测结果的一致性直接与样本间的相似性有关，图的充分性。从得到的全部视图中选出充分性最因此本文又提出了一种基于多视图预测标签一致大的5个视图作为MVAL的多视图。FR准则为性的样本选择方法。 1 2 1算法框架 bi.jl,2.-r小xeD 4-4-4) 1.1MVAL的基本流程 4-x04-x)+4-x)0-x) 基于MVAL的HSI分类的基本流程是：首先式中：D,为初始标记训练样本；r为地物类别数将H$I的全部已标记样本分为训练集和候选集，量；(4，-4)4：-4)T为第i、j类的均值类间散射矩然后对H$I采用某种视图生成方法得到多个视阵；(4-x4-x)r+(4,-x)-x)T为第i、j类的方图。每个视图分别训练一个分类器，并使用每个差类内分散矩阵。分类器对全部样本进行预测，得到其预测的结果 1.3传统的AMD查询策略和精度。根据预测结果，使用MVAL样本选择策传统样本选择方法通过比较各分类器对样本略从候选集中选出信息量大的样本。依次迭代，的不同预测结果个数，衡量样本的不确定性，并直到满足停止条件。根据各个分类器的预测结果从候选集中选出不同预测结果个数最多的样本进得到最终的分类结果和分类精度20-2川。停止条件行查询。该方法称为自适应最大不一致策略(ad- 一般为达到了最大迭代次数或分类精度达到某个 aptive maximum disagreement,.AMD)。具体表达值。基于MVAL的HSI分类的基本流程图如式为

aptive maximum disagreement, AMD) 的样本选择方法，该方法利用各分类器对样本预测结果的不一致性选择样本；文献 [ 1 2 ] 提出了加权投票熵 (weighted voting entropy, WVE) 的样本选择方法，由于不同视图对于不同类别的区分能力不同，该方法通过各视图的权重体现了不同视图对样本的辨别能力的差异；文献 [13] 提出了一种 IEUE 样本选择方法，该方法综合考虑了视图内和视图间的不确定性。这些方法均取得了良好的分类结果，但是这些方法只考虑了样本的不确定性，没有考虑样本的多样性，导致所选样本中存在冗余。并且，随着迭代次数的增加，不同视图训练的分类器会趋同，具有相同的分歧程度的样本越来越多，样本冗余问题会进一步加剧[11-14]。目前，学者们对 MVAL 中所选样本的多样性研究较少。文献 [15] 提出了一种用于 MVAL 的基于聚类的多样性样本选择方法，该方法采用局部聚类密度度量方法对 HSI 样本进行聚类，采用光谱角距离作为聚类的距离准则。然而，该方法在聚类过程中只使用了光谱信息，没有考虑样本的空间信息，由此选出的相似样本会产生同谱异物的问题[16-17]。本文提出了一种基于超像素分割[18] 的 MVAL 多样性样本选择方法。HSI 的超像素分割方法同时基于样本的光谱特性和空间特性，可以有效地避免样本选择过程中的同谱异物问题。在 MVAL 中，多个视图训练的多个分类器，彼此独立并互相补充，共同对样本选择过程和得到最终分类结果起作用[19]。分类器对不同样本的预测结果的一致性直接与样本间的相似性有关，因此本文又提出了一种基于多视图预测标签一致性的样本选择方法。 1 算法框架 1.1 MVAL 的基本流程基于 MVAL 的 HSI 分类的基本流程是：首先将 HSI 的全部已标记样本分为训练集和候选集，然后对 HSI 采用某种视图生成方法得到多个视图。每个视图分别训练一个分类器，并使用每个分类器对全部样本进行预测，得到其预测的结果和精度。根据预测结果，使用 MVAL 样本选择策略从候选集中选出信息量大的样本。依次迭代，直到满足停止条件。根据各个分类器的预测结果得到最终的分类结果和分类精度[20-21]。停止条件一般为达到了最大迭代次数或分类精度达到某个值。基于 MVAL 的 HSI 分类的基本流程图如图 1 所示。 HSI 数据输入候选集训练集训练分类器样本选择选出部分样本迭代预测所有样本输出样本预测标签模型分类精度图 1 基于 MVAL 的 HSI 分类的基本流程 Fig. 1 Basic flow chart of HSI classification based on MVAL 1.2 视图生成方法本文使用了 3D-Gabor 滤波视图生成方法，通过使用不同频率和方向的 3D-Gabor 滤波器将原始 HSI 转换成多个具有不同频谱空间特征的数据集[22]。利用这些数据集提供的频谱空间信息，将 HSI 的光谱和空间信息结合起来。3D-Gabor 内核为 Gω,φ,θ(x, y, λ) = g(x, y, λ) exp{j(xωx +yωy +λωλ)} ω φ ωx、ωy、ωλ λ θ g(x, y, λ) (x, y, λ) ω ∈ { 1 4 , 1 8 , 1 12 , 1 16 , 1 20} {φ, θ} = { 0, π 4 , π 2 , 3π 4 } φ = 0 θ 式中：为波向量的中心频率；为波向量和光谱维度的夹角；分别是样本的特征向量在高光谱图像的横纵坐标轴 x、y 和光谱方向上的投影；是样本的特征向量在地面 x、y 上的投影与 x 轴的夹角；是在域的三维高斯包络线。频率和方向的参数设置为：，。当时，波向量与不同的矢量方向相同，共 13 个方向。HSI 经 3DGabo r 滤波后，得到 6 5个不同频率和方向的 Gabor 立方体，得到的 Gabor立方体与原始 HSI 大小相同。然后，采用文献 [13] 中提出的 FR 准则衡量视图的充分性。从得到的全部视图中选出充分性最大的 5 个视图作为 MVAL 的多视图。FR 准则为 φFR = 1 B 2 r(r −1) ∑B b ∑ i, j∈{1,2,···,r} ∑ x∈Ds (µi −µj)(µi −µj) T (µi − x)(µi − x) T +(µj − x)(µj − x) T (µi −µj)(µi −µj) T (µi − x)(µi − x) T +(µj − x)(µj − x) T 式中：Ds 为初始标记训练样本；r 为地物类别数量；为第 i、j 类的均值类间散射矩阵；为第 i、j 类的方差类内分散矩阵。 1.3 传统的 AMD 查询策略传统样本选择方法通过比较各分类器对样本的不同预测结果个数，衡量样本的不确定性，并从候选集中选出不同预测结果个数最多的样本进行查询。该方法称为自适应最大不一致策略 (adaptive maximum disagreement，AMD)。具体表达式为 ·1008· 智能系统学报第 16 卷

第6期陈立伟，等：多视图主动学习的多样性样本选择方法研究 ·1009· QAMD arg max L()lcount,=1,2,..K 提出的基于超像素的多样性样本选择方法的 xEDe 式中：L(:)为第k个分类器对样本x的分类结果，定义公式为共有K个分类器；Dc为候选集；lum为其中不同 Xsuc=unique[L(x)L(2)…Lxm)】元素的个数。式中Xsuc为XAMD经过提出的基于超像素的多样性样本选择方法后得到的最终所选样本。unique 2MVAL样本选择方法的多样性选函数的具体过程如图3。择策略 Xc=xl,L=L儿j=2 针对MVAL样本选择过程中存在冗余样本的问题，本文提出了基于超像素分割和基于预测标签一致性的两种MVAL多样性样本选择策略。 L(x)L 在MVAL的传统AMD样本选择方法后，使用提出的多样性方法对所选样本进行进一步筛选，减少训练样本个数，从而降低人工标记成本。 Xsuc-[Xsiic,x 2.1基于超像素分割的多样性选择策略传统的超像素分割方法有Meanshift、简单线性迭代聚类(simple linear iterative clustering,SLIC), L=HL,L(g初归一化分割(normalized cut)、基于嫡率(entropy rate)等。其中，SLIC算法能够根据HSI的同质性和非均匀性特点进行超像素分割，使不同超像素的空间相干性大大降低。同时只需设置一个预分割超像素数量参数即可在运行速度、紧凑整齐度等方面有一定优势。因此，本文采用SLIC超像素算法4用于HSI的MVAL多样性样本选择过程。利用SLIC超像素方法对MVAL样本选择过程进行多样性改进的步骤为：首先对整个HSI进图3 unique函数的流程 Fig.3 Flow of unique function 行SLIC超像素分割，分割后的HSI数据如图2。设共得到k个超像素，每个样本：均对应一个超像素此方法先对原始H$I进行超像素分割，该过标签L,同一超像素的样本的超像素标签相同。然程同时考虑了样本的空间相邻性和光谱相似性。后使用一种样本选择方法（如AMD策略）选出不将HS中光谱相似且空间相邻的样本判别为相似确定性最大的m个样本，记为XAMD=[:x·xm]。样本，放入一个超像素区域中。通过超像素分割再从这m个样本找出属于相同超像素的样本。方法得到相似样本可以有效地避免同谱异物问接下来对其中属于同一个超像素的样本，随机选题，从而更好地进行多样性样本选择。出其中一个作为代表，剩下的样本放回候选集 2.2基于预测标签一致性的多样性选择策略中。令选出的样本必须来自不同的超像素，从而在HSI分类的MVAL方法中，每个分类器均实现样本选择过程的多样性改进。对样本进行预测。对于两个特别相似的样本，各分类器对它们的分类结果大概率相同。基于MVAL 原始高光谱图像超像素分割方法特有的多视图特点，以及每个视图分别训练分类器的特点，提出一种基于预测标签一致性的 SLIC 去冗余算法。该算法通过比较分类器对不同样本预测结果的一致性，找出所选样本中的相似样本，并去掉其中冗余样本。此方法的定义为图2高光谱图像的SLIC超像素分割图 Fig.2 SLIC superpixel segmentation schematic of hyper- D=克L4L4c儿 k=1 spectral images ∫1，a=b 得到超像素标签的表达式为 la,e={0,a≠b L=Lx),L∈[1，k 式中：x,x∈Uc,且x:≠x;D为样本x和x的相似程

QAMD = argmax xi∈DC |Lk(xi)|count，k = 1,2,··· ,K Lk(xi) xi DC | · |count 式中：为第 k 个分类器对样本的分类结果，共有 K 个分类器；为候选集；为其中不同元素的个数。 2 MVAL 样本选择方法的多样性选择策略针对 MVAL 样本选择过程中存在冗余样本的问题，本文提出了基于超像素分割和基于预测标签一致性的两种 MVAL 多样性样本选择策略。在 MVAL 的传统 AMD 样本选择方法后，使用提出的多样性方法对所选样本进行进一步筛选，减少训练样本个数，从而降低人工标记成本。 2.1 基于超像素分割的多样性选择策略传统的超像素分割方法有 Meanshift、简单线性迭代聚类 (simple linear iterative clustering，SLIC)、归一化分割 (normalized cut)、基于熵率 (entropy rate) 等。其中，SLIC 算法能够根据 HSI 的同质性和非均匀性特点进行超像素分割，使不同超像素的空间相干性大大降低。同时只需设置一个预分割超像素数量参数即可在运行速度、紧凑整齐度等方面有一定优势[23]。因此，本文采用 SLIC 超像素算法[24] 用于 HSI 的 MVAL 多样性样本选择过程。 xi Li XAMD = [x1 x2 ··· xm] 利用 SLIC 超像素方法对 MVAL 样本选择过程进行多样性改进的步骤为：首先对整个 HSI 进行 SLIC 超像素分割，分割后的 HSI 数据如图 2。设共得到 k 个超像素，每个样本均对应一个超像素标签，同一超像素的样本的超像素标签相同。然后使用一种样本选择方法 (如 AMD 策略) 选出不确定性最大的 m 个样本，记为。再从这 m 个样本找出属于相同超像素的样本。接下来对其中属于同一个超像素的样本，随机选出其中一个作为代表，剩下的样本放回候选集中。令选出的样本必须来自不同的超像素，从而实现样本选择过程的多样性改进。 SLIC 原始高光谱图像超像素分割图 2 高光谱图像的 SLIC 超像素分割图 Fig. 2 SLIC superpixel segmentation schematic of hyperspectral images 得到超像素标签的表达式为 Li = L(xi), Li ∈ [1, k] 提出的基于超像素的多样性样本选择方法的定义公式为 XSLIC = unique[L(x1) L(x2) ··· L(xm)] XSLIC XAMD unique 式中为经过提出的基于超像素的多样性样本选择方法后得到的最终所选样本。函数的具体过程如图 3。 XSLIC=[x1], L=[L (x1)], j=2 XSLIC=[XSLIC, xj ] XSLIC L=[L, L (xj )] j=j+1 j≤m Y Y N L (x N j ) ϵ L 图 3 unique 函数的流程 Fig. 3 Flow of unique function 此方法先对原始 HSI 进行超像素分割，该过程同时考虑了样本的空间相邻性和光谱相似性。将 HIS 中光谱相似且空间相邻的样本判别为相似样本，放入一个超像素区域中。通过超像素分割方法得到相似样本可以有效地避免同谱异物问题，从而更好地进行多样性样本选择。 2.2 基于预测标签一致性的多样性选择策略在 HSI 分类的 MVAL 方法中，每个分类器均对样本进行预测。对于两个特别相似的样本，各分类器对它们的分类结果大概率相同。基于 MVAL 方法特有的多视图特点，以及每个视图分别训练分类器的特点，提出一种基于预测标签一致性的去冗余算法。该算法通过比较分类器对不同样本预测结果的一致性，找出所选样本中的相似样本，并去掉其中冗余样本。此方法的定义为 D = ∑K k=1 |Lk(xi),Lk(xj)|equal |a,b|equal = { 1, a = b 0, a , b xi 式中： , xj ∈ UC，且xi , xj ；D 为样本xi和xj 的相似程第 6 期陈立伟，等：多视图主动学习的多样性样本选择方法研究 ·1009·

·1010· 智能系统学报第16卷度，D越大，x和x越相似。机选择一个作为代表加入训练集，如样本X,其余基于预测标签一致性的多样性样本选择方法样本放回候选集；再从样本X和样本X。中随机选如图4所示。首先使用一种样本选择方法（如AMD 择一个作为代表加入训练集，如样本X,其余样本策略)选出一批信息量大的样本X,X2,…,Xg,然放回候选集，最终选择的训练样本为X1,X2,X,X,X, 后对从中找出预测标签完全相同的样本。从图4 X8。从图4中可以看出，训练样本数由8个减少中可以看出，样本X与样本X的预测标签完全相为6个，通过基于预测标签一致性的去冗余方法同，均为[3,4,4,6,7：样本X与样本X的预测标签完可以实现去除多余的训练样本的目的，减少人工全相同，均为[6,6,7,12,7]。从样本X和样本X中随标记成本。 X:34467 X:34467 X:34467 X:45665 X:45665 X:45665 X:34467 X:34467 出：34467 AMD 候选集U。 X:8813137 D=5 X:8813137 去冗余 X:8813137 所选样本 X:667127 ·667127 66712 X6:667127 :667127 66729 X:388316 X7:388316 X:388316 X Xg:488415 Xg:488415 X:488415 图4基于预测标签一致性的多样性样本选择方法示意 Fig.4 Graphical representation of a diversity sampling method based on predictive label consistency 3实验结果与讨论致性。Kappa系数的具体表达式为 3.1实验数据集 Nxm-Nxm 为了验证本文算法的有效性，采用了2个常 Kappa= 用的高光谱图像进行仿真实验，分别是Indian W2- Pines数据集和Salinas数据集。Indian Pines数据集包括16个类别，共有21025个样本，其中有真 3.3实验结果对比实标签的样本为10249个；Salinas数据集也包括本节主要验证本文提出的两种多样性样本选 16个类别，共有111104个样本，其中有真实标签择方法的效果，并将提出的基于超像素分割的多的样本为54129个。样性选择方法和基于预测标签一致的去冗余算法 3.2分类性能评价指标分别简称为方法A和方法B。采用选取的2组本文使用综合精度(OA)、平均精度(AA)、 HSI数据进行3组实验。第1组：使用传统AMD Kappa系数(Kappa)对两组对比实验结果进行定策略进行样本选择，记为AMD。第2组：先使用量比较。 AMD策略进行样本选择，再将所选样本使用方 OA方法通过混淆矩阵判别总体分类精度，法A去除冗余，最后将去冗余后的所选样本加入具体表达式为训练集，进行MVAL,记为AMD+A。第3组：将方法A换成方法B,其他操作与第2组实验相同，记为AMD+B。将第2、3组实验结果与第1组实式中：N为全部样本数；n为类别总数；m为将样本验结果进行对比，验证这2种方法的有效性。正确分类到第i类的数量。以上所有实验均使用MLR分类器2，采用 AA表示在每个类别中分类正确的样本所占 3D-Gabor滤波视图生成方法，视图数量为5。的比重。如果各类别样本数量相同，则平均分类 3组数据使用相同频率和方向的3D-Gabor滤波精度AA与总体分类精度OA相同。AA的表达器，滤波后均得到65个Gabor立方体，再通过式为 FR准则选出充分性前5的立方体作为MVAL的 AA= 5个视图。实验前，分别在Indian Pines数据集和 Salinas数据集中有真实标签的样本中选出一部分式中：CA= 发表示各类别的分类精度：N为第类样本作为初始训练样本。具体方法为：从每个类样本总数。别中随机选出5个样本作为初始训练样本，共 Kappa系数用来表示分类图与真实图像的一 80个样本。其余的有真实标签的样本为候选样

度，D 越大，xi和xj 越相似。 {X1,X2,··· ,X8} X1 X3 X5 X6 X1 X3 基于预测标签一致性的多样性样本选择方法如图 4 所示。首先使用一种样本选择方法 (如 AMD 策略) 选出一批信息量大的样本，然后对从中找出预测标签完全相同的样本。从图 4 中可以看出，样本与样本的预测标签完全相同，均为 [3,4,4,6,7]；样本与样本的预测标签完全相同，均为 [6,6,7,12,7]。从样本和样本中随 X1 X5 X6 X5 {X1,X2,X4,X5,X7, X8} 机选择一个作为代表加入训练集，如样本，其余样本放回候选集；再从样本和样本中随机选择一个作为代表加入训练集，如样本，其余样本放回候选集，最终选择的训练样本为。从图 4 中可以看出，训练样本数由 8 个减少为 6 个，通过基于预测标签一致性的去冗余方法可以实现去除多余的训练样本的目的，减少人工标记成本。候选集 UC X1 : 3 4 4 6 7 X2 : 4 5 6 6 5 X3 : 3 4 4 6 7 X4 : 8 8 13 13 7 X5 : 6 6 7 12 7 X6 : 6 6 7 12 7 X7 : 3 8 8 3 16 X8 : 4 8 8 4 15 X1 X2 X4 X5 X7 X8 去冗余所选样本 X1 : 3 4 4 6 7 X2 : 4 5 6 6 5 X3 : 3 4 4 6 7 X4 : 8 8 13 13 7 X5 : 6 6 7 12 7 X6 : 6 6 7 12 7 X7 : 3 8 8 3 16 X8 : 4 8 8 4 15 X1 : 3 4 4 6 7 X2 : 4 5 6 6 5 X3 : 3 4 4 6 7 X4 : 8 8 13 13 7 X5 : 6 6 7 12 7 X6 : 6 6 7 12 7 X7 : 3 8 8 3 16 X8 : 4 8 8 4 15 AMD D=5 图 4 基于预测标签一致性的多样性样本选择方法示意 Fig. 4 Graphical representation of a diversity sampling method based on predictive label consistency 3 实验结果与讨论 3.1 实验数据集为了验证本文算法的有效性，采用了 2 个常用的高光谱图像进行仿真实验，分别是 Indian Pines 数据集和 Salinas 数据集。Indian Pines 数据集包括 16 个类别，共有 21 025 个样本，其中有真实标签的样本为 10 249 个； Salinas 数据集也包括 16 个类别，共有 111 104 个样本，其中有真实标签的样本为 54129 个。 3.2 分类性能评价指标本文使用综合精度 (OA)、平均精度 (AA)、 Kappa 系数 (Kappa) 对两组对比实验结果进行定量比较。 OA 方法通过混淆矩阵判别总体分类精度，具体表达式为 OA = 1 N ∑n i=1 mi 式中： N 为全部样本数；n 为类别总数；mi为将样本正确分类到第 i 类的数量。 AA 表示在每个类别中分类正确的样本所占的比重。如果各类别样本数量相同，则平均分类精度 AA 与总体分类精度 OA 相同。AA 的表达式为 AA = 1 N ∑n i=1 CA CA = mi Ni Ni 式中：表示各类别的分类精度；为第 i 类样本总数。 Kappa 系数用来表示分类图与真实图像的一致性。Kappa 系数的具体表达式为 Kappa = N × ∑n i=1 mi − ∑n i=1 Ni ×mi N2 − ∑n i=1 Ni ×mi 3.3 实验结果对比本节主要验证本文提出的两种多样性样本选择方法的效果，并将提出的基于超像素分割的多样性选择方法和基于预测标签一致的去冗余算法分别简称为方法 A 和方法 B。采用选取的 2 组 HSI 数据进行 3 组实验。第 1 组：使用传统 AMD 策略进行样本选择，记为 AMD。第 2 组：先使用 AMD 策略进行样本选择，再将所选样本使用方法 A 去除冗余，最后将去冗余后的所选样本加入训练集，进行 MVAL，记为 AMD+A。第 3 组：将方法 A 换成方法 B，其他操作与第 2 组实验相同，记为 AMD+B。将第 2、3 组实验结果与第 1 组实验结果进行对比，验证这 2 种方法的有效性。以上所有实验均使用 MLR 分类器[25] ，采用 3D-Gabor 滤波视图生成方法，视图数量为 5。 3 组数据使用相同频率和方向的 3D-Gabor 滤波器，滤波后均得到 65 个 Gabor 立方体，再通过 FR 准则选出充分性前 5 的立方体作为 MVAL 的 5 个视图。实验前，分别在 Indian Pines 数据集和 Salinas 数据集中有真实标签的样本中选出一部分样本作为初始训练样本。具体方法为：从每个类别中随机选出 5 个样本作为初始训练样本，共 80 个样本。其余的有真实标签的样本为候选样 ·1010· 智能系统学报第 16 卷

第6期陈立伟，等：多视图主动学习的多样性样本选择方法研究 ·1011· 本，测试样本为有真实标签的全部样本。在AMD nas数据集的AMD和AMD+A实验迭代过程中的样本选择方法中，每次迭代最多选择15个样本，分类结果如表2所示。共迭代20次。在方法A中，超像素的边长为从表1、2可以看出：无论迭代次数是多少， 4×4,超像素个数大约为总样本数除以16，超像素通过基于超像素分割的多样性选择方法改进后得中光谱和空间的权重因子为0.5。到的实验精度基本不变，而训练样本数量均有不为了进一步测试方法的效果，本文对比了实同程度的减少。验中每5次迭代对应的分类精度以及各组实验的两个数据集在AMD和AMD+A实验中得到耗时情况。Indian Pines数据集的AMD和AMD+ 的最终分类结果如表3所示，分类结果对比图如 A实验迭代过程中的分类结果如表1所示。Sali- 图5、6所示。表1 Indian Pines数据集的AMD+A与AMD的实验结果 Table 1 Experimental results of AMD+A and AMD in the Indian Pines dataset 序号实验迭代次数 OA Kappa AA 训练样本数 AMD 0.8371 0.8157 0.8916 142 5 AMD+A 0.8365 0.8149 0.8912 131 AMD 0.8958 0.8817 0.9245 168 2 10 AMD+A 0.8950 0.8809 0.9248 157 AMD 0.9463 0.9388 0.9473 214 15 AMD+A 0.9467 0.9393 0.9498 199 AMD 0.9678 0.9633 0.9654 263 20 AMD+A 0.9686 0.9643 0.9693 236 表2 Salinas数据集的AMD+A与AMD的实验结果 Table 2 Experimental results of AMD+A and AMD in the Salinas dataset 序号实验迭代次数 OA Kappa AA 训练样本数 AMD 0.9382 0.9312 0.9651 155 5 AMD+A 0.9382 0.9312 0.9651 154 AMD 0.9619 0.9576 0.9773 230 2 10 AMD+A 0.9544 0.9493 0.9739 215 AMD 0.9744 0.9715 0.9837 305 15 AMD+A 0.9746 0.9717 0.9852 272 AMD 0.9818 0.9798 0.9907 380 20 AMD+A 0.9795 0.9771 0.9896 315 表3AMD+A与AMD实验的最终结果 Table 3 Final results of the AMD+A and AMD experiments 数据集实验 OA Kappa AA 训练样本数耗时s AMD 0.9678 0.9633 0.9654 263 42.16 Indian Pines AMD+A 0.9686 0.9643 0.9693 236 45.65 AMD 0.9818 0.9798 0.9907 380 313.76 Salinas AMD+A 0.9795 0.9771 0.9896 315 338.68

本，测试样本为有真实标签的全部样本。在 AMD 样本选择方法中，每次迭代最多选择 15 个样本，共迭代 20 次。在方法 A 中，超像素的边长为 4×4，超像素个数大约为总样本数除以 16，超像素中光谱和空间的权重因子为 0.5。为了进一步测试方法的效果，本文对比了实验中每 5 次迭代对应的分类精度以及各组实验的耗时情况。Indian Pines 数据集的 AMD 和 AMD+ A 实验迭代过程中的分类结果如表 1 所示。Salinas 数据集的 AMD 和 AMD+A 实验迭代过程中的分类结果如表 2 所示。从表 1、2 可以看出：无论迭代次数是多少，通过基于超像素分割的多样性选择方法改进后得到的实验精度基本不变，而训练样本数量均有不同程度的减少。两个数据集在 AMD 和 AMD+A 实验中得到的最终分类结果如表 3 所示，分类结果对比图如图 5、6 所示。表 1 Indian Pines 数据集的 AMD+A 与 AMD 的实验结果 Table 1 Experimental results of AMD+A and AMD in the Indian Pines dataset 序号实验迭代次数 OA Kappa AA 训练样本数 1 AMD 5 0.8371 0.8157 0.891 6 142 AMD+A 0.8365 0.8149 0.891 2 131 2 AMD 10 0.8958 0.8817 0.924 5 168 AMD+A 0.8950 0.8809 0.924 8 157 3 AMD 15 0.9463 0.9388 0.947 3 214 AMD+A 0.9467 0.9393 0.949 8 199 4 AMD 20 0.9678 0.9633 0.965 4 263 AMD+A 0.9686 0.9643 0.969 3 236 表 2 Salinas 数据集的 AMD+A 与 AMD 的实验结果 Table 2 Experimental results of AMD+A and AMD in the Salinas dataset 序号实验迭代次数 OA Kappa AA 训练样本数 1 AMD 5 0.9382 0.9312 0.965 1 155 AMD+A 0.9382 0.9312 0.965 1 154 2 AMD 10 0.9619 0.9576 0.977 3 230 AMD+A 0.9544 0.9493 0.973 9 215 3 AMD 15 0.9744 0.9715 0.983 7 305 AMD+A 0.9746 0.9717 0.985 2 272 4 AMD 20 0.9818 0.9798 0.990 7 380 AMD+A 0.9795 0.9771 0.989 6 315 表 3 AMD+A 与 AMD 实验的最终结果 Table 3 Final results of the AMD+A and AMD experiments 数据集实验 OA Kappa AA 训练样本数耗时/s Indian Pines AMD 0.9678 0.963 3 0.965 4 263 42.16 AMD+A 0.9686 0.964 3 0.969 3 236 45.65 Salinas AMD 0.9818 0.979 8 0.990 7 380 313.76 AMD+A 0.9795 0.977 1 0.989 6 315 338.68 第 6 期陈立伟，等：多视图主动学习的多样性样本选择方法研究 ·1011·

·1012· 智能系统学报第16卷 Kappa值区别不大，分类结果图也无明显差别，然而两个数据集在AMD+A实验中用到的训练样本总数比AMD实验中分别减少了10.2%、17.1%.耗时仅增加了3.49s、24.92s。Indian Pines数据集的 AMD和AMD+B实验迭代过程中的分类结果如表4所示。Salinas数据集的AMD和AMD+B实 (a)AMD (b)AMD+A 验迭代过程中的分类结果如表5所示。图5用方法A改进前后的实验结果分析(Indian Pines) Fig.5 Comparison of experimental results before and 表4 Indian Pines数据集的AMD+B与AMD的实验结果 after improvement with method A(Indian Pines) Table 4 Experimental results of AMD+B and AMD in the Indian Pines dataset 迭代训练样序号实验 OA AA 次数 Kappa 本数 AMD 0.83560.81250.8807 153 AMD+B 0.83380.81040.8737 148 AMD 0.89440.87900.9084179 2 10 (a)AMD (b)AMD+A AMD+B 0.89390.87840.9065172 图6用方法A改进前后的实验结果分析(Salinas) AMD 0.94230.93420.9478217 3 15 Fig.6 Comparison of experimental results before and AMD+B 0.94200.93390.9482 202 after improvement with method A(Salinas) AMD 0.96140.95600.9638 268 由AMD和AMD+A的对比实验结果可以看 20 AMD+B 0.96450.95950.9628 246 出：3个HSI数据集在两组实验中的OA、AA、表5 Salinas数据集的AMD+B与AMD的实验结果 Table 5 Experimental results of AMD+B and AMD in the Salinas dataset 序号实验迭代次数 OA Kappa AA 训练样本数 AMD 0.8857 0.8734 0.9476 113 1 5 AMD+B 0.8945 0.8831 0.9513 100 AMD 0.9304 0.9227 0.9530 162 2 10 AMD+B 0.9224 0.9137 0.9478 125 AMD 0.9497 0.9441 0.9694 182 15 AMD+B 0.9449 0.9387 0.9640 138 AMD 0.9598 0.9553 0.9819 204 20 AMD+B 0.9524 0.9470 0.9780 152 从表4、5中可以看出：无论迭代次数是多不同程度的减少。两个数据集在AMD和AMD+B 少，通过基于预测标签一致的去冗余算法改进后实验中得到的最终分类结果如表6所示，分类结得到的实验精度基本不变，而训练样本数量均有果对比图如图7、8所示。表6AMD+B与AMD实验的最终结果 Table 6 Final results of AMD+B and AMD experiments 数据集实验 OA Kappa AA 训练样本数耗时s AMD 0.9614 0.9560 0.9638 268 41.96 Indian Pines AMD+B 0.9645 0.9595 0.9628 246 42.84 AMD 0.9598 0.9553 0.9819 204 309.34 Salinas AMD+B 0.9524 0.9470 0.9780 152 323.68

(a) AMD (b) AMD+A 图 5 用方法 A 改进前后的实验结果分析 (Indian Pines) Fig. 5 Comparison of experimental results before and after improvement with method A (Indian Pines) (a) AMD (b) AMD+A 图 6 用方法 A 改进前后的实验结果分析 (Salinas) Fig. 6 Comparison of experimental results before and after improvement with method A (Salinas) 由 AMD 和 AMD+A 的对比实验结果可以看出：3 个 HSI 数据集在两组实验中的 OA、AA、 Kappa 值区别不大，分类结果图也无明显差别，然而两个数据集在 AMD+A 实验中用到的训练样本总数比 AMD 实验中分别减少了 10.2%、17.1%，耗时仅增加了 3.49 s、24.92 s。Indian Pines 数据集的 AMD 和 AMD+B 实验迭代过程中的分类结果如表 4 所示。Salinas 数据集的 AMD 和 AMD+B 实验迭代过程中的分类结果如表 5 所示。表 4 Indian Pines 数据集的 AMD+B 与 AMD 的实验结果 Table 4 Experimental results of AMD+B and AMD in the Indian Pines dataset 序号实验迭代次数 OA Kappa AA 训练样本数 1 AMD 5 0.8356 0.812 5 0.880 7 153 AMD+B 0.8338 0.810 4 0.873 7 148 2 AMD 10 0.8944 0.879 0 0.908 4 179 AMD+B 0.8939 0.878 4 0.906 5 172 3 AMD 15 0.9423 0.934 2 0.947 8 217 AMD+B 0.9420 0.933 9 0.948 2 202 4 AMD 20 0.9614 0.956 0 0.963 8 268 AMD+B 0.9645 0.959 5 0.962 8 246 表 5 Salinas 数据集的 AMD+B 与 AMD 的实验结果 Table 5 Experimental results of AMD+B and AMD in the Salinas dataset 序号实验迭代次数 OA Kappa AA 训练样本数 1 AMD 5 0.8857 0.8734 0.947 6 113 AMD+B 0.8945 0.8831 0.951 3 100 2 AMD 10 0.9304 0.9227 0.953 0 162 AMD+B 0.9224 0.9137 0.947 8 125 3 AMD 15 0.9497 0.9441 0.969 4 182 AMD+B 0.9449 0.9387 0.964 0 138 4 AMD 20 0.9598 0.9553 0.981 9 204 AMD+B 0.9524 0.9470 0.978 0 152 从表 4、5 中可以看出：无论迭代次数是多少，通过基于预测标签一致的去冗余算法改进后得到的实验精度基本不变，而训练样本数量均有不同程度的减少。两个数据集在 AMD 和 AMD+B 实验中得到的最终分类结果如表 6 所示，分类结果对比图如图 7、8 所示。表 6 AMD+B 与 AMD 实验的最终结果 Table 6 Final results of AMD+B and AMD experiments 数据集实验 OA Kappa AA 训练样本数耗时/s Indian Pines AMD 0.961 4 0.956 0 0.963 8 268 41.96 AMD+B 0.964 5 0.959 5 0.962 8 246 42.84 Salinas AMD 0.959 8 0.955 3 0.981 9 204 309.34 AMD+B 0.952 4 0.947 0 0.978 0 152 323.68 ·1012· 智能系统学报第 16 卷

第6期陈立伟，等：多视图主动学习的多样性样本选择方法研究 ·1013· ing hyperspectral imaging and multivariate spectral ana lysis[J].Spectroscopy letters,2020,53(2):76-85. [2]张晓玲，张培强，沈兰荪.基于信息量失真测度的 VQ及在高光谱图像无损压缩中的应用[).遥感学报， 2004,8(5):414-418. ZHANG Xiaoling,ZHANG Peiqiang,SHEN Lansun.A (a)AMD (b)AMD+B VO based on information distortion measure and its ap- 图7用方法B改进前后的实验结果分析(Indian Pines) plication to lossless compression of hyperspectral Fig.7 Comparison of experimental results before and image[J].Journal of remote sensing,2004,8(5):414-418. after improvement with method B(Indian Pines) [3] WANG Meng,HUA Xiansheng.Active learning in multi- media annotation and retrieval:a survey[J].ACM transac- tions on intelligent systems and technology,2011,2(2):10. [4]TU Bing.KUANG Wenlan,ZHAO Guangzhe,et al.Hy- perspectral image classification by combining local bin- ary pattern and joint sparse representation[J.Internation- al journal of remote sensing,2019,40(24):9484-9500. [5]YANG Jihai,LI Shijun,XU Wenning.Active learning for (a)AMD (b)AMD+B visual image classification method based on transfer 图8用方法B改进前后的实验结果分析(Salinas) learning[J].IEEE access,2017,6:187-198 Fig.8 Comparison of experimental results before and [6]LIN Jianzhe,ZHAO Liang,LI Shuying,et al.Active- after improvement with method B(Salinas) learning-incorporated deep transfer learning for hyper- 由AMD和AMD+B的对比实验结果可以看 spectral image classification[J].IEEE journal of selected 出：3个HSI数据集在两组实验中的OA、AA、 topics in applied earth observations and remote sensing, Kappa值区别不大，分类结果图也无明显差别，然 2018,11(11)少：4048-4062. 而两个数据集在AMD+B实验中用到的训练样本 [7刀]赵忠明，高连如，陈东，等卫星遥感及图像处理平台发总数比AMD实验中分别减少了8.2%、25.4%。展J.中国图象图形学报，2019,2412少：2098-2110. AMD+B比AMD实验的耗时增加0.88s、14.34s。 ZHAO Zhongming,GAO Lianru,CHEN Dong,et al.De- 通过观察以上实验结果可以看出，AMD+A velopment of satellite remote sensing and image pro- 方法和AMD+B方法相对于传统AMD方法具有 cessing platform[J].Journal of image and graphics,2019, 明显优势。从实验结果来看，将本文提出的两种 2412:2098-2110 样本多样性选择方法用在传统AMD样本选择方 [8]程圆娥，周绍光，袁春琦，等.基于主动深度学习的高光法后，OA、AA、Kappa及分类结果图均无明显变谱影像分类.计算机工程与应用，2017,53(17)：192 化，训练样本数量均有不同程度的减少。使用这 196,248 两种改进方法虽然会少量地增加耗时，但增加的 CHENG Yuan'e,ZHOU Shaoguang,YUAN Chunqi,et al. 时间成本与节省的人工标记成本相比可以忽略不计。 Hyperspectral image classification based on active deep learning[J].Computer engineering and applications,2017, 4结束语 53(17):192-196,248. [9]吴超.高光谱图像处理若干关键技术研究D1.南京：南本文基于SLIC超像素分割方法和各视图预京航空航天大学，2012 测结果的一致性，提了出2种MVAL多样性样本 WU Chao.Research on some key technologies of hyper- 选择方法，有效地解决了传统MVAL样本选择过 spectral image processing[D].Nanjing:Nanjing Uni- 程存在冗余样本的问题。在2组HSI中进行实验， versity of Aeronautics and Astronautics,2012 验证了这两种方法能够有效地去除传统样本选择 [10]JAMSHIDPOUR N.SAFARI A,HOMAYOUNI S 过程中的冗余样本，在分类精度不变的前提下， Multiview active learning optimization based on genetic 减少训练样本总数，进而减少人工标记成本。 algorithm and Gaussian mixture models for hyperspec- 参考文献 tral data[J].IEEE geoscience and remote sensing letters, 2020,171):172-176. [1]LU Xiaohui,XIA Zhengyan,QU Fangfang,et al.Identi- [11]DI Wei,CRAWFORD MM.View generation for mul- fication of authenticity,quality and origin of saffron us- tiview maximum disagreement based active learning for

(a) AMD (b) AMD+B 图 7 用方法 B 改进前后的实验结果分析 (Indian Pines) Fig. 7 Comparison of experimental results before and after improvement with method B (Indian Pines) (a) AMD (b) AMD+B 图 8 用方法 B 改进前后的实验结果分析 (Salinas) Fig. 8 Comparison of experimental results before and after improvement with method B (Salinas) 由 AMD 和 AMD+B 的对比实验结果可以看出：3 个 HSI 数据集在两组实验中的 OA、AA、 Kappa 值区别不大，分类结果图也无明显差别，然而两个数据集在 AMD+B 实验中用到的训练样本总数比 AMD 实验中分别减少了 8.2%、25.4%。 AMD+B 比 AMD 实验的耗时增加 0.88 s、14.34 s。通过观察以上实验结果可以看出，AMD+A 方法和 AMD+B 方法相对于传统 AMD 方法具有明显优势。从实验结果来看，将本文提出的两种样本多样性选择方法用在传统 AMD 样本选择方法后，OA、AA、Kappa 及分类结果图均无明显变化，训练样本数量均有不同程度的减少。使用这两种改进方法虽然会少量地增加耗时，但增加的时间成本与节省的人工标记成本相比可以忽略不计。 4 结束语本文基于 SLIC 超像素分割方法和各视图预测结果的一致性，提了出 2 种 MVAL 多样性样本选择方法，有效地解决了传统 MVAL 样本选择过程存在冗余样本的问题。在 2 组 HSI 中进行实验，验证了这两种方法能够有效地去除传统样本选择过程中的冗余样本，在分类精度不变的前提下，减少训练样本总数，进而减少人工标记成本。参考文献： LU Xiaohui, XIA Zhengyan, QU Fangfang, et al. Identification of authenticity, quality and origin of saffron us- [1] ing hyperspectral imaging and multivariate spectral analysis[J]. Spectroscopy letters, 2020, 53(2): 76–85. 张晓玲, 张培强, 沈兰荪. 基于信息量失真测度的 VQ 及在高光谱图像无损压缩中的应用 [J]. 遥感学报, 2004, 8(5): 414–418. ZHANG Xiaoling, ZHANG Peiqiang, SHEN Lansun. A VQ based on information distortion measure and its application to lossless compression of hyperspectral image[J]. Journal of remote sensing, 2004, 8(5): 414–418. [2] WANG Meng, HUA Xiansheng. Active learning in multimedia annotation and retrieval: a survey[J]. ACM transactions on intelligent systems and technology, 2011, 2(2): 10. [3] TU Bing, KUANG Wenlan, ZHAO Guangzhe, et al. Hyperspectral image classification by combining local binary pattern and joint sparse representation[J]. International journal of remote sensing, 2019, 40(24): 9484–9500. [4] YANG Jihai, LI Shijun, XU Wenning. Active learning for visual image classification method based on transfer learning[J]. IEEE access, 2017, 6: 187–198. [5] LIN Jianzhe, ZHAO Liang, LI Shuying, et al. Activelearning-incorporated deep transfer learning for hyperspectral image classification[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2018, 11(11): 4048–4062. [6] 赵忠明, 高连如, 陈东, 等. 卫星遥感及图像处理平台发展 [J]. 中国图象图形学报, 2019, 24(12): 2098–2110. ZHAO Zhongming, GAO Lianru, CHEN Dong, et al. Development of satellite remote sensing and image processing platform[J]. Journal of image and graphics, 2019, 24(12): 2098–2110. [7] 程圆娥, 周绍光, 袁春琦, 等. 基于主动深度学习的高光谱影像分类 [J]. 计算机工程与应用, 2017, 53(17): 192– 196, 248. CHENG Yuan’e, ZHOU Shaoguang, YUAN Chunqi, et al. Hyperspectral image classification based on active deep learning[J]. Computer engineering and applications, 2017, 53(17): 192–196, 248. [8] 吴超. 高光谱图像处理若干关键技术研究 [D]. 南京: 南京航空航天大学, 2012. WU Chao. Research on some key technologies of hyperspectral image processing[D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2012. [9] JAMSHIDPOUR N, SAFARI A, HOMAYOUNI S. Multiview active learning optimization based on genetic algorithm and Gaussian mixture models for hyperspectral data[J]. IEEE geoscience and remote sensing letters, 2020, 17(1): 172–176. [10] DI Wei, CRAWFORD M M. View generation for multiview maximum disagreement based active learning for [11] 第 6 期陈立伟，等：多视图主动学习的多样性样本选择方法研究 ·1013·

·1014· 智能系统学报第16卷 hyperspectral image classification[].IEEE transactions [20]SUN Shiliang.A survey of multi-view machine learn- on geoscience and remote sensing,2012,50(5):1942- ing[J].Neural computing and applications,2013, 1954 23(7/8):2031-2038. [12]DI Wei.CRAWFORD MM.Multi-view adaptive dis- [21]ZHAO Jing,XIE Xijiong,XU Xin,et al.Multi-view agreement based active learning for hyperspectral image learning overview:recent progress and new challenges classification[Cl//2010 IEEE International Geoscience [J].Information fusion,2017,38:43-54. and Remote Sensing Symposium.Honolulu,USA,2010: [22]HE Lin,LI Jun,PLAZA A,et al.Discriminative low- 1374-1377 rank Gabor filtering for spectral-spatial hyperspectral [13]甘继生.基于广义组合核的高光谱图像GPU并行分 image classification[J].IEEE transactions on geoscience 类D1.南京：南京理工大学，2018 and remote sensing,2017,55(3):1381-1395. GAN Jisheng.Hyperspectral Image GPU parallel classi- [23]段无悔.基于超像素的高光谱图像分类算法研究D]. fication based on generalized composite cores[D]. 长沙：湖南大学，2015：1-64 Nanjing:Nanjing University of Science and Technology, DUAN Wuhui.Researches on hyperspectral image clas- 2012. sification algorithms based on superpixel[D].Changsha: [14]HU Jie,HE Zhi,LI Jun,et al.3D-gabor inspired mul- Hunan University,2015:1-64. tiview active learning for spectral-spatial hyperspectral [24]PATRA S.BHARDWAJ K.BRUZZONE L.A spectral- image classification[J].Remote sensing,2018,10(7): spatial multicriteria active learning technique for hyper- 1-24 spectral image classification[J].IEEE journal of selec- [15]XU Xiang,LI Jun,LI Shutao.Multiview intensity-based ted topics in applied earth observations and remote sens- active learning for hyperspectral image classification ing.2017,10(12):5213-5227. []IEEE transactions on geoscience and remote sensing, [25]BIOUCASDIAS B J,FIGUEIREDO M.Logistic regres- 2018.56(2):669-680 sion via variable splitting and augmented lagrangian [16]魏飞鸣，李小文，顾行发，等.基于形状参数的遥感图 tools[R].Instituto Superior Tecnico,TULisbon,2009. 像“同谱异物”目标区分[CW第十四届全国图象图形作者简介：学学术会议论文集.福州，中国.2008：477-481 陈立伟，副教授，博土，中国图像 WEI Feiming,LI Xiaowen,GU Xingfa,et al.Shape- 图形学会会员，黑龙江省生物医学工 based classification of"Spectral Similar"objects in re- 程学会会员，主要研究方向为人工智 mote sensing image processing[C]//Proceedings of the 能、深度学习、图像的分割、特征提取 14th National Conference on Image Graphics.Fuzhou, 分类识别以及理解。主持省市级科研 China,2008:477-481. 项目3项，参与国家级项目5项。获授权发明专利5项，发表学术论文 [17刀王立国，魏芳洁.结合APO算法的高光谱图像波段选 40余篇。择U.哈尔滨工业大学学报，2013,45(9)：100-106. WANG Liguo,WEI Fangjie.Artificial physics optimiza- 房赫，硕士研究生，主要研究方向 tion algorithm combined band selection for hyperspec- 为高光谱图像分类技术。 tral imagery[J].Journal of Harbin Institute of Techno- 1ogy,2013,45(9):100-106. [18]王阳.基于超像素的图像分割算法研究D1.兰州：兰州理工大学，2018：1-57. WANG Yang.Research on image segmentation al- gorithm based on superpixel[D].Lanzhou:Lanzhou Uni- 朱海峰，讲师，主要研究方向为人工智能、高光谱图像处理。 versity of Technology,2018:1-57. [19]LIU Peng,HUANG Jiwei,ZHANG Shiwu,et al.Mul- tiview hyperspectral topography of tissue structural and functional characteristics[J].Journal of biomedical op- tics,2016,21(1):1-12

hyperspectral image classification[J]. IEEE transactions on geoscience and remote sensing, 2012, 50(5): 1942– 1954. DI Wei, CRAWFORD M M. Multi-view adaptive disagreement based active learning for hyperspectral image classification[C]//2010 IEEE International Geoscience and Remote Sensing Symposium. Honolulu, USA, 2010: 1374−1377. [12] 甘继生. 基于广义组合核的高光谱图像 GPU 并行分类 [D]. 南京: 南京理工大学, 2018. GAN Jisheng. Hyperspectral Image GPU parallel classification based on generalized composite cores[D]. Nanjing: Nanjing University of Science and Technology, 2012. [13] HU Jie, HE Zhi, LI Jun, et al. 3D-gabor inspired multiview active learning for spectral-spatial hyperspectral image classification[J]. Remote sensing, 2018, 10(7): 1–24. [14] XU Xiang, LI Jun, LI Shutao. Multiview intensity-based active learning for hyperspectral image classification [J]. IEEE transactions on geoscience and remote sensing, 2018, 56(2): 669–680. [15] 魏飞鸣, 李小文, 顾行发, 等. 基于形状参数的遥感图像“同谱异物”目标区分 [C]//第十四届全国图象图形学学术会议论文集. 福州, 中国, 2008: 477−481. WEI Feiming, LI Xiaowen, GU Xingfa, et al. Shapebased classification of “Spectral Similar” objects in remote sensing image processing[C]//Proceedings of the 14th National Conference on Image Graphics. Fuzhou, China, 2008: 477−481. [16] 王立国, 魏芳洁. 结合 APO 算法的高光谱图像波段选择 [J]. 哈尔滨工业大学学报, 2013, 45(9): 100–106. WANG Liguo, WEI Fangjie. Artificial physics optimization algorithm combined band selection for hyperspectral imagery[J]. Journal of Harbin Institute of Technology, 2013, 45(9): 100–106. [17] 王阳. 基于超像素的图像分割算法研究 [D]. 兰州: 兰州理工大学, 2018: 1−57. WANG Yang. Research on image segmentation algorithm based on superpixel[D]. Lanzhou: Lanzhou University of Technology, 2018: 1−57. [18] LIU Peng, HUANG Jiwei, ZHANG Shiwu, et al. Multiview hyperspectral topography of tissue structural and functional characteristics[J]. Journal of biomedical optics, 2016, 21(1): 1–12. [19] SUN Shiliang. A survey of multi-view machine learning[J]. Neural computing and applications, 2013, 23(7/8): 2031–2038. [20] ZHAO Jing, XIE Xijiong, XU Xin, et al. Multi-view learning overview: recent progress and new challenges [J]. Information fusion, 2017, 38: 43–54. [21] HE Lin, LI Jun, PLAZA A, et al. Discriminative lowrank Gabor filtering for spectral–spatial hyperspectral image classification[J]. IEEE transactions on geoscience and remote sensing, 2017, 55(3): 1381–1395. [22] 段无悔. 基于超像素的高光谱图像分类算法研究 [D]. 长沙: 湖南大学, 2015: 1−64. DUAN Wuhui. Researches on hyperspectral image classification algorithms based on superpixel[D]. Changsha: Hunan University, 2015: 1−64. [23] PATRA S, BHARDWAJ K, BRUZZONE L. A spectralspatial multicriteria active learning technique for hyperspectral image classification[J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2017, 10(12): 5213–5227. [24] BIOUCASDIAS B J, FIGUEIREDO M. Logistic regression via variable splitting and augmented lagrangian tools[R]. Instituto Superior Técnico, TULisbon, 2009. [25] 作者简介：陈立伟，副教授，博士，中国图像图形学会会员，黑龙江省生物医学工程学会会员，主要研究方向为人工智能、深度学习、图像的分割、特征提取、分类识别以及理解。主持省市级科研项目 3 项，参与国家级项目 5 项。获授权发明专利 5 项，发表学术论文 40 余篇。房赫，硕士研究生，主要研究方向为高光谱图像分类技术。朱海峰，讲师，主要研究方向为人工智能、高光谱图像处理。 ·1014· 智能系统学报第 16 卷

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录