第4期 李欢,等:支持向量机的多观测样本二分类算法 .397. 随机实验的均值,如图2所示。 3)KMSMIs](kernel mutual subspace method): 1[ KMSM是MSM在非线性空间的扩展,该方法考虑了 图像集的非线性。与MSM不同的是,在用线性子空 间建模之前,KMSM需要先把图像样本非线性地映 射到高维特征空间。也就是说,KMSM用KPCA来 取代PCA,从而获得了数据的非线性。KMSM方法 …0 中,使用高斯核函数k(x,y)=exp(- 父以渊计古古门 ‖x-y‖2/2σ2),其中σ的选取与本文所提的算 (a)在Binary数据库上的平均识别率 法相同。 实验选用ETH-80物体识别数据库,ETH-80含 有8个种类的图像:苹果、车子、牛、杯子、狗、马、梨 和西红柿(如图3(a)所示)。每个种类又含有10个 物体类(例如,狗有10个不同的品种),每个物体类 中包含该物体不同角度的41张图像,例如图3(b) 93 ·0 显示了狗这一种类中一个物体类的所有图像。数据 :以w计士古门 库中的所有图像大小为128×128,为了简化计算,对 (b)在USPS数据库上的平均识别率 图像重新采样,使其大小为32×32。 图2在2种手写数字数据库上的识别率 Fig.2 Classification results measured on two different handwritten digit data sets 从实验结果可以看出本文SVM算法在Binary 数据库和USPS数据库上的识别率很高,尤其在 USPS数据库上,当样本不少于10时识别率为 100%,这就说明基于SVM的多观测样本二分类算 法的可行性。分析数据可得:算法的识别率随着多 观测样本数目的增大而提高,因为增加多观测样本 的数目能提供更多的某特定类别的信息,从而更加 准确地判断类别。 3.2物体图像分类 (a)ETH-80 下面在物体图像数据库上验证基于SVM的多 观测样本二分类算法的有效性,实验中同一物体的 不同观测图像作为此类物体的多观测样本。并将本 文算法与经典的多观测样本分类算法进行对比: I)KLD2(KL-divergence):该方法是典型的基 于密度估计的统计方法,把所有样本集看作是独立 同分布的高斯随机变量,然后通过计算样本集间KL 散度完成多观测样本的分类。实验中,协方差矩阵 特征向量的长度按能量的96%来选取。 2)MSMo(mutual subspace method):MSM是典 型的子空间方法,该方法中的每个图像集用子空间 来表示,而子空间通过主成分即协方差矩阵获得,把 (b)ETH-80中一个物体类的41张图片 训练集与测试集之间的主成分角)]作为相似性度 图3ETH80数据库的样本图像 量。实验中,当样本数目小于9时候,协方差矩阵的 Fig.3 Sample images from the ETH-80 database 特征向量长度等于样本数目,否则设为9。随机实验的均值袁如图 圆 所示遥 渊葬冤 在 月蚤灶葬则赠 数据库上的平均识别率 渊遭冤 在 哉杂孕杂 数据库上的平均识别率 图 圆摇 在 圆 种手写数字数据库上的识别率 云蚤早援圆摇 悦造葬泽泽蚤枣蚤糟葬贼蚤燥灶 则藻泽怎造贼泽 皂藻葬泽怎则藻凿 燥灶 贼憎燥 凿蚤枣枣藻则藻灶贼 澡葬灶凿憎则蚤贼贼藻灶 凿蚤早蚤贼 凿葬贼葬 泽藻贼泽 摇 摇 从实验结果可以看出本文 杂灾酝 算法在 月蚤灶葬则赠 数据库和 哉杂孕杂 数据库上的识别率很高袁尤其在 哉杂孕杂 数据库上袁 当样本不少于 员园 时识别率为 员园园豫袁这就说明基于 杂灾酝 的多观测样本二分类算 法的可行性遥 分析数据可得院算法的识别率随着多 观测样本数目的增大而提高袁因为增加多观测样本 的数目能提供更多的某特定类别的信息袁从而更加 准确地判断类别遥 猿援圆摇 物体图像分类 下面在物体图像数据库上验证基于 杂灾酝 的多 观测样本二分类算法的有效性袁实验中同一物体的 不同观测图像作为此类物体的多观测样本遥 并将本 文算法与经典的多观测样本分类算法进行对比院 员冤运蕴阅咱圆暂 渊 运蕴鄄凿蚤增藻则早藻灶糟藻冤 院该方法是典型的基 于密度估计的统计方法袁把所有样本集看作是独立 同分布的高斯随机变量袁然后通过计算样本集间 运蕴 散度完成多观测样本的分类遥 实验中袁协方差矩阵 特征向量的长度按能量的 怨远豫来选取遥 圆冤酝杂酝咱远暂渊皂怎贼怎葬造 泽怎遭泽责葬糟藻 皂藻贼澡燥凿冤 院酝杂酝 是典 型的子空间方法袁该方法中的每个图像集用子空间 来表示袁而子空间通过主成分即协方差矩阵获得袁把 训练集与测试集之间的主成分角咱员苑暂 作为相似性度 量遥 实验中袁当样本数目小于 怨 时候袁协方差矩阵的 特征向量长度等于样本数目袁否则设为 怨遥 猿冤 运酝杂酝咱愿暂 渊 噪藻则灶藻造 皂怎贼怎葬造 泽怎遭泽责葬糟藻 皂藻贼澡燥凿 冤 院 运酝杂酝 是 酝杂酝 在非线性空间的扩展袁该方法考虑了 图像集的非线性遥 与 酝杂酝 不同的是袁在用线性子空 间建模之前袁运酝杂酝 需要先把图像样本非线性地映 射到高维特征空间遥 也就是说袁运酝杂酝 用 运孕悦粤 来 取代 孕悦粤袁从而获得了数据的非线性遥 运酝杂酝 方法 中袁 使用高斯核函数 噪 曾 袁赠 越 藻曾责渊 原 椰曾 原 赠椰圆 辕 圆滓圆 冤 袁其中 滓 的选取与本文所提的算 法相同遥 实验选用 耘栽匀鄄愿园 物体识别数据库袁耘栽匀鄄愿园 含 有 愿 个种类的图像院苹果尧车子尧牛尧杯子尧狗尧马尧梨 和西红柿渊如图 猿渊葬冤所示冤 遥 每个种类又含有 员园 个 物体类渊例如袁狗有 员园 个不同的品种冤 袁每个物体类 中包含该物体不同角度的 源员 张图像袁例如图 猿渊遭冤 显示了狗这一种类中一个物体类的所有图像遥 数据 库中的所有图像大小为 员圆愿伊员圆愿袁为了简化计算袁对 图像重新采样袁使其大小为 猿圆伊猿圆遥 渊葬冤耘栽匀鄄愿园 渊 遭冤耘栽匀鄄愿园 中一个物体类的 源员 张图片 图 猿摇 耘栽匀鄄愿园 数据库的样本图像 云蚤早援猿摇 杂葬皂责造藻 蚤皂葬早藻泽 枣则燥皂 贼澡藻 耘栽匀原愿园 凿葬贼葬遭葬泽藻 第 源 期摇摇摇摇摇摇摇摇摇摇摇摇摇摇 李欢袁等院 支持向量机的多观测样本二分类算法 窑猿怨苑窑