令属性矢量 Z = H ×y ×z + S ×_中国高校课件下载中心

正在加载图片...

第2期李海峰，等：基于颜色特征的图像分类技术研究 ·157· 令属性矢量Z=HXyX:+SX:+V作为特征定如下：随机森林算法中，最大深度取10，森林中树矢量，由此可得Z∈0，xXyX:-1],得到一维直方的最大数取100，森林最小精度取0.01. 图，然后进行归一化，作为分类的颜色属性.对照在Boosting算法中，采用决策树算法作为弱分 HSV色表，发现当亮度1，饱和度S区分不是很明类器，弱分类器个数设置为100.随着集合中树的数显，而对于色调H属性肉眼比较容易分辨出不同，量的增加和信任度的增加，大部分的训练数据被正因此试验中将1、S分量都均匀地分为3份，而对于确分类，这些样本的权重不断的降低.具有较低相关 H分量可均匀地分为10份.试验表明使用HSV空权重的样本对弱分类器的训练有较低的影响，因此间较RGB空间有更好的分类能力这些样本会在训练分类器时被排除在外，而不对分 2.3考虑位置的颜色属性类器造成较大影响.在算法实现中，样本系数小于前面2种直方图颜色属性都没有考虑颜色在画 0.05时被排除.在使用灰度颜色直方图实验中，使面中的位置，而颜色在图片中的位置对于人类识别用灰度的256个分量作为属性.对这些分量按照图一个图像起着非常重要的作用，例如画面中心的内像大小进行归一化，每幅图像共由256个属性描述容一般比画面边缘的内容更加重要.汽车图像和花实验结果如表1所示朵的图像的背景可能都是大片的蓝天，这时直接使表1基于灰度颜色直方图颜色属性的学习结果用全局的颜色属性就不容易区分出这是花朵图片还 Table 1 Color attribute results based on gray histogram 是汽车图像，而且容易出现过度拟合现象.如果这时样本集测试集考虑颜色在图像中的分布，就可以提高中心位置颜图片集样本集测试集合符合合正确色属性的权重，从而达到更好的图像分类效果.本文算法合数量合正确合正确数量数量采用一种考虑颜色位置的简单颜色属性，首先将图 /例率/% 率/% /例 /例片分成xXy个等大的矩形小图片，即横向均匀分 Random 为x份，纵向均匀分为y份.为每个小图像进行编 1861 507 54.5 472 50.7 Forest ai … Boosting 1861 930 100.0 559 60.1 号，形成一个矩阵 MLP 1861 927 99.7 429 461 对每个矩形小图像统计RGB各个分量以及灰可以看出测试集合正确率不高，由于使用的属度分量的和，然后根据小图像大小归一化得到4个性比较多，处理速度也比较慢.这说明基于RGB颜标量，将这些标量依次排列起来作为该图像的颜色色统计的属性作为图像分类属性区分能力不高.在属性，共4×x×y个，然后依据这些属性对图像进 HSV颜色直方图实验中，参数设定为x=10,y=3, 行分类.在实验中取x=y=3,即将图像分为9张矩 :=3,即每张图像由90个属性描述，实验结果如表形图片.试验表明仅简单地将图像分为9块，就可以 2所示明显地提高基于颜色的分类质量，表2基于HSV颜色直方图颜色属性的学习结果 3实验结果及分析 Table 2 Color attribute learning results 3.1图像库 based on HSV color histogram 采用百度图像搜索引擎搜索了关于建筑物、汽样本集测试集图片集样本集测试集车和花朵3类图像，进行人工筛选，剔除不符合所在合符合合正确算法合数量合正确合正确主题的图片，得到544张建筑物图像、913张汽车图数量数量 /例率1% 率/% /例 /例像、404张花朵的图像作为实验的图像库， 3.2实验环境 Random 1861 881 94.7 697 74.9 程序采用Microsoft Visual Studio2005集成开 Forest 发环境，使用C++语言进行编写.测试机器是一台 Boosting 1861 930 100.0 693 74.5 使用AMD28O0+CPU和1GB内存的PC机，操 MLP 1861 930 100.0 606 65.1 作系统使用Windows XP SP2 3.3实验参数及结果分析由结果可知使用HSV颜色直方图的方式明显在测试3类基于颜色属性的实验中，采用如下优于RGB颜色直方图的方式，MLP算法出现了一方法处理图片：将所有图片中的50%的图像作为训定程度上的过度拟合现象.考虑位置时实验中参数练样本集，使用另外50%作为测试集.算法参数设 x=3,即每幅图像分为9个小图像，最后每幅图像 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net令属性矢量 Z = H ×y ×z + S ×z + V 作为特征矢量 ,由此可得 Z∈[0 , x ×y ×z - 1 ] ,得到一维直方图 ,然后进行归一化 , 作为分类的颜色属性. 对照 HSV 色表 ,发现当亮度 I ,饱和度 S 区分不是很明显 ,而对于色调 H 属性肉眼比较容易分辨出不同 , 因此试验中将 I、S 分量都均匀地分为 3 份 ,而对于 H 分量可均匀地分为 10 份. 试验表明使用 HSV 空间较 R GB 空间有更好的分类能力. 213 考虑位置的颜色属性前面 2 种直方图颜色属性都没有考虑颜色在画面中的位置 ,而颜色在图片中的位置对于人类识别一个图像起着非常重要的作用 ,例如画面中心的内容一般比画面边缘的内容更加重要. 汽车图像和花朵的图像的背景可能都是大片的蓝天 ,这时直接使用全局的颜色属性就不容易区分出这是花朵图片还是汽车图像 ,而且容易出现过度拟合现象. 如果这时考虑颜色在图像中的分布 ,就可以提高中心位置颜色属性的权重 ,从而达到更好的图像分类效果. 本文采用一种考虑颜色位置的简单颜色属性 ,首先将图片分成 x ×y 个等大的矩形小图片 ,即横向均匀分为 x 份 ,纵向均匀分为 y 份. 为每个小图像进行编号 ,形成一个矩阵 a11 … a1 x … ω … ay1 … ayx . 对每个矩形小图像统计 RGB 各个分量以及灰度分量的和 ,然后根据小图像大小归一化得到 4 个标量 ,将这些标量依次排列起来作为该图像的颜色属性 ,共 4 ×x ×y 个 ,然后依据这些属性对图像进行分类. 在实验中取 x = y = 3 ,即将图像分为 9 张矩形图片. 试验表明仅简单地将图像分为 9 块 ,就可以明显地提高基于颜色的分类质量. 3 实验结果及分析 311 图像库采用百度图像搜索引擎搜索了关于建筑物、汽车和花朵 3 类图像 ,进行人工筛选 ,剔除不符合所在主题的图片 ,得到 544 张建筑物图像、913 张汽车图像、404 张花朵的图像作为实验的图像库. 312 实验环境程序采用 Microsoft Visual St udio 2005 集成开发环境 ,使用 C + + 语言进行编写. 测试机器是一台使用 AMD 2800 + CPU 和 1 GB 内存的 PC 机 ,操作系统使用 Windows XP SP2. 313 实验参数及结果分析在测试 3 类基于颜色属性的实验中 ,采用如下方法处理图片 :将所有图片中的 50 %的图像作为训练样本集 ,使用另外 50 %作为测试集. 算法参数设定如下 :随机森林算法中 ,最大深度取 10 ,森林中树的最大数取 100 ,森林最小精度取 0101. 在 Boosting 算法中 ,采用决策树算法作为弱分类器 ,弱分类器个数设置为 100. 随着集合中树的数量的增加和信任度的增加 ,大部分的训练数据被正确分类 ,这些样本的权重不断的降低. 具有较低相关权重的样本对弱分类器的训练有较低的影响 ,因此这些样本会在训练分类器时被排除在外 ,而不对分类器造成较大影响. 在算法实现中 ,样本系数小于 0105 时被排除. 在使用灰度颜色直方图实验中 ,使用灰度的 256 个分量作为属性. 对这些分量按照图像大小进行归一化 ,每幅图像共由 256 个属性描述. 实验结果如表 1 所示. 表 1 基于灰度颜色直方图颜色属性的学习结果 Table 1 Color attribute results based on gray histogram 算法图片集合数量 / 例样本集合符合数量 / 例样本集合正确率 / % 测试集合正确数量 / 例测试集合正确率 / % Random Forest 1 861 507 5415 472 5017 Boosting 1 861 930 10010 559 6011 ML P 1 861 927 9917 429 4611 可以看出测试集合正确率不高 ,由于使用的属性比较多 ,处理速度也比较慢. 这说明基于 R GB 颜色统计的属性作为图像分类属性区分能力不高. 在 HSV 颜色直方图实验中 ,参数设定为 x = 10 , y = 3 , z = 3 ,即每张图像由 90 个属性描述 ,实验结果如表 2 所示. 表 2 基于 HSV颜色直方图颜色属性的学习结果 Table 2 Color attribute learning results based on HSV color histogram 算法图片集合数量 / 例样本集合符合数量 / 例样本集合正确率 / % 测试集合正确数量 / 例测试集合正确率 / % Random Forest 1 861 881 9417 697 7419 Boosting 1 861 930 10010 693 7415 ML P 1 861 930 10010 606 6511 由结果可知使用 HSV 颜色直方图的方式明显优于 RGB 颜色直方图的方式 ,ML P 算法出现了一定程度上的过度拟合现象. 考虑位置时实验中参数 x = 3 ,即每幅图像分为 9 个小图像 ,最后每幅图像第 2 期李海峰 ,等 :基于颜色特征的图像分类技术研究 · 751 ·

<<向上翻页向下翻页>>

点击下载：人工智能基础：颜色特征的图像分类技术研究