正在加载图片...
第2期 李海峰,等:基于颜色特征的图像分类技术研究 ·157· 令属性矢量Z=HXyX:+SX:+V作为特征 定如下:随机森林算法中,最大深度取10,森林中树 矢量,由此可得Z∈0,xXyX:-1],得到一维直方 的最大数取100,森林最小精度取0.01. 图,然后进行归一化,作为分类的颜色属性.对照 在Boosting算法中,采用决策树算法作为弱分 HSV色表,发现当亮度1,饱和度S区分不是很明 类器,弱分类器个数设置为100.随着集合中树的数 显,而对于色调H属性肉眼比较容易分辨出不同, 量的增加和信任度的增加,大部分的训练数据被正 因此试验中将1、S分量都均匀地分为3份,而对于 确分类,这些样本的权重不断的降低.具有较低相关 H分量可均匀地分为10份.试验表明使用HSV空 权重的样本对弱分类器的训练有较低的影响,因此 间较RGB空间有更好的分类能力 这些样本会在训练分类器时被排除在外,而不对分 2.3考虑位置的颜色属性 类器造成较大影响.在算法实现中,样本系数小于 前面2种直方图颜色属性都没有考虑颜色在画 0.05时被排除.在使用灰度颜色直方图实验中,使 面中的位置,而颜色在图片中的位置对于人类识别 用灰度的256个分量作为属性.对这些分量按照图 一个图像起着非常重要的作用,例如画面中心的内 像大小进行归一化,每幅图像共由256个属性描述 容一般比画面边缘的内容更加重要.汽车图像和花 实验结果如表1所示 朵的图像的背景可能都是大片的蓝天,这时直接使 表1基于灰度颜色直方图颜色属性的学习结果 用全局的颜色属性就不容易区分出这是花朵图片还 Table 1 Color attribute results based on gray histogram 是汽车图像,而且容易出现过度拟合现象.如果这时 样本集 测试集 考虑颜色在图像中的分布,就可以提高中心位置颜 图片集 样本集 测试集 合符合 合正确 色属性的权重,从而达到更好的图像分类效果.本文 算法 合数量 合正确 合正确 数量 数量 采用一种考虑颜色位置的简单颜色属性,首先将图 /例 率/% 率/% /例 /例 片分成xXy个等大的矩形小图片,即横向均匀分 Random 为x份,纵向均匀分为y份.为每个小图像进行编 1861 507 54.5 472 50.7 Forest ai … Boosting 1861 930 100.0 559 60.1 号,形成一个矩阵 MLP 1861 927 99.7 429 461 对每个矩形小图像统计RGB各个分量以及灰 可以看出测试集合正确率不高,由于使用的属 度分量的和,然后根据小图像大小归一化得到4个 性比较多,处理速度也比较慢.这说明基于RGB颜 标量,将这些标量依次排列起来作为该图像的颜色 色统计的属性作为图像分类属性区分能力不高.在 属性,共4×x×y个,然后依据这些属性对图像进 HSV颜色直方图实验中,参数设定为x=10,y=3, 行分类.在实验中取x=y=3,即将图像分为9张矩 :=3,即每张图像由90个属性描述,实验结果如表 形图片.试验表明仅简单地将图像分为9块,就可以 2所示 明显地提高基于颜色的分类质量, 表2基于HSV颜色直方图颜色属性的学习结果 3实验结果及分析 Table 2 Color attribute learning results 3.1图像库 based on HSV color histogram 采用百度图像搜索引擎搜索了关于建筑物、汽 样本集 测试集 图片集 样本集 测试集 车和花朵3类图像,进行人工筛选,剔除不符合所在 合符合 合正确 算法 合数量 合正确 合正确 主题的图片,得到544张建筑物图像、913张汽车图 数量 数量 /例 率1% 率/% /例 /例 像、404张花朵的图像作为实验的图像库, 3.2实验环境 Random 1861 881 94.7 697 74.9 程序采用Microsoft Visual Studio2005集成开 Forest 发环境,使用C++语言进行编写.测试机器是一台 Boosting 1861 930 100.0 693 74.5 使用AMD28O0+CPU和1GB内存的PC机,操 MLP 1861 930 100.0 606 65.1 作系统使用Windows XP SP2 3.3实验参数及结果分析 由结果可知使用HSV颜色直方图的方式明显 在测试3类基于颜色属性的实验中,采用如下 优于RGB颜色直方图的方式,MLP算法出现了一 方法处理图片:将所有图片中的50%的图像作为训 定程度上的过度拟合现象.考虑位置时实验中参数 练样本集,使用另外50%作为测试集.算法参数设 x=3,即每幅图像分为9个小图像,最后每幅图像 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net令属性矢量 Z = H ×y ×z + S ×z + V 作为特征 矢量 ,由此可得 Z∈[0 , x ×y ×z - 1 ] ,得到一维直方 图 ,然后进行归一化 , 作为分类的颜色属性. 对照 HSV 色表 ,发现当亮度 I ,饱和度 S 区分不是很明 显 ,而对于色调 H 属性肉眼比较容易分辨出不同 , 因此试验中将 I、S 分量都均匀地分为 3 份 ,而对于 H 分量可均匀地分为 10 份. 试验表明使用 HSV 空 间较 R GB 空间有更好的分类能力. 213 考虑位置的颜色属性 前面 2 种直方图颜色属性都没有考虑颜色在画 面中的位置 ,而颜色在图片中的位置对于人类识别 一个图像起着非常重要的作用 ,例如画面中心的内 容一般比画面边缘的内容更加重要. 汽车图像和花 朵的图像的背景可能都是大片的蓝天 ,这时直接使 用全局的颜色属性就不容易区分出这是花朵图片还 是汽车图像 ,而且容易出现过度拟合现象. 如果这时 考虑颜色在图像中的分布 ,就可以提高中心位置颜 色属性的权重 ,从而达到更好的图像分类效果. 本文 采用一种考虑颜色位置的简单颜色属性 ,首先将图 片分成 x ×y 个等大的矩形小图片 ,即横向均匀分 为 x 份 ,纵向均匀分为 y 份. 为每个小图像进行编 号 ,形成一个矩阵 a11 … a1 x … ω … ay1 … ayx . 对每个矩形小图像统计 RGB 各个分量以及灰 度分量的和 ,然后根据小图像大小归一化得到 4 个 标量 ,将这些标量依次排列起来作为该图像的颜色 属性 ,共 4 ×x ×y 个 ,然后依据这些属性对图像进 行分类. 在实验中取 x = y = 3 ,即将图像分为 9 张矩 形图片. 试验表明仅简单地将图像分为 9 块 ,就可以 明显地提高基于颜色的分类质量. 3 实验结果及分析 311 图像库 采用百度图像搜索引擎搜索了关于建筑物、汽 车和花朵 3 类图像 ,进行人工筛选 ,剔除不符合所在 主题的图片 ,得到 544 张建筑物图像、913 张汽车图 像、404 张花朵的图像作为实验的图像库. 312 实验环境 程序采用 Microsoft Visual St udio 2005 集成开 发环境 ,使用 C + + 语言进行编写. 测试机器是一台 使用 AMD 2800 + CPU 和 1 GB 内存的 PC 机 ,操 作系统使用 Windows XP SP2. 313 实验参数及结果分析 在测试 3 类基于颜色属性的实验中 ,采用如下 方法处理图片 :将所有图片中的 50 %的图像作为训 练样本集 ,使用另外 50 %作为测试集. 算法参数设 定如下 :随机森林算法中 ,最大深度取 10 ,森林中树 的最大数取 100 ,森林最小精度取 0101. 在 Boosting 算法中 ,采用决策树算法作为弱分 类器 ,弱分类器个数设置为 100. 随着集合中树的数 量的增加和信任度的增加 ,大部分的训练数据被正 确分类 ,这些样本的权重不断的降低. 具有较低相关 权重的样本对弱分类器的训练有较低的影响 ,因此 这些样本会在训练分类器时被排除在外 ,而不对分 类器造成较大影响. 在算法实现中 ,样本系数小于 0105 时被排除. 在使用灰度颜色直方图实验中 ,使 用灰度的 256 个分量作为属性. 对这些分量按照图 像大小进行归一化 ,每幅图像共由 256 个属性描述. 实验结果如表 1 所示. 表 1 基于灰度颜色直方图颜色属性的学习结果 Table 1 Color attribute results based on gray histogram 算法 图片集 合数量 / 例 样本集 合符合 数量 / 例 样本集 合正确 率 / % 测试集 合正确 数量 / 例 测试集 合正确 率 / % Random Forest 1 861 507 5415 472 5017 Boosting 1 861 930 10010 559 6011 ML P 1 861 927 9917 429 4611 可以看出测试集合正确率不高 ,由于使用的属 性比较多 ,处理速度也比较慢. 这说明基于 R GB 颜 色统计的属性作为图像分类属性区分能力不高. 在 HSV 颜色直方图实验中 ,参数设定为 x = 10 , y = 3 , z = 3 ,即每张图像由 90 个属性描述 ,实验结果如表 2 所示. 表 2 基于 HSV颜色直方图颜色属性的学习结果 Table 2 Color attribute learning results based on HSV color histogram 算法 图片集 合数量 / 例 样本集 合符合 数量 / 例 样本集 合正确 率 / % 测试集 合正确 数量 / 例 测试集 合正确 率 / % Random Forest 1 861 881 9417 697 7419 Boosting 1 861 930 10010 693 7415 ML P 1 861 930 10010 606 6511 由结果可知使用 HSV 颜色直方图的方式明显 优于 RGB 颜色直方图的方式 ,ML P 算法出现了一 定程度上的过度拟合现象. 考虑位置时实验中参数 x = 3 ,即每幅图像分为 9 个小图像 ,最后每幅图像 第 2 期 李海峰 ,等 :基于颜色特征的图像分类技术研究 · 751 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有