第3卷第2期 智能系统学报 Vol.3№2 2008年4月 CAAI Transactions on Intelligent Systems Apr.2008 颜色特征的图像分类技术研究 李海峰杜军平2 (1.北京工商大学计算机学院,北京100037:2.北京邮电大学计算机学院,北京100876) 摘要:研究了基于颜色的图像特征对于图像分类结果的影响.给出了采用基于颜色位置分布特征进行分类的方 法,并与基于RGB直方图特征和基于HSV直方图特征的方法进行了比较.分别采用随机森林、Boosting算法和 MLP神经网络3种分类方法进行图像分类,建立了自然图像分类系统.基于实验结果比较了随机森林Boosting算 法和MLP神经网络3种分类方法的优缺点,发现Boosting算法表现最好,更加适合于图像分类。 关键词:图像分类;颜色特征;Boosting算法 中图分类号:TP391文献标识码:A文章编号:16734785(2008)02-015504 Image classification technology based on color features LI Hai-feng',DU Junping? (1.School of Computer Science,Beijing Business and Technology University,Beijing 100037,China;2.School of Computer and Technology,Beijing University of Posts and Telecommunications,Beijing 100876,China) Abstract:This paper studies the effects of an image's color features on image classification.We developed a new classification method based on positional distribution of colors and compare it with other methods based on RGB and HSV histograms.The random forest,the Boosting algorithm,and the MLP neural net- work were applied respectively to classify images and a natural image classification system built up.The advantages and disadvantages of these three classification algorithms are discussed according to experimen- tal results,showing that the boosting algorithm gives the best performance and is more suitable to image classification. Key words:image classification;color features;boosting algorithm 为了提高面向旅游业的图像搜索引擎的搜索质 方法有很多种,如神经网络、支持向量机、决策树等, 量,实现对搜索结果进行筛选分类,剔除与其他结果 其分类效果各异山,最近组合分类器和加强分类器 图像相似度较低的图像,将会有助于提高搜索的结 也逐渐得到的人们的重视.本文将采用3种有代表 果质量.由于搜索引擎的及时性要求,需要一个比较 性的算法,即随机森林Boosting算法和MLP神 简洁快速的方法进行图像分类.图像分类技术是图 经网络进行图像分类研究 像处理的基础,图像特征提取是决定图像分类水平 的关键.图像特征提取即采用矢量数来描述图像的 1图像分类算法概述 某种性质,是图像处理的最基本问题之一.图像底层 本文主要讨论基于颜色的图像特征对于图像分 视觉特征主要包括颜色、纹理和形状.其中颜色特征 类结果的影响.为减少学习算法对结果的影响,采用 比较容易提取,处理速度也最快」 了3种学习算法进行比较和研究 本文讨论基于颜色特征的图像分类技术,并提 1.1随机森林算法 出使用包含位置信息的颜色属性提高图像分类的质 随机森林算法通过自助法(bootstrap,)生成多 量的方法.目前对多种类别图片进行分类的算法的 个树分类器,它属于组合分类器).其步骤如下:从 收稿日期:2007-08-07. 原始训练数据集N中重复随机抽取k个自助样本 基金项目:国家自然科学基金资助项目(60773112);北京市自然科学 基金资助项目(4082021). 集,每个自助样本集对应一棵分类树的训练数据集, 通讯作者:杜军平.E-mail:junpingd@bupt.edu.cn. 在一棵树的每个节点处,从M个特征中随机挑选m 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
第 3 卷第 2 期 智 能 系 统 学 报 Vol. 3 №. 2 2008 年 4 月 CAA I Transactions on Intelligent Systems Apr. 2008 颜色特征的图像分类技术研究 李海峰1 ,杜军平2 (1. 北京工商大学 计算机学院 , 北京 100037 ; 2. 北京邮电大学 计算机学院 , 北京 100876) 摘 要 :研究了基于颜色的图像特征对于图像分类结果的影响. 给出了采用基于颜色位置分布特征进行分类的方 法 ,并与基于 RGB 直方图特征和基于 HSV 直方图特征的方法进行了比较. 分别采用随机森林、Boosting 算法和 ML P 神经网络 3 种分类方法进行图像分类 ,建立了自然图像分类系统. 基于实验结果比较了随机森林、Boosting 算 法和 ML P 神经网络 3 种分类方法的优缺点 ,发现 Boosting 算法表现最好 ,更加适合于图像分类. 关键词 :图像分类 ;颜色特征 ;Boosting 算法 中图分类号 : TP391 文献标识码 :A 文章编号 :167324785 (2008) 0220155204 Image classification technology based on color features L I Hai2feng 1 , DU J un2ping 2 (1. School of Computer Science , Beijing Business and Technology University , Beijing 100037 , China ; 2. School of Computer and Technology , Beijing University of Posts and Telecommunications , Beijing 100876 ,China) Abstract :This paper studies t he effects of an image’s color feat ures on image classification. We developed a new classification met hod based on positional distribution of colors and compare it wit h ot her met hods based on RGB and HSV histograms. The random forest , t he Boosting algorit hm , and the ML P neural net2 work were applied respectively to classify images and a nat ural image classification system built up . The advantages and disadvantages of these three classification algorit hms are discussed according to experimen2 tal results , showing t hat t he boosting algorit hm gives t he best performance and is more suitable to image classification. Keywords :image classification ; color feat ures; boosting algorit hm 收稿日期 :2007208207. 基金项目 :国家自然科学基金资助项目(60773112) ;北京市自然科学 基金资助项目(4082021) . 通讯作者 :杜军平. E2mail :junpingd @bupt . edu. cn. 为了提高面向旅游业的图像搜索引擎的搜索质 量 ,实现对搜索结果进行筛选分类 ,剔除与其他结果 图像相似度较低的图像 ,将会有助于提高搜索的结 果质量. 由于搜索引擎的及时性要求 ,需要一个比较 简洁快速的方法进行图像分类. 图像分类技术是图 像处理的基础 ,图像特征提取是决定图像分类水平 的关键. 图像特征提取即采用矢量数来描述图像的 某种性质 ,是图像处理的最基本问题之一. 图像底层 视觉特征主要包括颜色、纹理和形状. 其中颜色特征 比较容易提取 ,处理速度也最快. 本文讨论基于颜色特征的图像分类技术 ,并提 出使用包含位置信息的颜色属性提高图像分类的质 量的方法. 目前对多种类别图片进行分类的算法的 方法有很多种 ,如神经网络、支持向量机、决策树等 , 其分类效果各异[ 1 ] ,最近组合分类器和加强分类器 也逐渐得到的人们的重视. 本文将采用 3 种有代表 性的算法 ,即随机森林[2 ] 、Boosting 算法和 ML P 神 经网络[ 324 ]进行图像分类研究. 1 图像分类算法概述 本文主要讨论基于颜色的图像特征对于图像分 类结果的影响. 为减少学习算法对结果的影响 ,采用 了 3 种学习算法进行比较和研究. 111 随机森林算法 随机森林算法通过自助法 ( bootstrap ) 生成多 个树分类器 ,它属于组合分类器[5 ] . 其步骤如下 :从 原始训练数据集 N 中重复随机抽取 k 个自助样本 集 ,每个自助样本集对应一棵分类树的训练数据集. 在一棵树的每个节点处 ,从 M 个特征中随机挑选 m
·156· 智能系统学报 第3卷 个特征(m《M,然后按照节点不纯度最小原则,从 (translation invariance),而且对观测视角的变化不 这m个特征中选择一个特征进行生长.节点n上的 太敏感.计算颜色直方图时需要将颜色空间划分成 分类数据如果都来自于同一类别,则此节点的不纯 若干个小的颜色区间,这个过程称为颜色量化.颜色 度1(=0.不纯度度量方法采用Gini准则,即假设 直方图的核心思想为:采用一定的量化方法对颜色 P(4)是节点n上属于,类样本个数占训练样本总 空间进行量化,然后计算颜色落在每个小区间内的 数的频率,则Gini准则表示为 像素数量,得到颜色直方图.在本文的实验中,采用 I(n) ∑P(@)Pg)=1-∑p2(o).1) 图像的RGB空间的灰度直方图作为颜色特征进行 分类,只统计颜色的灰度属性,并利用该属性进行分 将生成的多棵分类树组成随机森林,用随机森 类处理 林分类器对新的数据进行判别与分类,分类结果按 2.2改进的颜色直方图 树分类器的投票多少而定.当生成一棵分类树时,通 面向硬设备的颜色模型与人的视觉感知有一定 常需要防止出现过拟合现象 的距离.例如给定一个颜色,人们很难判断其中的 1.2Boos1ing算法 Boosting算法是一种特殊的组合分类器方 R、G、B分量,这时使用面向视觉感知的颜色模型 法6.Boosting方法使用基(弱)算法生成一系列的 比较方便.HSV模型就是面向视觉感知的颜色空间 基分类器,每个基分类器的训练依赖于上一次分类 (perceptual color spaces),较为符合人类思维对颜 器的分类结果.基分类器在训练集上的错误率用于 色的理解、思考方式.这一类模型还包括:HIS(hue, 调整训练样本的概率分布,最终分类器通过单个基 intensity,saturation)等.这些模型与人类颜色视觉 分类器的加权投票建立起来.Boosting算法具有很 感知比较接近,而且独立于显示设备.相对于其他颜 多优点:首先它简单易用,除了迭代次数T以外,不 色模型它更为准确地反映了人类视觉系统对色彩的 需要调节任何参数;其次它不需要先验知识.只要有 理解方式o).HSV模型可以从RGB模型颜色空间 足够多的数据以及弱学习器,就能达到任意预测精 进行转化.假设RGB颜色(r,g,b,r,g,b∈0,1, 度.Boosting不易导致过学习,所以不必担心训练的 ,255],对应HSV空间(h,s,)则 次数T.Boosting算法也存在一些缺点:过于依赖数 v'=max (r.g.b) 据和基学习器,对数据噪声很敏感.如果基学习器太 弱,则不能达到任意高的精度.在实验中采用了较为 v-min (r.g.b) 2 流行的AdaBoost算法I g= y'min (r.g.b 1.3MLP神经网络 令 MLP(multilayer perceptron)是神经网络的一 5+b',r=max(,g,且g=min(r,g,以: 种实现.MLP网络由感受层(S)、联想层(A)、响应 1-g',r=max(r,g,b且g≠min(,g,b: 层(R)构成.S、A、R均由同类神经元构成.反向传播 (back propagation,BP)学习算法在MLP模型中得 h' 1+r.g max (r.g.bb min (r.g. 3-b',g=max(r,g,b且b≠min(r,g,b: 到广泛应用1.它把一组样本的输入输出问题变为 3+g.b max (r.g.b r=min (r.g.b 一个非线性优化问题.网络开始训练时,选用较小的 、5-g其他 随机互联权值与内部阈值,通过反复加载训练样本 得到HSV空间向量: 并调整权值,直到代价函数下降到可接受的容限值」 h=60×h, 在试验中采用了MLP方法进行分类。 s mincr.g.b 2基于颜色的图像属性 颜色特征是图像特征中最为普遍、直观的特征, v=255 它和图像中所包含的物体或场景相关,对图像本身 由于这样得到的属性众多,而人眼无法分辨很 的尺寸、方向、视角的依赖性较小,具有一定的鲁棒 小的分量之间的差别,因此将H$V空间各个分量 性,,所以在图像检索中得到了广泛的应用.也是本 进行量化,不会导致算法结果的差别太大,而且可以 文研究的重点 减少计算量和提高计算速度.本文的实验中,将 2.1颜色直方图 HSV3个分量进行等间隔量化,将色调H平均分 颜色直方图是图像检索中最为常用的颜色特 为x份,饱和度S平均分为y份,亮度V平均分为: 征,它提取简便,具有旋转不变性(rotation invari- 份,得到3个标量H、S、V,其中H∈0,x-1],S∈ ance)、尺度不变性(scale invariance)、平移不变性 0,y-11,Ve/0,z-1] 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
个特征( m ν M) ,然后按照节点不纯度最小原则 ,从 这 m 个特征中选择一个特征进行生长. 节点 n 上的 分类数据如果都来自于同一类别 ,则此节点的不纯 度 I ( n) = 0. 不纯度度量方法采用 Gini 准则 ,即假设 P(ωj) 是节点 n 上属于ωj 类样本个数占训练样本总 数的频率 ,则 Gini 准则表示为 I( n) = i∑≠j P (ωj) P(ωj) = 1 - ∑ j P 2 (ωj) . (1) 将生成的多棵分类树组成随机森林 ,用随机森 林分类器对新的数据进行判别与分类 ,分类结果按 树分类器的投票多少而定. 当生成一棵分类树时 ,通 常需要防止出现过拟合现象. 112 B oosti ng 算法 Boosting 算法是一种特殊的组合分类器方 法[6 ] . Boosting 方法使用基 (弱) 算法生成一系列的 基分类器 ,每个基分类器的训练依赖于上一次分类 器的分类结果. 基分类器在训练集上的错误率用于 调整训练样本的概率分布 ,最终分类器通过单个基 分类器的加权投票建立起来. Boosting 算法具有很 多优点 :首先它简单易用 ,除了迭代次数 T 以外 ,不 需要调节任何参数 ;其次它不需要先验知识. 只要有 足够多的数据以及弱学习器 ,就能达到任意预测精 度.Boosting 不易导致过学习 ,所以不必担心训练的 次数 T. Boosting 算法也存在一些缺点 :过于依赖数 据和基学习器 ,对数据噪声很敏感. 如果基学习器太 弱 ,则不能达到任意高的精度. 在实验中采用了较为 流行的 AdaBoo st 算法[7 ] . 113 ML P 神经网络 ML P(multilayer perceptron) 是神经网络的一 种实现. ML P 网络由感受层 (S) 、联想层 (A) 、响应 层(R) 构成. S、A 、R 均由同类神经元构成. 反向传播 (back propagation ,BP) 学习算法在 ML P 模型中得 到广泛应用[8 ] . 它把一组样本的输入、输出问题变为 一个非线性优化问题. 网络开始训练时 ,选用较小的 随机互联权值与内部阈值 ,通过反复加载训练样本 并调整权值 ,直到代价函数下降到可接受的容限值. 在试验中采用了 ML P 方法进行分类. 2 基于颜色的图像属性 颜色特征是图像特征中最为普遍、直观的特征 , 它和图像中所包含的物体或场景相关 ,对图像本身 的尺寸、方向、视角的依赖性较小 ,具有一定的鲁棒 性[9 ] ,所以在图像检索中得到了广泛的应用. 也是本 文研究的重点. 211 颜色直方图 颜色直方图是图像检索中最为常用的颜色特 征 ,它提取简便 ,具有旋转不变性 (rotation invari2 ance) 、尺度不变性 (scale invariance) 、平移不变性 (translation invariance ) ,而且对观测视角的变化不 太敏感. 计算颜色直方图时需要将颜色空间划分成 若干个小的颜色区间 ,这个过程称为颜色量化. 颜色 直方图的核心思想为 :采用一定的量化方法对颜色 空间进行量化 ,然后计算颜色落在每个小区间内的 像素数量 ,得到颜色直方图. 在本文的实验中 ,采用 图像的 R GB 空间的灰度直方图作为颜色特征进行 分类 ,只统计颜色的灰度属性 ,并利用该属性进行分 类处理. 212 改进的颜色直方图 面向硬设备的颜色模型与人的视觉感知有一定 的距离. 例如给定一个颜色 ,人们很难判断其中的 R、G、B 分量 ,这时使用面向视觉感知的颜色模型 比较方便. HSV 模型就是面向视觉感知的颜色空间 (perceptual color spaces) ,较为符合人类思维对颜 色的理解、思考方式. 这一类模型还包括 : HIS( hue , intensity , saturation) 等. 这些模型与人类颜色视觉 感知比较接近 ,而且独立于显示设备. 相对于其他颜 色模型它更为准确地反映了人类视觉系统对色彩的 理解方式[10 ] . HSV 模型可以从 RGB 模型颜色空间 进行转化. 假设 RGB 颜色 ( r, g , b) , r, g , b ∈[0 , 1 , …,255 ] , 对应 HSV 空间( h ,s, v) 则 v′= max ( r, g , b) , r′= v′- r v′- min ( r, g , b) , g′= v′- g v′- min ( r, g , b) . (2) 令 h′= 5 + b′, r = max (r, g , b) 且 g = min (r, g , b) ; 1 - g′,r = max (r, g , b) 且 g ≠min (r, g , b) ; 1 + r′, g = max (r, g , b) 且 b = min (r, g , b) ; 3 - b′, g = max (r, g , b) 且 b ≠min (r, g , b) ; 3 + g′,b = max (r, g , b) 且 r = min (r, g , b) ; 5 - g′,其他. 得到 HSV 空间向量 : h = 60 ×h′, s = v′- min ( r, g , b) v′ , v = v′ 255 . 由于这样得到的属性众多 ,而人眼无法分辨很 小的分量之间的差别 ,因此将 HSV 空间各个分量 进行量化 ,不会导致算法结果的差别太大 ,而且可以 减少计算量和提高计算速度. 本文的实验中 , 将 HSV 3 个分量进行等间隔量化 ,将色调 H 平均分 为 x 份 ,饱和度 S 平均分为 y 份 ,亮度 V 平均分为 z 份 ,得到 3 个标量 H、S 、V ,其中 H ∈[0 , x - 1 ] , S ∈ [0 , y - 1 ] ,V ∈[0 , z - 1 ]. · 651 · 智 能 系 统 学 报 第 3 卷
第2期 李海峰,等:基于颜色特征的图像分类技术研究 ·157· 令属性矢量Z=HXyX:+SX:+V作为特征 定如下:随机森林算法中,最大深度取10,森林中树 矢量,由此可得Z∈0,xXyX:-1],得到一维直方 的最大数取100,森林最小精度取0.01. 图,然后进行归一化,作为分类的颜色属性.对照 在Boosting算法中,采用决策树算法作为弱分 HSV色表,发现当亮度1,饱和度S区分不是很明 类器,弱分类器个数设置为100.随着集合中树的数 显,而对于色调H属性肉眼比较容易分辨出不同, 量的增加和信任度的增加,大部分的训练数据被正 因此试验中将1、S分量都均匀地分为3份,而对于 确分类,这些样本的权重不断的降低.具有较低相关 H分量可均匀地分为10份.试验表明使用HSV空 权重的样本对弱分类器的训练有较低的影响,因此 间较RGB空间有更好的分类能力 这些样本会在训练分类器时被排除在外,而不对分 2.3考虑位置的颜色属性 类器造成较大影响.在算法实现中,样本系数小于 前面2种直方图颜色属性都没有考虑颜色在画 0.05时被排除.在使用灰度颜色直方图实验中,使 面中的位置,而颜色在图片中的位置对于人类识别 用灰度的256个分量作为属性.对这些分量按照图 一个图像起着非常重要的作用,例如画面中心的内 像大小进行归一化,每幅图像共由256个属性描述 容一般比画面边缘的内容更加重要.汽车图像和花 实验结果如表1所示 朵的图像的背景可能都是大片的蓝天,这时直接使 表1基于灰度颜色直方图颜色属性的学习结果 用全局的颜色属性就不容易区分出这是花朵图片还 Table 1 Color attribute results based on gray histogram 是汽车图像,而且容易出现过度拟合现象.如果这时 样本集 测试集 考虑颜色在图像中的分布,就可以提高中心位置颜 图片集 样本集 测试集 合符合 合正确 色属性的权重,从而达到更好的图像分类效果.本文 算法 合数量 合正确 合正确 数量 数量 采用一种考虑颜色位置的简单颜色属性,首先将图 /例 率/% 率/% /例 /例 片分成xXy个等大的矩形小图片,即横向均匀分 Random 为x份,纵向均匀分为y份.为每个小图像进行编 1861 507 54.5 472 50.7 Forest ai … Boosting 1861 930 100.0 559 60.1 号,形成一个矩阵 MLP 1861 927 99.7 429 461 对每个矩形小图像统计RGB各个分量以及灰 可以看出测试集合正确率不高,由于使用的属 度分量的和,然后根据小图像大小归一化得到4个 性比较多,处理速度也比较慢.这说明基于RGB颜 标量,将这些标量依次排列起来作为该图像的颜色 色统计的属性作为图像分类属性区分能力不高.在 属性,共4×x×y个,然后依据这些属性对图像进 HSV颜色直方图实验中,参数设定为x=10,y=3, 行分类.在实验中取x=y=3,即将图像分为9张矩 :=3,即每张图像由90个属性描述,实验结果如表 形图片.试验表明仅简单地将图像分为9块,就可以 2所示 明显地提高基于颜色的分类质量, 表2基于HSV颜色直方图颜色属性的学习结果 3实验结果及分析 Table 2 Color attribute learning results 3.1图像库 based on HSV color histogram 采用百度图像搜索引擎搜索了关于建筑物、汽 样本集 测试集 图片集 样本集 测试集 车和花朵3类图像,进行人工筛选,剔除不符合所在 合符合 合正确 算法 合数量 合正确 合正确 主题的图片,得到544张建筑物图像、913张汽车图 数量 数量 /例 率1% 率/% /例 /例 像、404张花朵的图像作为实验的图像库, 3.2实验环境 Random 1861 881 94.7 697 74.9 程序采用Microsoft Visual Studio2005集成开 Forest 发环境,使用C++语言进行编写.测试机器是一台 Boosting 1861 930 100.0 693 74.5 使用AMD28O0+CPU和1GB内存的PC机,操 MLP 1861 930 100.0 606 65.1 作系统使用Windows XP SP2 3.3实验参数及结果分析 由结果可知使用HSV颜色直方图的方式明显 在测试3类基于颜色属性的实验中,采用如下 优于RGB颜色直方图的方式,MLP算法出现了一 方法处理图片:将所有图片中的50%的图像作为训 定程度上的过度拟合现象.考虑位置时实验中参数 练样本集,使用另外50%作为测试集.算法参数设 x=3,即每幅图像分为9个小图像,最后每幅图像 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
令属性矢量 Z = H ×y ×z + S ×z + V 作为特征 矢量 ,由此可得 Z∈[0 , x ×y ×z - 1 ] ,得到一维直方 图 ,然后进行归一化 , 作为分类的颜色属性. 对照 HSV 色表 ,发现当亮度 I ,饱和度 S 区分不是很明 显 ,而对于色调 H 属性肉眼比较容易分辨出不同 , 因此试验中将 I、S 分量都均匀地分为 3 份 ,而对于 H 分量可均匀地分为 10 份. 试验表明使用 HSV 空 间较 R GB 空间有更好的分类能力. 213 考虑位置的颜色属性 前面 2 种直方图颜色属性都没有考虑颜色在画 面中的位置 ,而颜色在图片中的位置对于人类识别 一个图像起着非常重要的作用 ,例如画面中心的内 容一般比画面边缘的内容更加重要. 汽车图像和花 朵的图像的背景可能都是大片的蓝天 ,这时直接使 用全局的颜色属性就不容易区分出这是花朵图片还 是汽车图像 ,而且容易出现过度拟合现象. 如果这时 考虑颜色在图像中的分布 ,就可以提高中心位置颜 色属性的权重 ,从而达到更好的图像分类效果. 本文 采用一种考虑颜色位置的简单颜色属性 ,首先将图 片分成 x ×y 个等大的矩形小图片 ,即横向均匀分 为 x 份 ,纵向均匀分为 y 份. 为每个小图像进行编 号 ,形成一个矩阵 a11 … a1 x … ω … ay1 … ayx . 对每个矩形小图像统计 RGB 各个分量以及灰 度分量的和 ,然后根据小图像大小归一化得到 4 个 标量 ,将这些标量依次排列起来作为该图像的颜色 属性 ,共 4 ×x ×y 个 ,然后依据这些属性对图像进 行分类. 在实验中取 x = y = 3 ,即将图像分为 9 张矩 形图片. 试验表明仅简单地将图像分为 9 块 ,就可以 明显地提高基于颜色的分类质量. 3 实验结果及分析 311 图像库 采用百度图像搜索引擎搜索了关于建筑物、汽 车和花朵 3 类图像 ,进行人工筛选 ,剔除不符合所在 主题的图片 ,得到 544 张建筑物图像、913 张汽车图 像、404 张花朵的图像作为实验的图像库. 312 实验环境 程序采用 Microsoft Visual St udio 2005 集成开 发环境 ,使用 C + + 语言进行编写. 测试机器是一台 使用 AMD 2800 + CPU 和 1 GB 内存的 PC 机 ,操 作系统使用 Windows XP SP2. 313 实验参数及结果分析 在测试 3 类基于颜色属性的实验中 ,采用如下 方法处理图片 :将所有图片中的 50 %的图像作为训 练样本集 ,使用另外 50 %作为测试集. 算法参数设 定如下 :随机森林算法中 ,最大深度取 10 ,森林中树 的最大数取 100 ,森林最小精度取 0101. 在 Boosting 算法中 ,采用决策树算法作为弱分 类器 ,弱分类器个数设置为 100. 随着集合中树的数 量的增加和信任度的增加 ,大部分的训练数据被正 确分类 ,这些样本的权重不断的降低. 具有较低相关 权重的样本对弱分类器的训练有较低的影响 ,因此 这些样本会在训练分类器时被排除在外 ,而不对分 类器造成较大影响. 在算法实现中 ,样本系数小于 0105 时被排除. 在使用灰度颜色直方图实验中 ,使 用灰度的 256 个分量作为属性. 对这些分量按照图 像大小进行归一化 ,每幅图像共由 256 个属性描述. 实验结果如表 1 所示. 表 1 基于灰度颜色直方图颜色属性的学习结果 Table 1 Color attribute results based on gray histogram 算法 图片集 合数量 / 例 样本集 合符合 数量 / 例 样本集 合正确 率 / % 测试集 合正确 数量 / 例 测试集 合正确 率 / % Random Forest 1 861 507 5415 472 5017 Boosting 1 861 930 10010 559 6011 ML P 1 861 927 9917 429 4611 可以看出测试集合正确率不高 ,由于使用的属 性比较多 ,处理速度也比较慢. 这说明基于 R GB 颜 色统计的属性作为图像分类属性区分能力不高. 在 HSV 颜色直方图实验中 ,参数设定为 x = 10 , y = 3 , z = 3 ,即每张图像由 90 个属性描述 ,实验结果如表 2 所示. 表 2 基于 HSV颜色直方图颜色属性的学习结果 Table 2 Color attribute learning results based on HSV color histogram 算法 图片集 合数量 / 例 样本集 合符合 数量 / 例 样本集 合正确 率 / % 测试集 合正确 数量 / 例 测试集 合正确 率 / % Random Forest 1 861 881 9417 697 7419 Boosting 1 861 930 10010 693 7415 ML P 1 861 930 10010 606 6511 由结果可知使用 HSV 颜色直方图的方式明显 优于 RGB 颜色直方图的方式 ,ML P 算法出现了一 定程度上的过度拟合现象. 考虑位置时实验中参数 x = 3 ,即每幅图像分为 9 个小图像 ,最后每幅图像 第 2 期 李海峰 ,等 :基于颜色特征的图像分类技术研究 · 751 ·
·158· 智能系统学报 第3卷 由36个属性描述,结果如表3所示 [3]吕坤,高珊.一种基于改进的BP神经网络算法的布 匹瑕疵分类器J].微电子学与计算机,2006,23(3):88 表3基于颜色位置分布的颜色属性学习结果 90. Table 3 Color attribute learning results based LU Kun,GAO Shan.A fabric flaws classifier based on on color position distribution improved BP neural network algorithm [J ]Microelec- 样本集 测试集 tronics Computer,2006,23(3):88-90. 图片集 样本集 测试集 合符合 合正确 [4]BREIMAN L.Random forests [J ]Machine Learning, 算法 合数量 合正确 合正确 数量 数量 2001,45(1):532. /例 率/% 率/% 1例 1例 [5]SCHAPIRE R E.The strength of weak learnability [J]. Machine Learning,1990,5(2):197-227. Random 1861 874 94.0 722 77.6 [6]SCHAPIRE R E.A brief introduction to boosting[C]// Forest Proceedings of the Sixteenth International Joint Confer- Boosting 1861 877 94.3 729 783 ence on Artificial Intelligence.Stockholm,1999:1401- 1406. MLP 1861 918 98.7 651 69.9 [7]FABRIZIO S,AL ESSAMDRO S,NICOLA V.An im- proved boosting algorithm and its application[C]//Pro- 由结果可以看出基于颜色位置分布的颜色属 ceedings of the 2000ACM CIKM International Confer- 性,可以得到较好的学习效果.由于属性比较少,而 ence on Information and Knowledge Management. 且计算简单,所以试验的执行速度也比较快. Mclean,VA ,USA,2000 78-85. 4 结束语 [8]HAN Jiawei,KAMBER M.Data mining:concepts and techniques[M].北京:机械工业出版社,2001. 单纯依赖颜色的一些统计属性进行图像分类, 「9]杨再华李玉和,李庆祥.基于边缘特征提取的图像清晰 可以有一定的分类能力,但是也有一定的局限性,这 度评价函数U].计算机工程与应用,2005(10):3536. 是由于图像的最基础视觉属性不仅仅是颜色,还包 YAN G Zaihua,LI Yuhe,LI Qingxiang.Image definition 括形状和纹理.在使用颜色直方图时,HSV模型较 criterion based on edge gradient feature [J ]Computer RGB模型有更好的识别能力,这是因为HSV模型 Engineering and Applications,2005(10):35-36. 更接近人的视觉感觉,而RGB模型是一种设备描 [10]MANJUNATH B S,OHMJ R,VASUDENVAN V V,et al.Color and texture descriptors[J].IEEE Trans 述模型,因此从人类识别图像的角度进行图像分类, on CSVT,2001,11(6):703715. 可以得到更好的效果.仅仅粗略考虑颜色在图像中 作者简介 位置的分布,同时采用最简单的颜色统计,亦可以大 李海峰,男,1980年生,硕士研究生,主 幅度提高图像的分类能力.由此可以推断,如果采用 要研究方向为模式识别、智能信息系统等」 更精细的图像颜色属性的位置信息,可以更好地提 高图像分类质量.对于3种学习方法,可以发现 Boosting方法表现最好,更加适合于图像分类.颜色 属性是图像属性的最基本属性,提取最为方便快捷, 使用此属性可以达到一定的分类能力,因此可应用 杜军平,女,1963年生,教授,博士生导 师,中国人工智能学会常务副秘书长,中国 于要求不高的分类场合,例如图像搜索结果的筛选」 自动化学会智能自动化专业委员会副秘书 参考文献: 长,中国旅游信息标准技术委员会主任委 员,主要研究方向为数据挖掘、Agent理论 [1]章毓晋.图像分割[M].北京:科学出版社,2001. 与技术、智能信息处理、旅游智能信息系统 [2]贾富仓,李华.基于随机森林的多谱磁共振图像分割 等.近年来完成科研项目20余项,发表学 [J].计算机工程,2005,31(10):159161. 术论文90余篇,出版著作3部. JIA Fucang,LI Hua.Multi-spectral magnetic resonance Image segmentation using random forests [J].Computer Engineering,2005,31(10):159161. 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net
由 36 个属性描述 ,结果如表 3 所示. 表 3 基于颜色位置分布的颜色属性学习结果 Table 3 Color attribute learning results based on color position distribution 算法 图片集 合数量 / 例 样本集 合符合 数量 / 例 样本集 合正确 率 / % 测试集 合正确 数量 / 例 测试集 合正确 率 / % Random Forest 1 861 874 9410 722 7716 Boosting 1 861 877 9413 729 7813 ML P 1 861 918 9817 651 6919 由结果可以看出基于颜色位置分布的颜色属 性 ,可以得到较好的学习效果. 由于属性比较少 ,而 且计算简单 ,所以试验的执行速度也比较快. 4 结束语 单纯依赖颜色的一些统计属性进行图像分类 , 可以有一定的分类能力 ,但是也有一定的局限性 ,这 是由于图像的最基础视觉属性不仅仅是颜色 ,还包 括形状和纹理. 在使用颜色直方图时 , HSV 模型较 RGB 模型有更好的识别能力 ,这是因为 HSV 模型 更接近人的视觉感觉 ,而 RGB 模型是一种设备描 述模型 ,因此从人类识别图像的角度进行图像分类 , 可以得到更好的效果. 仅仅粗略考虑颜色在图像中 位置的分布 ,同时采用最简单的颜色统计 ,亦可以大 幅度提高图像的分类能力. 由此可以推断 ,如果采用 更精细的图像颜色属性的位置信息 ,可以更好地提 高图像分类质量. 对于 3 种学习方法 ,可以发现 Boo sting 方法表现最好 ,更加适合于图像分类. 颜色 属性是图像属性的最基本属性 ,提取最为方便快捷 , 使用此属性可以达到一定的分类能力 ,因此可应用 于要求不高的分类场合 ,例如图像搜索结果的筛选. 参考文献 : [1 ]章毓晋. 图像分割[ M]. 北京 :科学出版社 , 2001. [2 ]贾富仓 ,李 华. 基于随机森林的多谱磁共振图像分割 [J ]. 计算机工程 , 2005 ,31 (10) :1592161. J IA Fucang ,L I Hua. Multi2spectral magnetic resonance Image segmentation using random forests[J ]. Computer Engineering ,2005 ,31 (10) :1592161. [3 ]吕 坤 ,高 珊. 一种基于改进的 BP 神经网络算法的布 匹瑕疵分类器[J ]. 微电子学与计算机 ,2006 ,23 (3) :882 90. LU Kun , GAO Shan. A fabric flaws classifier based on improved BP neural network algorithm [J ]. Microelec2 tronics & Computer , 2006 ,23 (3) :88290. [4 ]BREIMAN L. Random forests[J ]. Machine Learning , 2001 ,45 (1) :5232. [5 ]SCHAPIRE R E. The strength of weak learnability[J ]. Machine Learning ,1990 , 5 (2) : 1972227. [6 ]SCHAPIRE R E. A brief introduction to boosting[ C]/ / Proceedings of the Sixteenth International Joint Confer2 ence on Artificial Intelligence. Stockholm , 1999 : 14012 1406. [7 ] FABRIZIO S , AL ESSAMDRO S , NICOLA V. An im2 proved boosting algorithm and its application[ C]/ / Pro2 ceedings of the 2000ACM CIKM International Confer2 ence on Information and Knowledge Management. Mclean ,VA ,USA ,2000 :78285. [8 ] HAN Jiawei , KAMBER M. Data mining : concepts and techniques [ M ]. 北京 :机械工业出版社 , 2001. [9 ]杨再华 ,李玉和 ,李庆祥. 基于边缘特征提取的图像清晰 度评价函数[J ]. 计算机工程与应用 , 2005 (10) : 35236. YAN G Zaihua ,L I Yuhe ,L I Qingxiang. Image definition criterion based on edge gradient feature [J ]. Computer Engineering and Applications , 2005 (10) : 35236. [10 ] MANJ UNA TH B S , O HM J R , VASUDENVAN V V , et al. Color and texture descriptors[J ]. IEEE Trans on CSV T , 2001 ,11 (6) : 7032715. 作者简介 : 李海峰 ,男 ,1980 年生 ,硕士研究生 ,主 要研究方向为模式识别、智能信息系统等. 杜军平 ,女 ,1963 年生 ,教授 ,博士生导 师 ,中国人工智能学会常务副秘书长 ,中国 自动化学会智能自动化专业委员会副秘书 长 ,中国旅游信息标准技术委员会主任委 员 ,主要研究方向为数据挖掘、Agent 理论 与技术、智能信息处理、旅游智能信息系统 等. 近年来完成科研项目 20 余项 ,发表学 术论文 90 余篇 ,出版著作 3 部. · 851 · 智 能 系 统 学 报 第 3 卷