个特征( m ν M) ,然后按照节点不纯度最小原则 ,从这 m 个特征

正在加载图片...

·156· 智能系统学报第3卷个特征(m《M,然后按照节点不纯度最小原则，从 (translation invariance),而且对观测视角的变化不这m个特征中选择一个特征进行生长.节点n上的太敏感.计算颜色直方图时需要将颜色空间划分成分类数据如果都来自于同一类别，则此节点的不纯若干个小的颜色区间，这个过程称为颜色量化.颜色度1(=0.不纯度度量方法采用Gini准则，即假设直方图的核心思想为：采用一定的量化方法对颜色 P(4)是节点n上属于，类样本个数占训练样本总空间进行量化，然后计算颜色落在每个小区间内的数的频率，则Gini准则表示为像素数量，得到颜色直方图.在本文的实验中，采用 I(n) ∑P(@)Pg)=1-∑p2(o).1) 图像的RGB空间的灰度直方图作为颜色特征进行分类，只统计颜色的灰度属性，并利用该属性进行分将生成的多棵分类树组成随机森林，用随机森类处理林分类器对新的数据进行判别与分类，分类结果按 2.2改进的颜色直方图树分类器的投票多少而定.当生成一棵分类树时，通面向硬设备的颜色模型与人的视觉感知有一定常需要防止出现过拟合现象的距离.例如给定一个颜色，人们很难判断其中的 1.2Boos1ing算法 Boosting算法是一种特殊的组合分类器方 R、G、B分量，这时使用面向视觉感知的颜色模型法6.Boosting方法使用基（弱）算法生成一系列的比较方便.HSV模型就是面向视觉感知的颜色空间基分类器，每个基分类器的训练依赖于上一次分类 (perceptual color spaces),较为符合人类思维对颜器的分类结果.基分类器在训练集上的错误率用于色的理解、思考方式.这一类模型还包括：HIS(hue, 调整训练样本的概率分布，最终分类器通过单个基 intensity,saturation)等.这些模型与人类颜色视觉分类器的加权投票建立起来.Boosting算法具有很感知比较接近，而且独立于显示设备.相对于其他颜多优点：首先它简单易用，除了迭代次数T以外，不色模型它更为准确地反映了人类视觉系统对色彩的需要调节任何参数；其次它不需要先验知识.只要有理解方式o).HSV模型可以从RGB模型颜色空间足够多的数据以及弱学习器，就能达到任意预测精进行转化.假设RGB颜色(r,g,b,r,g,b∈0,1，度.Boosting不易导致过学习，所以不必担心训练的 ,255],对应HSV空间(h,s,)则次数T.Boosting算法也存在一些缺点：过于依赖数 v'=max (r.g.b) 据和基学习器，对数据噪声很敏感.如果基学习器太弱，则不能达到任意高的精度.在实验中采用了较为 v-min (r.g.b) 2 流行的AdaBoost算法I g= y'min (r.g.b 1.3MLP神经网络令 MLP(multilayer perceptron)是神经网络的一 5+b',r=max(,g,且g=min(r,g,以：种实现.MLP网络由感受层(S)、联想层(A)、响应 1-g',r=max(r,g,b且g≠min(,g,b: 层(R)构成.S、A、R均由同类神经元构成.反向传播 (back propagation,BP)学习算法在MLP模型中得 h' 1+r.g max (r.g.bb min (r.g. 3-b',g=max(r,g,b且b≠min(r,g,b: 到广泛应用1.它把一组样本的输入输出问题变为 3+g.b max (r.g.b r=min (r.g.b 一个非线性优化问题.网络开始训练时，选用较小的、5-g其他随机互联权值与内部阈值，通过反复加载训练样本得到HSV空间向量：并调整权值，直到代价函数下降到可接受的容限值」 h=60×h, 在试验中采用了MLP方法进行分类。 s mincr.g.b 2基于颜色的图像属性颜色特征是图像特征中最为普遍、直观的特征， v=255 它和图像中所包含的物体或场景相关，对图像本身由于这样得到的属性众多，而人眼无法分辨很的尺寸、方向、视角的依赖性较小，具有一定的鲁棒小的分量之间的差别，因此将H$V空间各个分量性，，所以在图像检索中得到了广泛的应用.也是本进行量化，不会导致算法结果的差别太大，而且可以文研究的重点减少计算量和提高计算速度.本文的实验中，将 2.1颜色直方图 HSV3个分量进行等间隔量化，将色调H平均分颜色直方图是图像检索中最为常用的颜色特为x份，饱和度S平均分为y份，亮度V平均分为：征，它提取简便，具有旋转不变性(rotation invari- 份，得到3个标量H、S、V,其中H∈0，x-1],S∈ ance)、尺度不变性(scale invariance)、平移不变性 0,y-11,Ve/0,z-1] 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net个特征( m ν M) ,然后按照节点不纯度最小原则 ,从这 m 个特征中选择一个特征进行生长. 节点 n 上的分类数据如果都来自于同一类别 ,则此节点的不纯度 I ( n) = 0. 不纯度度量方法采用 Gini 准则 ,即假设 P(ωj) 是节点 n 上属于ωj 类样本个数占训练样本总数的频率 ,则 Gini 准则表示为 I( n) = i∑≠j P (ωj) P(ωj) = 1 - ∑ j P 2 (ωj) . (1) 将生成的多棵分类树组成随机森林 ,用随机森林分类器对新的数据进行判别与分类 ,分类结果按树分类器的投票多少而定. 当生成一棵分类树时 ,通常需要防止出现过拟合现象. 112 B oosti ng 算法 Boosting 算法是一种特殊的组合分类器方法[6 ] . Boosting 方法使用基 (弱) 算法生成一系列的基分类器 ,每个基分类器的训练依赖于上一次分类器的分类结果. 基分类器在训练集上的错误率用于调整训练样本的概率分布 ,最终分类器通过单个基分类器的加权投票建立起来. Boosting 算法具有很多优点 :首先它简单易用 ,除了迭代次数 T 以外 ,不需要调节任何参数 ;其次它不需要先验知识. 只要有足够多的数据以及弱学习器 ,就能达到任意预测精度.Boosting 不易导致过学习 ,所以不必担心训练的次数 T. Boosting 算法也存在一些缺点 :过于依赖数据和基学习器 ,对数据噪声很敏感. 如果基学习器太弱 ,则不能达到任意高的精度. 在实验中采用了较为流行的 AdaBoo st 算法[7 ] . 113 ML P 神经网络 ML P(multilayer perceptron) 是神经网络的一种实现. ML P 网络由感受层 (S) 、联想层 (A) 、响应层(R) 构成. S、A 、R 均由同类神经元构成. 反向传播 (back propagation ,BP) 学习算法在 ML P 模型中得到广泛应用[8 ] . 它把一组样本的输入、输出问题变为一个非线性优化问题. 网络开始训练时 ,选用较小的随机互联权值与内部阈值 ,通过反复加载训练样本并调整权值 ,直到代价函数下降到可接受的容限值. 在试验中采用了 ML P 方法进行分类. 2 基于颜色的图像属性颜色特征是图像特征中最为普遍、直观的特征 , 它和图像中所包含的物体或场景相关 ,对图像本身的尺寸、方向、视角的依赖性较小 ,具有一定的鲁棒性[9 ] ,所以在图像检索中得到了广泛的应用. 也是本文研究的重点. 211 颜色直方图颜色直方图是图像检索中最为常用的颜色特征 ,它提取简便 ,具有旋转不变性 (rotation invari2 ance) 、尺度不变性 (scale invariance) 、平移不变性 (translation invariance ) ,而且对观测视角的变化不太敏感. 计算颜色直方图时需要将颜色空间划分成若干个小的颜色区间 ,这个过程称为颜色量化. 颜色直方图的核心思想为 :采用一定的量化方法对颜色空间进行量化 ,然后计算颜色落在每个小区间内的像素数量 ,得到颜色直方图. 在本文的实验中 ,采用图像的 R GB 空间的灰度直方图作为颜色特征进行分类 ,只统计颜色的灰度属性 ,并利用该属性进行分类处理. 212 改进的颜色直方图面向硬设备的颜色模型与人的视觉感知有一定的距离. 例如给定一个颜色 ,人们很难判断其中的 R、G、B 分量 ,这时使用面向视觉感知的颜色模型比较方便. HSV 模型就是面向视觉感知的颜色空间 (perceptual color spaces) ,较为符合人类思维对颜色的理解、思考方式. 这一类模型还包括 : HIS( hue , intensity , saturation) 等. 这些模型与人类颜色视觉感知比较接近 ,而且独立于显示设备. 相对于其他颜色模型它更为准确地反映了人类视觉系统对色彩的理解方式[10 ] . HSV 模型可以从 RGB 模型颜色空间进行转化. 假设 RGB 颜色 ( r, g , b) , r, g , b ∈[0 , 1 , …,255 ] , 对应 HSV 空间( h ,s, v) 则 v′= max ( r, g , b) , r′= v′- r v′- min ( r, g , b) , g′= v′- g v′- min ( r, g , b) . (2) 令 h′= 5 + b′, r = max (r, g , b) 且 g = min (r, g , b) ; 1 - g′,r = max (r, g , b) 且 g ≠min (r, g , b) ; 1 + r′, g = max (r, g , b) 且 b = min (r, g , b) ; 3 - b′, g = max (r, g , b) 且 b ≠min (r, g , b) ; 3 + g′,b = max (r, g , b) 且 r = min (r, g , b) ; 5 - g′,其他. 得到 HSV 空间向量 : h = 60 ×h′, s = v′- min ( r, g , b) v′ , v = v′ 255 . 由于这样得到的属性众多 ,而人眼无法分辨很小的分量之间的差别 ,因此将 HSV 空间各个分量进行量化 ,不会导致算法结果的差别太大 ,而且可以减少计算量和提高计算速度. 本文的实验中 , 将 HSV 3 个分量进行等间隔量化 ,将色调 H 平均分为 x 份 ,饱和度 S 平均分为 y 份 ,亮度 V 平均分为 z 份 ,得到 3 个标量 H、S 、V ,其中 H ∈[0 , x - 1 ] , S ∈ [0 , y - 1 ] ,V ∈[0 , z - 1 ]. · 651 · 智能系统学报第 3 卷

<<向上翻页向下翻页>>

点击下载：人工智能基础：颜色特征的图像分类技术研究