正在加载图片...
·156· 智能系统学报 第3卷 个特征(m《M,然后按照节点不纯度最小原则,从 (translation invariance),而且对观测视角的变化不 这m个特征中选择一个特征进行生长.节点n上的 太敏感.计算颜色直方图时需要将颜色空间划分成 分类数据如果都来自于同一类别,则此节点的不纯 若干个小的颜色区间,这个过程称为颜色量化.颜色 度1(=0.不纯度度量方法采用Gini准则,即假设 直方图的核心思想为:采用一定的量化方法对颜色 P(4)是节点n上属于,类样本个数占训练样本总 空间进行量化,然后计算颜色落在每个小区间内的 数的频率,则Gini准则表示为 像素数量,得到颜色直方图.在本文的实验中,采用 I(n) ∑P(@)Pg)=1-∑p2(o).1) 图像的RGB空间的灰度直方图作为颜色特征进行 分类,只统计颜色的灰度属性,并利用该属性进行分 将生成的多棵分类树组成随机森林,用随机森 类处理 林分类器对新的数据进行判别与分类,分类结果按 2.2改进的颜色直方图 树分类器的投票多少而定.当生成一棵分类树时,通 面向硬设备的颜色模型与人的视觉感知有一定 常需要防止出现过拟合现象 的距离.例如给定一个颜色,人们很难判断其中的 1.2Boos1ing算法 Boosting算法是一种特殊的组合分类器方 R、G、B分量,这时使用面向视觉感知的颜色模型 法6.Boosting方法使用基(弱)算法生成一系列的 比较方便.HSV模型就是面向视觉感知的颜色空间 基分类器,每个基分类器的训练依赖于上一次分类 (perceptual color spaces),较为符合人类思维对颜 器的分类结果.基分类器在训练集上的错误率用于 色的理解、思考方式.这一类模型还包括:HIS(hue, 调整训练样本的概率分布,最终分类器通过单个基 intensity,saturation)等.这些模型与人类颜色视觉 分类器的加权投票建立起来.Boosting算法具有很 感知比较接近,而且独立于显示设备.相对于其他颜 多优点:首先它简单易用,除了迭代次数T以外,不 色模型它更为准确地反映了人类视觉系统对色彩的 需要调节任何参数;其次它不需要先验知识.只要有 理解方式o).HSV模型可以从RGB模型颜色空间 足够多的数据以及弱学习器,就能达到任意预测精 进行转化.假设RGB颜色(r,g,b,r,g,b∈0,1, 度.Boosting不易导致过学习,所以不必担心训练的 ,255],对应HSV空间(h,s,)则 次数T.Boosting算法也存在一些缺点:过于依赖数 v'=max (r.g.b) 据和基学习器,对数据噪声很敏感.如果基学习器太 弱,则不能达到任意高的精度.在实验中采用了较为 v-min (r.g.b) 2 流行的AdaBoost算法I g= y'min (r.g.b 1.3MLP神经网络 令 MLP(multilayer perceptron)是神经网络的一 5+b',r=max(,g,且g=min(r,g,以: 种实现.MLP网络由感受层(S)、联想层(A)、响应 1-g',r=max(r,g,b且g≠min(,g,b: 层(R)构成.S、A、R均由同类神经元构成.反向传播 (back propagation,BP)学习算法在MLP模型中得 h' 1+r.g max (r.g.bb min (r.g. 3-b',g=max(r,g,b且b≠min(r,g,b: 到广泛应用1.它把一组样本的输入输出问题变为 3+g.b max (r.g.b r=min (r.g.b 一个非线性优化问题.网络开始训练时,选用较小的 、5-g其他 随机互联权值与内部阈值,通过反复加载训练样本 得到HSV空间向量: 并调整权值,直到代价函数下降到可接受的容限值」 h=60×h, 在试验中采用了MLP方法进行分类。 s mincr.g.b 2基于颜色的图像属性 颜色特征是图像特征中最为普遍、直观的特征, v=255 它和图像中所包含的物体或场景相关,对图像本身 由于这样得到的属性众多,而人眼无法分辨很 的尺寸、方向、视角的依赖性较小,具有一定的鲁棒 小的分量之间的差别,因此将H$V空间各个分量 性,,所以在图像检索中得到了广泛的应用.也是本 进行量化,不会导致算法结果的差别太大,而且可以 文研究的重点 减少计算量和提高计算速度.本文的实验中,将 2.1颜色直方图 HSV3个分量进行等间隔量化,将色调H平均分 颜色直方图是图像检索中最为常用的颜色特 为x份,饱和度S平均分为y份,亮度V平均分为: 征,它提取简便,具有旋转不变性(rotation invari- 份,得到3个标量H、S、V,其中H∈0,x-1],S∈ ance)、尺度不变性(scale invariance)、平移不变性 0,y-11,Ve/0,z-1] 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net个特征( m ν M) ,然后按照节点不纯度最小原则 ,从 这 m 个特征中选择一个特征进行生长. 节点 n 上的 分类数据如果都来自于同一类别 ,则此节点的不纯 度 I ( n) = 0. 不纯度度量方法采用 Gini 准则 ,即假设 P(ωj) 是节点 n 上属于ωj 类样本个数占训练样本总 数的频率 ,则 Gini 准则表示为 I( n) = i∑≠j P (ωj) P(ωj) = 1 - ∑ j P 2 (ωj) . (1) 将生成的多棵分类树组成随机森林 ,用随机森 林分类器对新的数据进行判别与分类 ,分类结果按 树分类器的投票多少而定. 当生成一棵分类树时 ,通 常需要防止出现过拟合现象. 112 B oosti ng 算法 Boosting 算法是一种特殊的组合分类器方 法[6 ] . Boosting 方法使用基 (弱) 算法生成一系列的 基分类器 ,每个基分类器的训练依赖于上一次分类 器的分类结果. 基分类器在训练集上的错误率用于 调整训练样本的概率分布 ,最终分类器通过单个基 分类器的加权投票建立起来. Boosting 算法具有很 多优点 :首先它简单易用 ,除了迭代次数 T 以外 ,不 需要调节任何参数 ;其次它不需要先验知识. 只要有 足够多的数据以及弱学习器 ,就能达到任意预测精 度.Boosting 不易导致过学习 ,所以不必担心训练的 次数 T. Boosting 算法也存在一些缺点 :过于依赖数 据和基学习器 ,对数据噪声很敏感. 如果基学习器太 弱 ,则不能达到任意高的精度. 在实验中采用了较为 流行的 AdaBoo st 算法[7 ] . 113 ML P 神经网络 ML P(multilayer perceptron) 是神经网络的一 种实现. ML P 网络由感受层 (S) 、联想层 (A) 、响应 层(R) 构成. S、A 、R 均由同类神经元构成. 反向传播 (back propagation ,BP) 学习算法在 ML P 模型中得 到广泛应用[8 ] . 它把一组样本的输入、输出问题变为 一个非线性优化问题. 网络开始训练时 ,选用较小的 随机互联权值与内部阈值 ,通过反复加载训练样本 并调整权值 ,直到代价函数下降到可接受的容限值. 在试验中采用了 ML P 方法进行分类. 2 基于颜色的图像属性 颜色特征是图像特征中最为普遍、直观的特征 , 它和图像中所包含的物体或场景相关 ,对图像本身 的尺寸、方向、视角的依赖性较小 ,具有一定的鲁棒 性[9 ] ,所以在图像检索中得到了广泛的应用. 也是本 文研究的重点. 211 颜色直方图 颜色直方图是图像检索中最为常用的颜色特 征 ,它提取简便 ,具有旋转不变性 (rotation invari2 ance) 、尺度不变性 (scale invariance) 、平移不变性 (translation invariance ) ,而且对观测视角的变化不 太敏感. 计算颜色直方图时需要将颜色空间划分成 若干个小的颜色区间 ,这个过程称为颜色量化. 颜色 直方图的核心思想为 :采用一定的量化方法对颜色 空间进行量化 ,然后计算颜色落在每个小区间内的 像素数量 ,得到颜色直方图. 在本文的实验中 ,采用 图像的 R GB 空间的灰度直方图作为颜色特征进行 分类 ,只统计颜色的灰度属性 ,并利用该属性进行分 类处理. 212 改进的颜色直方图 面向硬设备的颜色模型与人的视觉感知有一定 的距离. 例如给定一个颜色 ,人们很难判断其中的 R、G、B 分量 ,这时使用面向视觉感知的颜色模型 比较方便. HSV 模型就是面向视觉感知的颜色空间 (perceptual color spaces) ,较为符合人类思维对颜 色的理解、思考方式. 这一类模型还包括 : HIS( hue , intensity , saturation) 等. 这些模型与人类颜色视觉 感知比较接近 ,而且独立于显示设备. 相对于其他颜 色模型它更为准确地反映了人类视觉系统对色彩的 理解方式[10 ] . HSV 模型可以从 RGB 模型颜色空间 进行转化. 假设 RGB 颜色 ( r, g , b) , r, g , b ∈[0 , 1 , …,255 ] , 对应 HSV 空间( h ,s, v) 则 v′= max ( r, g , b) , r′= v′- r v′- min ( r, g , b) , g′= v′- g v′- min ( r, g , b) . (2) 令 h′= 5 + b′, r = max (r, g , b) 且 g = min (r, g , b) ; 1 - g′,r = max (r, g , b) 且 g ≠min (r, g , b) ; 1 + r′, g = max (r, g , b) 且 b = min (r, g , b) ; 3 - b′, g = max (r, g , b) 且 b ≠min (r, g , b) ; 3 + g′,b = max (r, g , b) 且 r = min (r, g , b) ; 5 - g′,其他. 得到 HSV 空间向量 : h = 60 ×h′, s = v′- min ( r, g , b) v′ , v = v′ 255 . 由于这样得到的属性众多 ,而人眼无法分辨很 小的分量之间的差别 ,因此将 HSV 空间各个分量 进行量化 ,不会导致算法结果的差别太大 ,而且可以 减少计算量和提高计算速度. 本文的实验中 , 将 HSV 3 个分量进行等间隔量化 ,将色调 H 平均分 为 x 份 ,饱和度 S 平均分为 y 份 ,亮度 V 平均分为 z 份 ,得到 3 个标量 H、S 、V ,其中 H ∈[0 , x - 1 ] , S ∈ [0 , y - 1 ] ,V ∈[0 , z - 1 ]. · 651 · 智 能 系 统 学 报 第 3 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有