于内容的图像检索（ｃｏｎｔｅｎｔｂａｓｅｄｉｍａｇｅｒｅｔｒｉｅｖ

正在加载图片...

第4期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·637. 于内容的图像检素(content based image retrieval, 但是，在以上标注模型中都没有考虑到图像处 CBR),用低维的视觉特征如颜色、形状、纹理以及理中存在的模糊和不确定性的属性（锐利边界），如空间位置等来检索图像信息，但是CBR系统存在图像边缘、边界、区域等定义，对于临界的点，将其确低维特征与高维语义间的“语义鸿沟”，针对该问定为某一类都会影响标准的准确性，存在的这些模题，图像自动标注研究如何更加有效地标注和快速糊属性将干扰图像处理结果的精确性。故本文提出存取图像。一种基于隶属度的模糊分类方法，该方法结合模糊在多数图像自动标注(automatic image annota- 关联规则(fuzzy association rules,FARs)和决策树方 tion,AA)系统中，采用全局特征、基于块的局部特法来自动标注图像，方法的优点在于：一方面，在训征或是基于区域的局部特征表示图像。Jeon等) 练阶段，根据提出的评价标准获得模糊关联规则，该使用区域分割方法，假设图像语义用区域特征产生关联规则决定图像特征和语义关联的程度，更加直的词汇来描述，结合以上3种特征表述方法，提出全观的获取了低维图像特征和高维图像语义间的联局和局部的特征表示方法来标注图像。Wang等) 系，很好地解决了“语义鸿沟”问题：根据隶属度函提出了一种结合全局、区域及上下文特征表示的改数将低维图像特征映射到模糊特征向量，旨在处理进模型，通过计算它们的联合概率并结合以上3种 “锐利的边界”的问题。另一方面，运用决策树算法特征表示标注图像。Duygulu等[s)提出翻译模型标来解决冗余的模糊关联规则，过滤掉不必要的和弱注图像，该方法是一种生成式模型标注的代表性方的关联规则，大大减小了算法的时间复杂度，提高了法，它通过学习联合概率将关键词与图像的区域联标注的准确性和效率。系起来，将标注过程转化成一个将区域翻译为关键 1图像分割及特征提取词的过程。Monay等[)提出基于概率潜在语义分析 (probabilistic latent semantic analysis,PLSA)模型的在图像自动标注中，图像用全局特征或局部特图像自动标注方法PLSA-WORDS。.李志欣等在此征表示，把图像分割成不同子区域。图像分割是图基础上先后提出融合语义主题的图像自动标注) 像处理的关键步骤，图像分割的好坏将影响到图像及混合生成式和判别式模型的图像自动标注模型标注的精度。分割方法包括边缘检测、边缘跟踪、区 hybrid generative/discriminative model,HGDM)[8] 域增长等。区域增长的图像分割通常能将具有相同 HGDM首先用连续PLSA模型处理图像视觉特征，特征的联通区域分割出来。并且能提供很好的边界然后构建用来学习图像语义类别的分类模型链，综信息和分割结果。针对本文“锐利边界问题”，为了合神经网络、多类SVM以及K近邻分类器模型，利体现对图像的边缘信息点的处理，文中采用区域增用EM算法计算一个权重参数，根据该参数来选择长方法分割图像。区域生长一般分3个步骤：1)选精确度更高的分类模型，最终得到目标的语义。茹择合适的生长点：2)确定生长准则：3)确定生长停立云等f9)提出一种基于boosting学习的图像自动标止条件。表1给出了来自Corl5k数据集的部分图注系统，假设一组具有同一语义的图像能够由一组像分割前后对比。视觉模型来表示，即颜色和纹理特殊组合的2维多表1图像分割的几个实例分辨率隐马尔可夫模型，然后使用boosting算法实 Table 1 Several examples of image segmentation 现关键词与模型的关联。Sumathi和Hemalatha提原始图像分割后图像原始图像分割后图像出一种创新的混合分层图像标注模型]，该方法运用低维图像特征及其特征间距离找到图像的最近邻，然后用SVM方法得到图像标注。张静等[山提出一种新的模型提取图像前景和背景语义，运用视觉特点分析多个判别方法获得前景语义概念，用区域语义分析方法标注背景图像。Makadia等2]提出用JEC(joint equal contribution)的方法进行图像标图像表示和特征提取是标注算法中一个重要和注，JEC利用全局低维图像特征和基本距离度量的决定性的步骤，图像进行区域分割后，从分割区域中简单结合寻找给定图像的最近邻，然后使用一种贪提取低维视觉特征，特征向量呈现图像不同的属性心的标签传递机制将关键词赋予对应的图像，取得和特征。图像特征表示的相关文献有MPEG-7标了很好的标注精度和检索性能。准)、颜色聚合向量[14，Lowe在2004年提出的于内容的图像检索（ｃｏｎｔｅｎｔｂａｓｅｄｉｍａｇｅｒｅｔｒｉｅｖａｌ，ＣＢＩＲ），用低维的视觉特征如颜色、形状、纹理以及空间位置等来检索图像信息，但是ＣＢＩＲ系统存在低维特征与高维语义间的“语义鸿沟”，针对该问题，图像自动标注研究如何更加有效地标注和快速存取图像。在多数图像自动标注（ａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａ⁃ ｔｉｏｎ，ＡＩＡ）系统中，采用全局特征、基于块的局部特征或是基于区域的局部特征表示图像。Ｊｅｏｎ等［３］使用区域分割方法，假设图像语义用区域特征产生的词汇来描述，结合以上３种特征表述方法，提出全局和局部的特征表示方法来标注图像。Ｗａｎｇ等［４］提出了一种结合全局、区域及上下文特征表示的改进模型，通过计算它们的联合概率并结合以上３种特征表示标注图像。Ｄｕｙｇｕｌｕ等［５］提出翻译模型标注图像，该方法是一种生成式模型标注的代表性方法，它通过学习联合概率将关键词与图像的区域联系起来，将标注过程转化成一个将区域翻译为关键词的过程。Ｍｏｎａｙ等［６］提出基于概率潜在语义分析（ｐｒｏｂａｂｉｌｉｓｔｉｃｌａｔｅｎｔｓｅｍａｎｔｉｃａｎａｌｙｓｉｓ，ＰＬＳＡ）模型的图像自动标注方法ＰＬＳＡ⁃ＷＯＲＤＳ。李志欣等在此基础上先后提出融合语义主题的图像自动标注［７］及混合生成式和判别式模型的图像自动标注模型（ｈｙｂｒｉｄｇｅｎｅｒａｔｉｖｅ／ｄｉｓｃｒｉｍｉｎａｔｉｖｅｍｏｄｅｌ，ＨＧＤＭ）［８］。ＨＧＤＭ首先用连续ＰＬＳＡ模型处理图像视觉特征，然后构建用来学习图像语义类别的分类模型链，综合神经网络、多类ＳＶＭ以及Ｋ近邻分类器模型，利用ＥＭ算法计算一个权重参数，根据该参数来选择精确度更高的分类模型，最终得到目标的语义。茹立云等［９］提出一种基于ｂｏｏｓｔｉｎｇ学习的图像自动标注系统，假设一组具有同一语义的图像能够由一组视觉模型来表示，即颜色和纹理特殊组合的２维多分辨率隐马尔可夫模型，然后使用ｂｏｏｓｔｉｎｇ算法实现关键词与模型的关联。Ｓｕｍａｔｈｉ和Ｈｅｍａｌａｔｈａ提出一种创新的混合分层图像标注模型［１０］，该方法运用低维图像特征及其特征间距离找到图像的最近邻，然后用ＳＶＭ方法得到图像标注。张静等［１１］提出一种新的模型提取图像前景和背景语义，运用视觉特点分析多个判别方法获得前景语义概念，用区域语义分析方法标注背景图像。Ｍａｋａｄｉａ等［１２］提出用ＪＥＣ（ｊｏｉｎｔｅｑｕａｌｃｏｎｔｒｉｂｕｔｉｏｎ）的方法进行图像标注，ＪＥＣ利用全局低维图像特征和基本距离度量的简单结合寻找给定图像的最近邻，然后使用一种贪心的标签传递机制将关键词赋予对应的图像，取得了很好的标注精度和检索性能。但是，在以上标注模型中都没有考虑到图像处理中存在的模糊和不确定性的属性（锐利边界），如图像边缘、边界、区域等定义，对于临界的点，将其确定为某一类都会影响标准的准确性，存在的这些模糊属性将干扰图像处理结果的精确性。故本文提出一种基于隶属度的模糊分类方法，该方法结合模糊关联规则（ｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓ，ＦＡＲｓ）和决策树方法来自动标注图像，方法的优点在于：一方面，在训练阶段，根据提出的评价标准获得模糊关联规则，该关联规则决定图像特征和语义关联的程度，更加直观的获取了低维图像特征和高维图像语义间的联系，很好地解决了“语义鸿沟”问题；根据隶属度函数将低维图像特征映射到模糊特征向量，旨在处理 “锐利的边界”的问题。另一方面，运用决策树算法来解决冗余的模糊关联规则，过滤掉不必要的和弱的关联规则，大大减小了算法的时间复杂度，提高了标注的准确性和效率。１图像分割及特征提取在图像自动标注中，图像用全局特征或局部特征表示，把图像分割成不同子区域。图像分割是图像处理的关键步骤，图像分割的好坏将影响到图像标注的精度。分割方法包括边缘检测、边缘跟踪、区域增长等。区域增长的图像分割通常能将具有相同特征的联通区域分割出来。并且能提供很好的边界信息和分割结果。针对本文“锐利边界问题”，为了体现对图像的边缘信息点的处理，文中采用区域增长方法分割图像。区域生长一般分３个步骤：１）选择合适的生长点；２）确定生长准则；３）确定生长停止条件。表１给出了来自Ｃｏｒｅｌ５ｋ数据集的部分图像分割前后对比。表１图像分割的几个实例Ｔａｂｌｅ１Ｓｅｖｅｒａｌｅｘａｍｐｌｅｓｏｆｉｍａｇｅｓｅｇｍｅｎｔａｔｉｏｎ原始图像分割后图像原始图像分割后图像图像表示和特征提取是标注算法中一个重要和决定性的步骤，图像进行区域分割后，从分割区域中提取低维视觉特征，特征向量呈现图像不同的属性和特征。图像特征表示的相关文献有ＭＰＥＧ⁃７标准［１３］、颜色聚合向量［１４］，Ｌｏｗｅ在２００４年提出的第４期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·６３７·

<<向上翻页向下翻页>>

点击下载：机器学习：基于模糊关联规则和决策树的图像自动标注编辑部