机器学习：基于模糊关联规则和决策树的图像自动标注编辑部

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：2.14MB

第10卷第4期智能系统学报 Vol.10 No.4 2015年8月 CAAI Transactions on Intelligent Systems Aug.2015 D0:10.3969/j.issn.1673-4785.201505009 网络出版地址：http://www.cnki.net/kcms/detail/23.1538.TP.20150630.1544.002.html 基于模糊关联规则和决策树的图像自动标注李志欣12，李灵芝，张灿龙2 (1.广西师范大学广西多源信息挖据与安全重点实验室，广西桂林541004：2.广西信息科学实验中心，广西桂林541004) 摘要：传统的基于关联规则算法的图像自动标注存在“锐利边界”问题，使分类存在模糊性、不准确性。且随着多媒体技术的飞速发展，图像信息数据迅速增长，海量的图像数据会形成大量冗余的关联规则，这将导致分类效率大大降低。针对这2个问题，文中提出基于模糊关联规则和决策树的图像自动标注模型。该模型首先获得关联训练图像低层特征和高层语义的模糊关联规则，再利用决策树方法删减冗余的模糊关联规则，基于决策树删减后的模糊关联规则，大大减小了算法的计算复杂度。实验在Corl5k和IAPR-TC12两个基谁数据集上进行，并从精度、召回率、 F-measure以及产生的规则数量几个度量措施上进行比较。与其他几种前沿的图像自动标注方法的结果对比表明，该方法在图像的标注精度和标注效率上有很大的提高。关键词：锐利边界：模糊分类：图像自动标注：模糊关联规则：决策树中图分类号：TP391文献标志码：A文章编号：1673-4785(2015)04-0636-08 中文引用格式：李志欣，李灵芝，张灿龙.基于模糊关联规则和决策树的图像自动标注[J】.智能系统学报，2015,10(4)：636-644. 英文引用格式：LI Zhixin,LI Lingzhi,ZHANG Canlong.Automatic image annotation based on fuzzy association rules and decision trees[J].CAAI Transactions on Intelligent Systems,2015,10(4):636-644. Automatic image annotation based on fuzzy association rules and decision trees LI Zhixin'2,LI Lingzhi',ZHANG Canlong' (1.Guangxi Key Lab of Multi-source Information Mining Security,Guangxi Normal University,Guilin 541004,China;2.Guangxi Experiment Center of Information Science,Guilin 541004,China) Abstract:The traditional automatic image annotation based on association rules exists the problem of sharp boundary, which makes classification more fuzzy and inaccurate.Moreover,with the rapid development of multimedia technology, the size of image data increases quickly.Massive image data will produce a lot of redundant association rules,which greatly decreases the efficiency of image classification.In order to solve these two problems,this paper proposes an auto- matic image annotation approach based on fuzzy association rules and decision trees.The approach firstly obtains fuzzy association rules which represent the fuzzy correlations between low-level visual features and high-level semantic concepts of training images.Then,decision tree is adopted to reduce the redundant fuzzy association rules.As a result,computa- tional complexity of the algorithm is decreased to a large degree.Experiments were done on Corel5k and IAPR-TC12 datasets.The evaluation measures are compared from the aspects of precision,recall,F-measure and the number of rules.The experimental results show that the proposed method acquires higher accuracy and efficiency in comparison with several state-of-the-art automatic image annotation approaches. Keywords:sharp boundary;fuzzy classification;automatic image annotation;fuzzy association rules;decision tree 收稿日期：2015-05-06.网络出版日期：2015-06-30. 随着多媒体技术的飞速发展，图像信息数据迅基金项目：国家自然科学基金资助项目(61165009,61262005.61363035. 61365009):国家973计划资助项目(2012CB326403):广西自然科速增长，传统的人工图像标注2)已不能满足海量学基金资助项目(2012 CXNSFAA053219,2013 GXNSFAA019345, 的图像数据库标注要求，如何实现有效标注和快速 2014 CXNSFAA118368). 通信作者：李志欣.E-mail:liax@gu.cdu.cm 存取，已经成为多媒体领域一项重大研究课题。基

第１０卷第４期智能系统学报Ｖｏｌ．１０ №．４２０１５年８月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＡｕｇ．２０１５ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１５０５００９网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１５０６３０．１５４４．００２．ｈｔｍｌ基于模糊关联规则和决策树的图像自动标注李志欣１，２，李灵芝１，张灿龙１，２（１．广西师范大学广西多源信息挖掘与安全重点实验室，广西桂林５４１００４；２．广西信息科学实验中心，广西桂林５４１００４）摘要：传统的基于关联规则算法的图像自动标注存在“锐利边界”问题，使分类存在模糊性、不准确性。且随着多媒体技术的飞速发展，图像信息数据迅速增长，海量的图像数据会形成大量冗余的关联规则，这将导致分类效率大大降低。针对这２个问题，文中提出基于模糊关联规则和决策树的图像自动标注模型。该模型首先获得关联训练图像低层特征和高层语义的模糊关联规则，再利用决策树方法删减冗余的模糊关联规则，基于决策树删减后的模糊关联规则，大大减小了算法的计算复杂度。实验在Ｃｏｒｅｌ５ｋ和ＩＡＰＲ⁃ＴＣ１２两个基准数据集上进行，并从精度、召回率、Ｆ⁃ｍｅａｓｕｒｅ以及产生的规则数量几个度量措施上进行比较。与其他几种前沿的图像自动标注方法的结果对比表明，该方法在图像的标注精度和标注效率上有很大的提高。关键词：锐利边界；模糊分类；图像自动标注；模糊关联规则；决策树中图分类号：ＴＰ３９１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１５）０４⁃０６３６⁃０８中文引用格式：李志欣，李灵芝，张灿龙．基于模糊关联规则和决策树的图像自动标注［Ｊ］．智能系统学报，２０１５，１０（４）：６３６⁃６４４．英文引用格式：ＬＩＺｈｉｘｉｎ，ＬＩＬｉｎｇｚｈｉ，ＺＨＡＮＧＣａｎｌｏｎｇ．Ａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｂａｓｅｄｏｎｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓａｎｄｄｅｃｉｓｉｏｎｔｒｅｅｓ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１５，１０（４）：６３６⁃６４４．ＡｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｂａｓｅｄｏｎｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓａｎｄｄｅｃｉｓｉｏｎｔｒｅｅｓＬＩＺｈｉｘｉｎ１，２，ＬＩＬｉｎｇｚｈｉ１，ＺＨＡＮＧＣａｎｌｏｎｇ１，２（１．ＧｕａｎｇｘｉＫｅｙＬａｂｏｆＭｕｌｔｉ⁃ｓｏｕｒｃｅＩｎｆｏｒｍａｔｉｏｎＭｉｎｉｎｇ＆Ｓｅｃｕｒｉｔｙ，ＧｕａｎｇｘｉＮｏｒｍａｌＵｎｉｖｅｒｓｉｔｙ，Ｇｕｉｌｉｎ５４１００４，Ｃｈｉｎａ；２．ＧｕａｎｇｘｉＥｘｐｅｒｉｍｅｎｔＣｅｎｔｅｒｏｆＩｎｆｏｒｍａｔｉｏｎＳｃｉｅｎｃｅ，Ｇｕｉｌｉｎ５４１００４，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｔｈｅｔｒａｄｉｔｉｏｎａｌａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｂａｓｅｄｏｎａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓｅｘｉｓｔｓｔｈｅｐｒｏｂｌｅｍｏｆｓｈａｒｐｂｏｕｎｄａｒｙ，ｗｈｉｃｈｍａｋｅｓｃｌａｓｓｉｆｉｃａｔｉｏｎｍｏｒｅｆｕｚｚｙａｎｄｉｎａｃｃｕｒａｔｅ．Ｍｏｒｅｏｖｅｒ，ｗｉｔｈｔｈｅｒａｐｉｄｄｅｖｅｌｏｐｍｅｎｔｏｆｍｕｌｔｉｍｅｄｉａｔｅｃｈｎｏｌｏｇｙ，ｔｈｅｓｉｚｅｏｆｉｍａｇｅｄａｔａｉｎｃｒｅａｓｅｓｑｕｉｃｋｌｙ．Ｍａｓｓｉｖｅｉｍａｇｅｄａｔａｗｉｌｌｐｒｏｄｕｃｅａｌｏｔｏｆｒｅｄｕｎｄａｎｔａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓ，ｗｈｉｃｈｇｒｅａｔｌｙｄｅｃｒｅａｓｅｓｔｈｅｅｆｆｉｃｉｅｎｃｙｏｆｉｍａｇｅｃｌａｓｓｉｆｉｃａｔｉｏｎ．Ｉｎｏｒｄｅｒｔｏｓｏｌｖｅｔｈｅｓｅｔｗｏｐｒｏｂｌｅｍｓ，ｔｈｉｓｐａｐｅｒｐｒｏｐｏｓｅｓａｎａｕｔｏ⁃ ｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎａｐｐｒｏａｃｈｂａｓｅｄｏｎｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓａｎｄｄｅｃｉｓｉｏｎｔｒｅｅｓ．Ｔｈｅａｐｐｒｏａｃｈｆｉｒｓｔｌｙｏｂｔａｉｎｓｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓｗｈｉｃｈｒｅｐｒｅｓｅｎｔｔｈｅｆｕｚｚｙｃｏｒｒｅｌａｔｉｏｎｓｂｅｔｗｅｅｎｌｏｗ⁃ｌｅｖｅｌｖｉｓｕａｌｆｅａｔｕｒｅｓａｎｄｈｉｇｈ⁃ｌｅｖｅｌｓｅｍａｎｔｉｃｃｏｎｃｅｐｔｓｏｆｔｒａｉｎｉｎｇｉｍａｇｅｓ．Ｔｈｅｎ，ｄｅｃｉｓｉｏｎｔｒｅｅｉｓａｄｏｐｔｅｄｔｏｒｅｄｕｃｅｔｈｅｒｅｄｕｎｄａｎｔｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓ．Ａｓａｒｅｓｕｌｔ，ｃｏｍｐｕｔａ⁃ ｔｉｏｎａｌｃｏｍｐｌｅｘｉｔｙｏｆｔｈｅａｌｇｏｒｉｔｈｍｉｓｄｅｃｒｅａｓｅｄｔｏａｌａｒｇｅｄｅｇｒｅｅ．ＥｘｐｅｒｉｍｅｎｔｓｗｅｒｅｄｏｎｅｏｎＣｏｒｅｌ５ｋａｎｄＩＡＰＲ⁃ＴＣ１２ｄａｔａｓｅｔｓ．Ｔｈｅｅｖａｌｕａｔｉｏｎｍｅａｓｕｒｅｓａｒｅｃｏｍｐａｒｅｄｆｒｏｍｔｈｅａｓｐｅｃｔｓｏｆｐｒｅｃｉｓｉｏｎ，ｒｅｃａｌｌ，Ｆ⁃ｍｅａｓｕｒｅａｎｄｔｈｅｎｕｍｂｅｒｏｆｒｕｌｅｓ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄａｃｑｕｉｒｅｓｈｉｇｈｅｒａｃｃｕｒａｃｙａｎｄｅｆｆｉｃｉｅｎｃｙｉｎｃｏｍｐａｒｉｓｏｎｗｉｔｈｓｅｖｅｒａｌｓｔａｔｅ⁃ｏｆ⁃ｔｈｅ⁃ａｒｔａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎａｐｐｒｏａｃｈｅｓ．Ｋｅｙｗｏｒｄｓ：ｓｈａｒｐｂｏｕｎｄａｒｙ；ｆｕｚｚｙｃｌａｓｓｉｆｉｃａｔｉｏｎ；ａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎ；ｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓ；ｄｅｃｉｓｉｏｎｔｒｅｅ收稿日期：２０１５⁃０５⁃０６．网络出版日期：２０１５⁃０６⁃３０．基金项目：国家自然科学基金资助项目（６１１６５００９，６１２６２００５，６１３６３０３５，６１３６５００９）；国家９７３计划资助项目（２０１２ＣＢ３２６４０３）；广西自然科学基金资助项目（２０１２ＧＸＮＳＦＡＡ０５３２１９，２０１３ＧＸＮＳＦＡＡ０１９３４５，２０１４ＧＸＮＳＦＡＡ１１８３６８）．通信作者：李志欣．Ｅ⁃ｍａｉｌ：ｌｉｚｘ＠ｇｘｎｕ．ｅｄｕ．ｃｎ．随着多媒体技术的飞速发展，图像信息数据迅速增长，传统的人工图像标注［１⁃２］已不能满足海量的图像数据库标注要求，如何实现有效标注和快速存取，已经成为多媒体领域一项重大研究课题。基

第4期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·637. 于内容的图像检素(content based image retrieval, 但是，在以上标注模型中都没有考虑到图像处 CBR),用低维的视觉特征如颜色、形状、纹理以及理中存在的模糊和不确定性的属性（锐利边界），如空间位置等来检索图像信息，但是CBR系统存在图像边缘、边界、区域等定义，对于临界的点，将其确低维特征与高维语义间的“语义鸿沟”，针对该问定为某一类都会影响标准的准确性，存在的这些模题，图像自动标注研究如何更加有效地标注和快速糊属性将干扰图像处理结果的精确性。故本文提出存取图像。一种基于隶属度的模糊分类方法，该方法结合模糊在多数图像自动标注(automatic image annota- 关联规则(fuzzy association rules,FARs)和决策树方 tion,AA)系统中，采用全局特征、基于块的局部特法来自动标注图像，方法的优点在于：一方面，在训征或是基于区域的局部特征表示图像。Jeon等) 练阶段，根据提出的评价标准获得模糊关联规则，该使用区域分割方法，假设图像语义用区域特征产生关联规则决定图像特征和语义关联的程度，更加直的词汇来描述，结合以上3种特征表述方法，提出全观的获取了低维图像特征和高维图像语义间的联局和局部的特征表示方法来标注图像。Wang等) 系，很好地解决了“语义鸿沟”问题：根据隶属度函提出了一种结合全局、区域及上下文特征表示的改数将低维图像特征映射到模糊特征向量，旨在处理进模型，通过计算它们的联合概率并结合以上3种 “锐利的边界”的问题。另一方面，运用决策树算法特征表示标注图像。Duygulu等[s)提出翻译模型标来解决冗余的模糊关联规则，过滤掉不必要的和弱注图像，该方法是一种生成式模型标注的代表性方的关联规则，大大减小了算法的时间复杂度，提高了法，它通过学习联合概率将关键词与图像的区域联标注的准确性和效率。系起来，将标注过程转化成一个将区域翻译为关键 1图像分割及特征提取词的过程。Monay等[)提出基于概率潜在语义分析 (probabilistic latent semantic analysis,PLSA)模型的在图像自动标注中，图像用全局特征或局部特图像自动标注方法PLSA-WORDS。.李志欣等在此征表示，把图像分割成不同子区域。图像分割是图基础上先后提出融合语义主题的图像自动标注) 像处理的关键步骤，图像分割的好坏将影响到图像及混合生成式和判别式模型的图像自动标注模型标注的精度。分割方法包括边缘检测、边缘跟踪、区 hybrid generative/discriminative model,HGDM)[8] 域增长等。区域增长的图像分割通常能将具有相同 HGDM首先用连续PLSA模型处理图像视觉特征，特征的联通区域分割出来。并且能提供很好的边界然后构建用来学习图像语义类别的分类模型链，综信息和分割结果。针对本文“锐利边界问题”，为了合神经网络、多类SVM以及K近邻分类器模型，利体现对图像的边缘信息点的处理，文中采用区域增用EM算法计算一个权重参数，根据该参数来选择长方法分割图像。区域生长一般分3个步骤：1)选精确度更高的分类模型，最终得到目标的语义。茹择合适的生长点：2)确定生长准则：3)确定生长停立云等f9)提出一种基于boosting学习的图像自动标止条件。表1给出了来自Corl5k数据集的部分图注系统，假设一组具有同一语义的图像能够由一组像分割前后对比。视觉模型来表示，即颜色和纹理特殊组合的2维多表1图像分割的几个实例分辨率隐马尔可夫模型，然后使用boosting算法实 Table 1 Several examples of image segmentation 现关键词与模型的关联。Sumathi和Hemalatha提原始图像分割后图像原始图像分割后图像出一种创新的混合分层图像标注模型]，该方法运用低维图像特征及其特征间距离找到图像的最近邻，然后用SVM方法得到图像标注。张静等[山提出一种新的模型提取图像前景和背景语义，运用视觉特点分析多个判别方法获得前景语义概念，用区域语义分析方法标注背景图像。Makadia等2]提出用JEC(joint equal contribution)的方法进行图像标图像表示和特征提取是标注算法中一个重要和注，JEC利用全局低维图像特征和基本距离度量的决定性的步骤，图像进行区域分割后，从分割区域中简单结合寻找给定图像的最近邻，然后使用一种贪提取低维视觉特征，特征向量呈现图像不同的属性心的标签传递机制将关键词赋予对应的图像，取得和特征。图像特征表示的相关文献有MPEG-7标了很好的标注精度和检索性能。准)、颜色聚合向量[14，Lowe在2004年提出的

于内容的图像检索（ｃｏｎｔｅｎｔｂａｓｅｄｉｍａｇｅｒｅｔｒｉｅｖａｌ，ＣＢＩＲ），用低维的视觉特征如颜色、形状、纹理以及空间位置等来检索图像信息，但是ＣＢＩＲ系统存在低维特征与高维语义间的“语义鸿沟”，针对该问题，图像自动标注研究如何更加有效地标注和快速存取图像。在多数图像自动标注（ａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａ⁃ ｔｉｏｎ，ＡＩＡ）系统中，采用全局特征、基于块的局部特征或是基于区域的局部特征表示图像。Ｊｅｏｎ等［３］使用区域分割方法，假设图像语义用区域特征产生的词汇来描述，结合以上３种特征表述方法，提出全局和局部的特征表示方法来标注图像。Ｗａｎｇ等［４］提出了一种结合全局、区域及上下文特征表示的改进模型，通过计算它们的联合概率并结合以上３种特征表示标注图像。Ｄｕｙｇｕｌｕ等［５］提出翻译模型标注图像，该方法是一种生成式模型标注的代表性方法，它通过学习联合概率将关键词与图像的区域联系起来，将标注过程转化成一个将区域翻译为关键词的过程。Ｍｏｎａｙ等［６］提出基于概率潜在语义分析（ｐｒｏｂａｂｉｌｉｓｔｉｃｌａｔｅｎｔｓｅｍａｎｔｉｃａｎａｌｙｓｉｓ，ＰＬＳＡ）模型的图像自动标注方法ＰＬＳＡ⁃ＷＯＲＤＳ。李志欣等在此基础上先后提出融合语义主题的图像自动标注［７］及混合生成式和判别式模型的图像自动标注模型（ｈｙｂｒｉｄｇｅｎｅｒａｔｉｖｅ／ｄｉｓｃｒｉｍｉｎａｔｉｖｅｍｏｄｅｌ，ＨＧＤＭ）［８］。ＨＧＤＭ首先用连续ＰＬＳＡ模型处理图像视觉特征，然后构建用来学习图像语义类别的分类模型链，综合神经网络、多类ＳＶＭ以及Ｋ近邻分类器模型，利用ＥＭ算法计算一个权重参数，根据该参数来选择精确度更高的分类模型，最终得到目标的语义。茹立云等［９］提出一种基于ｂｏｏｓｔｉｎｇ学习的图像自动标注系统，假设一组具有同一语义的图像能够由一组视觉模型来表示，即颜色和纹理特殊组合的２维多分辨率隐马尔可夫模型，然后使用ｂｏｏｓｔｉｎｇ算法实现关键词与模型的关联。Ｓｕｍａｔｈｉ和Ｈｅｍａｌａｔｈａ提出一种创新的混合分层图像标注模型［１０］，该方法运用低维图像特征及其特征间距离找到图像的最近邻，然后用ＳＶＭ方法得到图像标注。张静等［１１］提出一种新的模型提取图像前景和背景语义，运用视觉特点分析多个判别方法获得前景语义概念，用区域语义分析方法标注背景图像。Ｍａｋａｄｉａ等［１２］提出用ＪＥＣ（ｊｏｉｎｔｅｑｕａｌｃｏｎｔｒｉｂｕｔｉｏｎ）的方法进行图像标注，ＪＥＣ利用全局低维图像特征和基本距离度量的简单结合寻找给定图像的最近邻，然后使用一种贪心的标签传递机制将关键词赋予对应的图像，取得了很好的标注精度和检索性能。但是，在以上标注模型中都没有考虑到图像处理中存在的模糊和不确定性的属性（锐利边界），如图像边缘、边界、区域等定义，对于临界的点，将其确定为某一类都会影响标准的准确性，存在的这些模糊属性将干扰图像处理结果的精确性。故本文提出一种基于隶属度的模糊分类方法，该方法结合模糊关联规则（ｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓ，ＦＡＲｓ）和决策树方法来自动标注图像，方法的优点在于：一方面，在训练阶段，根据提出的评价标准获得模糊关联规则，该关联规则决定图像特征和语义关联的程度，更加直观的获取了低维图像特征和高维图像语义间的联系，很好地解决了“语义鸿沟”问题；根据隶属度函数将低维图像特征映射到模糊特征向量，旨在处理 “锐利的边界”的问题。另一方面，运用决策树算法来解决冗余的模糊关联规则，过滤掉不必要的和弱的关联规则，大大减小了算法的时间复杂度，提高了标注的准确性和效率。１图像分割及特征提取在图像自动标注中，图像用全局特征或局部特征表示，把图像分割成不同子区域。图像分割是图像处理的关键步骤，图像分割的好坏将影响到图像标注的精度。分割方法包括边缘检测、边缘跟踪、区域增长等。区域增长的图像分割通常能将具有相同特征的联通区域分割出来。并且能提供很好的边界信息和分割结果。针对本文“锐利边界问题”，为了体现对图像的边缘信息点的处理，文中采用区域增长方法分割图像。区域生长一般分３个步骤：１）选择合适的生长点；２）确定生长准则；３）确定生长停止条件。表１给出了来自Ｃｏｒｅｌ５ｋ数据集的部分图像分割前后对比。表１图像分割的几个实例Ｔａｂｌｅ１Ｓｅｖｅｒａｌｅｘａｍｐｌｅｓｏｆｉｍａｇｅｓｅｇｍｅｎｔａｔｉｏｎ原始图像分割后图像原始图像分割后图像图像表示和特征提取是标注算法中一个重要和决定性的步骤，图像进行区域分割后，从分割区域中提取低维视觉特征，特征向量呈现图像不同的属性和特征。图像特征表示的相关文献有ＭＰＥＧ⁃７标准［１３］、颜色聚合向量［１４］，Ｌｏｗｅ在２００４年提出的第４期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·６３７·

·638. 智能系统学报第10卷 SFT特征[等，文中采用图像的颜色、边缘和纹理表示的边缘特征，从每幅图像提取一个22维特征向特征来表示。量。特征表示如图1所示。 2图像自动标注模型关联规则算法广泛运用在数据挖掘和分类[]中，研究证明关联规则方法比支持向量机(sup 边缘颜色纹理 port vector machine,SVM)、朴素贝叶斯、神经网络等方法具有更高的分类准确率，但关联规则算法处理 “锐利边界”问题性能较弱。为了解决这个问题，色度饱和度明度 Kuok等提出了模糊技术来挖掘关联规则1)，研究了图1图像的视觉特征表示很多基于FARs的分类模型，并广泛运用于数据挖掘 Fig.1 Image representation of visual features 中，同时，模糊关联规则在图像处理领域也有相关研颜色是图像的最重要的特征之一，RGB、LUV、究。文献[19]提出了一种基于自适应区间划分的模 HSV、HMMD是使用频繁的色彩空间，图像特征描述糊关联遥感图像分类方法。算法根据遥感图像分类器包括颜色直方图、颜色矩、颜色聚合向量等。纹理的特点，利用模糊C均值聚类算法自适应地建立连续特征能粗糙的捕捉图像的特点，在图像处理和计算型属性模糊区间，使用新的剪枝策略对项集进行筛选机视觉中，纹理分析模型采用高斯分布、马尔可夫随从而避免生成无用规则，采用一种新的规则重要性度机场和Gabor滤波器获取图像数据。边缘特征对于量方法对多模糊分类规则进行融合，从而有效地提高提取一些灰暗的图像特别重要，在4个方向(0、45°、分类效率和精确度。文献[20]提出运用一种分层的 90°和135)使用Canny边缘检测方法检测边缘线。模糊关联规则用于图像分类。但以上方法都存在模 HSV模型跟人类视觉感知密切相关，本文使用HSV 糊关联规则库过于庞大的问题。来定义颜色空间，通过包含9个容器的一维直方图本文提出的标注方法首先对视觉特征模糊化，来统计图像颜色的特征分布，它把颜色空间量化成再提取特征与语义之间的关系，形成模糊关联规则。不同的小容器并且计算属于每个区间颜色像素点的最后用决策树方法处理冗余的规则，使标注性能更频率。再综合9维的纹理特征向量和4维方向向量高，标注结果更准确。系统框架如图2所示。模糊分割图像分割特特提取模糊特征 FARs 决策树规则约简图像分割特征提取自动标注标注模型）图2基于FARs和决策树的图像自动标注框架 Fig.2 Automatic image annotation framework based on FARs and decision tree 2.1模糊关联规则 2.1.1模糊分割实验数据集分成训练和测试2个部分，训练数在图像处理中，存在着模糊和不确定性的定义，据集用来构建模型，测试数据集用来实现多标记图如图像边缘、边界、区域和纹理等定义，模糊属性将像的标注。在训练阶段，首先提取图像低维特征，根干扰图像处理结果的精确性。据模糊分割获得原始低维特征到模糊特征向量的映将颜色、纹理、边缘特征映射到模糊特征向量射，再计算模糊支持度和模糊置信度产生模糊关联中，图3给出由三角隶属度函数转换数值型低维视规则，最后，使用决策树对关联规则库进行后期处觉特征到语义概念的模糊集，隶属度取值[0,1]。理，删减冗余的关联规则

ＳＩＦＴ特征［１５］等，文中采用图像的颜色、边缘和纹理特征来表示。图１图像的视觉特征表示Ｆｉｇ．１Ｉｍａｇｅｒｅｐｒｅｓｅｎｔａｔｉｏｎｏｆｖｉｓｕａｌｆｅａｔｕｒｅｓ颜色是图像的最重要的特征之一，ＲＧＢ、ＬＵＶ、ＨＳＶ、ＨＭＭＤ是使用频繁的色彩空间，图像特征描述器包括颜色直方图、颜色矩、颜色聚合向量等。纹理特征能粗糙的捕捉图像的特点，在图像处理和计算机视觉中，纹理分析模型采用高斯分布、马尔可夫随机场和Ｇａｂｏｒ滤波器获取图像数据。边缘特征对于提取一些灰暗的图像特别重要，在４个方向（０、４５°、９０°和１３５°）使用Ｃａｎｎｙ边缘检测方法检测边缘线。ＨＳＶ模型跟人类视觉感知密切相关，本文使用ＨＳＶ来定义颜色空间，通过包含９个容器的一维直方图来统计图像颜色的特征分布，它把颜色空间量化成不同的小容器并且计算属于每个区间颜色像素点的频率。再综合９维的纹理特征向量和４维方向向量表示的边缘特征，从每幅图像提取一个２２维特征向量。特征表示如图１所示。２图像自动标注模型关联规则算法广泛运用在数据挖掘［１６］和分类［１７］中，研究证明关联规则方法比支持向量机（ｓｕｐ⁃ ｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅ，ＳＶＭ）、朴素贝叶斯、神经网络等方法具有更高的分类准确率，但关联规则算法处理 “锐利边界” 问题性能较弱。为了解决这个问题，Ｋｕｏｋ等提出了模糊技术来挖掘关联规则［１８］，研究了很多基于ＦＡＲｓ的分类模型，并广泛运用于数据挖掘中，同时，模糊关联规则在图像处理领域也有相关研究。文献［１９］提出了一种基于自适应区间划分的模糊关联遥感图像分类方法。算法根据遥感图像分类的特点，利用模糊Ｃ均值聚类算法自适应地建立连续型属性模糊区间，使用新的剪枝策略对项集进行筛选从而避免生成无用规则，采用一种新的规则重要性度量方法对多模糊分类规则进行融合，从而有效地提高分类效率和精确度。文献［２０］提出运用一种分层的模糊关联规则用于图像分类。但以上方法都存在模糊关联规则库过于庞大的问题。本文提出的标注方法首先对视觉特征模糊化，再提取特征与语义之间的关系，形成模糊关联规则。最后用决策树方法处理冗余的规则，使标注性能更高，标注结果更准确。系统框架如图２所示。图２基于ＦＡＲｓ和决策树的图像自动标注框架Ｆｉｇ．２ＡｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｆｒａｍｅｗｏｒｋｂａｓｅｄｏｎＦＡＲｓａｎｄｄｅｃｉｓｉｏｎｔｒｅｅ２．１模糊关联规则实验数据集分成训练和测试２个部分，训练数据集用来构建模型，测试数据集用来实现多标记图像的标注。在训练阶段，首先提取图像低维特征，根据模糊分割获得原始低维特征到模糊特征向量的映射，再计算模糊支持度和模糊置信度产生模糊关联规则，最后，使用决策树对关联规则库进行后期处理，删减冗余的关联规则。２．１．１模糊分割在图像处理中，存在着模糊和不确定性的定义，如图像边缘、边界、区域和纹理等定义，模糊属性将干扰图像处理结果的精确性。将颜色、纹理、边缘特征映射到模糊特征向量中，图３给出由三角隶属度函数转换数值型低维视觉特征到语义概念的模糊集，隶属度取值［０，１］。 ·６３８· 智能系统学报第１０卷

第4期李志欣，等：基于模糊关联规则和决策树的图像自动标注 .639· 特征属性映射到模糊分区数。 2.1.2挖掘模糊关联规则给定一个图像数据集D,其低维的特征向量集赵 A={a,a2,…,an},m代表特征的维度，模糊向量低中集A,={A1,A,A,…,A,A号，A,…,A,A2 Am},模糊集合S={1,2,…,P1,1,2,…,P2, 0 30 60 宽度 …l,2,…,pm},其中特征向量a的模糊集为p:, (a)是特征a属于模糊集P:的隶属度值。下面图3三角隶属度函数(K=3) Fig.3 Triangular membership functions (K 3 给出一个简单的二维图像特征的模糊化，A={a1, a2},展示挖掘模糊关联规则的过程。模糊集MFs= 图3中横坐标表示图像低维特征属性值，纵坐标表 {low,mid,high},根据图3的三角隶属度函数，可示其在模糊集中的隶属度，K是每个低维视觉以得到原始特征向量和相应的模糊特征向量，训练集是已经标注的图像，标注语义用简单的字母表示，详细的信息如表2所示。表2原始特征向量与模糊特征向量 Table 2 Original feature vector versus fuzzy feature vector 原始特征向量图像编号 Fuzzy(a,） Fuzy(a2）标注语义 a a2 t u 4品 ui u峰 1 10 33 0.67 0.33 0 0.67 0.33 0 A.C.E.F 2 10 54 0.83 0.17 0 0.17 0.83 0 A.D 3 12 18 0.6 0.4 0 0.4 0.6 0 A,C,E 4 3 54 0 0.9 0.1 0 0.2 0.8 A,B,C 5 51 48 0 0.3 0.7 0 0.4 0.6 B.C.D,F 6 45 46.5 0 0.5 0.5 0 0.45 0.55 A,B,E 7 30 10.5 1 0 0.65 0.35 0 C.D 8 57 15 0 0.1 0.9 0.5 0.5 0 A,C 9 45 9 0 0.5 0.5 0.7 0.3 0 A.C,E 10 23.4 西 0.22 0.78 0 0 0.7 0.3 B.D,F 11 27 49.5 0.1 0.9 0 0 0.35 0.65 B.C,D 12 20.1 33 0.33 0.67 0 0 0.9 0.1 A,B,D,F 步骤1糊支持度(fuzzy support,FS)和模糊置表示所有实例中存在50%图像包含特征4，并且图信度(fuzzy confidence,FC)是模糊关联规则最常见像语义为C,:若FC等于0.5，表示图像集中有50% 的衡量标准，模糊支持度表示数据集合中包含特征被标注为C。根据式(1)、(2)，表3给出了从表2 a:以及语义C的百分比，模糊置信度衡量一条规则中挖掘出的FARs(列出部分)及其FS和FC。的精确度，用来计算数据集中包含特征a:以及语义步骤2构建FARs。定义有效的模糊关联规 C:的图像占含特征α：的图像的百分比。关联规则则：首先，遍历所有模糊特征向量，根据其FS大于 (condition)→y:condition表示模糊特征向量的组或等于最小模糊支持度阈值mS得到频繁项集，并合，y表示图像语义。且关联规则的置信度大于或等于最小模糊置信度例如a,is low→C: mFC。然后，基于Apriori算法获取FARs。详细描 u(a:)）述如算法1和算法2所示。 FS(a:is low→C)= tl (1) 算法1取频繁项集F Input:训练集T,mFS. u(a:) FC(a:is low→C)= (2) Output:频繁项集F. Process: 式中：1T1是数据集D的图像数目，若FS等于0.5， 1)C+-Fuzzy partition(T)

图３三角隶属度函数（Ｋ＝３）Ｆｉｇ．３Ｔｒｉａｎｇｕｌａｒｍｅｍｂｅｒｓｈｉｐｆｕｎｃｔｉｏｎｓ（Ｋ＝３）图３中横坐标表示图像低维特征属性值，纵坐标表示其在模糊集中的隶属度，Ｋ是每个低维视觉特征属性映射到模糊分区数。２．１．２挖掘模糊关联规则给定一个图像数据集Ｄ，其低维的特征向量集Ａ＝｛ａ１，ａ２，…，ａｍ｝，ｍ代表特征的维度，模糊向量集Ａｆ＝｛Ａ１１，Ａ２１，Ａｐ１１，…，Ａ１２，Ａ２２，ＡＰ２２，…，Ａ１ｍ，Ａ２ｍ，Ａｐｍｍ｝，模糊集合Ｓ＝｛１，２， …，ｐ１，１，２， …，ｐ２， …１，２， …，ｐｍ｝，其中特征向量ａｊ的模糊集为ｐｉ，ｕｐｉ（ａｊ）是特征ａｊ属于模糊集ｐｉ的隶属度值。下面给出一个简单的二维图像特征的模糊化，Ａ＝｛ａ１，ａ２｝，展示挖掘模糊关联规则的过程。模糊集ＭＦｓ＝｛ｌｏｗ，ｍｉｄ，ｈｉｇｈ｝，根据图３的三角隶属度函数，可以得到原始特征向量和相应的模糊特征向量，训练集是已经标注的图像，标注语义用简单的字母表示，详细的信息如表２所示。表２原始特征向量与模糊特征向量Ｔａｂｌｅ２Ｏｒｉｇｉｎａｌｆｅａｔｕｒｅｖｅｃｔｏｒｖｅｒｓｕｓｆｕｚｚｙｆｅａｔｕｒｅｖｅｃｔｏｒ图像编号原始特征向量ａ１ａ２Ｆｕｚｚｙ（ａ１）ｕａ１ｌｏｗｕａ１ｍｉｄｕａ１ｈｉｇｈＦｕｚｚｙ（ａ２）ｕａ２ｌｏｗｕａ２ｍｉｄｕａ２ｈｉｇｈ标注语义１１０３３０．６７０．３３００．６７０．３３０Ａ，Ｃ，Ｅ，Ｆ２１０５４０．８３０．１７００．１７０．８３０Ａ，Ｄ３１２１８０．６０．４００．４０．６０Ａ，Ｃ，Ｅ４３３５４００．９０．１００．２０．８Ａ，Ｂ，Ｃ５５１４８００．３０．７００．４０．６Ｂ，Ｃ，Ｄ，Ｆ６４５４６．５００．５０．５００．４５０．５５Ａ，Ｂ，Ｅ７３０１０．５０１００．６５０．３５０Ｃ，Ｄ８５７１５００．１０．９０．５０．５０Ａ，Ｃ９４５９００．５０．５０．７０．３０Ａ，Ｃ，Ｅ１０２３．４３９０．２２０．７８０００．７０．３Ｂ，Ｄ，Ｆ１１２７４９．５０．１０．９０００．３５０．６５Ｂ，Ｃ，Ｄ１２２０．１３３０．３３０．６７０００．９０．１Ａ，Ｂ，Ｄ，Ｆ步骤１糊支持度（ｆｕｚｚｙｓｕｐｐｏｒｔ，ＦＳ）和模糊置信度（ｆｕｚｚｙｃｏｎｆｉｄｅｎｃｅ，ＦＣ）是模糊关联规则最常见的衡量标准，模糊支持度表示数据集合中包含特征ａｉ以及语义Ｃｊ的百分比，模糊置信度衡量一条规则的精确度，用来计算数据集中包含特征ａｉ以及语义Ｃｊ的图像占含特征ａｉ的图像的百分比。关联规则（ｃｏｎｄｉｔｉｏｎ） →ｙ：ｃｏｎｄｉｔｉｏｎ表示模糊特征向量的组合，ｙ表示图像语义。例如ａｉｉｓｌｏｗ → Ｃｊ：ＦＳ（ａｉｉｓｌｏｗ → Ｃｊ）＝ ∑ａｉ∈ｃｊｕｌ（ａｉ）Ｔ（１）ＦＣ（ａｉｉｓｌｏｗ → Ｃｊ）＝ ∑ａｉ∈ｃｊｕｌ（ａｉ） ∑ａｉ∈ｃｕｌ（ａｉ）（２）式中：｜Ｔ｜是数据集Ｄ的图像数目，若ＦＳ等于０．５，表示所有实例中存在５０％图像包含特征ａｉ并且图像语义为Ｃｊ；若ＦＣ等于０．５，表示图像集中有５０％被标注为Ｃｊ。根据式（１）、（２），表３给出了从表２中挖掘出的ＦＡＲｓ（列出部分）及其ＦＳ和ＦＣ。步骤２构建ＦＡＲｓ。定义有效的模糊关联规则：首先，遍历所有模糊特征向量，根据其ＦＳ大于或等于最小模糊支持度阈值ｍＦＳ得到频繁项集，并且关联规则的置信度大于或等于最小模糊置信度ｍＦＣ。然后，基于Ａｐｒｉｏｒｉ算法获取ＦＡＲｓ。详细描述如算法１和算法２所示。算法１取频繁项集ＦＩｎｐｕｔ：训练集Ｔ，ｍＦＳ．Ｏｕｔｐｕｔ：频繁项集Ｆ．Ｐｒｏｃｅｓｓ：１）Ｃ１←Ｆｕｚｚｙｐａｒｔｉｔｉｏｎ（Ｔ）第４期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·６３９·

·640. 智能系统学报第10卷 2)Ffuzzy frequent 1 item sets 著名的ID3算法、C4.5以及Breiman提出的CART 3)for(k=2;Fk-1≠；k++)do 算法。 4)Ca=Candidate(F-1); FARs的不足在于模糊关联规则数目随着图像 5)for each transaction tT do 数据集的扩大变得庞大，将产生大量冗余的关联规 6)for each candidate cC do 则，导致标注性能降低。约简模糊关联规则成了研 7)F=Checking(C,mFS) 究的热点，文献[21-22]提出用遗传算法解决这个 8)return F=UF 问题。算法2获取FARs 本文提出运用决策树算法[]实现最佳模糊关 Input:频繁项集F,mFC. 联规则提取，在决策树的每个节点处根据一个或多 Output:FARs. 个属性值进行划分，这种方式直观且分类精度高、可 Process: 读性好、分类速度快。通过算法可以过滤掉冗余的 1)for every feature attribute cC,do 和弱的关联规则，实验证明该方法能取得很好的标 2)while F≠Φ，do 注效果。 3)for every frequent itemsets fF 通过获得的模糊关联规则，规则的前件用来 4)if(fuzconf(f→c)≥MFC)then 构建决策树的新的属性，若一条关联规则如下： 5)Output the rule f→c with conf=fuzconf(f→ R1:（a1 is low,a2 is mid)→A,a1∩a2即决策树 c); 的候选属性，这样的候选属性构建的决策树是否表3模糊关联规则及其FS、FC 使标注效果更好，这是不确定的，这里提出了新 Table 3 Fuzzy support and fuzzy confidence of association rules 的评价标准。首先，选择候选属性AN作为决策编号规则 Fuzzy support Fuzzy confidence a,is low→A 树的根节点，根节点的信息量计算如式(3)，T表 1 0.23 0.88 2 a is lowB 0.05 0.24 示数据库图像实例数目，k表示图像的类别数量， 3 a,is low→C 0.11 0.50 S代表类j的图像数量。 4 a is lowD 0.12 0.54 (3) 5 a2 is low→A 0.20 0.79 6名阁 6 a2 is low→B 0 0 用生成的候选属性进行数据分割时，使AN=1 7 a2 is low-C 0.24 0.95 的数据记录的数目用式(4)表示，在这些符合 8 a2 is low→+D 0.07 0.27 AN=1的数据记录中，类别属性C的值为c:的记 9 a,is mid→A 0.30 0.55 录数目如式(5)，但是类别属性C的值为c:的记录 10 a,is mid→B 0.34 0.62 11 a1 is mid→C 数目是未知的，由于新的规则是利用近似精确规则 0.37 0.68 12 a,is mid→D 0.32 0.58 来生成的，即当规则前件出现时，规则的后件仅在少 13 a2 is mid→A 0.34 0.70 数例外的情况下不出现。从而这里忽略了这类数据 14 a2 is mid→B 0.25 0.51 包含的信息量。 15 a is midC 0.25 0.51 16 a2 is mid→D 0.29 0.60 T =T sup(R.) (4) conf(R:) 17 a1 is high→A 0.17 0.74 T2=T·sup(R:) (5) 18 a,is high一→B 0.11 0.48 这样符合AN,=1的数据记录所包含的信息量 19 a.is high→C 0.18 0.81 如式(6)，而在这些不符合AN=1的数据记录数目 20 a1 is high→D 0.06 0.26 21 a2 is highA 0.12 0.48 为式(7)： 22 a2 is high→B 0.16 1 (6) 23 a,is high→C 0.17 0.68 24a2 is high→D 0.14 0.55 (7) 2.2决策树 T3=T-T;=7conf(R:)-sup(R) conf(R) 决策树方法是一种基本的分类和回归方法，用设在这些不符合AN,=1的数据记录中，类别属于分类的决策树主要优点是具有可读性，分类速度性值C(k=1,2,…,n)的记录数目为T4,则这些快。决策树学习的思想主要来源于Quinlan提出的记录所包含的信息量为

２）Ｆ１←｛ｆｕｚｚｙｆｒｅｑｕｅｎｔ１ｉｔｅｍｓｅｔｓ｝３）ｆｏｒ（ｋ＝２；Ｆｋ－１≠；ｋ＋＋）ｄｏ４）Ｃｋ＝Ｃａｎｄｉｄａｔｅ（Ｆｋ－１）；５）ｆｏｒｅａｃｈｔｒａｎｓａｃｔｉｏｎｔ ∈ Ｔｄｏ６）ｆｏｒｅａｃｈｃａｎｄｉｄａｔｅｃ ∈ Ｃｋｄｏ７）Ｆｋ＝Ｃｈｅｃｋｉｎｇ（Ｃｋ，ｍＦＳ）８）ｒｅｔｕｒｎＦ＝∪ｋＦｋ算法２获取ＦＡＲｓＩｎｐｕｔ：频繁项集Ｆ，ｍＦＣ．Ｏｕｔｐｕｔ：ＦＡＲｓ．Ｐｒｏｃｅｓｓ：１）ｆｏｒｅｖｅｒｙｆｅａｔｕｒｅａｔｔｒｉｂｕｔｅｃ ∈ Ｃ，ｄｏ２）ｗｈｉｌｅＦｋ ≠ Φ ，ｄｏ３）ｆｏｒｅｖｅｒｙｆｒｅｑｕｅｎｔｉｔｅｍｓｅｔｓｆ ∈ Ｆｋ４）ｉｆ（ｆｕｚｃｏｎｆ（ｆ → ｃ） ≥ＭＦＣ）ｔｈｅｎ５）Ｏｕｔｐｕｔｔｈｅｒｕｌｅｆ → ｃｗｉｔｈｃｏｎｆ＝ｆｕｚｃｏｎｆ（ｆ → ｃ）；表３模糊关联规则及其ＦＳ、ＦＣＴａｂｌｅ３Ｆｕｚｚｙｓｕｐｐｏｒｔａｎｄｆｕｚｚｙｃｏｎｆｉｄｅｎｃｅｏｆａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓ编号规则ＦｕｚｚｙｓｕｐｐｏｒｔＦｕｚｚｙｃｏｎｆｉｄｅｎｃｅ１ａ１ｉｓｌｏｗ → Ａ０．２３０．８８２ａ１ｉｓｌｏｗ → Ｂ０．０５０．２４３ａ１ｉｓｌｏｗ → Ｃ０．１１０．５０４ａ１ｉｓｌｏｗ → Ｄ０．１２０．５４５ａ２ｉｓｌｏｗ → Ａ０．２００．７９６ａ２ｉｓｌｏｗ → Ｂ００７ａ２ｉｓｌｏｗ → Ｃ０．２４０．９５８ａ２ｉｓｌｏｗ → Ｄ０．０７０．２７９ａ１ｉｓｍｉｄ → Ａ０．３００．５５１０ａ１ｉｓｍｉｄ → Ｂ０．３４０．６２１１ａ１ｉｓｍｉｄ → Ｃ０．３７０．６８１２ａ１ｉｓｍｉｄ → Ｄ０．３２０．５８１３ａ２ｉｓｍｉｄ → Ａ０．３４０．７０１４ａ２ｉｓｍｉｄ → Ｂ０．２５０．５１１５ａ２ｉｓｍｉｄ → Ｃ０．２５０．５１１６ａ２ｉｓｍｉｄ → Ｄ０．２９０．６０１７ａ１ｉｓｈｉｇｈ → Ａ０．１７０．７４１８ａ１ｉｓｈｉｇｈ → Ｂ０．１１０．４８１９ａ１ｉｓｈｉｇｈ → Ｃ０．１８０．８１２０ａ１ｉｓｈｉｇｈ → Ｄ０．０６０．２６２１ａ２ｉｓｈｉｇｈ → Ａ０．１２０．４８２２ａ２ｉｓｈｉｇｈ → Ｂ０．１６１２３ａ２ｉｓｈｉｇｈ → Ｃ０．１７０．６８２４ａ２ｉｓｈｉｇｈ → Ｄ０．１４０．５５２．２决策树决策树方法是一种基本的分类和回归方法，用于分类的决策树主要优点是具有可读性，分类速度快。决策树学习的思想主要来源于Ｑｕｉｎｌａｎ提出的著名的ＩＤ３算法、Ｃ４．５以及Ｂｒｅｉｍａｎ提出的ＣＡＲＴ算法。ＦＡＲｓ的不足在于模糊关联规则数目随着图像数据集的扩大变得庞大，将产生大量冗余的关联规则，导致标注性能降低。约简模糊关联规则成了研究的热点，文献［２１⁃２２］提出用遗传算法解决这个问题。本文提出运用决策树算法［２３］实现最佳模糊关联规则提取，在决策树的每个节点处根据一个或多个属性值进行划分，这种方式直观且分类精度高、可读性好、分类速度快。通过算法可以过滤掉冗余的和弱的关联规则，实验证明该方法能取得很好的标注效果。通过获得的模糊关联规则，规则的前件用来构建决策树的新的属性，若一条关联规则如下：Ｒ１：（ａ１ｉｓｌｏｗ，ａ２ｉｓｍｉｄ） → Ａ，ａ１∩ａ２即决策树的候选属性，这样的候选属性构建的决策树是否使标注效果更好，这是不确定的，这里提出了新的评价标准。首先，选择候选属性ＡＮｊ作为决策树的根节点，根节点的信息量计算如式（３），Ｔ表示数据库图像实例数目，ｋ表示图像的类别数量，ｃｊ代表类ｊ的图像数量。Ｇｒｏｏｔ＝－ ∑ ｋｊ＝１ｃｊＴｌｂｃｊＴ（３）用生成的候选属性进行数据分割时，使ＡＮｊ＝１的数据记录的数目用式（４）表示，在这些符合ＡＮｊ＝１的数据记录中，类别属性Ｃ的值为ｃｉ的记录数目如式（５），但是类别属性Ｃ的值为ｃｉ的记录数目是未知的，由于新的规则是利用近似精确规则来生成的，即当规则前件出现时，规则的后件仅在少数例外的情况下不出现。从而这里忽略了这类数据包含的信息量。Ｔ１＝Ｔｓｕｐ（Ｒｉ）ｃｏｎｆ（Ｒｉ）（４）Ｔ２＝Ｔ·ｓｕｐ（Ｒｉ）（５）这样符合ＡＮｊ＝１的数据记录所包含的信息量如式（６），而在这些不符合ＡＮｊ＝１的数据记录数目为式（７）：Ｇ１＝Ｔ１Ｔ－Ｔ２Ｔ１ｌｂＴ２Ｔ１ é ë ê ê ù û ú ú （６）Ｔ３＝Ｔ－Ｔ１＝Ｔｃｏｎｆ（Ｒｉ）－ｓｕｐ（Ｒｉ）ｃｏｎｆ（Ｒｉ）（７）设在这些不符合ＡＮｊ＝１的数据记录中，类别属性值Ｃｋ（ｋ＝１，２，…，ｎ）的记录数目为Ｔ３ｋ，则这些记录所包含的信息量为 ·６４０· 智能系统学报第１０卷

第4期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·641· 引别] 3.2参数设置 (8) 方法中最小模糊支持度(mS)、最小模糊置信综上所述，新属性的近似信息增益为度(mF℃)和分区大小K3个参数都将影响图像标注 Gain(AN,)=G-G,-G2,其中，若Gain(AN)> 性能。为了获得最优参数，在Corel5k和IAPR TC 0,表示属性AN有效，应该保留，否则，删除该条规 12数据集下，分别设置不同mFS和mFC的参数值，则。详细描述如算法3所示。如图4所示，当mFS=0.05,mFC=0.85时，标注的精算法3根据新规则删减FARs 度最高，为92.5%。从结果可以看到mFS越大，对 Input:FARs 于标注的性能更敏感。因此实验中选择更小的 Output:决策树 mFS。另一方面，mFS越高，标注的性能更加健壮。 Process: 从表中可以看到最好的标注准确率92.5%满足的条 1)Generate new candidate attribute in the fuzzy 件是(mFS,mFC)=(0.05,0.85)。同样，把这2个 association rules F 最优参数用于后续分区最佳大小K的确定实验中。 2)for every candidate attribute AN,do 图5给出了当分区数分别为3、4、5、6、7、8时，标注 3)if Gain(AN,)>0 then 的性能比较。从结果看出，K为6满足最佳效果。 4)Keep AN;in use; 综上，实验将每个低维图像特征属性划分为6个模 5)else abandon AN, 糊分区。由原来的22维低维图像特征，模糊分割 6)Delete the FARs which including the AN,o 后，得到22×6维的模糊特征向量。 3 实验结果分析 .-mFS=0.05 100 nF=0.10 95 3.1数据集 .20 90 实验采用Corel5k[)和IAPR TC-1222个数据 85 集来进行图像标注测试，这2个数据集在近年的图 80 像标注研究中被广泛应用于标注算法性能的比较。 70 自从被提出用于图像标注实验后，已经成为图像实 0.50 0.600.70 0.800.90 mFC 验的标准数据集。图4不同mFC和mFS下的图像标注精度 Corel5k图像集涵盖多个主题的5000幅图 Fig.4 Precisions of image annotation with different 片，Corel5k由50张CD组成，包含50个语义主 mFC and mFS 题。每个CD包含100张大小相等的图像，每张 CD代表一个语义主题，例如天空、非洲、海滩、建 100i 筑、城市等。Corl5k图像库通常分成3个部分： 90 4000张图像作为训练集，500张图像作为验证集用来估计模型参数，其余500张作为测试集评 70 价算法性能。使用验证集寻找到最优模型参数后4000张 60 3 4 5678 训练集和500张验证集混合起来组成新的训练集。该图像库中的每张图片被标注1~5个标注图5不同K值下的图像标注精度(mFS=0.05,mFC=0.85) 词，训练集中总共有374个标注词，在测试集中 Fig.5 Precisions of image annotation with different K 总共使用了263个标注词。 (mFS=0.05,mFC=0.85) IAPR TC-12数据集应用在自动图像标注并扩 3.3评价标准展到多媒体信息检索影响的评估上，该数据集包括实验在机器系统Windows7,软件Visual Studio 20000幅分割图像，包括不同的动物，城市和许多其 2012下测试运行，使用ntel2.66 GHz Pentium4 他类别的图像。在特征提取阶段，每个区域的特征 CPU。实验给出了标注的评价标准、精确率、召回率向量具有99535个属性，所述特征由已提取的颜色以及综合评价指标F-measure,公式如下：空间LAB、纹理和空间位置表示。 precision =a/b (9) recall a/c (10)

Ｇ２＝Ｔ３Ｔ－ ∑ ｎｋ＝１Ｔ３ｋＴ３ｌｂＴ３ｋＴ３ é ë ê ê ù û ú ú （８）综上所述，新属性的近似信息增益为Ｇａｉｎ（ＡＮｊ）＝Ｇｒｏｏｔ –Ｇ１ –Ｇ２，其中，若Ｇａｉｎ（ＡＮｊ）＞０，表示属性ＡＮｊ有效，应该保留，否则，删除该条规则。详细描述如算法３所示。算法３根据新规则删减ＦＡＲｓＩｎｐｕｔ：ＦＡＲｓＯｕｔｐｕｔ：决策树Ｐｒｏｃｅｓｓ：１）ＧｅｎｅｒａｔｅｎｅｗｃａｎｄｉｄａｔｅａｔｔｒｉｂｕｔｅｉｎｔｈｅｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓＦ；２）ｆｏｒｅｖｅｒｙｃａｎｄｉｄａｔｅａｔｔｒｉｂｕｔｅＡＮｊｄｏ３）ｉｆＧａｉｎ（ＡＮｊ）＞０ｔｈｅｎ４）ＫｅｅｐＡＮｊｉｎｕｓｅ；５）ｅｌｓｅａｂａｎｄｏｎＡＮｊ；６）ＤｅｌｅｔｅｔｈｅＦＡＲｓｗｈｉｃｈｉｎｃｌｕｄｉｎｇｔｈｅＡＮｊ。３实验结果分析３．１数据集实验采用Ｃｏｒｅｌ５ｋ［５］和ＩＡＰＲＴＣ⁃１２［１２］２个数据集来进行图像标注测试，这２个数据集在近年的图像标注研究中被广泛应用于标注算法性能的比较。自从被提出用于图像标注实验后，已经成为图像实验的标准数据集。Ｃｏｒｅｌ５ｋ图像集涵盖多个主题的５０００幅图片，Ｃｏｒｅｌ５ｋ由５０张ＣＤ组成，包含５０个语义主题。每个ＣＤ包含１００张大小相等的图像，每张ＣＤ代表一个语义主题，例如天空、非洲、海滩、建筑、城市等。Ｃｏｒｅｌ５ｋ图像库通常分成３个部分：４０００张图像作为训练集，５００张图像作为验证集用来估计模型参数，其余５００张作为测试集评价算法性能。使用验证集寻找到最优模型参数后４０００张训练集和５００张验证集混合起来组成新的训练集。该图像库中的每张图片被标注１～５个标注词，训练集中总共有３７４个标注词，在测试集中总共使用了２６３个标注词。ＩＡＰＲＴＣ⁃１２数据集应用在自动图像标注并扩展到多媒体信息检索影响的评估上，该数据集包括２００００幅分割图像，包括不同的动物，城市和许多其他类别的图像。在特征提取阶段，每个区域的特征向量具有９９５３５个属性，所述特征由已提取的颜色空间ＬＡＢ、纹理和空间位置表示。３．２参数设置方法中最小模糊支持度（ｍＦＳ）、最小模糊置信度（ｍＦＣ）和分区大小Ｋ３个参数都将影响图像标注性能。为了获得最优参数，在Ｃｏｒｅｌ５ｋ和ＩＡＰＲＴＣ⁃ １２数据集下，分别设置不同ｍＦＳ和ｍＦＣ的参数值，如图４所示，当ｍＦＳ＝０．０５，ｍＦＣ＝０．８５时，标注的精度最高，为９２．５％。从结果可以看到ｍＦＳ越大，对于标注的性能更敏感。因此实验中选择更小的ｍＦＳ。另一方面，ｍＦＳ越高，标注的性能更加健壮。从表中可以看到最好的标注准确率９２．５％满足的条件是（ｍＦＳ，ｍＦＣ）＝（０．０５，０．８５）。同样，把这２个最优参数用于后续分区最佳大小Ｋ的确定实验中。图５给出了当分区数分别为３、４、５、６、７、８时，标注的性能比较。从结果看出，Ｋ为６满足最佳效果。综上，实验将每个低维图像特征属性划分为６个模糊分区。由原来的２２维低维图像特征，模糊分割后，得到２２×６维的模糊特征向量。图４不同ｍＦＣ和ｍＦＳ下的图像标注精度Ｆｉｇ．４ＰｒｅｃｉｓｉｏｎｓｏｆｉｍａｇｅａｎｎｏｔａｔｉｏｎｗｉｔｈｄｉｆｆｅｒｅｎｔｍＦＣａｎｄｍＦＳ图５不同Ｋ值下的图像标注精度（ｍＦＳ＝０．０５，ｍＦＣ＝０．８５）Ｆｉｇ．５ＰｒｅｃｉｓｉｏｎｓｏｆｉｍａｇｅａｎｎｏｔａｔｉｏｎｗｉｔｈｄｉｆｆｅｒｅｎｔＫ（ｍＦＳ＝０．０５，ｍＦＣ＝０．８５）３．３评价标准实验在机器系统Ｗｉｎｄｏｗｓ７，软件ＶｉｓｕａｌＳｔｕｄｉｏ２０１２下测试运行，使用Ｉｎｔｅｌ２．６６ＧＨｚＰｅｎｔｉｕｍ４ＣＰＵ。实验给出了标注的评价标准、精确率、召回率以及综合评价指标Ｆ⁃ｍｅａｓｕｒｅ，公式如下：ｐｒｅｃｉｓｉｏｎ＝ａ／ｂ（９）ｒｅｃａｌｌ＝ａ／ｃ（１０）第４期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·６４１·

·642. 智能系统学报第10卷 2×precision×recall 表6 Corel5k上图像自动标注模型的性能比较 F-measure (11) recall precision Table 6 Performance comparison of automatic image 式中：a表示正确标注为某类的图像数量，b表示 annotation models on Corel 5k 所有自动标注为该类的图像数量，c表示测试集 49个性能全部260个召回率>0 中真实标注包含该类的所有图像数量。最佳的词集词集上的模型的关键词表4和表5给出本文标注方法的准确率、召上的结果结果个数 MP MR 回率及F-measure,从表4中看出，该方法可以高 MP MR TM 49 0.200.34 0.060.04 效且准确地标注测试图像集。从表中看出，类别 JEC 139 0.27 0.32 “建筑”在Corel5k和“景色”在IAPR TC-I2数据 PLSA-WORDS 105 0.56 0.71 0.14 0.20 集中标注准确率尤为突出。表4 Corel5k中标注的评价标准 HGDM 137 0.780.83 0.280.32 Table 4 Evaluation measure of annotation on Corel 5k Our approach 138 0.810.85 0.300.35 类别 precision recall F-measure 3.4.2 IAPR TC-12上的实验结果非洲 0.81 0.77 0.85 表7给出了IAPR TC-12数据集上实验结果，测沙滩 0.87 0.80 0.90 试在所有291个关键词下，测试包括召回率大于0 建筑 0.93 0.89 0.93 的关键词个数、平均精度、平均召回率。对比其他标山 0.87 0.86 0.89 注模型，表现出更好的标注性能。大象 0.92 0.88 0.95 表7 IAPR TC-12上图像自动标注模型的性能比较平均值 0.88 0.84 0.90 Table 7 Performance comparison of automatic image 表5 IAPR TC-12中标注的评价标准 annotation models on IAPR TC-12 Table 5 Evaluation measure of annotation on IAPR TC-12 召回率>0的类别模型 MP MR precision recall F-measure 关键词个数运动 0.79 0.75 0.82 JEC 196 0.25 0.16 人 0.87 0.89 0.94 PLSA-WORDS 177 0.180.12 风景 0.91 0.90 0.88 HGDM 194 0.290.18 动物 0.88 0.81 0.87 Our approach 199 0.320.21 平均值 0.86 0.84 0.88 3.4对比实验为了验证该模型的高效性，实验在2个图像集 3.4.1 Corel5k上的实验结果下，选择不同图像数目进行测试。表8中，基于模糊为了更有力证明该方法的准确性和可靠性，关联规则的标注方法的平均精确度比非模糊关联规实验做了与其他相关标注方法的对比，对比方法则更高，另外，本文提的方法对比CFAR,实验得到有翻译模型[)、JEC2】、PLSA-WORDS!6、HG- 的规则数目减少，标注精确度增加，证明决策树对于 DM]和CFAR[2,PLSA-WORDS是基于PLSA 删减冗余关联规则有显著的成效。的标注模型，HGDM是一种基于混合模型的标注 3.5在Corel5k中的实验结果方法，CFAR提出一种模糊关联规则语义标注在Corel5k数据集下，从5000幅图像中随模型。机选择60%图像作为训练集，运用本文方法训练实验在Corel5k和IAPR TC-I22个数据集获得标注模型，即决策树删减后的模糊关联规则下进行，表6为Corel5k数据集下所得标注结果，库，再对余下40%的图像进行标注。在性能最佳的49个关键词集合和训练集合中所表9给出随机抽取的一些图像，实验选取标有260个关键词集合中评价平均精度(MP)和平注精确度最高的5个关键字作为最后的标注结均召回率(MR),从表中数据得出，本文提出的方果，表中给出在Corel5k图像集下与人工标注的法在性能上要优于其他多数标注模型，体现了算比较，实验结果充分证明了此方法的准确性和可法的准确性和稳定性。靠性

Ｆ⁃ｍｅａｓｕｒｅ＝２ × ｐｒｅｃｉｓｉｏｎ × ｒｅｃａｌｌｒｅｃａｌｌ＋ｐｒｅｃｉｓｉｏｎ（１１）式中：ａ表示正确标注为某类的图像数量，ｂ表示所有自动标注为该类的图像数量，ｃ表示测试集中真实标注包含该类的所有图像数量。表４和表５给出本文标注方法的准确率、召回率及Ｆ⁃ｍｅａｓｕｒｅ，从表４中看出，该方法可以高效且准确地标注测试图像集。从表中看出，类别 “建筑”在Ｃｏｒｅｌ５ｋ和“景色”在ＩＡＰＲＴＣ⁃１２数据集中标注准确率尤为突出。表４Ｃｏｒｅｌ５ｋ中标注的评价标准Ｔａｂｌｅ４ＥｖａｌｕａｔｉｏｎｍｅａｓｕｒｅｏｆａｎｎｏｔａｔｉｏｎｏｎＣｏｒｅｌ５ｋ类别ｐｒｅｃｉｓｉｏｎｒｅｃａｌｌＦ⁃ｍｅａｓｕｒｅ非洲０．８１０．７７０．８５沙滩０．８７０．８００．９０建筑０．９３０．８９０．９３山０．８７０．８６０．８９大象０．９２０．８８０．９５平均值０．８８０．８４０．９０表５ＩＡＰＲＴＣ⁃１２中标注的评价标准Ｔａｂｌｅ５ＥｖａｌｕａｔｉｏｎｍｅａｓｕｒｅｏｆａｎｎｏｔａｔｉｏｎｏｎＩＡＰＲＴＣ⁃１２类别ｐｒｅｃｉｓｉｏｎｒｅｃａｌｌＦ⁃ｍｅａｓｕｒｅ运动０．７９０．７５０．８２人０．８７０．８９０．９４风景０．９１０．９００．８８动物０．８８０．８１０．８７平均值０．８６０．８４０．８８３．４对比实验３．４．１Ｃｏｒｅｌ５ｋ上的实验结果为了更有力证明该方法的准确性和可靠性，实验做了与其他相关标注方法的对比，对比方法有翻译模型［９］、ＪＥＣ［１２］、ＰＬＳＡ⁃ＷＯＲＤＳ［６］、ＨＧ⁃ ＤＭ［８］和ＣＦＡＲ［２４］，ＰＬＳＡ⁃ＷＯＲＤＳ是基于ＰＬＳＡ的标注模型，ＨＧＤＭ是一种基于混合模型的标注方法，ＣＦＡＲ提出一种模糊关联规则语义标注模型。实验在Ｃｏｒｅｌ５ｋ和ＩＡＰＲＴＣ⁃１２２个数据集下进行，表６为Ｃｏｒｅｌ５ｋ数据集下所得标注结果，在性能最佳的４９个关键词集合和训练集合中所有２６０个关键词集合中评价平均精度（ＭＰ）和平均召回率（ＭＲ），从表中数据得出，本文提出的方法在性能上要优于其他多数标注模型，体现了算法的准确性和稳定性。表６Ｃｏｒｅｌ５ｋ上图像自动标注模型的性能比较Ｔａｂｌｅ６ＰｅｒｆｏｒｍａｎｃｅｃｏｍｐａｒｉｓｏｎｏｆａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｍｏｄｅｌｓｏｎＣｏｒｅｌ５ｋ模型召回率＞０的关键词个数４９个性能最佳的词集上的结果ＭＰＭＲ全部２６０个词集上的结果ＭＰＭＲＴＭ４９０．２００．３４０．０６０．０４ＪＥＣ１３９－－０．２７０．３２ＰＬＳＡ⁃ＷＯＲＤＳ１０５０．５６０．７１０．１４０．２０ＨＧＤＭ１３７０．７８０．８３０．２８０．３２Ｏｕｒａｐｐｒｏａｃｈ１３８０．８１０．８５０．３００．３５３．４．２ＩＡＰＲＴＣ⁃１２上的实验结果表７给出了ＩＡＰＲＴＣ⁃１２数据集上实验结果，测试在所有２９１个关键词下，测试包括召回率大于０的关键词个数、平均精度、平均召回率。对比其他标注模型，表现出更好的标注性能。表７ＩＡＰＲＴＣ⁃１２上图像自动标注模型的性能比较Ｔａｂｌｅ７ＰｅｒｆｏｒｍａｎｃｅｃｏｍｐａｒｉｓｏｎｏｆａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｍｏｄｅｌｓｏｎＩＡＰＲＴＣ⁃１２模型召回率＞０的关键词个数ＭＰＭＲＪＥＣ１９６０．２５０．１６ＰＬＳＡ⁃ＷＯＲＤＳ１７７０．１８０．１２ＨＧＤＭ１９４０．２９０．１８Ｏｕｒａｐｐｒｏａｃｈ１９９０．３２０．２１为了验证该模型的高效性，实验在２个图像集下，选择不同图像数目进行测试。表８中，基于模糊关联规则的标注方法的平均精确度比非模糊关联规则更高，另外，本文提的方法对比ＣＦＡＲ，实验得到的规则数目减少，标注精确度增加，证明决策树对于删减冗余关联规则有显著的成效。３．５在Ｃｏｒｅｌ５ｋ中的实验结果在Ｃｏｒｅｌ５ｋ数据集下，从５０００幅图像中随机选择６０％图像作为训练集，运用本文方法训练获得标注模型，即决策树删减后的模糊关联规则库，再对余下４０％的图像进行标注。表９给出随机抽取的一些图像，实验选取标注精确度最高的５个关键字作为最后的标注结果，表中给出在Ｃｏｒｅｌ５ｋ图像集下与人工标注的比较，实验结果充分证明了此方法的准确性和可靠性。 ·６４２· 智能系统学报第１０卷

第4期李志欣，等：基于模糊关联规则和决策树的图像自动标注 .643 表8 Corel5k和IAPR TC-12上不同模型的分类结果比较 Table 8 Classification results comparison of different models on Corel 5k and IAPR TC-12 SVM CFAR 类别数据集图像数 Our approach 精确度精确度规则数精确度规则数天空 Corel 5k 100 0.85 0.83 12 0.83 9 大海 Corel 5k 56 0.76 0.82 > 0.83 5 人 Corel 5k 78 0.80 0.81 9 0.82 7 树 Corel 5k 90 0.69 0.77 6 0.80 6 花 Corel 5k 30 0.69 0.75 4 0.77 5 运动 IAPR TC-12 86 0.71 0.80 10 0.82 8 人 IAPR TC-12 55 0.70 0.74 > 0.80 6 景 IAPR TC-12 90 0.71 0.80 9 0.79 6 动物 IAPR TC-12 60 0.72 0.82 8 0.80 > 表9 Corel5k中图像自动标注结果 Table 9 Results of automatic image annotation on Corel 5k boat,sky, tiger,snow, sun,water, 本文方法 birds,tree, cars,road, snow,mountain, buildings,water stone seabeach branchleaf buildings stone,sky boat,city, sun,water, birds, 人工标注 cars,grass snow,mountain, tiger,snow buildings seabeach,sky branchleaf buildings,road stone,sky and Data Engineering,1992,4(5):431-442 4 结束语 [2]MARKKULA M,SORMUNEN E.End-user searching chal- 本文提出基于FARs和决策树的图像自动标注 lenges indexing practices in the digital newspaper photo ar- chive[J].Information Retrieval,2000,1(4):259-285. 方法，在该标注模型中，FARs提取低维图像特征和 [3]JEON J,LAVRENKO V,MANMATHA R.Automatic image 高维语义间的联系，在现实世界中，由于面对的是海 annotation and retrieval using cross-media relevance models 量的图像数据集，将决策树方法应用到约简FARs [C]//Proceedings of the 26th Annual International ACM 中。实验证明此标注模型不仅大大减少了标注的时 SIGIR Conference on Research and Development in Informa- tion Retrieval.New York.USA.2003:119-126. 间，也提高了标注的准确性。与经典的机器学习方 [4]WANG Yong,MEI Tao,GONG Shaogang,et al.Combining 法SVM、boosting、neutral network等比较，优势在于 global,regional and contextual features for automatic image 运用模糊关联规则方法直观的获取了低维特征和高 annotation[J].Pattern Recognition,2009,42(2):259- 维语义间的联系：与传统的关联规则方法相比，增加 266. 了决策树对模糊关联规则的处理，提高了标注性能： [5]DUYGULU P,BARNARD K,DE FREITAS J F G,et al. Object recognition as machine translation:learning a lexicon 在未来的研究方向中，重点放在图像低维属性的模 for a fixed image vocabulary M]//HEYDEN A,SPARR 糊分割上，尝试更多的隶属度函数将低维特征模糊 G,NIELSEN M,et al.Lecture Notes in Computer Science, 化，获得更准确的模糊分割函数：另一方面，在对 vol.2353.Berlin:Springer-Varlag,2002:97-112. FARs评价的准则上，加入更多可靠的标准，以达到 [6]MONAY F,GATICA-PEREZ D.Modeling semantic aspects 更高的标注精度和更好的检索效果。 for cross-media image indexing[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(10): 参考文献： 1802-1817. [7]李志欣，施智平，李志清，等.融合语义主题的图像自 [1]CHANG S K,HSU A.Image information systems:where do 动标注[J].软件学报，2011,22(4)：801-812. we go from here?[J].IEEE Transactions on Knowledge LI Zhixin,SHI Zhiping,LI Zhiqing,et al.Automatic image

表８Ｃｏｒｅｌ５ｋ和ＩＡＰＲＴＣ⁃１２上不同模型的分类结果比较Ｔａｂｌｅ８ＣｌａｓｓｉｆｉｃａｔｉｏｎｒｅｓｕｌｔｓｃｏｍｐａｒｉｓｏｎｏｆｄｉｆｆｅｒｅｎｔｍｏｄｅｌｓｏｎＣｏｒｅｌ５ｋａｎｄＩＡＰＲＴＣ⁃１２类别数据集图像数ＳＶＭ精确度ＣＦＡＲ精确度规则数Ｏｕｒａｐｐｒｏａｃｈ精确度规则数天空Ｃｏｒｅｌ５ｋ１０００．８５０．８３１２０．８３９大海Ｃｏｒｅｌ５ｋ５６０．７６０．８２７０．８３５人Ｃｏｒｅｌ５ｋ７８０．８００．８１９０．８２７树Ｃｏｒｅｌ５ｋ９００．６９０．７７６０．８０６花Ｃｏｒｅｌ５ｋ３００．６９０．７５４０．７７５运动ＩＡＰＲＴＣ⁃１２８６０．７１０．８０１００．８２８人ＩＡＰＲＴＣ⁃１２５５０．７００．７４７０．８０６景ＩＡＰＲＴＣ⁃１２９００．７１０．８０９０．７９６动物ＩＡＰＲＴＣ⁃１２６００．７２０．８２８０．８０７表９Ｃｏｒｅｌ５ｋ中图像自动标注结果Ｔａｂｌｅ９ＲｅｓｕｌｔｓｏｆａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎｏｎＣｏｒｅｌ５ｋ本文方法ｂｏａｔ，ｓｋｙ，ｂｕｉｌｄｉｎｇｓ，ｗａｔｅｒｔｉｇｅｒ，ｓｎｏｗ，ｓｔｏｎｅｓｕｎ，ｗａｔｅｒ，ｓｅａｂｅａｃｈｂｉｒｄｓ，ｔｒｅｅ，ｂｒａｎｃｈｌｅａｆｃａｒｓ，ｒｏａｄ，ｂｕｉｌｄｉｎｇｓｓｎｏｗ，ｍｏｕｎｔａｉｎ，ｓｔｏｎｅ，ｓｋｙ人工标注ｂｏａｔ，ｃｉｔｙ，ｂｕｉｌｄｉｎｇｓｔｉｇｅｒ，ｓｎｏｗｓｕｎ，ｗａｔｅｒ，ｓｅａｂｅａｃｈ，ｓｋｙｂｉｒｄｓ，ｂｒａｎｃｈｌｅａｆｃａｒｓ，ｇｒａｓｓｂｕｉｌｄｉｎｇｓ，ｒｏａｄｓｎｏｗ，ｍｏｕｎｔａｉｎ，ｓｔｏｎｅ，ｓｋｙ４结束语本文提出基于ＦＡＲｓ和决策树的图像自动标注方法，在该标注模型中，ＦＡＲｓ提取低维图像特征和高维语义间的联系，在现实世界中，由于面对的是海量的图像数据集，将决策树方法应用到约简ＦＡＲｓ中。实验证明此标注模型不仅大大减少了标注的时间，也提高了标注的准确性。与经典的机器学习方法ＳＶＭ、ｂｏｏｓｔｉｎｇ、ｎｅｕｔｒａｌｎｅｔｗｏｒｋ等比较，优势在于运用模糊关联规则方法直观的获取了低维特征和高维语义间的联系；与传统的关联规则方法相比，增加了决策树对模糊关联规则的处理，提高了标注性能；在未来的研究方向中，重点放在图像低维属性的模糊分割上，尝试更多的隶属度函数将低维特征模糊化，获得更准确的模糊分割函数；另一方面，在对ＦＡＲｓ评价的准则上，加入更多可靠的标准，以达到更高的标注精度和更好的检索效果。参考文献：［１］ＣＨＡＮＧＳＫ，ＨＳＵＡ．Ｉｍａｇｅｉｎｆｏｒｍａｔｉｏｎｓｙｓｔｅｍｓ：ｗｈｅｒｅｄｏｗｅｇｏｆｒｏｍｈｅｒｅ？［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＫｎｏｗｌｅｄｇｅａｎｄＤａｔａＥｎｇｉｎｅｅｒｉｎｇ，１９９２，４（５）：４３１⁃４４２［２］ＭＡＲＫＫＵＬＡＭ，ＳＯＲＭＵＮＥＮＥ．Ｅｎｄ⁃ｕｓｅｒｓｅａｒｃｈｉｎｇｃｈａｌ⁃ ｌｅｎｇｅｓｉｎｄｅｘｉｎｇｐｒａｃｔｉｃｅｓｉｎｔｈｅｄｉｇｉｔａｌｎｅｗｓｐａｐｅｒｐｈｏｔｏａｒ⁃ ｃｈｉｖｅ［Ｊ］．ＩｎｆｏｒｍａｔｉｏｎＲｅｔｒｉｅｖａｌ，２０００，１（４）：２５９⁃２８５．［３］ＪＥＯＮＪ，ＬＡＶＲＥＮＫＯＶ，ＭＡＮＭＡＴＨＡＲ．Ａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎａｎｄｒｅｔｒｉｅｖａｌｕｓｉｎｇｃｒｏｓｓ⁃ｍｅｄｉａｒｅｌｅｖａｎｃｅｍｏｄｅｌｓ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２６ｔｈＡｎｎｕａｌＩｎｔｅｒｎａｔｉｏｎａｌＡＣＭＳＩＧＩＲＣｏｎｆｅｒｅｎｃｅｏｎＲｅｓｅａｒｃｈａｎｄＤｅｖｅｌｏｐｍｅｎｔｉｎＩｎｆｏｒｍａ⁃ ｔｉｏｎＲｅｔｒｉｅｖａｌ．ＮｅｗＹｏｒｋ，ＵＳＡ，２００３：１１９⁃１２６．［４］ＷＡＮＧＹｏｎｇ，ＭＥＩＴａｏ，ＧＯＮＧＳｈａｏｇａｎｇ，ｅｔａｌ．Ｃｏｍｂｉｎｉｎｇｇｌｏｂａｌ，ｒｅｇｉｏｎａｌａｎｄｃｏｎｔｅｘｔｕａｌｆｅａｔｕｒｅｓｆｏｒａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎ［Ｊ］．ＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ，２００９，４２（２）：２５９⁃ ２６６．［５］ＤＵＹＧＵＬＵＰ，ＢＡＲＮＡＲＤＫ，ＤＥＦＲＥＩＴＡＳＪＦＧ，ｅｔａｌ．Ｏｂｊｅｃｔｒｅｃｏｇｎｉｔｉｏｎａｓｍａｃｈｉｎｅｔｒａｎｓｌａｔｉｏｎ：ｌｅａｒｎｉｎｇａｌｅｘｉｃｏｎｆｏｒａｆｉｘｅｄｉｍａｇｅｖｏｃａｂｕｌａｒｙ［Ｍ］／／ＨＥＹＤＥＮＡ，ＳＰＡＲＲＧ，ＮＩＥＬＳＥＮＭ，ｅｔａｌ．ＬｅｃｔｕｒｅＮｏｔｅｓｉｎＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，ｖｏｌ．２３５３．Ｂｅｒｌｉｎ：Ｓｐｒｉｎｇｅｒ⁃Ｖａｒｌａｇ，２００２：９７⁃１１２．［６］ＭＯＮＡＹＦ，ＧＡＴＩＣＡ⁃ＰＥＲＥＺＤ．Ｍｏｄｅｌｉｎｇｓｅｍａｎｔｉｃａｓｐｅｃｔｓｆｏｒｃｒｏｓｓ⁃ｍｅｄｉａｉｍａｇｅｉｎｄｅｘｉｎｇ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ，２００７，２９（１０）：１８０２⁃１８１７．［７］李志欣，施智平，李志清，等．融合语义主题的图像自动标注［Ｊ］．软件学报，２０１１，２２（４）：８０１⁃８１２．ＬＩＺｈｉｘｉｎ，ＳＨＩＺｈｉｐｉｎｇ，ＬＩＺｈｉｑｉｎｇ，ｅｔａｌ．Ａｕｔｏｍａｔｉｃｉｍａｇｅ第４期李志欣，等：基于模糊关联规则和决策树的图像自动标注 ·６４３·

·644. 智能系统学报第10卷 annotation by fusing semantic topics[J].Journal of Soft- 方法[J].计算机研究与发展，2012,49(7)：1500- ware,2011,22(4):801-812. 1506. [8]LI Zhixin,SHI Zhongzhi,ZHAO Weizhong,et al.Learning DONG Jie,SHEN Guojie.Remote sensing image classifi- semantic concepts from image database with hybrid genera- cation based on fuzzy associative classification[]].Journal tive/discriminative approach[J].Engineering Applications of Computer Research and Development,2012,49(7): of Artificial Intelligence,2013,26(9):2143-2152. 1500-1506. [9]茹立云，马少平，路晶.基于Boosting学习的图片语义自 [20]TAZAREE A,EFTEKHARI-MOGHADAM A M,SAJJADI- 动标注[J].中国图象图形学报，2006,11(4)：486-491 GHAEM-MAGHAMI S.A semantic image classifier based RU Liyun,MA Shaoping,LU Jing.Boosting-based automat- on hierarchical fuzzy association rule mining[J].Multimedia ic linguistic indexing of pictures[].Journal of Image and Tools and Applications,2014,69(3):921-949. Graphics,2006,11(4):486-491. [21]SHIBUCHI H,NOZAKI K,YAMAMOTO N,et al.Selec- [10]SUMATHI T,HEMALATHA M.An innovative hybrid hi- ting fuzzy if-then rules for classification problems using ge- erarchical model for automatic image annotation M]/ netic algorithms[J].IEEE Transactions on Fuzzy Systems, KRISHNA P V,BABU M R,ARIWA E.Global Trends in 1995,3(3):260-270. Information Systems and Software Applications,Volume [22]PACH F P,ABONYI J.Association rule and decision tree 270.Berlin:Springer-Varlag,2012:718-726. based methods for fuzzy rule base generation[].Interna- [11]张静，胡微微，陈志华，等.多模型融合的多标签图像 tional Scholarly and Scientific Research and Innovation, 自动标注[J].计算机辅助设计与图形学学报，2014， 2008,2(1):546-551. 26(3):472-478. [23]GAO Jing,ZHAO Baoyong.New method about how to con- ZHANG Jing,HU Weiwei,CHEN Zhihua,et al.Multi- struct decision tree based on association rule[C]//Pro- model fused framework for image annotation[J].Journal of ceedings of International Workshop on Open-Source for Sci- Computer-Aided Design and Computer Graphics,2014,26 entific Computation.Beijing,China,2011:131-135. (3):472-478. [24]SILLA C N.FREITAS A A.A survey of hierarchical classi- [12]MAKADIA A,PAVLOVIC V,KUMAR S.Baselines for fication across different application domains[J].Data Min- image annotation[].International Journal of Computer ing and Knowledge Discovery,2011,22(1/2):31-72. Vision,2010,90(1):88-105. 作者简介： [13]LI Feifei,FERGUS R,PERONA P.One-shot learning of 李志欣，男，1971年生，副教授，博 object categories[].IEEE Transactions on Pattern Analy- 士，主要研究方向为图像理解、机器学 sis and Machine Intelligence,2006,28(4):594-611. 习、多媒体分析与检索。发表学术论文 [14]PASS G,ZABITH R.Histogram refinement for content- 40余篇，其中SCI收录5篇，EI收录 based image retrieval[C]//Proceedings of the 3rd IEEE 30篇。 Workshop on Applications of Computer Vision.Sarasota, USA,1996:96-102. [15]LOWE D G.Distinctive image features form scale-invariant 李灵芝，女，1987年生，硕士研究生， keypoints[J].International Journal of Computer Vision, 主要研究方向为图像理解，机器学习。 2004,60(2):91-110. [16]JUKIC N,NESTOROV S.Comprehensive data warehouse exploration with qualified association-rule mining[].De- cision Support Systems,2006,42(2):859-878. [17]HU Y C,CHEN R S,TZENG G H.Mining fuzzy associa- tion rules for classification problems[J].Computer and In- 张灿龙，男，1975年生，副教授，博 dustrial Engineering,2002,43(4):735-750. 土，主要研究方向为模式识别、图像目 [18 ]KUOK C M,FU A,WONG M H.Mining fuzzy association 标跟踪。 rules in databases[J].ACM SIGMOD Record,1998,27 (1):41-46. [19]董杰，沈国杰.一种基于模糊关联分类的遥感图像分类 [责任编辑：孟玮]

ａｎｎｏｔａｔｉｏｎｂｙｆｕｓｉｎｇｓｅｍａｎｔｉｃｔｏｐｉｃｓ［Ｊ］．ＪｏｕｒｎａｌｏｆＳｏｆｔ⁃ ｗａｒｅ，２０１１，２２（４）：８０１⁃８１２．［８］ＬＩＺｈｉｘｉｎ，ＳＨＩＺｈｏｎｇｚｈｉ，ＺＨＡＯＷｅｉｚｈｏｎｇ，ｅｔａｌ．Ｌｅａｒｎｉｎｇｓｅｍａｎｔｉｃｃｏｎｃｅｐｔｓｆｒｏｍｉｍａｇｅｄａｔａｂａｓｅｗｉｔｈｈｙｂｒｉｄｇｅｎｅｒａ⁃ ｔｉｖｅ／ｄｉｓｃｒｉｍｉｎａｔｉｖｅａｐｐｒｏａｃｈ［Ｊ］．ＥｎｇｉｎｅｅｒｉｎｇＡｐｐｌｉｃａｔｉｏｎｓｏｆＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ，２０１３，２６（９）：２１４３⁃２１５２．［９］茹立云，马少平，路晶．基于Ｂｏｏｓｔｉｎｇ学习的图片语义自动标注［Ｊ］．中国图象图形学报，２００６，１１（４）：４８６⁃４９１．ＲＵＬｉｙｕｎ，ＭＡＳｈａｏｐｉｎｇ，ＬＵＪｉｎｇ．Ｂｏｏｓｔｉｎｇ⁃ｂａｓｅｄａｕｔｏｍａｔ⁃ ｉｃｌｉｎｇｕｉｓｔｉｃｉｎｄｅｘｉｎｇｏｆｐｉｃｔｕｒｅｓ［Ｊ］．ＪｏｕｒｎａｌｏｆＩｍａｇｅａｎｄＧｒａｐｈｉｃｓ，２００６，１１（４）：４８６⁃４９１．［１０］ＳＵＭＡＴＨＩＴ，ＨＥＭＡＬＡＴＨＡＭ．Ａｎｉｎｎｏｖａｔｉｖｅｈｙｂｒｉｄｈｉ⁃ ｅｒａｒｃｈｉｃａｌｍｏｄｅｌｆｏｒａｕｔｏｍａｔｉｃｉｍａｇｅａｎｎｏｔａｔｉｏｎ［Ｍ］／／ＫＲＩＳＨＮＡＰＶ，ＢＡＢＵＭＲ，ＡＲＩＷＡＥ．ＧｌｏｂａｌＴｒｅｎｄｓｉｎＩｎｆｏｒｍａｔｉｏｎＳｙｓｔｅｍｓａｎｄＳｏｆｔｗａｒｅＡｐｐｌｉｃａｔｉｏｎｓ，Ｖｏｌｕｍｅ２７０．Ｂｅｒｌｉｎ：Ｓｐｒｉｎｇｅｒ⁃Ｖａｒｌａｇ，２０１２：７１８⁃７２６．［１１］张静，胡微微，陈志华，等．多模型融合的多标签图像自动标注［Ｊ］．计算机辅助设计与图形学学报，２０１４，２６（３）：４７２⁃４７８．ＺＨＡＮＧＪｉｎｇ，ＨＵＷｅｉｗｅｉ，ＣＨＥＮＺｈｉｈｕａ，ｅｔａｌ．Ｍｕｌｔｉ⁃ ｍｏｄｅｌｆｕｓｅｄｆｒａｍｅｗｏｒｋｆｏｒｉｍａｇｅａｎｎｏｔａｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒ⁃ＡｉｄｅｄＤｅｓｉｇｎａｎｄＣｏｍｐｕｔｅｒＧｒａｐｈｉｃｓ，２０１４，２６（３）：４７２⁃４７８．［１２］ＭＡＫＡＤＩＡＡ，ＰＡＶＬＯＶＩＣＶ，ＫＵＭＡＲＳ．Ｂａｓｅｌｉｎｅｓｆｏｒｉｍａｇｅａｎｎｏｔａｔｉｏｎ［Ｊ］．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，２０１０，９０（１）：８８⁃１０５．［１３］ＬＩＦｅｉｆｅｉ，ＦＥＲＧＵＳＲ，ＰＥＲＯＮＡＰ．Ｏｎｅ⁃ｓｈｏｔｌｅａｒｎｉｎｇｏｆｏｂｊｅｃｔｃａｔｅｇｏｒｉｅｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡｎａｌｙ⁃ ｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ，２００６，２８（４）：５９４⁃６１１．［１４］ＰＡＳＳＧ，ＺＡＢＩＴＨＲ．Ｈｉｓｔｏｇｒａｍｒｅｆｉｎｅｍｅｎｔｆｏｒｃｏｎｔｅｎｔ⁃ ｂａｓｅｄｉｍａｇｅｒｅｔｒｉｅｖａｌ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ３ｒｄＩＥＥＥＷｏｒｋｓｈｏｐｏｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ｓａｒａｓｏｔａ，ＵＳＡ，１９９６：９６⁃１０２．［１５］ＬＯＷＥＤＧ．Ｄｉｓｔｉｎｃｔｉｖｅｉｍａｇｅｆｅａｔｕｒｅｓｆｏｒｍｓｃａｌｅ⁃ｉｎｖａｒｉａｎｔｋｅｙｐｏｉｎｔｓ［Ｊ］．ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＶｉｓｉｏｎ，２００４，６０（２）：９１⁃１１０．［１６］ＪＵＫＩＣＮ，ＮＥＳＴＯＲＯＶＳ．Ｃｏｍｐｒｅｈｅｎｓｉｖｅｄａｔａｗａｒｅｈｏｕｓｅｅｘｐｌｏｒａｔｉｏｎｗｉｔｈｑｕａｌｉｆｉｅｄａｓｓｏｃｉａｔｉｏｎ⁃ｒｕｌｅｍｉｎｉｎｇ［Ｊ］．Ｄｅ⁃ ｃｉｓｉｏｎＳｕｐｐｏｒｔＳｙｓｔｅｍｓ，２００６，４２（２）：８５９⁃８７８．［１７］ＨＵＹＣ，ＣＨＥＮＲＳ，ＴＺＥＮＧＧＨ．Ｍｉｎｉｎｇｆｕｚｚｙａｓｓｏｃｉａ⁃ ｔｉｏｎｒｕｌｅｓｆｏｒｃｌａｓｓｉｆｉｃａｔｉｏｎｐｒｏｂｌｅｍｓ［Ｊ］．ＣｏｍｐｕｔｅｒａｎｄＩｎ⁃ ｄｕｓｔｒｉａｌＥｎｇｉｎｅｅｒｉｎｇ，２００２，４３（４）：７３５⁃７５０．［１８］ＫＵＯＫＣＭ，ＦＵＡ，ＷＯＮＧＭＨ．Ｍｉｎｉｎｇｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｓｉｎｄａｔａｂａｓｅｓ［Ｊ］．ＡＣＭＳＩＧＭＯＤＲｅｃｏｒｄ，１９９８，２７（１）：４１⁃４６．［１９］董杰，沈国杰．一种基于模糊关联分类的遥感图像分类方法［Ｊ］．计算机研究与发展，２０１２，４９（７）：１５００⁃ １５０６．ＤＯＮＧＪｉｅ，ＳＨＥＮＧｕｏｊｉｅ．Ｒｅｍｏｔｅｓｅｎｓｉｎｇｉｍａｇｅｃｌａｓｓｉｆｉ⁃ ｃａｔｉｏｎｂａｓｅｄｏｎｆｕｚｚｙａｓｓｏｃｉａｔｉｖｅｃｌａｓｓｉｆｉｃａｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒＲｅｓｅａｒｃｈａｎｄＤｅｖｅｌｏｐｍｅｎｔ，２０１２，４９（７）：１５００⁃１５０６．［２０］ＴＡＺＡＲＥＥＡ，ＥＦＴＥＫＨＡＲＩ⁃ＭＯＧＨＡＤＡＭＡＭ，ＳＡＪＪＡＤＩ⁃ ＧＨＡＥＭ⁃ＭＡＧＨＡＭＩＳ．Ａｓｅｍａｎｔｉｃｉｍａｇｅｃｌａｓｓｉｆｉｅｒｂａｓｅｄｏｎｈｉｅｒａｒｃｈｉｃａｌｆｕｚｚｙａｓｓｏｃｉａｔｉｏｎｒｕｌｅｍｉｎｉｎｇ［Ｊ］．ＭｕｌｔｉｍｅｄｉａＴｏｏｌｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，２０１４，６９（３）：９２１⁃９４９．［２１］ＳＨＩＢＵＣＨＩＨ，ＮＯＺＡＫＩＫ，ＹＡＭＡＭＯＴＯＮ，ｅｔａｌ．Ｓｅｌｅｃ⁃ ｔｉｎｇｆｕｚｚｙｉｆ⁃ｔｈｅｎｒｕｌｅｓｆｏｒｃｌａｓｓｉｆｉｃａｔｉｏｎｐｒｏｂｌｅｍｓｕｓｉｎｇｇｅ⁃ ｎｅｔｉｃａｌｇｏｒｉｔｈｍｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＦｕｚｚｙＳｙｓｔｅｍｓ，１９９５，３（３）：２６０⁃２７０．［２２］ＰＡＣＨＦＰ，ＡＢＯＮＹＩＪ．Ａｓｓｏｃｉａｔｉｏｎｒｕｌｅａｎｄｄｅｃｉｓｉｏｎｔｒｅｅｂａｓｅｄｍｅｔｈｏｄｓｆｏｒｆｕｚｚｙｒｕｌｅｂａｓｅｇｅｎｅｒａｔｉｏｎ［Ｊ］．Ｉｎｔｅｒｎａ⁃ ｔｉｏｎａｌＳｃｈｏｌａｒｌｙａｎｄＳｃｉｅｎｔｉｆｉｃＲｅｓｅａｒｃｈａｎｄＩｎｎｏｖａｔｉｏｎ，２００８，２（１）：５４６⁃５５１．［２３］ＧＡＯＪｉｎｇ，ＺＨＡＯＢａｏｙｏｎｇ．Ｎｅｗｍｅｔｈｏｄａｂｏｕｔｈｏｗｔｏｃｏｎ⁃ ｓｔｒｕｃｔｄｅｃｉｓｉｏｎｔｒｅｅｂａｓｅｄｏｎａｓｓｏｃｉａｔｉｏｎｒｕｌｅ［Ｃ］／／Ｐｒｏ⁃ ｃｅｅｄｉｎｇｓｏｆＩｎｔｅｒｎａｔｉｏｎａｌＷｏｒｋｓｈｏｐｏｎＯｐｅｎ⁃ＳｏｕｒｃｅｆｏｒＳｃｉ⁃ ｅｎｔｉｆｉｃＣｏｍｐｕｔａｔｉｏｎ．Ｂｅｉｊｉｎｇ，Ｃｈｉｎａ，２０１１：１３１⁃１３５．［２４］ＳＩＬＬＡＣＮ，ＦＲＥＩＴＡＳＡＡ．Ａｓｕｒｖｅｙｏｆｈｉｅｒａｒｃｈｉｃａｌｃｌａｓｓｉ⁃ ｆｉｃａｔｉｏｎａｃｒｏｓｓｄｉｆｆｅｒｅｎｔａｐｐｌｉｃａｔｉｏｎｄｏｍａｉｎｓ［Ｊ］．ＤａｔａＭｉｎ⁃ ｉｎｇａｎｄＫｎｏｗｌｅｄｇｅＤｉｓｃｏｖｅｒｙ，２０１１，２２（１／２）：３１⁃７２．作者简介：李志欣，男，１９７１年生，副教授，博士，主要研究方向为图像理解、机器学习、多媒体分析与检索。发表学术论文４０余篇，其中ＳＣＩ收录５篇，ＥＩ收录３０篇。李灵芝，女，１９８７年生，硕士研究生，主要研究方向为图像理解、机器学习。张灿龙，男，１９７５年生，副教授，博士，主要研究方向为模式识别、图像目标跟踪。［责任编辑：孟玮］ ·６４４· 智能系统学报第１０卷

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录