正在加载图片...
·352 智能系统学报 第6卷 式中:K(01,02)代表关键字01、02在训练集中共同 重要的矩阵,相似矩阵S和初始标注矩阵Y,前者对 作为一幅图像的标注而出现的次数,可以将它作为 应着上一节中得到的共生矩阵,而后者由CMRM算 一个矩阵存储记为K,不难看出,K是一个对称矩 法对测试图像进行标注而得到, 阵:N为训练集的大小,它代表了训练图像集中所 2.3基于词间相关性标注算法 包含的全部图像的数目;1则表示标注中出现了关 下面给出算法的具体步骤如下, 键字0,的全部图像的数量,它就决定了K(01, 1)从数据集的文件中读入训练数据信息,进而 w2)与K(Ww2,01)并不相等,因为常见的关键字,在 完成对基本信息#(0,J)、#(0,T)、#(b,J)、#(b,T) 图像集的标注中出现的次数相对于一般的关键字要 的统计,并转2). 多,也就是它的值大,相应的1g()就小 2)估计关键字和和视觉词元b的条件概率,并 n 计算关键字与视觉词元之间的联合概率, 要准确地获取关键字之间的词间相关性矩阵, 3)提取词间相关性矩阵S. 需要对训练集数据进行统计和整理,并进行相应的 4)将2)中得到标注矩阵与式(7)中的初始状 计算.下面将详细说明计算该矩阵的算法,算法的主 态矩阵Y对应,进行迭代计算,直到收敛,得到的新 要步骤如下: 矩阵就是最终标注结果。 1)读入训练图像集中的标注信息,即训练图像 5)对矩阵每行的元素按概率值排序,取概率最大 本身自带的标注关键字; 的N个作为最终的标注关键字,在本文方法中W=5. 2)从训练集的标注信息中,统计出任意2个关 键字的共生次数,即K(01,w2); 3实验结果与分析 3)统计每个关键字在训练图像集中作为标注 3.1实验数据 出现的次数n1; 本文采用带有标注字的Corel5k图像集[9]实 4)按照式(6)计算出词间相关性矩阵; 验.整个图像集中共包含50个文件夹,每个文件夹 5)对矩阵进行归一化处理 100张图像,共5000张图像.从每个文件夹中选取 2.2相关关系传播算法 80张图像作为训练图像,再先取10张作为评估图 本文利用图学习算法来实现词间相关性在各个 像集,用于对参数进行评估,其余10张图像作为测 关键字之间的传播.文献[8]将图学习算法应用于 试图像4. 图像标注中,所提出的基于图学习的标注框架首先 对所有图像均先利用NCut算法进行图像分割, 进行初始标注,即以图像为节点,以图间相似性为边 取前10个面积较大的区域作为有效区域,进行特征 建立图,通过图学习算法将标注信息从已标注图像 提取.区域的视觉特征为36维特征向量,包括18种 传递到未标注图像,然后对标注结果进行改善.这 颜色特征、12种纹理特征和6种形状特征.对训练 时,利用词间相关性建立以词为节点的图,以初始标 图像,利用-均值聚类算法(K=500)对所有有效区 注结果设置初始状态向量,通过学习算法得到图像 域进行聚类,由聚类结果得到500个视觉词元 的最终标注结果.本文方法借鉴了这一框架, 3.2实验结果 设G=(V,E)表示图,其中V={x1,2,…,x} 对500幅测试图像进行了自动的标注,计算了 是图的顶点,对应标注的关键字;E代表图的边,边 每个关键字(标注字)的平均查全率和平均查准率 上的权值对应它所连接的2个关键字之间的相关强 查全率(recall)度量出对单个词查询的完整性,查准 度.同时,设CMRM标注结果用矩阵Y表示,它的元 率(precision)反映出查询的精度.对于给定的标注 素y:表示第i幅图像被标注为第j个关键字的概率. 字w,若在测试图像集的手工标注结果中包含w的 结果矩阵R的元素表示每幅图像被标注为每个关 图像个数为Nm,使用自动标注模型的标注结果中包 键字的最终概率结果,由下面的迭代过程产生81: 含该词的图像个数为N,,其中参照手工标注结果有 R(t+1)=B·S·R(t)+(1-B)Y,(7) N,个是正确的,则单个标注字的查全率和查准率为 R*=(1-B)(1-BS)Y. (8) 式中:t表示迭代次数,其初值为0,R(0)=YB是传 recall =N 播系数,它决定了相关矩阵对标注结果的影响程度, N, 本文中t的终值取500,B取0.25. precision= N. 从上面的描述可以看出,迭代过程中有2个最 采用标注字的平均查准率和平均查全率来考察
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有