正在加载图片...
·420- 智能系统学报 第3卷 匹配成功,否则失败根据文献7建议,本文ε取044 家公司的垃圾图片 匹配过程如下: 系统提取截图的特征信息(图4(b),并且保 l)用①-Tree为F。的全部元素建立索引; 存至“黑名单中.系统每读入一封内嵌有图片的电 2)根据式(7),使用BBF(best-bin-first)搜索算 子邮件,都会先提取出内置图片的特征信息,并拿它 法得到F,中每个元素k在KD-Tree中的近似k 去与“黑名单中事先截取下的子图做图像特征匹 近邻这里k取2).BBF算法寻找的是特征向量的 配.一旦被系统发现该邮件图片与用户之前获取的 近似最近邻,在不显著降低匹配精度的情况下,这种 截图有足够多的相似点(图4(c)),那么就有理由 算法比常规搜索快得多.设返回的2个最近邻特征 相信这张图片正是一幅类似的广告图片,而这封邮 点为、: 件将被标上“ad的广告(advertising)邮件标志(图 3)根据式(8)确定万是否是k的有效匹配: 4(d)),最后由系统过滤掉 4)对所有k重复以上过程,得到F,的特征点 kk,与F,匹配到的所有特征点对(matched pairs) For more informaton,Please do not click 的集合 e www.VIPRX1.org dress bar ofyou browser,then press the Ente 3系统结构及运行实例 (a)截图 31系统结构 设计的图片垃圾邮件过滤系统主要由以下4个 功能模块组成: 1)邮件平台.这是本邮件系统赖以运行的框架 e 性功能模块该模块具备完善的邮件收发功能,以及 (b)截图的SFT特征 日常的邮件管理与维护功能.它提供给用户一个友 For moce indormaton,Please do notclck 好的操作界面,最终的程序运行效果也都是通过该 www.VIPRX1.org 邮件平台来显示的: 2)截图功能模块.用户使用这个模块来获取某 macy Online 张截图,并将之传给特征向量析取器.该模块提供了 pt和80% 一项系统与用户间的交互操作,即系统首先自动搜 寻图片中特征点密度最高的子区域并标记出,用户 可以根据系统的建议决定是否选择这块截图: 3)特征向量析取器.系统需要完成一些预处理 st iype:www.ViPRX2.org had0re5 fyou owe红en8heE 来协助后面的图像匹配工作.采用了一个图像特征 析取器来预先提取图片的SFT特征向量,这样一来 图像的匹配工作就由图像与图像的匹配转换成了向 (c)找到了匹配项 量与向量的匹配,这将大大减少时间开销: Pics Kind 4)图像匹配模块.这个模块在整个系统的起到 图像识别作用.邮件图片与所有截图的特征向量经 特征向量析取器处理过后送至垃圾图像识别器进行 匹配,最终匹配结果将被反馈到邮件平台 3.2运行实例 以广告垃圾邮件为例,介绍本系统具体的检测 垃圾邮件的运行过程.一般来说,广告图片中往往在 显眼的位置上存在一个公司商标或者说某块标志性 图像区域.如图4(a)所示,截取了广告图片中的一 个子图,它显示有公司的网址信息,而一般情况下这 (d)搜寻结果 个子图也同时存在于该公司发出的其他广告图片 图4检测广告图片实例 中.就认为凡是含有此子图的图片都是来自于同一 Fig 4 Example of detecting advertising mage 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net匹配成功,否则失败.根据文献 [7]建议,本文ε取 0. 44. 匹配过程如下 : 1) 用 KD2Tree为 Fb 的全部元素建立索引; 2) 根据式 (7) ,使用 BBF( best2bin2first)搜索算 法 [ 11 ]得到 Fa 中每个元素 ki 在 KD2Tree中的近似 k 近邻 (这里 k取 2). BBF算法寻找的是特征向量的 近似最近邻 ,在不显著降低匹配精度的情况下 ,这种 算法比常规搜索快得多. 设返回的 2个最近邻特征 点为 f1、f2 ; 3) 根据式 (8)确定 f1 是否是 ki 的有效匹配; 4) 对所有 ki 重复以上过程 , 得到 Fb 的特征点 k1 2kN b与 Fa 匹配到的所有特征点对 (matched pairs) 的集合. 3 系统结构及运行实例 3. 1 系统结构 设计的图片垃圾邮件过滤系统主要由以下 4个 功能模块组成 : 1)邮件平台. 这是本邮件系统赖以运行的框架 性功能模块. 该模块具备完善的邮件收发功能 ,以及 日常的邮件管理与维护功能. 它提供给用户一个友 好的操作界面 ,最终的程序运行效果也都是通过该 邮件平台来显示的; 2)截图功能模块. 用户使用这个模块来获取某 张截图 ,并将之传给特征向量析取器. 该模块提供了 一项系统与用户间的交互操作 ,即系统首先自动搜 寻图片中特征点密度最高的子区域并标记出 ,用户 可以根据系统的建议决定是否选择这块截图; 3)特征向量析取器. 系统需要完成一些预处理 来协助后面的图像匹配工作. 采用了一个图像特征 析取器来预先提取图片的 SIFT特征向量 ,这样一来 图像的匹配工作就由图像与图像的匹配转换成了向 量与向量的匹配 ,这将大大减少时间开销; 4)图像匹配模块. 这个模块在整个系统的起到 图像识别作用. 邮件图片与所有截图的特征向量经 特征向量析取器处理过后送至垃圾图像识别器进行 匹配 ,最终匹配结果将被反馈到邮件平台. 3. 2 运行实例 以广告垃圾邮件为例 ,介绍本系统具体的检测 垃圾邮件的运行过程. 一般来说 ,广告图片中往往在 显眼的位置上存在一个公司商标或者说某块标志性 图像区域. 如图 4 ( a)所示 ,截取了广告图片中的一 个子图 ,它显示有公司的网址信息 ,而一般情况下这 个子图也同时存在于该公司发出的其他广告图片 中. 就认为凡是含有此子图的图片都是来自于同一 家公司的垃圾图片. 系统提取截图的特征信息 (图 4 ( b) ) ,并且保 存至“黑名单 ”中. 系统每读入一封内嵌有图片的电 子邮件 ,都会先提取出内置图片的特征信息 ,并拿它 去与“黑名单 ”中事先截取下的子图做图像特征匹 配. 一旦被系统发现该邮件图片与用户之前获取的 截图有足够多的相似点 (图 4 ( c) ) ,那么就有理由 相信这张图片正是一幅类似的广告图片 ,而这封邮 件将被标上“ad”的广告 ( advertising)邮件标志 (图 4 ( d) ) ,最后由系统过滤掉. ( a) 截图 ( b) 截图的 SIFT特征 ( c) 找到了匹配项 ( d) 搜寻结果 图 4 检测广告图片实例 Fig. 4 Examp le of detecting advertising image ·420· 智 能 系 统 学 报 第 3卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有