第14卷第2期 智能系统学报 Vol.14 No.2 2019年3月 CAAI Transactions on Intelligent Systems Mar.2019 D0:10.11992/tis.201709014 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.tp.20180420.1018.002.html 改进SURF特征的维吾尔文复杂文档图像匹配检索 阿丽亚·巴吐尔,努尔毕亚·亚地卡尔,吾尔尼沙·买买提,阿力木江·艾沙2,库尔班·吾布力 (1.新疆大学信息科学与工程学院,新疆乌鲁木齐,830046;2.新疆大学网络与信息中心,新疆乌鲁木齐, 830046) 摘要:针对图像局部特征的词袋模型(Bag-of-Word,BOW)检索研究中聚类中心的不确定性和计算复杂性问 题,提出一种由不同种类的距离进行相似程度测量的检索和由匹配点数来检索的方法。这种方法首先需要改 进文档图像的SURF特征,有效降低特征提取复杂度;其次,对FAST+SURF特征实现FLANN双向匹配与KD- Tre+BBF匹配,在不同变换条件下验证特征鲁棒性;最后,基于这两种检索方法对已收集整理好的各类维吾尔 文文档图像数据库进行检索。实验结果表明:基于距离的相似性度量复杂度次于基于匹配数目的检索,而且两 种检索策略都能满足快速、精确查找需求。 关键词:复杂文档:维吾尔文档图像:文档图像分割:特征提取:SURF特征:FLANN双向匹配:KD-Tre+BBF匹 配:图像检索 中图分类号:TP391.1文献标志码:A文章编号:1673-4785(2019)02-0296-10 中文引用格式:阿丽亚·巴吐尔,努尔毕亚·亚地卡尔,吾尔尼沙·买买提,等.改进SURF特征的维吾尔文复杂文档图像匹配检 索1.智能系统学报,2019,14(2):296-305. 英文引用格式:ALIYA Batur,NURBIYA Yadikar,HORNISA Mamat,,etal.Complex Uyghur document image matching and re-. trieval based on modified SURF feature[JI.CAAI transactions on intelligent systems,2019,14(2):296-305. Complex Uyghur document image matching and retrieval based on modified SURF feature ALIYA Batur',NURBIYA Yadikar',HORNISA Mamat',ALIMJAN Aysa',KURBAN Ubul' (1.School of Information Science and Engineering,Xinjiang University,Urumgi 830046,China;2.Network and information center, Xinjiang University,Xinjiang University,Urumqi 830046,China) Abstract:This study is aimed at the uncertainty and computational complexity of the clustering center in local image features retrieval based on the bag-of-words(BOW)model.A method to retrieve the measure of similarity degree from different kinds of distance and another method that requires using the matching point number as the basis of retrieval are proposed in this paper.In this method,the SURF feature is first modified to effectively reduce feature extraction com- plexity,and then FLANN(fast library for approximate nearest neighbors)bidirectional matching and KD-Tree +BBF matching are implemented for FAST+SURF features.Feature robustness is verified under different transformation con- ditions.Finally,all kinds of Uyghur document images that have been classified and sorted based on these two retrieval methods are retrieved.The results of the retrieval experiments indicate that the similarity degree measure retrieval based on distance is inferior to the retrieval based on matching number,and both of these two retrieval strategies can meet the requirements of fast and accurate searching. Keywords:complex document image;Uyghur document image;document image segmentation;feature extraction; SURF feature;FALNN bidirectional matching;KD-Tree+BBF matching;image retrieval 收稿日期:2017-09-17.网络出版日期:2018-04-24 在当今信息技术高速发展的背景下,多媒体 基金项目:国家自然科学基金项目(61563052,61163028, 61363064片新疆大学博士科研启动基金项目BS150262), 技术的发展使文档图像在信息的交换中运用越来 新疆维吾尔自治区高校科研计划创新团队项目 越频繁。日益增长的需求使文档图像的数量越来 (XJEDU2017T002). 通信作者:库尔班吾布力.E-mail:urbanu@xju.edu.cn. 越庞大,这就要求文档图像存储系统能够为用户
DOI: 10.11992/tis.201709014 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20180420.1018.002.html 改进 SURF 特征的维吾尔文复杂文档图像匹配检索 阿丽亚·巴吐尔1 ,努尔毕亚·亚地卡尔1 ,吾尔尼沙·买买提1 ,阿力木江·艾沙2 ,库尔班·吾布力1 (1. 新疆大学 信息科学与工程学院,新疆 乌鲁木齐,830046; 2. 新疆大学 网络与信息中心,新疆 乌鲁木齐, 830046) 摘 要:针对图像局部特征的词袋模型 (Bag-of-Word, BOW) 检索研究中聚类中心的不确定性和计算复杂性问 题,提出一种由不同种类的距离进行相似程度测量的检索和由匹配点数来检索的方法。这种方法首先需要改 进文档图像的 SURF 特征,有效降低特征提取复杂度;其次,对 FAST+SURF 特征实现 FLANN 双向匹配与 KDTree+BBF 匹配,在不同变换条件下验证特征鲁棒性;最后,基于这两种检索方法对已收集整理好的各类维吾尔 文文档图像数据库进行检索。实验结果表明:基于距离的相似性度量复杂度次于基于匹配数目的检索,而且两 种检索策略都能满足快速、精确查找需求。 关键词:复杂文档;维吾尔文档图像;文档图像分割;特征提取;SURF 特征;FLANN 双向匹配;KD-Tree+BBF 匹 配;图像检索 中图分类号:TP391.1 文献标志码:A 文章编号:1673−4785(2019)02−0296−10 中文引用格式:阿丽亚·巴吐尔, 努尔毕亚·亚地卡尔, 吾尔尼沙·买买提, 等. 改进 SURF 特征的维吾尔文复杂文档图像匹配检 索[J]. 智能系统学报, 2019, 14(2): 296–305. 英文引用格式:ALIYA Batur, NURBIYA Yadikar, HORNISA Mamat, et al. Complex Uyghur document image matching and retrieval based on modified SURF feature[J]. CAAI transactions on intelligent systems, 2019, 14(2): 296–305. Complex Uyghur document image matching and retrieval based on modified SURF feature ALIYA Batur1 ,NURBIYA Yadikar1 ,HORNISA Mamat1 ,ALIMJAN Aysa2 ,KURBAN Ubul1 (1. School of Information Science and Engineering, Xinjiang University, Urumqi 830046, China; 2. Network and information center, Xinjiang University, Xinjiang University, Urumqi 830046, China) Abstract: This study is aimed at the uncertainty and computational complexity of the clustering center in local image features retrieval based on the bag-of-words (BOW) model. A method to retrieve the measure of similarity degree from different kinds of distance and another method that requires using the matching point number as the basis of retrieval are proposed in this paper. In this method, the SURF feature is first modified to effectively reduce feature extraction complexity, and then FLANN (fast library for approximate nearest neighbors) bidirectional matching and KD-Tree + BBF matching are implemented for FAST + SURF features. Feature robustness is verified under different transformation conditions. Finally, all kinds of Uyghur document images that have been classified and sorted based on these two retrieval methods are retrieved. The results of the retrieval experiments indicate that the similarity degree measure retrieval based on distance is inferior to the retrieval based on matching number, and both of these two retrieval strategies can meet the requirements of fast and accurate searching. Keywords: complex document image; Uyghur document image; document image segmentation; feature extraction; SURF feature; FALNN bidirectional matching; KD-Tree+BBF matching; image retrieval 在当今信息技术高速发展的背景下,多媒体 技术的发展使文档图像在信息的交换中运用越来 越频繁。日益增长的需求使文档图像的数量越来 越庞大,这就要求文档图像存储系统能够为用户 收稿日期:2017−09−17. 网络出版日期:2018−04−24. 基金项目:国家自然科学基金项 目 (61563052, 61163028, 61363064);新疆大学博士科研启动基金项目 (BS150262), 新疆维吾尔自治区高校科研计划创新团队项 目 (XJEDU2017T002). 通信作者:库尔班·吾布力. E-mail:urbanu@xju.edu.cn. 第 14 卷第 2 期 智 能 系 统 学 报 Vol.14 No.2 2019 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2019
第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·297· 提供快速高效的检索服务,为了达成这一目标许 王亚文等基于中心-边缘区域比较模板匹配算法 多国内外学者进行了卓有成效的研究。王澎 有效跟踪目标区域,提取SURF特征,将匹配对数 等提出提取图像关键点的64维SURF特征集, 目与模板匹配数目比较自适应调整跟踪窗口,实 计算每一维上的一阶中心矩与加权绝对中心矩, 现目标检测。这些方法分别对特征提取和匹配方 形成特征向量,将其作为SVM分类的依据,对1000 式进行不同程度的改进,但是检索时间或检索准 幅图片进行分类,获得86.8%的正确分类率。赵 确率需要进一步提高。 璐璐等4,对提取的64维SURF特征点,基于 本文提取改进的W×64维SURF特征,并对其 FLANN算法进行双向匹配,对匹配对进行PROSAC 实现FLANN双向匹配,依次统计匹配性能参数, 分析,剔除误匹配对,提高图像匹配精度,有效缩 并将其作为相似性度量依据,从大规模图像数据 短匹配占用时间。闫丽等,扩展Haar响应,生成 库中有效检索输出目标文档图像。此外,为降低 包含线特征、中心环绕特征、角点特征的Haar- 检索复杂度,笔者运用基于距离的相似性度量方 Lik特征集,提高描述子的区分率,基于欧氏距 离比实现遥感图像的快速准确匹配。陈剑虹等) 法,快速查找目标文档图像。 提出改进SURF关键点检测,提取图像细节区域 1FAST+SURF特征提取 的特征点,不经过非极大值抑制有效去除边缘点 与低对比点,将优先队列(BBF)融入到KD-Tree 本文对细节信息丰富的维吾尔文复杂文档图 双向匹配中,实现稳定、快速鲁邦特征的精确匹 像进行研究,不对其进行版面分析,对改进 配。罗楠等对SURF特征描述进行改进,用改 SURF特征实现脱离于词袋模型的检索方法,从 进DAISY描述算子为每个关键点分配主方向,形 大规模图像数据库中实现有效检索。本文算法流 成维数为200的特征向量,并通过最近邻距离比 程如图1所示。 NNDR)匹配目标图像,其最大匹配率达到95.78%。 维文复杂文档 复杂文档图像数据库 扫描 FAST关键点检测 FAST关键点检测 SURF特 征向量 SURF特征 SURF特征 FLANN双向匹配 RANSAC分析 基于匹配点数的检索 将检索结果 基于欧式距离的检索 输出给用户 图1基于改进SURF特征的维吾尔文印刷体复杂文档图像检索流程框图 Fig.1 The block diagram of Uyghur printed complex document image retrieval based on modified SURF feature
提供快速高效的检索服务,为了达成这一目标许 多国内外学者进行了卓有成效的研究[1-2]。王澎 等 [3]提出提取图像关键点的 64 维 SURF 特征集, 计算每一维上的一阶中心矩与加权绝对中心矩, 形成特征向量,将其作为 SVM 分类的依据,对 1 000 幅图片进行分类,获得 86.8% 的正确分类率。赵 璐璐等[4-5] ,对提取的 64 维 SURF 特征点,基于 FLANN 算法进行双向匹配,对匹配对进行 PROSAC 分析,剔除误匹配对,提高图像匹配精度,有效缩 短匹配占用时间。闫丽等[6] ,扩展 Haar 响应,生成 包含线特征、中心环绕特征、角点特征的 HaarLike 特征集,提高描述子的区分率,基于欧氏距 离比实现遥感图像的快速准确匹配。陈剑虹等[7] 提出改进 SURF 关键点检测,提取图像细节区域 的特征点,不经过非极大值抑制有效去除边缘点 与低对比点,将优先队列 (BBF) 融入到 KD-Tree 双向匹配中,实现稳定、快速鲁邦特征的精确匹 配。罗楠等[8]对 SURF 特征描述进行改进,用改 进 DAISY 描述算子为每个关键点分配主方向,形 成维数为 200 的特征向量,并通过最近邻距离比 (NNDR) 匹配目标图像,其最大匹配率达到 95.78%。 王亚文等[9]基于中心-边缘区域比较模板匹配算法 有效跟踪目标区域,提取 SURF 特征,将匹配对数 目与模板匹配数目比较自适应调整跟踪窗口,实 现目标检测。这些方法分别对特征提取和匹配方 式进行不同程度的改进,但是检索时间或检索准 确率需要进一步提高。 本文提取改进的 N×64 维 SURF 特征,并对其 实现 FLANN 双向匹配,依次统计匹配性能参数, 并将其作为相似性度量依据,从大规模图像数据 库中有效检索输出目标文档图像。此外,为降低 检索复杂度,笔者运用基于距离的相似性度量方 法,快速查找目标文档图像。 1 FAST+SURF 特征提取 本文对细节信息丰富的维吾尔文复杂文档图 像进行研究,不对其进行版面分析,对改 进 SURF 特征实现脱离于词袋模型的检索方法,从 大规模图像数据库中实现有效检索。本文算法流 程如图 1 所示。 维文复杂文档 复杂文档图像数据库 扫描 基于欧式距离的检索 SURF 特 征向量 将检索结果 输出给用户 FAST 关键点检测 SURF 特征 FAST 关键点检测 SURF 特征 基于匹配点数的检索 FLANN 双向匹配 RANSAC 分析 图 1 基于改进 SURF 特征的维吾尔文印刷体复杂文档图像检索流程框图 Fig. 1 The block diagram of Uyghur printed complex document image retrieval based on modified SURF feature 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·297·
·298· 智能系统学报 第14卷 图1中的快速鲁棒特征(SURF)提取过程与 点的Hessian迹回,其表达式为 SFT相似,由关键点检测与特征描述两部分构成。 Det(H=DxDn-(0.9Dy)月 (3) 但其维持图像尺寸不变,以倍数关系改变盒子滤波 器的尺寸、尺度,在积分图像的基础上滤波构建 尺度空间,使得特征检测耗用时间远短于SFT。在 5199147195 27517599] 特征描述中,统计扇形区域内的Haar小波响应 5273951☐ 值,确定关键点的主方向,累加统计划分区域内XY 9152127 方向的Haar值与Haar绝对值,降低计算复杂度。 Scale 1.1原始SURF特征向量提取 计算灰度图像在(x,y)处的积分值,并与不同 图2SURF尺度空间示意 尺度下的高斯函数二阶偏导数做卷积运算。为降 Fig.2 Schematic diagram of SURF scale space 低计算复杂度,用不同尺寸、尺度的盒子滤波器 在尺度空间被检测出的关键点对文档图像的 近似替代卷积结果,形成不同尺寸条件下的Hessian 尺寸、平移和旋转有鲁棒性。给SURF局部特征 矩阵行列式。最后,计算Hessian行列式的迹,并 点分配主方向来保证其旋转不变。以5°为量级, 与相邻尺度下的26个像素点进行非极大值抑制 在60°滑动扇形区域内累加求和每一个像素点在 NMS)运算,获取SURF关键点的精确位置Io-, 水平、垂直方向上的Haar小波响应分量,求其最 其数学表达式如下: 大值作为此关键点主方向。以关键点为中心 iX jY 〉Gray(i,ji) 取20×20区域,将这个区域又按4×4的大小划分 (1) 00 成25个子区域,然后依次计算每个小区域的像素 H(x,σ)= Lu(x,) Lg(x,σ) 点的水平方向和垂直方向的Haar值以及绝对和 L(x,σ)Lm(x,o) (2) 值,最后将提取64维SURF特征向量。 D(x,)D(x.) D(x,)Dv(x,) 1.2改进SURF特征提取 式中:Isn为积分图像,Hx,o)为Hessian矩阵行 原始SURF特征相比于SIFT,被检测特征点 列式,L(x,o)、L,x,o)分别为X方向、Y方向的二 数目少、特征提取占用时间短。但是,对于图文 阶偏导数卷积,L,(x,σ)、L(x,σ)为混合偏导数卷 混排的复杂文档图像,缩短时间参量不理想。因 积。D(x,σ)为盒子滤波近似值。对应SIFT,构 此,为实现维文复杂版面图像中关键点的快速检 建4组尺度空间,每组含有不同尺寸、尺度下的 测,本文提取文档图像的灰度信息和角点。检测 盒子滤波。其层次表达如图2所示。 角点时用FAST算法,并用SURF算子描述,构成 当盒子滤波器尺寸为W×N时,其对应的高斯 64维FAST+SURF特征,有效缩短特征提取时 尺度为s=0×N/9,其中o=1.2。尺度空间中取每 间。其特征检测算法流程如图3所示。 求所有像素点与中心点的差值的 以像素点P。为中心,在=3的圆上,取 开始 总和S,作为FAST值。 16个像素点 比较以P。为中心的3×3领域内。 所有被检测角点的FAST得分值 P-PKr且p,PKa y S-S N Pg-Pat且pplt Y Y P。为关键点 遗弃 P-PK红,其中 =1-16,if(i》9) 结束 遗弃 Y 图3改进SURF特征关键点检测流程框图 Fig.3 Flow chart of improved SURF feature key point detection
图 1 中的快速鲁棒特征 (SURF) 提取过程与 SIFT 相似,由关键点检测与特征描述两部分构成。 但其维持图像尺寸不变,以倍数关系改变盒子滤波 器的尺寸、尺度,在积分图像的基础上滤波构建 尺度空间,使得特征检测耗用时间远短于 SIFT。在 特征描述中,统计扇形区域内的 Haar 小波响应 值,确定关键点的主方向,累加统计划分区域内 X、Y 方向的 Haar 值与 Haar 绝对值,降低计算复杂度。 1.1 原始 SURF 特征向量提取 计算灰度图像在 (x, y) 处的积分值,并与不同 尺度下的高斯函数二阶偏导数做卷积运算。为降 低计算复杂度,用不同尺寸、尺度的盒子滤波器 近似替代卷积结果,形成不同尺寸条件下的 Hessian 矩阵行列式。最后,计算 Hessian 行列式的迹,并 与相邻尺度下的 26 个像素点进行非极大值抑制 (NMS) 运算,获取 SURF 关键点的精确位置[10-11] , 其数学表达式如下: I ∑ (X,Y) = ∑i≪X i=0 ∑ j≪Y j=0 Gray(i, j) (1) H (x,σ) = [ Lxx (x,σ) Lxy (x,σ) Lyx (x,σ) Lyy (x,σ) ] = [ Dxx (x,σ) Dxy (x,σ) Dyx (x,σ) Dyy (x,σ) ] (2) 式中: I∑(X,Y)为积分图像,H(x, σ) 为 Hessian 矩阵行 列式,Lxx(x, σ)、Lyy(x, σ) 分别为 X 方向、Y 方向的二 阶偏导数卷积,Lxy(x, σ)、Lyx(x, σ) 为混合偏导数卷 积。Dxx(x, σ) 为盒子滤波近似值。对应 SIFT,构 建 4 组尺度空间,每组含有不同尺寸、尺度下的 盒子滤波。其层次表达如图 2 所示。 当盒子滤波器尺寸为 N×N 时,其对应的高斯 尺度为 s=σ0×N/9,其中 σ0=1.2。尺度空间中取每一 点的 Hessian 迹 [12] ,其表达式为 Det(H) = DxxDyy − ( 0.9Dxy)2 (3) 在尺度空间被检测出的关键点对文档图像的 尺寸、平移和旋转有鲁棒性。给 SURF 局部特征 点分配主方向来保证其旋转不变。以 5°为量级, 在 60°滑动扇形区域内累加求和每一个像素点在 水平、垂直方向上的 Haar 小波响应分量,求其最 大值作为此关键点主方向[13]。以关键点为中心 取 20×20 区域,将这个区域又按 4×4 的大小划分 成 25 个子区域,然后依次计算每个小区域的像素 点的水平方向和垂直方向的 Haar 值以及绝对和 值,最后将提取 64 维 SURF 特征向量。 1.2 改进 SURF 特征提取 原始 SURF 特征相比于 SIFT,被检测特征点 数目少、特征提取占用时间短。但是,对于图文 混排的复杂文档图像,缩短时间参量不理想。因 此,为实现维文复杂版面图像中关键点的快速检 测,本文提取文档图像的灰度信息和角点。检测 角点时用 FAST 算法,并用 SURF 算子描述,构成 64 维 FAST+SURF 特征,有效缩短特征提取时 间 [14]。其特征检测算法流程如图 3 所示。 Octaves Scale 51 99 147 195 27 51 75 99 15 15 27 9 21 27 39 51 图 2 SURF 尺度空间示意 Fig. 2 Schematic diagram of SURF scale space 开始 结束 以像素点 Po 为中心,在 r=3 的圆上,取 16 个像素点 遗弃 Po 为关键点 |P1−P0 |Si 比较以 Po 为中心的 3×3 领域内, 所有被检测角点的 FAST 得分值 |P5−P0 |>9) 遗弃 求所有像素点与中心点的差值的 总和 S,作为 FAST 值。 N Y Y Y N N N Y 图 3 改进 SURF 特征关键点检测流程框图 Fig. 3 Flow chart of improved SURF feature key point detection. ·298· 智 能 系 统 学 报 第 14 卷
第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·299· 获取具有平移、缩放不变性的关键点后,为 维持旋转不变性,给被检测的FAST关键点进行 SURF描述,统计划分子区域内Haar小波响应的 水平、垂直分量累加值与绝对累加值,形成N×64 维特征。 2FAST+SURF特征匹配分析 如果采用传统的方法进行特征匹配不仅计算 (a)改进的SURF特征匹配效果图 量大,耗时长,而且系统的内存占用率较高。维 吾尔文复杂文档图像的文字区域中存在较多的黑 像素信息,被检测关键点数目较多。因此,为有 效提高匹配速率,笔者对不同版面图像实现双向 快速近似最近邻(FLANN)匹配,将其结果与KD- Tree+BBF匹配结果进行对比分析,以系统性能作 为基本出发点来构建匹配系统,从而使系统能够 对复杂的维吾尔文文档图像进行高效的检索。 2.1双向FLANN匹配 (b)匹配点关系图 设用户输入查询图像与维吾尔文复杂文档图 图4改进SURF特征双向FLANN匹配示意 像库中,待匹配图像的改进SURF特征向量集分 Fig.4 Schematic diagram of improved SURF features bid- 别为A=[xx2…xwJ厂,B=y12…ywJ「。通过计算 irectional FLANN matching x到特征向量B的最大和最小距离,并设定阈值 输入64维数据集合,计算每一维上的 为=pxMin,。如果计算所得距离小于设定阈值,则 最大方差D=E(x-E(x 记录该点并等待进一步匹配计算,如果距离大于 设定阈值,则继续进行其他点的匹配。由于FLANN 取MaxD)]对应的i,并计算i中数据点 算法具有匹配速度快的特点,所以本文采用FLANN 的中值(Median)为根节点(Node-date) 算法进行匹配,并在先后两个方向同时开始匹 ! 配,这样能够快速获得所需匹配对的相似性信 息,从而进行进一步的判断。具体为:先从A到B vp与Node-date()比较 的方向开始匹配,然后再从B到A的方向进行匹 递归上述过程,在左右子树数据 配,分别形成位置信息集合{m,m与{m,m}。这 集中依次选定父节点,再分左右 子树,当找到叶点分割结束 样逐次将m的大小与m进行比较,如果大小相同 则说明m完全匹配。同时在匹配过程中通过 (a)KD-Tree建立流程I RANSAC算法求出将要进行匹配的点与影射矩 阵的距离,并用此距离与设定的距离阈值进行比 输入查询点Q 沿根一父→叶方向 进行二叉搜索 较,这样做的目的是为了能够比较有效地去掉误 匹配点对,从而使个匹配点对能够准确地匹配。 经过回潮操作,用优先级顺序访问待回潮 原始图像FALNN双向匹配结果如图4所示。 树分支,再以查询点为圆心且通过叶子点 2.2KD-Tree+BBF匹配 的圆内域查找最近邻点 KD-Tree的匹配主要由树形结构的建立与最 近领查找等两个部分组成。KD-Tree搜索能力与 求出查询点到最近邻与次近邻点的 特征向量的维数相关,维数越大,搜索能力越 距离,将距离比与國值比较,求出 最佳匹配特征点 差。因此,本文从改进的KD-Tree出发,将得到 的距离结果与预设的阈值相比较,判断是否为匹 (b)特征匹配过程 配关键点。本文中对改进64维SURF特征实 图5改进KD-Tree匹配过程描述 现改进KD-Tree匹配的过程如图5所示。 Fig.5 The description of improved KD-Tree matching
获取具有平移、缩放不变性的关键点后,为 维持旋转不变性,给被检测的 FAST 关键点进行 SURF 描述,统计划分子区域内 Haar 小波响应的 水平、垂直分量累加值与绝对累加值,形成 N×64 维特征。 2 FAST+SURF 特征匹配分析 如果采用传统的方法进行特征匹配不仅计算 量大,耗时长,而且系统的内存占用率较高。维 吾尔文复杂文档图像的文字区域中存在较多的黑 像素信息,被检测关键点数目较多。因此,为有 效提高匹配速率,笔者对不同版面图像实现双向 快速近似最近邻 (FLANN) 匹配,将其结果与 KD− Tree+BBF 匹配结果进行对比分析,以系统性能作 为基本出发点来构建匹配系统,从而使系统能够 对复杂的维吾尔文文档图像进行高效的检索。 2.1 双向 FLANN 匹配 A = [x1 x2 ··· xN] T B = [y1 y2 ··· yN] T xi { m A j ,m B k } { m B k ,m A ′ j } m A j m A ′ j m B k 设用户输入查询图像与维吾尔文复杂文档图 像库中,待匹配图像的改进 SURF 特征向量集分 别为 , 。通过计算 到特征向量 B 的最大和最小距离,并设定阈值 为 γ=ρ×Mini。如果计算所得距离小于设定阈值,则 记录该点并等待进一步匹配计算,如果距离大于 设定阈值,则继续进行其他点的匹配。由于 FLANN 算法具有匹配速度快的特点,所以本文采用 FLANN 算法进行匹配,并在先后两个方向同时开始匹 配,这样能够快速获得所需匹配对的相似性信 息,从而进行进一步的判断。具体为:先从 A 到 B 的方向开始匹配,然后再从 B 到 A 的方向进行匹 配,分别形成位置信息集合 与 。这 样逐次将 的大小与 进行比较,如果大小相同 则说明 完全匹配。同时在匹配过程中通 过 RANSAC 算法求出将要进行匹配的点与影射矩 阵的距离,并用此距离与设定的距离阈值进行比 较,这样做的目的是为了能够比较有效地去掉误 匹配点对,从而使个匹配点对能够准确地匹配。 原始图像 FALNN 双向匹配结果如图 4 所示。 2.2 KD−Tree+BBF 匹配 KD−Tree 的匹配主要由树形结构的建立与最 近领查找等两个部分组成。KD−Tree 搜索能力与 特征向量的维数相关,维数越大,搜索能力越 差。因此,本文从改进的 KD−Tree 出发,将得到 的距离结果与预设的阈值相比较,判断是否为匹 配关键点[15]。本文中对改进 64 维 SURF 特征实 现改进 KD−Tree 匹配的过程如图 5 所示。 (a) 改进的 SURF 特征匹配效果图 (b) 匹配点关系图 图 4 改进 SURF 特征双向 FLANN 匹配示意 Fig. 4 Schematic diagram of improved SURF features bidirectional FLANN matching 输入 64 维数据集合,计算每一维上的 最大方差 D(i)=E(x_i 2 )−[E(x_i)]2 取Max[D(i)]对应的 i,并计算 i 中数据点 的中值 (Median) 为根节点 (Node-date) υp 与 Node-date (i) 比较 递归上述过程,在左右子树数据 集中依次选定父节点,再分左右 子树,当找到叶点分割结束 左子树 右子树 (a) KD-Tree 建立流程[16] 输入查询点 Q 沿根→父→叶方向 进行二叉搜索 经过回溯操作,用优先级顺序访问待回溯 树分支,再以查询点为圆心且通过叶子点 的圆内域查找最近邻点 求出查询点到最近邻与次近邻点的 距离,将距离比与阈值比较,求出 最佳匹配特征点 (b) 特征匹配过程 图 5 改进 KD−Tree 匹配过程描述 Fig. 5 The description of improved KD−Tree matching 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·299·
·300· 智能系统学报 第14卷 匹配系统在不同变换条件下的匹配效率一般 不同分辨率(100dpi,200dpi,400dpi)扫描形成 是由匹配率(MR)、正确匹配率(CMR)与错误匹 8位的.bmp格式的维文复杂文档图像,构造含有 配率(MR)来衡量,它们计算公式分别为 1000幅不同分辨率、不同底色信息、不同版面结 Ne 构的复杂文档图像的数据库。本系统是在Win- MR= Na (4) dows7环境下用Visual Studio20l0+openCV- CMR=N 2.4.10编程开发的。 (5) Ne 4.2实验结果与分析 SURF特征在检测的时候主要是靠尺度空间 IMR (6) 层数(Octaves)、组数(Intervals)、斑点(THRES)阈 值的选择。阈值(Octaves,Intervals,Init-sample, 式中:N和N分别为总匹配对数目和被检测的 THRES)选定的不同,提取的特征点数目也不相 特征点数;Nc和N分别指正确匹配对总数和错 同。为验证FAST+SURF特征的效率,在不同的 误匹配对总数。 阈值条件下,对1606×2290的同一张图像进行实 3维吾尔文复杂文档图像检索 验,统计关键点数和特征提取时间,实验结果如 表1给出。 用户输入查询复杂文档图像,系统自动获取 表1在不同阈值条件下同一幅图像检测的参数统计表% 64维改进SURF特征向量,与特征向量库之间基 Table 1 The statistical table of detecting parameters using 于多种相似性度量算法,从数据库中查找目标文 the same image under different threshold condi- 档图像,返回用户界面。本文运用两种相似性度 tionss 量算法实现用户特定目标文档图像的检索,即基 阈值 阈值参数 关键点数 特征提取时间s 于距离的相似性度量与基于匹配数目的相似性度 0.0004f 9290 38.536 量。文中用4种特征向量间距离相似性度量算 (4,4,2) 0.004f 2290 19.248 法,其数学表达式为 0.04f 0 10.195 dEnelidean =V(x1-X2)2+(y1-y2) (7) 0.0004f 9290 38.262 dManhattan =1-X2+ly1-y2l (8) (4,3,2) 0.004f 2290 19.378 dchebyshev max (l1-x2l,ly1-y2D) (9) 0.04f 0 10.29 X1X2+Y1y2 dCosine= (10) 0.0004f 9177 37.833 Vx2+x22vy2+y22 (3,3,2) 0.004f 2982 19.326 对于同一个查询文档图像的改进SURF特征 0.04f 0 10.221 向量,基于上述四种距离分别度量相似性,实现 0.0004f 9177 37.811 维吾尔文复杂文档图像的检索,以检索率为系统 (3,42) 0.004f 2982 19.275 性能指标,评估本系统有效性。在以匹配数目为 0.04f 0 10.134 检索依据的检索系统中,从匹配数目和正确匹配 数目考虑,统计查询图像与图像库中每幅图像之 从表1可以得到,尺度空间阈值的变化对 间的正确匹配数目,将其按降序排序,实现文档图 SURF特征点的检测尤为重要。层数与层间组数 像的有效检索。其中越相似复杂文档图像,则其 的变化由改变盒子滤波器数目来实现,其影响表 匹配数目越大。本文计算系统检索率的表达式为 现在对积分图像的处理上,且特征检测耗用时间 R=N-S (11) 上有微小差异。阈值的变化极大影响了最终检索 N-1 结果。对于每一个候选点,取其上下邻域空间中 式中:N是指复杂文档图像数据总的样本数,S是 的26个像素点,相互比较Hessian矩阵行列式 指系统检索出来的目标文档图像的位置序号。 值。若候选点Hessian行列式值比26个像素点行 4实验结果与分析 列式值都大或都小且小于阈值,则此候选点视为 关键点。本文考虑多个阈值参数对SURF关键点 4.1实验数据 检测的影响,并为减少时间和计算复杂度,提出 收集维吾尔文复杂版面书籍、杂志、公文,以 了FAST+SURF特征提取算法。为验证该方法的
匹配系统在不同变换条件下的匹配效率一般 是由匹配率 (MR)、正确匹配率 (CMR) 与错误匹 配率 (IMR) 来衡量,它们计算公式分别为 MR = Nc Nd (4) CMR = Nac Nc (5) IMR = Nai Nc (6) 式中:Nc 和 Nd 分别为总匹配对数目和被检测的 特征点数;Nac 和 Nai 分别指正确匹配对总数和错 误匹配对总数。 3 维吾尔文复杂文档图像检索 用户输入查询复杂文档图像,系统自动获取 64 维改进 SURF 特征向量,与特征向量库之间基 于多种相似性度量算法,从数据库中查找目标文 档图像,返回用户界面。本文运用两种相似性度 量算法实现用户特定目标文档图像的检索,即基 于距离的相似性度量与基于匹配数目的相似性度 量。文中用 4 种特征向量间距离相似性度量算 法,其数学表达式为 dEuclidean = √ (x1 − x2) 2 +(y1 −y2) 2 (7) dManhattan = |x1 − x2|+|y1 −y2| (8) dChebyshev = max(|x1 − x2|,|y1 −y2|) (9) dCosine = x1 x2+y1y2 √ x1 2 + x2 2 √ y1 2 +y2 2 (10) 对于同一个查询文档图像的改进 SURF 特征 向量,基于上述四种距离分别度量相似性,实现 维吾尔文复杂文档图像的检索,以检索率为系统 性能指标,评估本系统有效性。在以匹配数目为 检索依据的检索系统中,从匹配数目和正确匹配 数目考虑,统计查询图像与图像库中每幅图像之 间的正确匹配数目,将其按降序排序,实现文档图 像的有效检索。其中越相似复杂文档图像,则其 匹配数目越大。本文计算系统检索率的表达式为 R = N −S N −1 (11) 式中:N 是指复杂文档图像数据总的样本数,S 是 指系统检索出来的目标文档图像的位置序号。 4 实验结果与分析 4.1 实验数据 收集维吾尔文复杂版面书籍、杂志、公文,以 不同分辨率 (100 dpi,200 dpi,400 dpi) 扫描形成 8 位的.bmp 格式的维文复杂文档图像,构造含有 1 000 幅不同分辨率、不同底色信息、不同版面结 构的复杂文档图像的数据库。本系统是在 Windows7 环境下用 Visual Studio 2010+openCV- 2.4.10 编程开发的。 4.2 实验结果与分析 SURF 特征在检测的时候主要是靠尺度空间 层数 (Octaves)、组数 (Intervals)、斑点 (THRES) 阈 值的选择。阈值 (Octaves,Intervals,Init-sample, THRES) 选定的不同,提取的特征点数目也不相 同。为验证 FAST+SURF 特征的效率,在不同的 阈值条件下,对 1 606×2 290 的同一张图像进行实 验,统计关键点数和特征提取时间,实验结果如 表 1 给出。 表 1 在不同阈值条件下同一幅图像检测的参数统计表[16] Table 1 The statistical table of detecting parameters using the same image under different threshold conditions[16] 阈值 阈值参数 关键点数 特征提取时间/s (4, 4, 2) 0.000 4f 9 290 38.536 0.004f 2 290 19.248 0.04f 0 10.195 (4, 3, 2) 0.000 4f 9 290 38.262 0.004f 2 290 19.378 0.04f 0 10.29 (3, 3, 2) 0.000 4f 9 177 37.833 0.004f 2 982 19.326 0.04f 0 10.221 (3, 4, 2) 0.000 4f 9 177 37.811 0.004f 2 982 19.275 0.04f 0 10.134 从表 1 可以得到,尺度空间阈值的变化对 SURF 特征点的检测尤为重要。层数与层间组数 的变化由改变盒子滤波器数目来实现,其影响表 现在对积分图像的处理上,且特征检测耗用时间 上有微小差异。阈值的变化极大影响了最终检索 结果。对于每一个候选点,取其上下邻域空间中 的 26 个像素点,相互比较 Hessian 矩阵行列式 值。若候选点 Hessian 行列式值比 26 个像素点行 列式值都大或都小且小于阈值,则此候选点视为 关键点。本文考虑多个阈值参数对 SURF 关键点 检测的影响,并为减少时间和计算复杂度,提出 了 FAST+SURF 特征提取算法。为验证该方法的 ·300· 智 能 系 统 学 报 第 14 卷
第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·301· 优越性,在(4,4,2,0.00040阈值下提取相同版面 不同灰度阈值下的FAST+SURF特征进行性能分 不同尺寸的维文复杂文档的SURF特征,将其与 析,实验结果如表2所示。 表2在同一个阈值下同一幅不同尺寸图像中检测的FAST+SURF关键点与时间对比表 Table 2 The comparison table of detecting FAST+SURF key points and time using different image sizes in a same threshold 图像尺寸 性能 SIFT SURF FAST(50)+surf FAST(100)+surf FAST(150)+surf FAST(200)+surf 关键点数 3276 3537 9767 7195 4960 964 803×1145 占用时间s 30.405 15.866 0.021 0.01 0.009 0.009 关键点数 10320 11516 22028 9414 9299 2524 1606×2290 占用时间s 105.45051.141 0.031 0.019 0.017 0.015 关键点数 27820 38115 52967 17764 7839 214 3212×4581 占用时间s250.492162.491 0.082 0.04 0.035 0.03 经多次实验发现FAST(IOO)+SURF特征数目 提取特征对旋转、尺度、光照变换的鲁棒性,进行 接近在(4,4,2,0.0004f)阈值下的原始SURF特 不相同变换的情况,选择大小为1606×2290的维 征数目。以检测FAST关键点来增加被检测特征 吾尔文复杂文档图像且提取改进SURF特征,同 点总量为付出,就可以很大程度上减少在特征点 时分别用FLANN双向匹配、KD-Tree+BBF匹配 检测上耗费的时间复杂度,这样不仅能够明显优 寻找能够精确匹配对总数。基于FLANN的双向 化匹配效率,还能够让快速检索维吾尔文复杂文 匹配对阈值的依赖性较强,其定义为?= 档图像成为可能。从表2中能够了解到,同一幅 不同尺寸图像的SURF特征点数目随图像尺寸变 max{a×min_dist,}。为精确定位阈值,分别在 大而增多。而本文提出的改进FAST+SURF特征 =B与=a×min dist下匹配两幅相同版面文档图 中,特征点数目不与图像尺寸成正比关系。FAST 像,并得知当y=0.1或y=50×min dist时匹配性能 角点检测中,建立高斯卷积或Haar滤波的尺度空 最可靠。分别在两种阈值下匹配换后的文档图像 间、计算高斯函数导数与积分图像的卷积是完全 与原始图像,统计匹配性能参数得知当阈值为 没有必要的,我们只需要检测相对周围像素点, =01时,系统匹配性能最可靠。在尺寸变换下 检测都亮或都暗区域,这样能够明显缩短特征检 FLANN双向匹配在阈值y=0.1的下匹配与KD 测时间同时也显著降低计算复杂度。为检测本文 Tree+BBF匹配的结果如下表3所示。 表3维吾尔文档图像尺寸变换下FAST(I0O)+SURF特征点的两种匹配结果6 Table 3 Two kinds of FAST(100)+SURF feature points matching results under Uyghur document image scale transform FLANN双向匹配 KD-Tree+BBF匹配 变换参量性能指标 整幅 1:(1/2) 1(1/4) 整幅 1:(1/2) 1:(1/4) 关键点总数目 9414 4369 2082 9414 4369 2082 匹配对总数目 1145 454 200 9335 4264 2017 正确匹配对数目 759 363 172 7582 4151 573 正确匹配率% 66.29 79.96 86 81.22 97.35 28.40 错误匹配对数目 386 91 28 1753 113 1444 错误匹配率% 33.71 20.04 14 18.78 2.65 71.59 内点数目 768 358 59 将原始的文档图像划分为相等的2块和4 同。图像中的非文字区域是由图片组成,特征点 块,随着图像尺寸的减小,被检测的特征点数目 的分布较为密集,干扰点也较多,关键特征点的 也随之减少,在匹配时,匹配到的关键点数目也 选择比较困难,而文字区域的特征点分布较为均 减少。在特征提取时由于每块剪切图像中文字所 匀,因此被检测局部关键点数目较多。从表3可 占比例的不同,提取的特征点的位置也不尽相 以得到以下结论,使用KD-Tree+BBF匹配时,它
优越性,在 (4,4,2,0.000 4f) 阈值下提取相同版面 不同尺寸的维文复杂文档的 SURF 特征,将其与 不同灰度阈值下的 FAST+SURF 特征进行性能分 析,实验结果如表 2 所示。 表 2 在同一个阈值下同一幅不同尺寸图像中检测的 FAST+SURF 关键点与时间对比表 Table 2 The comparison table of detecting FAST+SURF key points and time using different image sizes in a same threshold 图像尺寸 性能 SIFT SURF FAST(50)+surf FAST(100)+surf FAST(150)+surf FAST(200)+surf 803×1 145 关键点数 3 276 3 537 9 767 7 195 4 960 964 占用时间/s 30.405 15.866 0.021 0.01 0.009 0.009 1 606×2 290 关键点数 10 320 11 516 22 028 9 414 9 299 2 524 占用时间/s 105.450 51.141 0.031 0.019 0.017 0.015 3 212×4 581 关键点数 27 820 38 115 52 967 17 764 7 839 214 占用时间/s 250.492 162.491 0.082 0.04 0.035 0.03 经多次实验发现 FAST(100)+SURF 特征数目 接近在 (4,4,2,0.000 4f) 阈值下的原始 SURF 特 征数目。以检测 FAST 关键点来增加被检测特征 点总量为付出,就可以很大程度上减少在特征点 检测上耗费的时间复杂度,这样不仅能够明显优 化匹配效率,还能够让快速检索维吾尔文复杂文 档图像成为可能。从表 2 中能够了解到,同一幅 不同尺寸图像的 SURF 特征点数目随图像尺寸变 大而增多。而本文提出的改进 FAST+SURF 特征 中,特征点数目不与图像尺寸成正比关系。FAST 角点检测中,建立高斯卷积或 Haar 滤波的尺度空 间、计算高斯函数导数与积分图像的卷积是完全 没有必要的,我们只需要检测相对周围像素点, 检测都亮或都暗区域,这样能够明显缩短特征检 测时间同时也显著降低计算复杂度。为检测本文 提取特征对旋转、尺度、光照变换的鲁棒性,进行 不相同变换的情况,选择大小为 1 606×2 290 的维 吾尔文复杂文档图像且提取改进 SURF 特征,同 时分别用 FLANN 双向匹配、KD−Tree+BBF 匹配 寻找能够精确匹配对总数。基于 FLANN 的双向 匹配对阈值的依赖性较强,其定义 为 γ = max{α×min_dist, β}。为精确定位阈值,分别在 γ=β 与 γ=α×min_dist 下匹配两幅相同版面文档图 像,并得知当 γ=0.1 或 γ=50×min_dist 时匹配性能 最可靠。分别在两种阈值下匹配换后的文档图像 与原始图像,统计匹配性能参数得知当阈值为 γ=0.1 时,系统匹配性能最可靠。在尺寸变换下 FLANN 双向匹配在阈值 γ=0.1 的下匹配与 KD− Tree+BBF 匹配的结果如下表 3 所示。 表 3 维吾尔文档图像尺寸变换下 FAST(100)+SURF 特征点的两种匹配结果[16] Table 3 Two kinds of FAST (100)+SURF feature points matching results under Uyghur document image scale transform[16] 变换参量性能指标 FLANN 双向匹配 KD-Tree+BBF 匹配 整幅 1∶(1/2) 1∶(1/4) 整幅 1∶(1/2) 1∶(1/4) 关键点总数目 9 414 4 369 2 082 9 414 4 369 2 082 匹配对总数目 1 145 454 200 9 335 4 264 2 017 正确匹配对数目 759 363 172 7 582 4 151 573 正确匹配率/% 66.29 79.96 86 81.22 97.35 28.40 错误匹配对数目 386 91 28 1 753 113 1 444 错误匹配率/% 33.71 20.04 14 18.78 2.65 71.59 内点数目 768 358 59 — — — 将原始的文档图像划分为相等的 2 块和 4 块,随着图像尺寸的减小,被检测的特征点数目 也随之减少,在匹配时,匹配到的关键点数目也 减少。在特征提取时由于每块剪切图像中文字所 占比例的不同,提取的特征点的位置也不尽相 同。图像中的非文字区域是由图片组成,特征点 的分布较为密集,干扰点也较多,关键特征点的 选择比较困难,而文字区域的特征点分布较为均 匀,因此被检测局部关键点数目较多。从表 3 可 以得到以下结论,使用 KD−Tree+BBF 匹配时,它 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·301·
·302· 智能系统学报 第14卷 的总的匹配对数、正确的匹配对数、错误的匹配 双向匹配不需要回溯,只需要将近似近邻替代最 对数比使用FLANN双向匹配的结果好。实验 近邻,若实验图像过大时,每幅图像提取的关键 中,随着图像尺寸的减小,提取到的关键点的总 点会变多,而数量庞大的关键点会增加运算的复 数目也成倍减小,匹配时的正确匹配的数目也成 杂度和运行时间,这也给运行系统的稳定性带来 倍减小,相较于FLANN双向匹配而言,KD-Tree+ 影响,因此当关键点数量庞大时FLANN双向匹 BBF匹配时的正确匹配率要高。但在使用这两种 配的效果较好。为证明SURF特征的旋转不变性, 匹配算法时,KD-Tree+BBF的匹配算法在构建与 对原始图像进行不同角度旋转,并分别用这两种 匹配上需遍历父节点与叶点且回溯,而FLANN 匹配算法进行匹配,统计实验结果如表4所示。 表4维吾尔文档图像旋转变换条件下FAST(100+SURF特征点的两种匹配结果 Table 4 Two kinds of FAST(100)+SURF feature points matching results under Uyghur document image rotation transform FLANN双向匹配 KD-Tree+BBF匹配 变换参量性能指标 原始 +5 +10° -5 -10° 原始 +5 +10° -50 -10° 关键点总数目 9414 10373 10614 9339 10423 9414 10373 10614 9339 10423 匹配对总数目 1145 1213 1164 1070 1254 9335 6044 6691 6005 6794 正确匹配对 759 791 757 752 785 7582 1802 2112 2015 1845 正确匹配率% 66.29 65.21 65.03 70.28 62.60 81.22 29.81 31.56 33.56 27.16 错误匹配对 386 422 407 318 469 1753 4242 4579 3990 4949 错误匹配率/% 33.71 34.79 34.97 29.72 37.40 18.78 70.19 68.44 66.44 72.84 内点数目 768 3 5 逆时针或顺时针旋转印刷体维文复杂文档图 从9335~6005,变化范围较大;对于整体结果,匹 像,使图像面积扩大,图像的位置也会发生变化, 配结果相对较好的是KD-Tree+BBF的匹配率, 因此特征点的位置也会改变。由表4可以得出, FLANN匹配效果较差,但KD-Tree+BBF FALNN双向匹配中,当旋转不同的角度时,图像 检索工作量大,而FALNN检索工作量小。当旋 的整体面积不同,关键点的数也不同。因此匹配 转角度发生变化时,FLANN双向匹配的结果较 时的正确匹配率也在62.60%~70.28%变化。可 好,KD-Tree+BBF匹配的结果较差。为验证在光 见,匹配对总数变化率与正确/错误匹配率相关。 照变换条件下的检索效果,对原始文档图像的亮 在不进行任何旋转变换时,内点数目为最大值为 度进行改变,统计不同亮度变换下的两种匹配性 768。在KD-Tree+BBF匹配中,匹配对数目减少, 能参数,实验结果如表5给出。 表5维吾尔文文档图像光照变换下的FAST(IO0)+SURF特征点的两种匹配结果 Table 5 Two types of FAST (100)+SURF feature points matching results with Uyghur document image illumination transform FLANN双向匹配 KD-Tree+BBF匹配 变换参量性能指标 原始20 4060-20 -40-60 原始20 40 60 -20 -40 -60 关键点总数目 9414988294119729896396473019194149882941197298963964730191 匹配对总数目 11451073113910559999522229 9335489249314374559157897048 正确匹配对 759 749 758 705 803 784 1018 7582355618691638349932812652 正确匹配率% 66.2969.8066.5566.8280.3882.3545.6781.2272.6937.9037.4562.5856.6837.63 错误匹配对 38632438135019616812111753133630622736209225084396 错误匹配率/% 33.7130.2033.4533.1819.6217.6554.3318.7827.3162.1062.5537.4243.3262.37 内点数目 768321917287216 表5中,在FLANN双向匹配中,亮度变亮的 803~1018,这是受采集的实验样本的影响,亮度 变化对匹配的正确率影响较小,在705~758波动; 过暗时会形成干扰点,因此亮度的变化范围不易 而亮度变暗的变化对匹配的正确率影响较大,在 过大。在KD-Tree+BBF匹配中,当亮度变暗到
的总的匹配对数、正确的匹配对数、错误的匹配 对数比使用 FLANN 双向匹配的结果好。实验 中,随着图像尺寸的减小,提取到的关键点的总 数目也成倍减小,匹配时的正确匹配的数目也成 倍减小,相较于 FLANN 双向匹配而言,KD−Tree+ BBF 匹配时的正确匹配率要高。但在使用这两种 匹配算法时,KD−Tree+BBF 的匹配算法在构建与 匹配上需遍历父节点与叶点且回溯,而 FLANN 双向匹配不需要回溯,只需要将近似近邻替代最 近邻,若实验图像过大时,每幅图像提取的关键 点会变多,而数量庞大的关键点会增加运算的复 杂度和运行时间,这也给运行系统的稳定性带来 影响,因此当关键点数量庞大时 FLANN 双向匹 配的效果较好。为证明 SURF 特征的旋转不变性, 对原始图像进行不同角度旋转,并分别用这两种 匹配算法进行匹配,统计实验结果如表 4 所示。 表 4 维吾尔文档图像旋转变换条件下 FAST(100)+SURF 特征点的两种匹配结果 Table 4 Two kinds of FAST (100)+SURF feature points matching results under Uyghur document image rotation transform 变换参量性能指标 FLANN 双向匹配 KD−Tree+BBF 匹配 原始 +5° +10° −5° −10° 原始 +5° +10° −5° −10° 关键点总数目 9 414 10 373 10 614 9 339 10 423 9 414 10 373 10 614 9 339 10 423 匹配对总数目 1 145 1 213 1 164 1 070 1 254 9 335 6 044 6 691 6 005 6 794 正确匹配对 759 791 757 752 785 7 582 1 802 2 112 2 015 1 845 正确匹配率/% 66.29 65.21 65.03 70.28 62.60 81.22 29.81 31.56 33.56 27.16 错误匹配对 386 422 407 318 469 1 753 4 242 4 579 3 990 4 949 错误匹配率/% 33.71 34.79 34.97 29.72 37.40 18.78 70.19 68.44 66.44 72.84 内点数目 768 12 13 11 11 — — — — — 逆时针或顺时针旋转印刷体维文复杂文档图 像,使图像面积扩大,图像的位置也会发生变化, 因此特征点的位置也会改变。由表 4 可以得出, FALNN 双向匹配中,当旋转不同的角度时,图像 的整体面积不同,关键点的数也不同。因此匹配 时的正确匹配率也在 62.60%~70.28% 变化。可 见,匹配对总数变化率与正确/错误匹配率相关。 在不进行任何旋转变换时,内点数目为最大值为 768。在 KD−Tree+BBF 匹配中,匹配对数目减少, 从 9 335~6 005,变化范围较大;对于整体结果,匹 配结果相对较好的是 KD−Tree+BBF 的匹配率, FLAN N 匹配效果较差, 但 KD−Tree+BBF 检索工作量大,而 FALNN 检索工作量小。当旋 转角度发生变化时,FLANN 双向匹配的结果较 好,KD−Tree+BBF 匹配的结果较差。为验证在光 照变换条件下的检索效果,对原始文档图像的亮 度进行改变,统计不同亮度变换下的两种匹配性 能参数,实验结果如表 5 给出。 表 5 维吾尔文文档图像光照变换下的 FAST(100)+SURF 特征点的两种匹配结果 Table 5 Two types of FAST (100)+SURF feature points matching results with Uyghur document image illumination transform 变换参量性能指标 FLANN 双向匹配 KD−Tree+BBF 匹配 原始 20 40 60 −20 −40 −60 原始 20 40 60 −20 −40 −60 关键点总数目 9 414 9 882 9 411 9 729 8 963 9 647 30 191 9 414 9 882 9 411 9 729 8 963 9 647 30 191 匹配对总数目 1 145 1 073 1 139 1 055 999 952 2 229 9 335 4 892 4 931 4 374 5 591 5 789 7 048 正确匹配对 759 749 758 705 803 784 1 018 7 582 3 556 1 869 1 638 3 499 3 281 2 652 正确匹配率/% 66.29 69.80 66.55 66.82 80.38 82.35 45.67 81.22 72.69 37.90 37.45 62.58 56.68 37.63 错误匹配对 386 324 381 350 196 168 1 211 1 753 1 336 3 062 2 736 2 092 2 508 4 396 错误匹配率/% 33.71 30.20 33.45 33.18 19.62 17.65 54.33 18.78 27.31 62.10 62.55 37.42 43.32 62.37 内点数目 768 321 91 7 287 216 8 — — — — — — — 表 5 中,在 FLANN 双向匹配中,亮度变亮的 变化对匹配的正确率影响较小,在 705~758 波动; 而亮度变暗的变化对匹配的正确率影响较大,在 803~1 018,这是受采集的实验样本的影响,亮度 过暗时会形成干扰点,因此亮度的变化范围不易 过大。在 KD−Tree+BBF 匹配中,当亮度变暗到 ·302· 智 能 系 统 学 报 第 14 卷
第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·303· 60时,实验样本整体模糊,样本的背景色也被列 将复杂的文档图像分别均匀划分为等面积 入检测范围,对检测到的关键特征点造成干扰, 的2块、4块和8块,由于每幅图像的文字分布区 从而对匹配时的匹配数目造成干扰,影响正确匹 域不同,所以分割后的每小块中包含的关键点数 配率;亮度变暗时提取的特征点数目要多于亮度 目也不同。在本实验中,当被选择查询图像分割 变亮时的特征点数目,匹配的精度也较差。可 成4块时,绝大部分为非文字区域,因此提取的特 知,在亮度变换条件下性能较稳定的是KD- 征数目少,并在完整图像库中检索含有本区域的 Tree+BBF匹配。 图像时,检索率明显下降。从图6(a)可知,不同 由于维吾尔文复杂文档图像库是由不同版 距离相似性度量算法对检索系统的影响不同。因 面、不同底色、不同分辨率文档图像采集而建立 此在剪切图像研究中,基于匹配距离的检索系统 的。在灰度化过程中,不能有效消除文档图像底 相对性能优于基于匹配数目的检索。当完整文档 色,因此底色信息影响关键点检测。此外,将图 图像为查询输入时,与目标图像关键点位置一一 像几何均匀分割成不同小块与整幅图像匹配时, 对应,因此关键点之间距离为最小;当复杂版面 若图像版面越相似,则匹配率较高:因此从数据 图像均匀分割分别作为查询图像时,被检测关键 库中取不具有底色,相似版面结构的分辨率为 点数目减少,被分割图文面积不均匀,在诸多相 100dpi,尺寸为1606×2290的100幅维吾尔文复 似版面中难以找出含有被分割区域的复杂文档图 杂文档图像构建小规模图像数据库。从中任选一 像。从图6(b)可知,基于匹配数目的检索性能优 幅图像,将其几何均匀划分成2、4、8块,分别作 于基于距离的检索。由于局部特征的尺寸变换不 为查询图像,再以基于匹配距离与匹配数目为依 变性维使得对于区域匹配数目相对稳定,因此不 据进行图像检索。由于文档图像尺寸大,被检测 同分割条件下检索目标文档图像的检索率都接 特征点数目较多,因此系统检索耗用时间较长, 近100%。 本文不作为系统性能指标。用不同匹配方法所进 在实验中,采集的原始图像篇幅较大,特征提 行的检索实验对比如图6所示。 取到的特征点数目太多,这对最终匹配点的数目 ■欧氏距离检索■余弦距离检索 造成很大的影响。因此,为更好地评估系统性 ■曼哈頓距离检索■切比雪夫距离检索 能,对采集到的原始维吾尔文复杂文档图像数据 100 库进行修改:1)对图像进行压缩,将图像压缩成 90 256×256尺寸;2)对图像进行剪切,将图像剪切成 256×256尺寸。对同一幅文档图像进行两种修改 样本实例如图7所示。 0 乱北心 u&小 8块 4块 2块 整幅 片Lyy火 切分数 u山好6 (a)不同距离相似性度量检索率对比 心山人 10 心dy雨 95 85 呢 70 一◆一欧氏距离检索 围因里日 65 一一匹配数目检索 2 60 8块 4块 2块 整幅 (a)压缩图像样本实例(b)剪切的图像样本实例 切分数 (b)基于欧氏距离与匹配数目检索的检错率对比 图7修改数据库样本实例 Fig.7 The sample instance of modified database 图6 改进SURF特征实现维吾尔文复杂文档图像检索 从图7中可以得到,对原始的整幅图像进行 的性能指标对比 Fig.6 The performance comparison figure of modified 压缩,会使图像的清晰度降低。而对原始的整幅 SURF feature based Uyghur complex document im- 图像进行剪切,只是剪切图像的一部分,不会对 age retrieval 清晰度造成影响,但篇幅的减少也会使提取的特
−60 时,实验样本整体模糊,样本的背景色也被列 入检测范围,对检测到的关键特征点造成干扰, 从而对匹配时的匹配数目造成干扰,影响正确匹 配率;亮度变暗时提取的特征点数目要多于亮度 变亮时的特征点数目,匹配的精度也较差。可 知,在亮度变换条件下性能较稳定的 是 KD− Tree+BBF 匹配。 由于维吾尔文复杂文档图像库是由不同版 面、不同底色、不同分辨率文档图像采集而建立 的。在灰度化过程中,不能有效消除文档图像底 色,因此底色信息影响关键点检测。此外,将图 像几何均匀分割成不同小块与整幅图像匹配时, 若图像版面越相似,则匹配率较高;因此从数据 库中取不具有底色,相似版面结构的分辨率为 100 dpi,尺寸为 1 606×2 290 的 100 幅维吾尔文复 杂文档图像构建小规模图像数据库。从中任选一 幅图像,将其几何均匀划分成 2、4、8 块,分别作 为查询图像,再以基于匹配距离与匹配数目为依 据进行图像检索。由于文档图像尺寸大,被检测 特征点数目较多,因此系统检索耗用时间较长, 本文不作为系统性能指标。用不同匹配方法所进 行的检索实验对比如图 6 所示。 (a) 不同距离相似性度量检索率对比 (b) 基于欧氏距离与匹配数目检索的检错率对比 30 40 50 60 70 80 90 100 8块 4块 2块 切分数 整幅 欧氏距离检索 余弦距离检索 曼哈顿距离检索 切比雪夫距离检索 60 65 70 75 80 85 90 95 100 欧氏距离检索 匹配数目检索 8块 4块 2块 整幅 检索率/% 检索率/% 切分数 图 6 改进 SURF 特征实现维吾尔文复杂文档图像检索 的性能指标对比 Fig. 6 The performance comparison figure of modified SURF feature based Uyghur complex document image retrieval 将复杂的文档图像分别均匀划分为等面积 的 2 块、4 块和 8 块,由于每幅图像的文字分布区 域不同,所以分割后的每小块中包含的关键点数 目也不同。在本实验中,当被选择查询图像分割 成 4 块时,绝大部分为非文字区域,因此提取的特 征数目少,并在完整图像库中检索含有本区域的 图像时,检索率明显下降。从图 6(a) 可知,不同 距离相似性度量算法对检索系统的影响不同。因 此在剪切图像研究中,基于匹配距离的检索系统 相对性能优于基于匹配数目的检索。当完整文档 图像为查询输入时,与目标图像关键点位置一一 对应,因此关键点之间距离为最小;当复杂版面 图像均匀分割分别作为查询图像时,被检测关键 点数目减少,被分割图文面积不均匀,在诸多相 似版面中难以找出含有被分割区域的复杂文档图 像。从图 6(b) 可知,基于匹配数目的检索性能优 于基于距离的检索。由于局部特征的尺寸变换不 变性维使得对于区域匹配数目相对稳定,因此不 同分割条件下检索目标文档图像的检索率都接 近 100%。 在实验中,采集的原始图像篇幅较大,特征提 取到的特征点数目太多,这对最终匹配点的数目 造成很大的影响。因此,为更好地评估系统性 能,对采集到的原始维吾尔文复杂文档图像数据 库进行修改:1) 对图像进行压缩,将图像压缩成 256×256 尺寸;2) 对图像进行剪切,将图像剪切成 256×256 尺寸。对同一幅文档图像进行两种修改 样本实例如图 7 所示。 (a) 压缩图像样本实例 (b) 剪切的图像样本实例 图 7 修改数据库样本实例 Fig. 7 The sample instance of modified database 从图 7 中可以得到,对原始的整幅图像进行 压缩,会使图像的清晰度降低。而对原始的整幅 图像进行剪切,只是剪切图像的一部分,不会对 清晰度造成影响,但篇幅的减少也会使提取的特 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·303·
·304· 智能系统学报 第14卷 征点减少。因此改造后的数据库都会对检索精度 图像检索研究进一步推进。文中通过不同阈值条 有或多或少影响。本文分别从匹配数目、匹配距 件下检测SURF特征,分析多种阈值对其影响。 离这两个方面进行测试,其检索实验结果如表8、9 因此,为提高特征阈值适应性及快速检测特征 所示。 点,将FAST角点检测与SURF描述相结合,使特 表8对剪切文档图像库进行检索实验的统计结果 征检测时间压缩到50~1425倍。文中笔者对选取 Table 8 The statistical results of the sheared Uyghur docu- 的64维特征向量运用两种匹配,并在尺寸、旋 ment image retrieval experiment 转、光照变换条件下实验统计匹配率,对两种匹 检索性能指标检索率%总检索时间/s平均索引时间/s 配性能进行对比分析。最后,分别对原始100幅 匹配数目检素 100 1000 1 文档图像、压缩1000幅图像、剪切1000幅文档 欧式距离检索 100 854 0.854 图像,基于多种距离度量特征向量间的相似性, 余弦距离检索 检索目标文档图像,将其检索率与基于匹配数目 100 861 0.861 的检索率对比,亮出以匹配数目为检索依据的搜 表9对压缩文档图像库进行检索实验的统计结果 索系统优越性。系统最高检索率都达到100%。 Table 9 The statistical results of the compressed Uyghur 但是,由于原始文档图像篇幅较大,提取的特 document image retrieval experiment 征点数目较多,特征点之间的匹配点数目也会增 检索性能指标检索率%总检索时间/s平均索引时间s 大,因此基于匹配数目的检索系统耗用时间比基 匹配数目检索 100 1636 1.636 于距离的检索系统较长,系统检索所占用时间都 欧式距离检索 100 599 0.599 不太理想。在保证系统较高的检索率的前提下, 余弦距离检索 怎样进一步降低时间开销是下一步研究重点。 100 607 0.607 由表8可以得出,由于剪切文档图像是从原 参考文献: 始文档图像上分割的一部分,因此检测到的特征 [1]张敬丽,张会清,代汝勇.基于MIC-SURF的快速图像匹 点数目也会减少。当输入裁剪图像,在剪切构造 配算法.计算机工程,2016,42(1:210-214. 的维文复杂文档数据库中,基于3种方法检索,其 ZHANG Jingli,ZHANG Huiqing,DAI Ruyong.Fast im- 检索率都达到100%,但检索占用时间不同。匹配 age matching algorithm based on MIC-SURF[J].Com 数目检索时需要先比较最近邻的特征点之间距 puter engineering,2016,42(1):210-214 离,看距离比值是否在设定的阈值范围内,若是, [2]ALFANINDYA A,HASHIM N,ESWARAN C.Content 则相匹配,反之不匹配,这就导致检索时耗时较长。 based image retrieval and classification using speeded-up robust features(SURF)and grouped bag-of-visual-words 由于压缩文档只是对原始文档图像的缩小, (GBoVW)[C]//Proceedings of 2013 International Confer- 因此其内容包含整体图像内容。由表9可知,在 ence on Technology,Informatics,Management,Engineer- 时间损耗上,基于匹配数目的检索系统较多,而 ing,and Environment.Bandung,Indonesia,2013:77-82. 基于距离相似性度量的检索时间较少。对于剪切 [3]王澍,吕学强,张凯,等.基于快速鲁棒特征集合统计特 文档和压缩文档这两种数据库,基于匹配数目的 征的图像分类方法[J].计算机应用,2015,35(1): 检索中提取的特征点数目越多,匹配时的匹配点 224230 数目也会增多,则匹配时间也会随之变化。基于 WANG Shu,LYU Xueqiang,ZHANG Kai,et al.Image 距离相似性的检索中,剪切的文档图像篇幅较 classification approach based on statistical features of 少,比压缩的文档图像检索用时更短。由于人工剪 speed up robust feature set[J].Journal of computer applica- 切采集图像,易受人主观因素的影响;此外原始 tions..2015,35(1224-230 图像库是由不同分辨率图像构成,采集时分辨率 [4]赵璐璐,耿国华,李康,等.基于SURF和快速近似最近 越大则图像获取内容越少,使得图像失去完整性, 邻搜索的图像匹配算法[J】.计算机应用研究,2013」 因此压缩图像检索时间比剪切图像检索时间短。 30(3):921-923. ZHAO Lulu,GENG Guohua,LI Kang,et al.Images 5结束语 matching algorithm based on SURF and fast approximate nearest neighbor search[J].Application research of com- 本文为弥补维吾尔文复杂文档图像在检索领 puters,.2013,30(3):921-923 域中的空白,在维吾尔文文档图像检索匹配中运 [5]CHEON S H,EOM I K,HA S W,et al.An enhanced 用SURF与改进SURF特征,使得少数民族文档 SURF algorithm based on new interest point detection pro-
征点减少。因此改造后的数据库都会对检索精度 有或多或少影响。本文分别从匹配数目、匹配距 离这两个方面进行测试,其检索实验结果如表 8、9 所示。 表 8 对剪切文档图像库进行检索实验的统计结果 Table 8 The statistical results of the sheared Uyghur document image retrieval experiment 检索性能指标 检索率/% 总检索时间/s 平均索引时间/s 匹配数目检索 100 1 000 1 欧式距离检索 100 854 0.854 余弦距离检索 100 861 0.861 表 9 对压缩文档图像库进行检索实验的统计结果 Table 9 The statistical results of the compressed Uyghur document image retrieval experiment 检索性能指标 检索率/% 总检索时间/s 平均索引时间/s 匹配数目检索 100 1 636 1.636 欧式距离检索 100 599 0.599 余弦距离检索 100 607 0.607 由表 8 可以得出,由于剪切文档图像是从原 始文档图像上分割的一部分,因此检测到的特征 点数目也会减少。当输入裁剪图像,在剪切构造 的维文复杂文档数据库中,基于 3 种方法检索,其 检索率都达到 100%,但检索占用时间不同。匹配 数目检索时需要先比较最近邻的特征点之间距 离,看距离比值是否在设定的阈值范围内,若是, 则相匹配,反之不匹配,这就导致检索时耗时较长。 由于压缩文档只是对原始文档图像的缩小, 因此其内容包含整体图像内容。由表 9 可知,在 时间损耗上,基于匹配数目的检索系统较多,而 基于距离相似性度量的检索时间较少。对于剪切 文档和压缩文档这两种数据库,基于匹配数目的 检索中提取的特征点数目越多,匹配时的匹配点 数目也会增多,则匹配时间也会随之变化。基于 距离相似性的检索中,剪切的文档图像篇幅较 少,比压缩的文档图像检索用时更短。由于人工剪 切采集图像,易受人主观因素的影响;此外原始 图像库是由不同分辨率图像构成,采集时分辨率 越大则图像获取内容越少,使得图像失去完整性, 因此压缩图像检索时间比剪切图像检索时间短。 5 结束语 本文为弥补维吾尔文复杂文档图像在检索领 域中的空白,在维吾尔文文档图像检索匹配中运 用 SURF 与改进 SURF 特征,使得少数民族文档 图像检索研究进一步推进。文中通过不同阈值条 件下检测 SURF 特征,分析多种阈值对其影响。 因此,为提高特征阈值适应性及快速检测特征 点,将 FAST 角点检测与 SURF 描述相结合,使特 征检测时间压缩到 50~1 425 倍。文中笔者对选取 的 64 维特征向量运用两种匹配,并在尺寸、旋 转、光照变换条件下实验统计匹配率,对两种匹 配性能进行对比分析。最后,分别对原始 100 幅 文档图像、压缩 1 000 幅图像、剪切 1 000 幅文档 图像,基于多种距离度量特征向量间的相似性, 检索目标文档图像,将其检索率与基于匹配数目 的检索率对比,亮出以匹配数目为检索依据的搜 索系统优越性。系统最高检索率都达到 100%。 但是,由于原始文档图像篇幅较大,提取的特 征点数目较多,特征点之间的匹配点数目也会增 大,因此基于匹配数目的检索系统耗用时间比基 于距离的检索系统较长,系统检索所占用时间都 不太理想。在保证系统较高的检索率的前提下, 怎样进一步降低时间开销是下一步研究重点。 参考文献: 张敬丽, 张会清, 代汝勇. 基于 MIC-SURF 的快速图像匹 配算法[J]. 计算机工程, 2016, 42(1): 210–214. ZHANG Jingli, ZHANG Huiqing, DAI Ruyong. Fast image matching algorithm based on MIC-SURF[J]. Computer engineering, 2016, 42(1): 210–214. [1] ALFANINDYA A, HASHIM N, ESWARAN C. Content based image retrieval and classification using speeded-up robust features (SURF) and grouped bag-of-visual-words (GBoVW)[C]//Proceedings of 2013 International Conference on Technology, Informatics, Management, Engineering, and Environment. Bandung, Indonesia, 2013: 77–82. [2] 王澍, 吕学强, 张凯, 等. 基于快速鲁棒特征集合统计特 征的图像分类方法[J]. 计算机应用, 2015, 35(1): 224–230. WANG Shu, LYU Xueqiang, ZHANG Kai, et al. Image classification approach based on statistical features of speed up robust feature set[J]. Journal of computer applications, 2015, 35(1): 224–230. [3] 赵璐璐, 耿国华, 李康, 等. 基于 SURF 和快速近似最近 邻搜索的图像匹配算法[J]. 计算机应用研究, 2013, 30(3): 921–923. ZHAO Lulu, GENG Guohua, LI Kang, et al. Images matching algorithm based on SURF and fast approximate nearest neighbor search[J]. Application research of computers, 2013, 30(3): 921–923. [4] CHEON S H, EOM I K, HA S W, et al. An enhanced SURF algorithm based on new interest point detection pro- [5] ·304· 智 能 系 统 学 报 第 14 卷
第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·305· cedure and fast computation technique[J].Journal of real- ive study of image low level feature extraction al- time image processing.2016. gorithms[J].Egyptian informatics journal,2013,14(2): [6]闫利,陈林.一种改进的SURF及其在遥感影像匹配中 175-181. 的应用[】.武汉大学学报(信息科学版),2013,38(7): [13]HUANG Ligin,CHEN Caigan,SHEN Henghua,et al 770-773,804. Adaptive registration algorithm of color images based on YAN Li,CHEN Lin.A modified SURF descriptor and its SURF[J].Measurement,2015,66:118-124. application in remote sensing images matching[J].Geomat- [14]安维胜,余让明,伍玉铃.基于FAST和SURF的图像 ics and information science of Wuhan university,2013, 配准算法[J.计算机工程,2015,41(10少:232-235,239. 38(7:770-773.804 AN Weisheng,YU Rangming,WU Yuling.Image regis- [7]陈剑虹,韩小珍.结合FAST-SURF和改进k-d树最近邻 tration algorithm based on FAST and SURF[J].Com- 查找的图像配准.西安理工大学学报,2016,32(2): puter engineering,2015,41(10):232-235,239. 213-217,252 [15]HUI Dong,YUAN Handian.Research of image match- CHEN Jianhong,HAN Xiaozhen.Image matching al- ing algorithm based on SURF features[C]//Proceedings of gorithm combining FAST-SURF and improved k-d tree 2012 International Conference on Computer Science and nearest neighbor search[J.Journal of Xi'an university of Information Processing(CSIP).Xi'an,China,2012: technology,2016,32(2):213-217,252. 1140-1143. [8]罗楠,孙权森,陈强,等.结合SURF特征点与DAISY描 [16]阿丽亚·巴吐尔.基于局部特征的维吾尔文印刷体复杂 述符的图像匹配算法[】.计算机科学,2014,41(11): 文档图像检索研究D1.乌鲁木齐:新疆大学,2017 286-290,300. LUO Nan,SUN Quansen,CHEN Qiang,et al.Image ALIYA Batur.Research on Uyghur printed complex doc- matching algorithm combining SURF feature point and ument image retrieval based on local feature[D].Urum- chi:Xinjiang University,2017. DAISY descriptor[J].Computer science,2014,41(11): 286-290,300. 作者简介: [9]王亚文,陈鸿昶,李邵梅,等.基于关键点匹配的多策略 阿丽亚·巴吐尔,女,1990年生,硕 尺度自适应跟踪算法[J】.计算机工程与设计,2016, 士研究生,主要研究方向为模式识别、 37(1):247-253. 图像检索。 WANG Yawen,CHEN Hongchang,LI Shaomei,et al. Multi-strategy scale adaptive tracking algorithm via keypo- int matching[J].Computer engineering and design,2016, 37(1):247-253. [1O]张凤晶,王志强,吴迪,等.基于SURF的图像配准改进 努尔毕亚亚地卡尔,女,1970年 算法.长春理工大学学报(自然科学版),2016,39(1): 生,讲师,中国人工智能学会会员,主 要研究方向为图像处理、计算机视觉。 112-115 ZHANG Fengjing,WANG Zhiqiang,WU Di,et al.Im- proved algorithm of image regestration based on SURF[J].Journal of Changchun university of science and technology (natural science edition),2016,39(1): 112-115 吾尔尼沙买买提,女,1976年生。 [11]LIU Yanling,MA Sihang.Research on image based on 讲师,中国人工智能学会会员,主要研 究方向为信号与信息处理、模式识别。 improved SURF feature matching[Cl//Proceedings of 7th International Symposium on Computational Intelligence and Design.Hangzhou,China,2014:581-584 [12]EL-GAYAR MM,SOLIMAN H,MEKY N.A comparat-
cedure and fast computation technique[J]. Journal of realtime image processing, 2016. 闫利, 陈林. 一种改进的 SURF 及其在遥感影像匹配中 的应用[J]. 武汉大学学报(信息科学版), 2013, 38(7): 770–773, 804. YAN Li, CHEN Lin. A modified SURF descriptor and its application in remote sensing images matching[J]. Geomatics and information science of Wuhan university, 2013, 38(7): 770–773, 804. [6] 陈剑虹, 韩小珍. 结合 FAST-SURF 和改进 k-d 树最近邻 查找的图像配准[J]. 西安理工大学学报, 2016, 32(2): 213–217, 252. CHEN Jianhong, HAN Xiaozhen. Image matching algorithm combining FAST-SURF and improved k-d tree nearest neighbor search[J]. Journal of Xi’an university of technology, 2016, 32(2): 213–217, 252. [7] 罗楠, 孙权森, 陈强, 等. 结合 SURF 特征点与 DAISY 描 述符的图像匹配算法[J]. 计算机科学, 2014, 41(11): 286–290, 300. LUO Nan, SUN Quansen, CHEN Qiang, et al. Image matching algorithm combining SURF feature point and DAISY descriptor[J]. Computer science, 2014, 41(11): 286–290, 300. [8] 王亚文, 陈鸿昶, 李邵梅, 等. 基于关键点匹配的多策略 尺度自适应跟踪算法[J]. 计算机工程与设计, 2016, 37(1): 247–253. WANG Yawen, CHEN Hongchang, LI Shaomei, et al. Multi-strategy scale adaptive tracking algorithm via keypoint matching[J]. Computer engineering and design, 2016, 37(1): 247–253. [9] 张凤晶, 王志强, 吴迪, 等. 基于 SURF 的图像配准改进 算法[J]. 长春理工大学学报(自然科学版), 2016, 39(1): 112–115. ZHANG Fengjing, WANG Zhiqiang, WU Di, et al. Improved algorithm of image regestration based on SURF[J]. Journal of Changchun university of science and technology (natural science edition), 2016, 39(1): 112–115. [10] LIU Yanling, MA Sihang. Research on image based on improved SURF feature matching[C]//Proceedings of 7th International Symposium on Computational Intelligence and Design. Hangzhou, China, 2014: 581–584. [11] [12] EL-GAYAR M M, SOLIMAN H, MEKY N. A comparative study of image low level feature extraction algorithms[J]. Egyptian informatics journal, 2013, 14(2): 175–181. HUANG Liqin, CHEN Caigan, SHEN Henghua, et al. Adaptive registration algorithm of color images based on SURF[J]. Measurement, 2015, 66: 118–124. [13] 安维胜, 余让明, 伍玉铃. 基于 FAST 和 SURF 的图像 配准算法[J]. 计算机工程, 2015, 41(10): 232–235, 239. AN Weisheng, YU Rangming, WU Yuling. Image registration algorithm based on FAST and SURF[J]. Computer engineering, 2015, 41(10): 232–235, 239. [14] HUI Dong, YUAN Handian. Research of image matching algorithm based on SURF features[C]//Proceedings of 2012 International Conference on Computer Science and Information Processing (CSIP). Xi’an, China, 2012: 1140–1143. [15] 阿丽亚•巴吐尔. 基于局部特征的维吾尔文印刷体复杂 文档图像检索研究[D]. 乌鲁木齐: 新疆大学, 2017. ALIYA Batur. Research on Uyghur printed complex document image retrieval based on local feature[D]. Urumchi: Xinjiang University, 2017. [16] 作者简介: 阿丽亚·巴吐尔,女,1990 年生,硕 士研究生,主要研究方向为模式识别、 图像检索。 努尔毕亚·亚地卡尔,女,1970 年 生,讲师,中国人工智能学会会员,主 要研究方向为图像处理、计算机视觉。 吾尔尼沙·买买提,女,1976 年生, 讲师,中国人工智能学会会员,主要研 究方向为信号与信息处理、模式识别。 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·305·