第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·297· 提供快速高效的检索服务,为了达成这一目标许 王亚文等基于中心-边缘区域比较模板匹配算法 多国内外学者进行了卓有成效的研究。王澎 有效跟踪目标区域,提取SURF特征,将匹配对数 等提出提取图像关键点的64维SURF特征集, 目与模板匹配数目比较自适应调整跟踪窗口,实 计算每一维上的一阶中心矩与加权绝对中心矩, 现目标检测。这些方法分别对特征提取和匹配方 形成特征向量,将其作为SVM分类的依据,对1000 式进行不同程度的改进,但是检索时间或检索准 幅图片进行分类,获得86.8%的正确分类率。赵 确率需要进一步提高。 璐璐等4,对提取的64维SURF特征点,基于 本文提取改进的W×64维SURF特征,并对其 FLANN算法进行双向匹配,对匹配对进行PROSAC 实现FLANN双向匹配,依次统计匹配性能参数, 分析,剔除误匹配对,提高图像匹配精度,有效缩 并将其作为相似性度量依据,从大规模图像数据 短匹配占用时间。闫丽等,扩展Haar响应,生成 库中有效检索输出目标文档图像。此外,为降低 包含线特征、中心环绕特征、角点特征的Haar- 检索复杂度,笔者运用基于距离的相似性度量方 Lik特征集,提高描述子的区分率,基于欧氏距 离比实现遥感图像的快速准确匹配。陈剑虹等) 法,快速查找目标文档图像。 提出改进SURF关键点检测,提取图像细节区域 1FAST+SURF特征提取 的特征点,不经过非极大值抑制有效去除边缘点 与低对比点,将优先队列(BBF)融入到KD-Tree 本文对细节信息丰富的维吾尔文复杂文档图 双向匹配中,实现稳定、快速鲁邦特征的精确匹 像进行研究,不对其进行版面分析,对改进 配。罗楠等对SURF特征描述进行改进,用改 SURF特征实现脱离于词袋模型的检索方法,从 进DAISY描述算子为每个关键点分配主方向,形 大规模图像数据库中实现有效检索。本文算法流 成维数为200的特征向量,并通过最近邻距离比 程如图1所示。 NNDR)匹配目标图像,其最大匹配率达到95.78%。 维文复杂文档 复杂文档图像数据库 扫描 FAST关键点检测 FAST关键点检测 SURF特 征向量 SURF特征 SURF特征 FLANN双向匹配 RANSAC分析 基于匹配点数的检索 将检索结果 基于欧式距离的检索 输出给用户 图1基于改进SURF特征的维吾尔文印刷体复杂文档图像检索流程框图 Fig.1 The block diagram of Uyghur printed complex document image retrieval based on modified SURF feature提供快速高效的检索服务,为了达成这一目标许 多国内外学者进行了卓有成效的研究[1-2]。王澎 等 [3]提出提取图像关键点的 64 维 SURF 特征集, 计算每一维上的一阶中心矩与加权绝对中心矩, 形成特征向量,将其作为 SVM 分类的依据,对 1 000 幅图片进行分类,获得 86.8% 的正确分类率。赵 璐璐等[4-5] ,对提取的 64 维 SURF 特征点,基于 FLANN 算法进行双向匹配,对匹配对进行 PROSAC 分析,剔除误匹配对,提高图像匹配精度,有效缩 短匹配占用时间。闫丽等[6] ,扩展 Haar 响应,生成 包含线特征、中心环绕特征、角点特征的 HaarLike 特征集,提高描述子的区分率,基于欧氏距 离比实现遥感图像的快速准确匹配。陈剑虹等[7] 提出改进 SURF 关键点检测,提取图像细节区域 的特征点,不经过非极大值抑制有效去除边缘点 与低对比点,将优先队列 (BBF) 融入到 KD-Tree 双向匹配中,实现稳定、快速鲁邦特征的精确匹 配。罗楠等[8]对 SURF 特征描述进行改进,用改 进 DAISY 描述算子为每个关键点分配主方向,形 成维数为 200 的特征向量,并通过最近邻距离比 (NNDR) 匹配目标图像,其最大匹配率达到 95.78%。 王亚文等[9]基于中心-边缘区域比较模板匹配算法 有效跟踪目标区域,提取 SURF 特征,将匹配对数 目与模板匹配数目比较自适应调整跟踪窗口,实 现目标检测。这些方法分别对特征提取和匹配方 式进行不同程度的改进,但是检索时间或检索准 确率需要进一步提高。 本文提取改进的 N×64 维 SURF 特征,并对其 实现 FLANN 双向匹配,依次统计匹配性能参数, 并将其作为相似性度量依据,从大规模图像数据 库中有效检索输出目标文档图像。此外,为降低 检索复杂度,笔者运用基于距离的相似性度量方 法,快速查找目标文档图像。 1 FAST+SURF 特征提取 本文对细节信息丰富的维吾尔文复杂文档图 像进行研究,不对其进行版面分析,对改 进 SURF 特征实现脱离于词袋模型的检索方法,从 大规模图像数据库中实现有效检索。本文算法流 程如图 1 所示。 维文复杂文档 复杂文档图像数据库 扫描 基于欧式距离的检索 SURF 特 征向量 将检索结果 输出给用户 FAST 关键点检测 SURF 特征 FAST 关键点检测 SURF 特征 基于匹配点数的检索 FLANN 双向匹配 RANSAC 分析 图 1 基于改进 SURF 特征的维吾尔文印刷体复杂文档图像检索流程框图 Fig. 1 The block diagram of Uyghur printed complex document image retrieval based on modified SURF feature 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·297·