正在加载图片...
第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·301· 优越性,在(4,4,2,0.00040阈值下提取相同版面 不同灰度阈值下的FAST+SURF特征进行性能分 不同尺寸的维文复杂文档的SURF特征,将其与 析,实验结果如表2所示。 表2在同一个阈值下同一幅不同尺寸图像中检测的FAST+SURF关键点与时间对比表 Table 2 The comparison table of detecting FAST+SURF key points and time using different image sizes in a same threshold 图像尺寸 性能 SIFT SURF FAST(50)+surf FAST(100)+surf FAST(150)+surf FAST(200)+surf 关键点数 3276 3537 9767 7195 4960 964 803×1145 占用时间s 30.405 15.866 0.021 0.01 0.009 0.009 关键点数 10320 11516 22028 9414 9299 2524 1606×2290 占用时间s 105.45051.141 0.031 0.019 0.017 0.015 关键点数 27820 38115 52967 17764 7839 214 3212×4581 占用时间s250.492162.491 0.082 0.04 0.035 0.03 经多次实验发现FAST(IOO)+SURF特征数目 提取特征对旋转、尺度、光照变换的鲁棒性,进行 接近在(4,4,2,0.0004f)阈值下的原始SURF特 不相同变换的情况,选择大小为1606×2290的维 征数目。以检测FAST关键点来增加被检测特征 吾尔文复杂文档图像且提取改进SURF特征,同 点总量为付出,就可以很大程度上减少在特征点 时分别用FLANN双向匹配、KD-Tree+BBF匹配 检测上耗费的时间复杂度,这样不仅能够明显优 寻找能够精确匹配对总数。基于FLANN的双向 化匹配效率,还能够让快速检索维吾尔文复杂文 匹配对阈值的依赖性较强,其定义为?= 档图像成为可能。从表2中能够了解到,同一幅 不同尺寸图像的SURF特征点数目随图像尺寸变 max{a×min_dist,}。为精确定位阈值,分别在 大而增多。而本文提出的改进FAST+SURF特征 =B与=a×min dist下匹配两幅相同版面文档图 中,特征点数目不与图像尺寸成正比关系。FAST 像,并得知当y=0.1或y=50×min dist时匹配性能 角点检测中,建立高斯卷积或Haar滤波的尺度空 最可靠。分别在两种阈值下匹配换后的文档图像 间、计算高斯函数导数与积分图像的卷积是完全 与原始图像,统计匹配性能参数得知当阈值为 没有必要的,我们只需要检测相对周围像素点, =01时,系统匹配性能最可靠。在尺寸变换下 检测都亮或都暗区域,这样能够明显缩短特征检 FLANN双向匹配在阈值y=0.1的下匹配与KD 测时间同时也显著降低计算复杂度。为检测本文 Tree+BBF匹配的结果如下表3所示。 表3维吾尔文档图像尺寸变换下FAST(I0O)+SURF特征点的两种匹配结果6 Table 3 Two kinds of FAST(100)+SURF feature points matching results under Uyghur document image scale transform FLANN双向匹配 KD-Tree+BBF匹配 变换参量性能指标 整幅 1:(1/2) 1(1/4) 整幅 1:(1/2) 1:(1/4) 关键点总数目 9414 4369 2082 9414 4369 2082 匹配对总数目 1145 454 200 9335 4264 2017 正确匹配对数目 759 363 172 7582 4151 573 正确匹配率% 66.29 79.96 86 81.22 97.35 28.40 错误匹配对数目 386 91 28 1753 113 1444 错误匹配率% 33.71 20.04 14 18.78 2.65 71.59 内点数目 768 358 59 将原始的文档图像划分为相等的2块和4 同。图像中的非文字区域是由图片组成,特征点 块,随着图像尺寸的减小,被检测的特征点数目 的分布较为密集,干扰点也较多,关键特征点的 也随之减少,在匹配时,匹配到的关键点数目也 选择比较困难,而文字区域的特征点分布较为均 减少。在特征提取时由于每块剪切图像中文字所 匀,因此被检测局部关键点数目较多。从表3可 占比例的不同,提取的特征点的位置也不尽相 以得到以下结论,使用KD-Tree+BBF匹配时,它优越性,在 (4,4,2,0.000 4f) 阈值下提取相同版面 不同尺寸的维文复杂文档的 SURF 特征,将其与 不同灰度阈值下的 FAST+SURF 特征进行性能分 析,实验结果如表 2 所示。 表 2 在同一个阈值下同一幅不同尺寸图像中检测的 FAST+SURF 关键点与时间对比表 Table 2 The comparison table of detecting FAST+SURF key points and time using different image sizes in a same threshold 图像尺寸 性能 SIFT SURF FAST(50)+surf FAST(100)+surf FAST(150)+surf FAST(200)+surf 803×1 145 关键点数 3 276 3 537 9 767 7 195 4 960 964 占用时间/s 30.405 15.866 0.021 0.01 0.009 0.009 1 606×2 290 关键点数 10 320 11 516 22 028 9 414 9 299 2 524 占用时间/s 105.450 51.141 0.031 0.019 0.017 0.015 3 212×4 581 关键点数 27 820 38 115 52 967 17 764 7 839 214 占用时间/s 250.492 162.491 0.082 0.04 0.035 0.03 经多次实验发现 FAST(100)+SURF 特征数目 接近在 (4,4,2,0.000 4f) 阈值下的原始 SURF 特 征数目。以检测 FAST 关键点来增加被检测特征 点总量为付出,就可以很大程度上减少在特征点 检测上耗费的时间复杂度,这样不仅能够明显优 化匹配效率,还能够让快速检索维吾尔文复杂文 档图像成为可能。从表 2 中能够了解到,同一幅 不同尺寸图像的 SURF 特征点数目随图像尺寸变 大而增多。而本文提出的改进 FAST+SURF 特征 中,特征点数目不与图像尺寸成正比关系。FAST 角点检测中,建立高斯卷积或 Haar 滤波的尺度空 间、计算高斯函数导数与积分图像的卷积是完全 没有必要的,我们只需要检测相对周围像素点, 检测都亮或都暗区域,这样能够明显缩短特征检 测时间同时也显著降低计算复杂度。为检测本文 提取特征对旋转、尺度、光照变换的鲁棒性,进行 不相同变换的情况,选择大小为 1 606×2 290 的维 吾尔文复杂文档图像且提取改进 SURF 特征,同 时分别用 FLANN 双向匹配、KD−Tree+BBF 匹配 寻找能够精确匹配对总数。基于 FLANN 的双向 匹配对阈值的依赖性较强,其定义 为 γ = max{α×min_dist, β}。为精确定位阈值,分别在 γ=β 与 γ=α×min_dist 下匹配两幅相同版面文档图 像,并得知当 γ=0.1 或 γ=50×min_dist 时匹配性能 最可靠。分别在两种阈值下匹配换后的文档图像 与原始图像,统计匹配性能参数得知当阈值为 γ=0.1 时,系统匹配性能最可靠。在尺寸变换下 FLANN 双向匹配在阈值 γ=0.1 的下匹配与 KD− Tree+BBF 匹配的结果如下表 3 所示。 表 3 维吾尔文档图像尺寸变换下 FAST(100)+SURF 特征点的两种匹配结果[16] Table 3 Two kinds of FAST (100)+SURF feature points matching results under Uyghur document image scale transform[16] 变换参量性能指标 FLANN 双向匹配 KD-Tree+BBF 匹配 整幅 1∶(1/2) 1∶(1/4) 整幅 1∶(1/2) 1∶(1/4) 关键点总数目 9 414 4 369 2 082 9 414 4 369 2 082 匹配对总数目 1 145 454 200 9 335 4 264 2 017 正确匹配对数目 759 363 172 7 582 4 151 573 正确匹配率/% 66.29 79.96 86 81.22 97.35 28.40 错误匹配对数目 386 91 28 1 753 113 1 444 错误匹配率/% 33.71 20.04 14 18.78 2.65 71.59 内点数目 768 358 59 — — — 将原始的文档图像划分为相等的 2 块和 4 块,随着图像尺寸的减小,被检测的特征点数目 也随之减少,在匹配时,匹配到的关键点数目也 减少。在特征提取时由于每块剪切图像中文字所 占比例的不同,提取的特征点的位置也不尽相 同。图像中的非文字区域是由图片组成,特征点 的分布较为密集,干扰点也较多,关键特征点的 选择比较困难,而文字区域的特征点分布较为均 匀,因此被检测局部关键点数目较多。从表 3 可 以得到以下结论,使用 KD−Tree+BBF 匹配时,它 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·301·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有