第2期 阿丽亚·巴吐尔,等:改进SURF特征的维吾尔文复杂文档图像匹配检索 ·303· 60时,实验样本整体模糊,样本的背景色也被列 将复杂的文档图像分别均匀划分为等面积 入检测范围,对检测到的关键特征点造成干扰, 的2块、4块和8块,由于每幅图像的文字分布区 从而对匹配时的匹配数目造成干扰,影响正确匹 域不同,所以分割后的每小块中包含的关键点数 配率;亮度变暗时提取的特征点数目要多于亮度 目也不同。在本实验中,当被选择查询图像分割 变亮时的特征点数目,匹配的精度也较差。可 成4块时,绝大部分为非文字区域,因此提取的特 知,在亮度变换条件下性能较稳定的是KD- 征数目少,并在完整图像库中检索含有本区域的 Tree+BBF匹配。 图像时,检索率明显下降。从图6(a)可知,不同 由于维吾尔文复杂文档图像库是由不同版 距离相似性度量算法对检索系统的影响不同。因 面、不同底色、不同分辨率文档图像采集而建立 此在剪切图像研究中,基于匹配距离的检索系统 的。在灰度化过程中,不能有效消除文档图像底 相对性能优于基于匹配数目的检索。当完整文档 色,因此底色信息影响关键点检测。此外,将图 图像为查询输入时,与目标图像关键点位置一一 像几何均匀分割成不同小块与整幅图像匹配时, 对应,因此关键点之间距离为最小;当复杂版面 若图像版面越相似,则匹配率较高:因此从数据 图像均匀分割分别作为查询图像时,被检测关键 库中取不具有底色,相似版面结构的分辨率为 点数目减少,被分割图文面积不均匀,在诸多相 100dpi,尺寸为1606×2290的100幅维吾尔文复 似版面中难以找出含有被分割区域的复杂文档图 杂文档图像构建小规模图像数据库。从中任选一 像。从图6(b)可知,基于匹配数目的检索性能优 幅图像,将其几何均匀划分成2、4、8块,分别作 于基于距离的检索。由于局部特征的尺寸变换不 为查询图像,再以基于匹配距离与匹配数目为依 变性维使得对于区域匹配数目相对稳定,因此不 据进行图像检索。由于文档图像尺寸大,被检测 同分割条件下检索目标文档图像的检索率都接 特征点数目较多,因此系统检索耗用时间较长, 近100%。 本文不作为系统性能指标。用不同匹配方法所进 在实验中,采集的原始图像篇幅较大,特征提 行的检索实验对比如图6所示。 取到的特征点数目太多,这对最终匹配点的数目 ■欧氏距离检索■余弦距离检索 造成很大的影响。因此,为更好地评估系统性 ■曼哈頓距离检索■切比雪夫距离检索 能,对采集到的原始维吾尔文复杂文档图像数据 100 库进行修改:1)对图像进行压缩,将图像压缩成 90 256×256尺寸;2)对图像进行剪切,将图像剪切成 256×256尺寸。对同一幅文档图像进行两种修改 样本实例如图7所示。 0 乱北心 u&小 8块 4块 2块 整幅 片Lyy火 切分数 u山好6 (a)不同距离相似性度量检索率对比 心山人 10 心dy雨 95 85 呢 70 一◆一欧氏距离检索 围因里日 65 一一匹配数目检索 2 60 8块 4块 2块 整幅 (a)压缩图像样本实例(b)剪切的图像样本实例 切分数 (b)基于欧氏距离与匹配数目检索的检错率对比 图7修改数据库样本实例 Fig.7 The sample instance of modified database 图6 改进SURF特征实现维吾尔文复杂文档图像检索 从图7中可以得到,对原始的整幅图像进行 的性能指标对比 Fig.6 The performance comparison figure of modified 压缩,会使图像的清晰度降低。而对原始的整幅 SURF feature based Uyghur complex document im- 图像进行剪切,只是剪切图像的一部分,不会对 age retrieval 清晰度造成影响,但篇幅的减少也会使提取的特−60 时,实验样本整体模糊,样本的背景色也被列 入检测范围,对检测到的关键特征点造成干扰, 从而对匹配时的匹配数目造成干扰,影响正确匹 配率;亮度变暗时提取的特征点数目要多于亮度 变亮时的特征点数目,匹配的精度也较差。可 知,在亮度变换条件下性能较稳定的 是 KD− Tree+BBF 匹配。 由于维吾尔文复杂文档图像库是由不同版 面、不同底色、不同分辨率文档图像采集而建立 的。在灰度化过程中,不能有效消除文档图像底 色,因此底色信息影响关键点检测。此外,将图 像几何均匀分割成不同小块与整幅图像匹配时, 若图像版面越相似,则匹配率较高;因此从数据 库中取不具有底色,相似版面结构的分辨率为 100 dpi,尺寸为 1 606×2 290 的 100 幅维吾尔文复 杂文档图像构建小规模图像数据库。从中任选一 幅图像,将其几何均匀划分成 2、4、8 块,分别作 为查询图像,再以基于匹配距离与匹配数目为依 据进行图像检索。由于文档图像尺寸大,被检测 特征点数目较多,因此系统检索耗用时间较长, 本文不作为系统性能指标。用不同匹配方法所进 行的检索实验对比如图 6 所示。 (a) 不同距离相似性度量检索率对比 (b) 基于欧氏距离与匹配数目检索的检错率对比 30 40 50 60 70 80 90 100 8块 4块 2块 切分数 整幅 欧氏距离检索 余弦距离检索 曼哈顿距离检索 切比雪夫距离检索 60 65 70 75 80 85 90 95 100 欧氏距离检索 匹配数目检索 8块 4块 2块 整幅 检索率/% 检索率/% 切分数 图 6 改进 SURF 特征实现维吾尔文复杂文档图像检索 的性能指标对比 Fig. 6 The performance comparison figure of modified SURF feature based Uyghur complex document image retrieval 将复杂的文档图像分别均匀划分为等面积 的 2 块、4 块和 8 块,由于每幅图像的文字分布区 域不同,所以分割后的每小块中包含的关键点数 目也不同。在本实验中,当被选择查询图像分割 成 4 块时,绝大部分为非文字区域,因此提取的特 征数目少,并在完整图像库中检索含有本区域的 图像时,检索率明显下降。从图 6(a) 可知,不同 距离相似性度量算法对检索系统的影响不同。因 此在剪切图像研究中,基于匹配距离的检索系统 相对性能优于基于匹配数目的检索。当完整文档 图像为查询输入时,与目标图像关键点位置一一 对应,因此关键点之间距离为最小;当复杂版面 图像均匀分割分别作为查询图像时,被检测关键 点数目减少,被分割图文面积不均匀,在诸多相 似版面中难以找出含有被分割区域的复杂文档图 像。从图 6(b) 可知,基于匹配数目的检索性能优 于基于距离的检索。由于局部特征的尺寸变换不 变性维使得对于区域匹配数目相对稳定,因此不 同分割条件下检索目标文档图像的检索率都接 近 100%。 在实验中,采集的原始图像篇幅较大,特征提 取到的特征点数目太多,这对最终匹配点的数目 造成很大的影响。因此,为更好地评估系统性 能,对采集到的原始维吾尔文复杂文档图像数据 库进行修改:1) 对图像进行压缩,将图像压缩成 256×256 尺寸;2) 对图像进行剪切,将图像剪切成 256×256 尺寸。对同一幅文档图像进行两种修改 样本实例如图 7 所示。 (a) 压缩图像样本实例 (b) 剪切的图像样本实例 图 7 修改数据库样本实例 Fig. 7 The sample instance of modified database 从图 7 中可以得到,对原始的整幅图像进行 压缩,会使图像的清晰度降低。而对原始的整幅 图像进行剪切,只是剪切图像的一部分,不会对 清晰度造成影响,但篇幅的减少也会使提取的特 第 2 期 阿丽亚·巴吐尔,等:改进 SURF 特征的维吾尔文复杂文档图像匹配检索 ·303·