正在加载图片...
第5期 张文超,等:几何信息与SFT特征相结合的特定人手写关键词检测 ·547. 周围的梯度统计信息。利用式(3)可以对匹配特征 件的几何意义是,分布于汉字上的特征点随笔画的 点对进行初步筛选: 随意性移动的范围不会超过一定的阈值。因为相同 |0-0.1<P1 的汉字具有相同的笔画结构和笔顺,相应的特征点 0,1 也应当具有类似的分布。 P2< (3) C p2 ‖d,-d.I2<p3 式中:0,、o,、d,和0.、0.、d.分别表示关键词图 像和窗口图像的特征点方向角、尺度、特征矢量。 P1、P2、P,分别是对应的阈值。匹配点经过初步筛 窗口图像 选后的结果如图2所示。 性 也气促使症状发: 关键词图像 图2匹配特征点初步筛选后结果 Fig.2 Feature matching after initial selection 图3窗口内匹配点的分布信息 图中截取了滑动窗口在文本图像中的一个片 Fig.3 Location information of matching points 段,矩形框为窗口的位置,下面显示的是关键词的图 当存在越多的正确匹配点时,GCG图中互相连 像,细直线连接了两幅图像中匹配的特征点。可以 接的顶点将会越多。为了得到一个存在最多正确匹 看到图中依然存在很多误匹配的点对,这是由汉字 配点对的子集,就要在GCG中找到一个最大子图, 重复的结构信息引起的。利用特征点在文字的空间 在这个子图中所有的顶点都是互相连接的,可使用 分布建立几何约束,可以进一步删除误匹配点对。 最大团查找(maximal clique matching,MCM)算法来 几何约束原理就是:关键词图像上存在一定位置关 实现,其具体过程如下 系的两个特征点,它们在窗口图像中对应的两个匹 1)初始化候选顶点集C=V,最大团顶点集为 配点也具有相似的位置关系。通过这个原理可以在 M=9; 特征点对之间建立几何约束图,再通过图论中的最 2)计算V中每个顶点的度,记为集合Deg(V): 大团查找算法获得正确的匹配,点对集合。几何约束 3)选择C中Deg(V)最大的顶点to,将其加入 图(geometric constraint graph,GCG)建立步骤如下 M,即M=MU{o}; 1)设S={s1,s2,…,sm}为关键词图像特征点 4)将。从C中删除,并且只在C中保留和。相 集,W={01,02,…,0n}为文本图像中与之匹配的 连接的顶点,即C=C\o,C=CUN(o)。其中 特征点集。无向图G=(V,E)表示几何约束图。V= V()表示o的邻接顶点集。 {1,2,"}为G的顶点集合,其中:=(s,0:), 5)如课C=p,算法结束,否测转到重复上述过程。 表示S和W中每一对匹配点就对应G中的一个顶 通过建立几何约束图和最大团查找算法,可以 点。ECV×V为G边的集合。 删除大量误匹配点对,图2中的初始匹配经过几何 2)按照如下方法添加G的边,对于任意两个特 约束处理后结果如图4所示。线连接了两幅图中匹 征点对:=(5,0)和=(s,四),满足约束条件 配的特征点对,从图4中可以看到,笔画上的特征点 基本上是正确匹配的。 |(x-x)-(x:-xg)|<p4×Avg(c,) I-y,)-(,-y)1<5×Ag(a,)(4) 性 色会侯使症状袭 则在顶点,和之间添加一条边。式中x,和x。表 示特征点在关键词图像和窗口图像内的横坐标,而 图4匹配特征点进一步筛选结果 y、y.则表示其纵坐标,参考图3示例。P4和P5是 Fig.4 Location information of matching points 两个阈值,为了适应不同关键词图像的尺寸,式(4) 2.3窗口筛选和合并 中的右值应当与其平均尺度值成正比。该式约束条 结合几何约束对匹配点进行筛选之后,每个窗周围的梯度统计信息。 利用式(3)可以对匹配特征 点对进行初步筛选: θs - θw < p1 p2 < σs σw < 1 p2 ‖ ds - dw‖2 < p3 (3) 式中: θs 、 σs 、 ds 和 θw 、 σw 、 dw 分别表示关键词图 像和窗口图像的特征点方向角、尺度、特征矢量。 p1 、 p2 、 p3 分别是对应的阈值。 匹配点经过初步筛 选后的结果如图 2 所示。 图 2 匹配特征点初步筛选后结果 Fig.2 Feature matching after initial selection 图中截取了滑动窗口在文本图像中的一个片 段,矩形框为窗口的位置,下面显示的是关键词的图 像,细直线连接了两幅图像中匹配的特征点。 可以 看到图中依然存在很多误匹配的点对,这是由汉字 重复的结构信息引起的。 利用特征点在文字的空间 分布建立几何约束,可以进一步删除误匹配点对。 几何约束原理就是:关键词图像上存在一定位置关 系的两个特征点,它们在窗口图像中对应的两个匹 配点也具有相似的位置关系。 通过这个原理可以在 特征点对之间建立几何约束图,再通过图论中的最 大团查找算法获得正确的匹配点对集合。 几何约束 图(geometric constraint graph,GCG)建立步骤如下 1)设 S = {s1 ,s2 ,...,sm } 为关键词图像特征点 集, W = {w1 ,w2 ,...,wm } 为文本图像中与之匹配的 特征点集。 无向图 G = (V,E) 表示几何约束图。 V = {v1 ,v2 ,...,vm } 为 G 的顶点集合,其中 vi = (si,wi) , 表示 S 和 W 中每一对匹配点就对应 G 中的一个顶 点。 E ⊆ V × V 为 G 边的集合。 2)按照如下方法添加 G 的边,对于任意两个特 征点对 vi = (si,wi) 和 vj = (sj,wj) ,满足约束条件 (xs i - xs j ) - (xwi - xwj ) < p4 × Avg(σs) (ys i - ys j ) - (ywi - ywj ) < p5 × Avg(σs) (4) 则在顶点 vi 和 vj 之间添加一条边。 式中 xs 和 xw 表 示特征点在关键词图像和窗口图像内的横坐标,而 ys 、 yw 则表示其纵坐标,参考图 3 示例。 p4 和 p5 是 两个阈值,为了适应不同关键词图像的尺寸,式(4) 中的右值应当与其平均尺度值成正比。 该式约束条 件的几何意义是,分布于汉字上的特征点随笔画的 随意性移动的范围不会超过一定的阈值。 因为相同 的汉字具有相同的笔画结构和笔顺,相应的特征点 也应当具有类似的分布。 图 3 窗口内匹配点的分布信息 Fig.3 Location information of matching points 当存在越多的正确匹配点时,GCG 图中互相连 接的顶点将会越多。 为了得到一个存在最多正确匹 配点对的子集,就要在 GCG 中找到一个最大子图, 在这个子图中所有的顶点都是互相连接的,可使用 最大团查找(maximal clique matching,MCM)算法来 实现,其具体过程如下 1)初始化候选顶点集 C = V ,最大团顶点集为 M = φ ; 2)计算 V 中每个顶点的度,记为集合 Deg(V); 3)选择 C 中 Deg(V) 最大的顶点 v0 ,将其加入 M,即 M = M ∪ {v0 } ; 4)将 v0 从 C 中删除,并且只在 C 中保留和 v0 相 连接的顶点,即 C = C \v0 , C = C ∪ N(v0 ) 。 其中 N(v0 ) 表示 v0 的邻接顶点集。 5)如果C = φ ,算法结束,否则转到重复上述过程。 通过建立几何约束图和最大团查找算法,可以 删除大量误匹配点对,图 2 中的初始匹配经过几何 约束处理后结果如图 4 所示。 线连接了两幅图中匹 配的特征点对,从图 4 中可以看到,笔画上的特征点 基本上是正确匹配的。 图 4 匹配特征点进一步筛选结果 Fig.4 Location information of matching points 2.3 窗口筛选和合并 结合几何约束对匹配点进行筛选之后,每个窗 第 5 期 张文超,等:几何信息与 SIFT 特征相结合的特定人手写关键词检测 ·547·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有