正在加载图片...
第5期 张文超,等:几何信息与SFT特征相结合的特定人手写关键词检测 .549. 此基础上分别进行增大和减小。其中S为关键词图 像宽度的1/6。测试结果如表2所示。 表1不同筛选阈值和约束阈值的检测结果 Table 1 Detection results of different selection thresholds and restriction thresholds 窗口宽度 滑动 W-S W+S W+2S 步长 及 P R F R 心 分 R P W/3 77.02 85.82 81.18 81.69 89.62 85.47 78.17 93.81 85.28 77.85 94.23 85.26 W/4 86.07 82.03 84.01 86.58 90.42 88.46 83.80 92.69 88.02 74.52 93.73 83.03 W/5 83.80 86.63 85.19 83.39 86.30 84.82 81.19 91.42 86.00 77.48 93.49 84.74 W/6 89.26 82.65 85.83 86.59 85.49 86.04 86.25 92.12 89.08 77.85 92.56 84.57 W/7 86.96 82.20 84.51 86.07 88.51 87.27 84.37 89.22 86.73 77.25 93.08 84.43 表2不同窗口宽度和滑动步长的检测结果 Table 2 Detection results of different window widths and sliding steps 约束阈值P4P5 筛选阈值k 14,11 15,12 16,13 R P F R P R 2 0.24 86.58 85.84 86.21 90.47 74.09 81.46 92.69 64.46 76.04 0.25 84.73 90.44 87.49 87.13 83.92 85.49 87.88 73.63 80.13 0.26 83.38 92.56 87.73 86.39 86.17 86.28 87.27 82.47 84.80 0.27 78.12 95.80 86.06 83.80 92.69 88.02 87.27 87.43 87.35 0.28 74.79 97.18 84.52 79.65 94.60 86.49 80.53 90.15 85.07 从表2数据横向分析,随着窗口宽度的增大,召 表3所示。从表3和表1的对比可以看出,所有的 回率呈现先升高后降低的趋势,而准确率逐渐升高, 召回率都有提高,大部分准确率下降,由于召回率提 这是因为太小的窗口宽度可能损失一部分正确匹配 高的幅度更大,所以整体的F值有所提高,并且在相 点,而太大的窗口又会引入很多误匹配点,但是由于 同的参数下取得最大值。本文方法为了提高关键词 结构约束能够筛选窗口,使得准确率大幅提升。只 检测的成功率,在基于SFT特征进行文字图像匹配 有适当窗口大小才能得到比较好的结果。纵向分 之后,利用了文字几何信息对匹配点对进行筛选。 析,滑动步长的大小对召回率和准确率的影响出现 为了验证文字结构信息对检测的效果,对结合文字 了波动,这是由于手写体汉字间距的随意性导致。 几何信息之前和之后进行了对比实验,结果如表4 整体来看,F值在横向也表现出先升高后降低的趋 所示。很显然,在没有几何信息约束的情况下仅仅 势,在纵向有一定波动性。在窗口宽度取W+S,滑动 依靠SFT特征进行匹配,大部分图像存在误检的情 步长取W/6时,F值取得最大值89.08%。 况。这是由于汉字大量的重复结构造成,汉字笔画 固定窗口大小和滑动步长为上述两个最佳值, 类别单一,只有依靠笔画之间的结构约束才能精准 再次对筛选阈值和约束阈值进行实验。测试结果如 地匹配。 表3固定参数后不同筛选阈值和约束阈值的检测结果 Table 3 detection results with different selection threshold and restriction threshold after parameters fixed 约束阈值P4,P5 筛选阈值k 14.11 15,12 16,13 R P F R P F R P 0.25 87.17 89.11 88.13 92.54 82.40 87.18 93.28 70.62 80.83 0.26 85.82 90.98 88.33 89.58 86.50 88.01 91.57 78.54 84.55 0.27 79.23 94.76 86.30 86.25 92.12 89.08 91.57 85.57 88.47 0.28 76.64 96.37 85.38 79.65 92.48 85.59 81.12 89.18 84.96此基础上分别进行增大和减小。 其中 S 为关键词图 像宽度的 1 / 6。 测试结果如表 2 所示。 表 1 不同筛选阈值和约束阈值的检测结果 Table 1 Detection results of different selection thresholds and restriction thresholds 滑动 步长 窗口宽度 W-S W W+S W+2S R P F R P F R P F R P F W/ 3 77.02 85.82 81.18 81.69 89.62 85.47 78.17 93.81 85.28 77.85 94.23 85.26 W/ 4 86.07 82.03 84.01 86.58 90.42 88.46 83.80 92.69 88.02 74.52 93.73 83.03 W/ 5 83.80 86.63 85.19 83.39 86.30 84.82 81.19 91.42 86.00 77.48 93.49 84.74 W/ 6 89.26 82.65 85.83 86.59 85.49 86.04 86.25 92.12 89.08 77.85 92.56 84.57 W/ 7 86.96 82.20 84.51 86.07 88.51 87.27 84.37 89.22 86.73 77.25 93.08 84.43 表 2 不同窗口宽度和滑动步长的检测结果 Table 2 Detection results of different window widths and sliding steps 筛选阈值 k 约束阈值 p4 ,p5 14,11 R P F 15,12 R P F 16,13 R P F 0.24 86.58 85.84 86.21 90.47 74.09 81.46 92.69 64.46 76.04 0.25 84.73 90.44 87.49 87.13 83.92 85.49 87.88 73.63 80.13 0.26 83.38 92.56 87.73 86.39 86.17 86.28 87.27 82.47 84.80 0.27 78.12 95.80 86.06 83.80 92.69 88.02 87.27 87.43 87.35 0.28 74.79 97.18 84.52 79.65 94.60 86.49 80.53 90.15 85.07 从表 2 数据横向分析,随着窗口宽度的增大,召 回率呈现先升高后降低的趋势,而准确率逐渐升高, 这是因为太小的窗口宽度可能损失一部分正确匹配 点,而太大的窗口又会引入很多误匹配点,但是由于 结构约束能够筛选窗口,使得准确率大幅提升。 只 有适当窗口大小才能得到比较好的结果。 纵向分 析,滑动步长的大小对召回率和准确率的影响出现 了波动,这是由于手写体汉字间距的随意性导致。 整体来看,F 值在横向也表现出先升高后降低的趋 势,在纵向有一定波动性。 在窗口宽度取 W+S,滑动 步长取 W/ 6 时,F 值取得最大值 89.08%。 固定窗口大小和滑动步长为上述两个最佳值, 再次对筛选阈值和约束阈值进行实验。 测试结果如 表 3 所示。 从表 3 和表 1 的对比可以看出,所有的 召回率都有提高,大部分准确率下降,由于召回率提 高的幅度更大,所以整体的 F 值有所提高,并且在相 同的参数下取得最大值。 本文方法为了提高关键词 检测的成功率,在基于 SIFT 特征进行文字图像匹配 之后,利用了文字几何信息对匹配点对进行筛选。 为了验证文字结构信息对检测的效果,对结合文字 几何信息之前和之后进行了对比实验,结果如表 4 所示。 很显然,在没有几何信息约束的情况下仅仅 依靠 SIFT 特征进行匹配,大部分图像存在误检的情 况。 这是由于汉字大量的重复结构造成,汉字笔画 类别单一,只有依靠笔画之间的结构约束才能精准 地匹配。 表 3 固定参数后不同筛选阈值和约束阈值的检测结果 Table 3 detection results with different selection threshold and restriction threshold after parameters fixed 筛选阈值 k 约束阈值 p4 ,p5 14,11 R P F 15,12 R P F 16,13 R P F 0.25 87.17 89.11 88.13 92.54 82.40 87.18 93.28 70.62 80.83 0.26 85.82 90.98 88.33 89.58 86.50 88.01 91.57 78.54 84.55 0.27 79.23 94.76 86.30 86.25 92.12 89.08 91.57 85.57 88.47 0.28 76.64 96.37 85.38 79.65 92.48 85.59 81.12 89.18 84.96 第 5 期 张文超,等:几何信息与 SIFT 特征相结合的特定人手写关键词检测 ·549·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有