正在加载图片...
第2期 谭婷,等:基于图表示和匹配的表单定位与提取 ·237· 点,该方法更适用于具有相同分辨率、亮度和对 4结束语 比度的扫描图像,另外,当基准点出现异物遮挡 或缺损的情况难以灵活处理。本文方法采用表单 本文提出了一种基于图表示和匹配的表单定 图匹配的方法以解决上述处理过程中存在的不 位与提取方法,实验表明:本文方法适用于局部 遮挡和不同类别、分辨率、方向、旋转、光照条件 足,根据不同表单已有的图案选取多个参考关键 下的表单图像的处理,是一种通用的表单图像准 区域构建图,采用图匹配的配准方式以解决单一 确定位和相关区域的提取方法。虽然本文方法实 参考基准点鲁棒性差的问题。此外图匹配配准方 现了大部分表单图像相关信息的准确定位和提 式能更好的适应不同尺度、方向、分辨率、光照条 取,但在缩小和单面形变幅度较大的图像上表现 件的图像,以及基准位置局部遮挡的问题。 效果不佳,下一步将考虑采用不同方法建立表单 关键区域的映射,以适应缩小比例大和较大范围 香红字成由款它以空益有北企区 形变图像的处理,同时,采用更为准确的后处理 本海过号中被通股位有闲公通止金组二 方法,去除无关的空白区域,使表单相关信息的 褚斌 提取精确到完整的字符串。 38967870167 参考文献: (a)定位结果 (b)提取结果 [1]SHARMA D V,LEHAL G S.Form field frame boundary 图7CXB表单定位和提取结果 removal for form processing system in Gurmukhi Fig.7 Results for C-XB form Location and extraction script[C]//Proceedings of the 10th International Confer- 品是B记E4 ence on Document Analysis and Recognition.Barcelona. Spain,2009:256-260. [2]CHEN J L,LEE H J.An efficient algorithm for form struc- ture extraction using strip projection[J].Pattern recogni- 300411G033 ion,1998,31(9):1353-1368. (a)定位结果 (b)提取结果 [3]LIU Wenyin,DORI D.From raster to vectors:extracting visual information from line drawings[J].Pattern analysis 图8EMS-MULT表单定位和提取结果 and applications,1999,2(1):10-21. Fig.8 Results for EMS-MULT form Location and [4]WATANABE T,LUO Qin,SUGIE N,et al.Layout recog- extraction nition of multi-kinds of table-form documents[J].IEEE transactions on pattern analysis and machine intelligence, 1995.17(4):432-445 [5]LAM S W.SRIHARI S N.Multi-domain document layout 韩偷巧 understanding[C]//Proceedings of International Confer- 18221423567 ence on Document Analysis and Recognition.1991: 112-120 (a)定位结果 (b)提取结果 [6]SACHDEVA R.SHARMA D V.Data extraction from 图9 YUNDA表单定位和提取结果 hand-filled form using form template[J].International Fig.9 Results for YUNDA form Location and extraction journal on recent and innovation trends in computing and communication,2015,3(8):5311-5317. 海方浦东新区东方路160号仁济 [7]NING L W,SIAH Y K,KHALID M,et al.Design of an 门诊楼5楼检科533室 automated data entry system for hand-filled forms[C]//Pro- 王亚福 ceedings of 2000 TENCON.Kuala Lumpur,Malaysia, 2000:162-166 881782141 [8]BENSEFIA A.Extraction of Arabic handwriting fields by (a)定位结果 (b)提取结果 forms matching[J].Journal of signal and information pro- 图10 EMS-FLAT表单定位和提取结果 cessing.2015,6(1):53424. Fig.10 Results for EMS-FLAT form Location and [9]CESARINI F.GORI M,MARINAI S,et al.INFORMys:a extraction flexible invoice-like form-reader system[J].IEEE transac-点,该方法更适用于具有相同分辨率、亮度和对 比度的扫描图像,另外,当基准点出现异物遮挡 或缺损的情况难以灵活处理。本文方法采用表单 图匹配的方法以解决上述处理过程中存在的不 足,根据不同表单已有的图案选取多个参考关键 区域构建图,采用图匹配的配准方式以解决单一 参考基准点鲁棒性差的问题。此外图匹配配准方 式能更好的适应不同尺度、方向、分辨率、光照条 件的图像,以及基准位置局部遮挡的问题。 4 结束语 本文提出了一种基于图表示和匹配的表单定 位与提取方法,实验表明:本文方法适用于局部 遮挡和不同类别、分辨率、方向、旋转、光照条件 下的表单图像的处理,是一种通用的表单图像准 确定位和相关区域的提取方法。虽然本文方法实 现了大部分表单图像相关信息的准确定位和提 取,但在缩小和单面形变幅度较大的图像上表现 效果不佳,下一步将考虑采用不同方法建立表单 关键区域的映射,以适应缩小比例大和较大范围 形变图像的处理,同时,采用更为准确的后处理 方法,去除无关的空白区域,使表单相关信息的 提取精确到完整的字符串。 参考文献: SHARMA D V, LEHAL G S. Form field frame boundary removal for form processing system in Gurmukhi script[C]//Proceedings of the 10th International Confer￾ence on Document Analysis and Recognition. Barcelona, Spain, 2009: 256–260. [1] CHEN J L, LEE H J. An efficient algorithm for form struc￾ture extraction using strip projection[J]. Pattern recogni￾tion, 1998, 31(9): 1353–1368. [2] LIU Wenyin, DORI D. From raster to vectors: extracting visual information from line drawings[J]. Pattern analysis and applications, 1999, 2(1): 10–21. [3] WATANABE T, LUO Qin, SUGIE N, et al. Layout recog￾nition of multi-kinds of table-form documents[J]. IEEE transactions on pattern analysis and machine intelligence, 1995, 17(4): 432–445. [4] LAM S W, SRIHARI S N. Multi-domain document layout understanding[C]//Proceedings of International Confer￾ence on Document Analysis and Recognition. 1991: 112–120. [5] SACHDEVA R, SHARMA D V. Data extraction from hand-filled form using form template[J]. International journal on recent and innovation trends in computing and communication, 2015, 3(8): 5311–5317. [6] NING L W, SIAH Y K, KHALID M, et al. Design of an automated data entry system for hand-filled forms[C]//Pro￾ceedings of 2000 TENCON. Kuala Lumpur, Malaysia, 2000: 162–166. [7] BENSEFIA A. Extraction of Arabic handwriting fields by forms matching[J]. Journal of signal and information pro￾cessing, 2015, 6(1): 53424. [8] CESARINI F, GORI M, MARINAI S, et al. INFORMys: a flexible invoice-like form-reader system[J]. IEEE transac- [9] (a) 定位结果 (b) 提取结果 图 10 EMS-FLAT 表单定位和提取结果 Fig. 10 Results for EMS-FLAT form Location and extraction (a) 定位结果 (b) 提取结果 图 7 C-XB 表单定位和提取结果 Fig. 7 Results for C-XB form Location and extraction (a) 定位结果 (b) 提取结果 图 8 EMS-MULT 表单定位和提取结果 Fig. 8 Results for EMS-MULT form Location and extraction (a) 定位结果 (b) 提取结果 图 9 YUNDA 表单定位和提取结果 Fig. 9 Results for YUNDA form Location and extraction 第 2 期 谭婷,等:基于图表示和匹配的表单定位与提取 ·237·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有