这里 Ttotal表示送入分类器总的样本数目 , R 表示分类正确的样本

点击下载：【学术论文 - 自然语言处理与理解】一种基于Homogeneity的文本检测新方法

正在加载图片...

·72· 智能系统学报第2卷这里To表示送入分类器总的样本数目，R表的特征为4.2节中描述的6维统计量.测试结果如示分类正确的样本数目，Tea为文本区域的样本数表2所示目，B为非文本区域的样本数目.为了保证识别率的表2SVM对从视频中提取出图片的分类结果均衡，避免文本区域过多的误识，文中选择使用 Table 2 Result of SVM tested on our dataset o 10:10作为训练样本比例（文本：非文本） Color Our 在测试时，把滑动窗口得到的6维特征输入到 Robert Sobel Canny LOG Robert method SVM,SVM的输出为0和1分别代表非文本和文 83.4077.3080.78-68.7265.6386.79 本.使用SVM的分类结果可以得到一个与原始图 86.9689.0355.8584.2489.4088.70 像对应的二值图像，如图2(a)所示 cg82.8875.5884.4466.4462.1584.62 文中同时采用2003年国际自然场景文本阅读比赛(ICDAR'2003 Robust Reading Competi- tion)1提供的测试集进行了测试，测试集为507幅图片，这些图片都是场景文本图片，训练样本为258 幅图片，测试样本为249幅图片.测试结果如表3所示表3SM对ICDAR'2003测试图片的分类结果 Table 3 Result of SVM tested on ICDAR'2003 dataset Color Our (a)SVM识别结果 Robert Sobel Canny LOG Robert method 74.7973.7247.9669.8354.6176.89 Cr 52.7855.0970.1453.9974.7957.09 cB77.3876.7844.3172.4051.3378.36 至今年9月我国累计吸收合问外景金从实验结果可以看出，在Homogeneity空间进夹破了1万亿美元达到了1055.5亿美元行特征提取比用边缘算子直接提取文本的效果好图2(b)是利用文中方法进行文本检测的实际效果」 5结束语文中提出了一种基于Homogeneity的文本检 (b)文本检测结果测的方法，Homogeneity这种方法己经被成功地应图2文本检测实例用到图像分割中，文中把它应用到文本检测中，通过 Fig.2 Examples of text detection 实验可以看出这种方法是有效的.由实验结果也可以看出，该算法中的一些经验参数的选择和特征提 4实验结果取、特征选择等问题上还有待研究.今后将进一步研为了验证文中算法的性能，文中作了以下的实究多分辨分析和特征选择等问题，进一步提高文本验：分别使用边缘算子与Ho mo geneity映射2类方检测的准确率法得到特征图像，然后在所得到的特征图像中按照参考文献：上述方法，在相同的条件下进行特征提取和分类器分类 [1]JEONG K Y,JUNG K,KIM E Y,et al:Neural net- 图片样本集为：453幅图片，这些图片是从视频 work-based text location for news video indexing [J ] IEEE Transactions on Information Theory,1998,44 中截取出来的包括动画片、新闻、体育、电影等方面。 (5):319.323. 其中训练样本为138幅图片，测试样本为315幅图 [2]KIM K I,JUNG K,KIM J H.Texture-based approach 片.在训练SVM分类器时，根据4.3节的实验结 for text detection in images using support vector ma- 果，训练样本比例选择10：10（文本：非文本），选取 chines and continuously adaptive mean shift algorithm 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved hup://www.cnki.net这里 Ttotal表示送入分类器总的样本数目 , R 表示分类正确的样本数目 , Ttext 为文本区域的样本数目 , B 为非文本区域的样本数目. 为了保证识别率的均衡 ,避免文本区域过多的误识 , 文中选择使用 10 :10作为训练样本比例(文本 :非文本) . 在测试时 ,把滑动窗口得到的 6 维特征输入到 SVM ,SVM 的输出为 0 和 1 分别代表非文本和文本. 使用 SVM 的分类结果可以得到一个与原始图像对应的二值图像 ,如图 2 (a) 所示. (a) SVM 识别结果 (b) 文本检测结果图 2 文本检测实例 Fig. 2 Examples of text detection 4 实验结果为了验证文中算法的性能 ,文中作了以下的实验 :分别使用边缘算子与 Homogeneity 映射 2 类方法得到特征图像 ,然后在所得到的特征图像中按照上述方法 ,在相同的条件下进行特征提取和分类器分类. 图片样本集为 :453 幅图片 ,这些图片是从视频中截取出来的包括动画片、新闻、体育、电影等方面. 其中训练样本为 138 幅图片 ,测试样本为 315 幅图片. 在训练 SVM 分类器时 ,根据 4. 3 节的实验结果 ,训练样本比例选择 10 :10 (文本 :非文本) ,选取的特征为 4. 2 节中描述的 6 维统计量. 测试结果如表 2 所示. 表 2 SVM 对从视频中提取出图片的分类结果 Table 2 Result of SVM tested on our dataset % Robert Sobel Canny LO G Color Robert Our method c 83. 40 77. 30 80. 78 68. 72 65. 63 86. 79 cT 86. 96 89. 03 55. 85 84. 24 89. 40 88. 70 cB 82. 88 75. 58 84. 44 66. 44 62. 15 84. 62 文中同时采用 2003 年国际自然场景文本阅读比赛 ( ICDAR ’2003 Robust Reading Competi2 tion) [9 ]提供的测试集进行了测试 ,测试集为 507 幅图片 ,这些图片都是场景文本图片 ,训练样本为 258 幅图片 ,测试样本为 249 幅图片. 测试结果如表 3 所示. 表 3 SVM 对 ICDAR ’2003 测试图片的分类结果 Table 3 Result of SVM tested on ICDAR’2003 dataset % Robert Sobel Canny LO G Color Robert Our method c 74. 79 73. 72 47. 96 69. 83 54. 61 76. 89 cT 52. 78 55. 09 70. 14 53. 99 74. 79 57. 09 cB 77. 38 76. 78 44. 31 72. 40 51. 33 78. 36 从实验结果可以看出 ,在 Homogeneity 空间进行特征提取比用边缘算子直接提取文本的效果好. 图 2 (b) 是利用文中方法进行文本检测的实际效果. 5 结束语文中提出了一种基于 Homogeneity 的文本检测的方法 , Homogeneity 这种方法已经被成功地应用到图像分割中 ,文中把它应用到文本检测中 ,通过实验可以看出这种方法是有效的. 由实验结果也可以看出 ,该算法中的一些经验参数的选择和特征提取、特征选择等问题上还有待研究. 今后将进一步研究多分辨分析和特征选择等问题 ,进一步提高文本检测的准确率. 参考文献 : [1 ]J EON G K Y , J UN G K , KIM E Y , et al : Neural net2 work2based text location for news video indexing [J ]. IEEE Transactions on Information Theory , 1998 , 44 (5) :319 - 323. [2 ] KIM K I , J UN G K , KIM J H. Texture2based approach for text detection in images using support vector ma2 chines and continuously adaptive mean shift algorithm · 27 · 智能系统学报第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

<<向上翻页向下翻页>>

点击下载：【学术论文 - 自然语言处理与理解】一种基于Homogeneity的文本检测新方法