·72· 智能系统学报 第2卷 这里To表示送入分类器总的样本数目,R表 的特征为4.2节中描述的6维统计量.测试结果如 示分类正确的样本数目,Tea为文本区域的样本数 表2所示 目,B为非文本区域的样本数目.为了保证识别率的 表2SVM对从视频中提取出图片的分类结果 均衡,避免文本区域过多的误识,文中选择使用 Table 2 Result of SVM tested on our dataset o 10:10作为训练样本比例(文本:非文本) Color Our 在测试时,把滑动窗口得到的6维特征输入到 Robert Sobel Canny LOG Robert method SVM,SVM的输出为0和1分别代表非文本和文 83.4077.3080.78-68.7265.6386.79 本.使用SVM的分类结果可以得到一个与原始图 86.9689.0355.8584.2489.4088.70 像对应的二值图像,如图2(a)所示 cg82.8875.5884.4466.4462.1584.62 文中同时采用2003年国际自然场景文本阅读 比赛(ICDAR'2003 Robust Reading Competi- tion)1提供的测试集进行了测试,测试集为507幅 图片,这些图片都是场景文本图片,训练样本为258 幅图片,测试样本为249幅图片.测试结果如表3所 示 表3SM对ICDAR'2003测试图片的分类结果 Table 3 Result of SVM tested on ICDAR'2003 dataset Color Our (a)SVM识别结果 Robert Sobel Canny LOG Robert method 74.7973.7247.9669.8354.6176.89 Cr 52.7855.0970.1453.9974.7957.09 cB77.3876.7844.3172.4051.3378.36 至今年9月 我国累计吸收合问外景金 从实验结果可以看出,在Homogeneity空间进 夹破了1万亿美元 达到了1055.5亿美元 行特征提取比用边缘算子直接提取文本的效果好 图2(b)是利用文中方法进行文本检测的实际效果」 5结束语 文中提出了一种基于Homogeneity的文本检 (b)文本检测结果 测的方法,Homogeneity这种方法己经被成功地应 图2文本检测实例 用到图像分割中,文中把它应用到文本检测中,通过 Fig.2 Examples of text detection 实验可以看出这种方法是有效的.由实验结果也可 以看出,该算法中的一些经验参数的选择和特征提 4实验结果 取、特征选择等问题上还有待研究.今后将进一步研 为了验证文中算法的性能,文中作了以下的实 究多分辨分析和特征选择等问题,进一步提高文本 验:分别使用边缘算子与Ho mo geneity映射2类方 检测的准确率 法得到特征图像,然后在所得到的特征图像中按照 参考文献: 上述方法,在相同的条件下进行特征提取和分类器 分类 [1]JEONG K Y,JUNG K,KIM E Y,et al:Neural net- 图片样本集为:453幅图片,这些图片是从视频 work-based text location for news video indexing [J ] IEEE Transactions on Information Theory,1998,44 中截取出来的包括动画片、新闻、体育、电影等方面。 (5):319.323. 其中训练样本为138幅图片,测试样本为315幅图 [2]KIM K I,JUNG K,KIM J H.Texture-based approach 片.在训练SVM分类器时,根据4.3节的实验结 for text detection in images using support vector ma- 果,训练样本比例选择10:10(文本:非文本),选取 chines and continuously adaptive mean shift algorithm 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved hup://www.cnki.net这里 Ttotal表示送入分类器总的样本数目 , R 表 示分类正确的样本数目 , Ttext 为文本区域的样本数 目 , B 为非文本区域的样本数目. 为了保证识别率的 均衡 ,避免文本区域过多的误识 , 文中选择使用 10 :10作为训练样本比例(文本 :非文本) . 在测试时 ,把滑动窗口得到的 6 维特征输入到 SVM ,SVM 的输出为 0 和 1 分别代表非文本和文 本. 使用 SVM 的分类结果可以得到一个与原始图 像对应的二值图像 ,如图 2 (a) 所示. (a) SVM 识别结果 (b) 文本检测结果 图 2 文本检测实例 Fig. 2 Examples of text detection 4 实验结果 为了验证文中算法的性能 ,文中作了以下的实 验 :分别使用边缘算子与 Homogeneity 映射 2 类方 法得到特征图像 ,然后在所得到的特征图像中按照 上述方法 ,在相同的条件下进行特征提取和分类器 分类. 图片样本集为 :453 幅图片 ,这些图片是从视频 中截取出来的包括动画片、新闻、体育、电影等方面. 其中训练样本为 138 幅图片 ,测试样本为 315 幅图 片. 在训练 SVM 分类器时 ,根据 4. 3 节的实验结 果 ,训练样本比例选择 10 :10 (文本 :非文本) ,选取 的特征为 4. 2 节中描述的 6 维统计量. 测试结果如 表 2 所示. 表 2 SVM 对从视频中提取出图片的分类结果 Table 2 Result of SVM tested on our dataset % Robert Sobel Canny LO G Color Robert Our method c 83. 40 77. 30 80. 78 68. 72 65. 63 86. 79 cT 86. 96 89. 03 55. 85 84. 24 89. 40 88. 70 cB 82. 88 75. 58 84. 44 66. 44 62. 15 84. 62 文中同时采用 2003 年国际自然场景文本阅读 比赛 ( ICDAR ’2003 Robust Reading Competi2 tion) [9 ]提供的测试集进行了测试 ,测试集为 507 幅 图片 ,这些图片都是场景文本图片 ,训练样本为 258 幅图片 ,测试样本为 249 幅图片. 测试结果如表 3 所 示. 表 3 SVM 对 ICDAR ’2003 测试图片的分类结果 Table 3 Result of SVM tested on ICDAR’2003 dataset % Robert Sobel Canny LO G Color Robert Our method c 74. 79 73. 72 47. 96 69. 83 54. 61 76. 89 cT 52. 78 55. 09 70. 14 53. 99 74. 79 57. 09 cB 77. 38 76. 78 44. 31 72. 40 51. 33 78. 36 从实验结果可以看出 ,在 Homogeneity 空间进 行特征提取比用边缘算子直接提取文本的效果好. 图 2 (b) 是利用文中方法进行文本检测的实际效果. 5 结束语 文中提出了一种基于 Homogeneity 的文本检 测的方法 , Homogeneity 这种方法已经被成功地应 用到图像分割中 ,文中把它应用到文本检测中 ,通过 实验可以看出这种方法是有效的. 由实验结果也可 以看出 ,该算法中的一些经验参数的选择和特征提 取、特征选择等问题上还有待研究. 今后将进一步研 究多分辨分析和特征选择等问题 ,进一步提高文本 检测的准确率. 参考文献 : [1 ]J EON G K Y , J UN G K , KIM E Y , et al : Neural net2 work2based text location for news video indexing [J ]. IEEE Transactions on Information Theory , 1998 , 44 (5) :319 - 323. [2 ] KIM K I , J UN G K , KIM J H. Texture2based approach for text detection in images using support vector ma2 chines and continuously adaptive mean shift algorithm · 27 · 智 能 系 统 学 报 第 2 卷 © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net