第2卷第1期 智能系统学报 Vol.2№1 2007年2月 CAAI Transactions on Intelligent Systems Fcb.2007 一种基于Ho mo geneity的文本检测新方法 黄剑华唐降龙,刘家锋,徐莉莉 (哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001) 摘要:视频图像中的文本包含了丰富的语义层次上的内容描述信息,为基于语义的图像检索提供重要的索引信息 资源.提出了一种基于Homogeneity和支持向量机(support vector machine)的视频图像中文本检测方法,首先将图 像由空间域映射到Homogeneity域中,然后对映射到Homogeneity空间中的图像进行特征提取,利用SVM判别文 本区域.实验表明此文本检测方法优于用基于边缘特征的文本检测方法 关键词:文本检测:特征提取;Homo geneity,支持向量机 中图分类号:TP391.2文献标识码:A文章编号:16734785(2007)01-006905 A new method for text detection based on Homogeneity HUAN G Jianhua,TAN G Xiang-long ,L IU Jia-feng,XU Li-li (School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China) Abstract:Text data presented in images and video contains useful and important semantic information for automatic indexing.In this paper,a method for text detection based on homogeneity and SVM is pro- posed.First an original image is mapped from space domain to homogeneity domain,and then text region property is confirmed by SVM trained to extract property feature in homogeneity domain.Comparison with the text detection method based on edge features shows that the proposed method has a better accura- cy Key words :text detection;feature extraction;Homogeneity;SVM 随着数字化存储技术的发展和计算机性能的不本检测方法4,,使用边缘和边缘密度来找出文本 断提高,数字视频在各个领域的应用越来越广泛,能区域的位置.在视频片断处理中除使用单帧图像外 够从大量的视频资料中找到需要的信息成为人们迫 还可以利用多幅图像来检测、提取和增强文本区 切的要求.图像和视频中的文本包含许多非常重要 域6].也有部分研究者将颜色信息和边缘或者纹理 的信息,如街道名称、商店名称、路标、交通标示、字 特征结合在一起使用,不在灰度图像上而是在彩色 幕等,这些信息是图像和视频资料自动注释、索引、图像上提取边缘特征刀.还有算法直接在压缩的图 压缩等方面重要的依据 像中进行文本检测劉 从视频图像处理和文档分析的研究角度出发, 上述的方法在检测文本时只考虑了图像区域的 目前己经提出了一些文本提取算法,这些算法主要 全局信息,没有考虑局部信息,一定程度上造成文本 是从感性的特征出发,利用颜色、亮度、形状纹理等 检测的错误.文中提出了一种基于Homogeneity的 属性来提取文本信息,总结起来可以归纳为3类:1) 文本检测方法,这种方法充分考虑了图像区域的局 基于连通区域的文本检测方法山,这一方法假定字 部信息,反映了一个区域的一致性强度,能够更好地 符的颜色相近且与背景可分,2)基于纹理特征的文 反映文本区域的特征,可以更好地突出文本区域, 本检测方法2引,通过识别图像的纹理特征,如角点 适用于背景比较复杂的视频图像中文本检测.实验 特征,来区分文本区域与背景:3)基于边缘特征的文 表明在Homogeneity空间进行特征提取优于用边 缘算子进行特征提取.」 收稿日期:200603-07. 基金项目:国家自然科学基金资助项目(60573071) 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net第 2 卷第 1 期 智 能 系 统 学 报 Vol. 2 №. 1 2007 年 2 月 CAA I Transactions on Intelligent Systems Feb. 2007 一种基于 Homogeneity 的文本检测新方法 黄剑华 ,唐降龙 ,刘家锋 ,徐莉莉 (哈尔滨工业大学 计算机科学与技术学院 ,黑龙江 哈尔滨 150001) 摘 要 :视频图像中的文本包含了丰富的语义层次上的内容描述信息 ,为基于语义的图像检索提供重要的索引信息 资源. 提出了一种基于 Homogeneity 和支持向量机(support vector machine) 的视频图像中文本检测方法 ,首先将图 像由空间域映射到 Homogeneity 域中 ,然后对映射到 Homogeneity 空间中的图像进行特征提取 ,利用 SVM 判别文 本区域. 实验表明此文本检测方法优于用基于边缘特征的文本检测方法. 关键词 :文本检测 ;特征提取 ; Homogeneity ;支持向量机 中图分类号 : TP391. 2 文献标识码 :A 文章编号 :167324785 (2007) 0120069205 A new method for text detection based on Homogeneity HUAN G Jian2hua , TAN G Xiang2long ,L IU Jia2feng ,XU Li2li (School of Computer Science and Technology , Harbin Institute of Technology , Harbin 150001 , China) Abstract :Text data presented in images and video contains usef ul and important semantic information for automatic indexing. In t his paper , a method for text detection based on homogeneity and SVM is pro2 posed. First an original image is mapped from space domain to homogeneity domain , and then text region property is confirmed by SVM trained to extract property feature in homogeneity domain. Comparison with the text detection method based on edge features shows t hat t he proposed method has a better accura2 cy. Keywords :text detection ;feat ure extraction ; Homogeneity ;SVM 收稿日期 :2006203207. 基金项目 :国家自然科学基金资助项目(60573071) . 随着数字化存储技术的发展和计算机性能的不 断提高 ,数字视频在各个领域的应用越来越广泛 ,能 够从大量的视频资料中找到需要的信息成为人们迫 切的要求. 图像和视频中的文本包含许多非常重要 的信息 ,如街道名称、商店名称、路标、交通标示、字 幕等 ,这些信息是图像和视频资料自动注释、索引、 压缩等方面重要的依据. 从视频图像处理和文档分析的研究角度出发 , 目前已经提出了一些文本提取算法 ,这些算法主要 是从感性的特征出发 ,利用颜色、亮度、形状、纹理等 属性来提取文本信息 ,总结起来可以归纳为 3 类 :1) 基于连通区域的文本检测方法[ 1 ] ,这一方法假定字 符的颜色相近且与背景可分 ;2) 基于纹理特征的文 本检测方法[2 - 3 ] ,通过识别图像的纹理特征 ,如角点 特征 ,来区分文本区域与背景 ;3) 基于边缘特征的文 本检测方法[4 - 5 ] ,使用边缘和边缘密度来找出文本 区域的位置. 在视频片断处理中除使用单帧图像外 还可以利用多幅图像来检测、提取和增强文本区 域[6 ] . 也有部分研究者将颜色信息和边缘或者纹理 特征结合在一起使用 ,不在灰度图像上而是在彩色 图像上提取边缘特征[7 ] . 还有算法直接在压缩的图 像中进行文本检测[ 8 ] . 上述的方法在检测文本时只考虑了图像区域的 全局信息 ,没有考虑局部信息 ,一定程度上造成文本 检测的错误. 文中提出了一种基于 Homogeneity 的 文本检测方法 ,这种方法充分考虑了图像区域的局 部信息 ,反映了一个区域的一致性强度 ,能够更好地 反映文本区域的特征 ,可以更好地突出文本区域 , 适用于背景比较复杂的视频图像中文本检测. 实验 表明在 Homogeneity 空间进行特征提取优于用边 缘算子进行特征提取. © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net