第 2 卷第 1 期智能系统学报 Vol. 2 №. 1 20

点击下载：【学术论文 - 自然语言处理与理解】一种基于Homogeneity的文本检测新方法

正在加载图片...

第2卷第1期智能系统学报 Vol.2№1 2007年2月 CAAI Transactions on Intelligent Systems Fcb.2007 一种基于Ho mo geneity的文本检测新方法黄剑华唐降龙，刘家锋，徐莉莉 (哈尔滨工业大学计算机科学与技术学院，黑龙江哈尔滨150001) 摘要：视频图像中的文本包含了丰富的语义层次上的内容描述信息，为基于语义的图像检索提供重要的索引信息资源.提出了一种基于Homogeneity和支持向量机(support vector machine)的视频图像中文本检测方法，首先将图像由空间域映射到Homogeneity域中，然后对映射到Homogeneity空间中的图像进行特征提取，利用SVM判别文本区域.实验表明此文本检测方法优于用基于边缘特征的文本检测方法关键词：文本检测：特征提取；Homo geneity,支持向量机中图分类号：TP391.2文献标识码：A文章编号：16734785(2007)01-006905 A new method for text detection based on Homogeneity HUAN G Jianhua,TAN G Xiang-long ,L IU Jia-feng,XU Li-li (School of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China) Abstract:Text data presented in images and video contains useful and important semantic information for automatic indexing.In this paper,a method for text detection based on homogeneity and SVM is pro- posed.First an original image is mapped from space domain to homogeneity domain,and then text region property is confirmed by SVM trained to extract property feature in homogeneity domain.Comparison with the text detection method based on edge features shows that the proposed method has a better accura- cy Key words :text detection;feature extraction;Homogeneity;SVM 随着数字化存储技术的发展和计算机性能的不本检测方法4，，使用边缘和边缘密度来找出文本断提高，数字视频在各个领域的应用越来越广泛，能区域的位置.在视频片断处理中除使用单帧图像外够从大量的视频资料中找到需要的信息成为人们迫还可以利用多幅图像来检测、提取和增强文本区切的要求.图像和视频中的文本包含许多非常重要域6].也有部分研究者将颜色信息和边缘或者纹理的信息，如街道名称、商店名称、路标、交通标示、字特征结合在一起使用，不在灰度图像上而是在彩色幕等，这些信息是图像和视频资料自动注释、索引、图像上提取边缘特征刀.还有算法直接在压缩的图压缩等方面重要的依据像中进行文本检测劉从视频图像处理和文档分析的研究角度出发，上述的方法在检测文本时只考虑了图像区域的目前己经提出了一些文本提取算法，这些算法主要全局信息，没有考虑局部信息，一定程度上造成文本是从感性的特征出发，利用颜色、亮度、形状纹理等检测的错误.文中提出了一种基于Homogeneity的属性来提取文本信息，总结起来可以归纳为3类：1) 文本检测方法，这种方法充分考虑了图像区域的局基于连通区域的文本检测方法山，这一方法假定字部信息，反映了一个区域的一致性强度，能够更好地符的颜色相近且与背景可分，2)基于纹理特征的文反映文本区域的特征，可以更好地突出文本区域，本检测方法2引，通过识别图像的纹理特征，如角点适用于背景比较复杂的视频图像中文本检测.实验特征，来区分文本区域与背景：3)基于边缘特征的文表明在Homogeneity空间进行特征提取优于用边缘算子进行特征提取.」收稿日期：200603-07. 基金项目：国家自然科学基金资助项目(60573071) 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved http://www.cnki.net第 2 卷第 1 期智能系统学报 Vol. 2 №. 1 2007 年 2 月 CAA I Transactions on Intelligent Systems Feb. 2007 一种基于 Homogeneity 的文本检测新方法黄剑华 ,唐降龙 ,刘家锋 ,徐莉莉 (哈尔滨工业大学计算机科学与技术学院 ,黑龙江哈尔滨 150001) 摘要 :视频图像中的文本包含了丰富的语义层次上的内容描述信息 ,为基于语义的图像检索提供重要的索引信息资源. 提出了一种基于 Homogeneity 和支持向量机(support vector machine) 的视频图像中文本检测方法 ,首先将图像由空间域映射到 Homogeneity 域中 ,然后对映射到 Homogeneity 空间中的图像进行特征提取 ,利用 SVM 判别文本区域. 实验表明此文本检测方法优于用基于边缘特征的文本检测方法. 关键词 :文本检测 ;特征提取 ; Homogeneity ;支持向量机中图分类号 : TP391. 2 文献标识码 :A 文章编号 :167324785 (2007) 0120069205 A new method for text detection based on Homogeneity HUAN G Jian2hua , TAN G Xiang2long ,L IU Jia2feng ,XU Li2li (School of Computer Science and Technology , Harbin Institute of Technology , Harbin 150001 , China) Abstract :Text data presented in images and video contains usef ul and important semantic information for automatic indexing. In t his paper , a method for text detection based on homogeneity and SVM is pro2 posed. First an original image is mapped from space domain to homogeneity domain , and then text region property is confirmed by SVM trained to extract property feature in homogeneity domain. Comparison with the text detection method based on edge features shows t hat t he proposed method has a better accura2 cy. Keywords :text detection ;feat ure extraction ; Homogeneity ;SVM 收稿日期 :2006203207. 基金项目 :国家自然科学基金资助项目(60573071) . 随着数字化存储技术的发展和计算机性能的不断提高 ,数字视频在各个领域的应用越来越广泛 ,能够从大量的视频资料中找到需要的信息成为人们迫切的要求. 图像和视频中的文本包含许多非常重要的信息 ,如街道名称、商店名称、路标、交通标示、字幕等 ,这些信息是图像和视频资料自动注释、索引、压缩等方面重要的依据. 从视频图像处理和文档分析的研究角度出发 , 目前已经提出了一些文本提取算法 ,这些算法主要是从感性的特征出发 ,利用颜色、亮度、形状、纹理等属性来提取文本信息 ,总结起来可以归纳为 3 类 :1) 基于连通区域的文本检测方法[ 1 ] ,这一方法假定字符的颜色相近且与背景可分 ;2) 基于纹理特征的文本检测方法[2 - 3 ] ,通过识别图像的纹理特征 ,如角点特征 ,来区分文本区域与背景 ;3) 基于边缘特征的文本检测方法[4 - 5 ] ,使用边缘和边缘密度来找出文本区域的位置. 在视频片断处理中除使用单帧图像外还可以利用多幅图像来检测、提取和增强文本区域[6 ] . 也有部分研究者将颜色信息和边缘或者纹理特征结合在一起使用 ,不在灰度图像上而是在彩色图像上提取边缘特征[7 ] . 还有算法直接在压缩的图像中进行文本检测[ 8 ] . 上述的方法在检测文本时只考虑了图像区域的全局信息 ,没有考虑局部信息 ,一定程度上造成文本检测的错误. 文中提出了一种基于 Homogeneity 的文本检测方法 ,这种方法充分考虑了图像区域的局部信息 ,反映了一个区域的一致性强度 ,能够更好地反映文本区域的特征 ,可以更好地突出文本区域 , 适用于背景比较复杂的视频图像中文本检测. 实验表明在 Homogeneity 空间进行特征提取优于用边缘算子进行特征提取. © 1994-2008 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net

向下翻页>>

点击下载：【学术论文 - 自然语言处理与理解】一种基于Homogeneity的文本检测新方法