正在加载图片...
第4期 吕国宁,等:视觉感知式场景文字检测定位方法 ·565. 1.2谱残差视觉显著性模型 谱残差视觉显著性算法[]是快速可靠且无需 先验知识的显著性算法,它分为3步:1)将彩色图 ESSEX ESSEX 像灰度化并进行适当缩放和预处理:2)对前一步产 SUMMER SCHOOL SUMMER SCHOOI IN DATA ANALYSIS IN DATA ANALYSIS 生的灰度图像傅里叶幅度对数谱进行卷积均值滤 4.311 4.311 波:3)从图像傅里叶幅度对数谱中减去上一步的均 值滤波结果,最终得到显著性图S。式(4)描述谱 (b)红色-绿色通道与蓝色一黄色通道原图 残差视觉显著性模型的求解 S=log(A(1))-h()log(A(1))(4) 式中:A(I)表示图像的傅里叶幅度谱,log(A(I)) 生阳变 表示图像的傅里叶幅度对数谱,h(I)表示均值 SUPRER SCHOOL 滤波。 NDANLSS 图3显示的是利用谱残差视觉显著性模型得到 4.3ff 的场景文字显著性图。上面一行图像是场景文字 的原图,下面一行图像是对应的谱残差显著性图, (c)=5 图像亮度代表显著性程度。谱残差视觉显著性算 法有效检测自然场景中包含文字的边缘丰富区域, 但同时也会因为环境中其他边缘丰富的元素产生 虚警率。 ESSEX ESSEX SUMMER SCHOOL SUMMER SCHOOL IN DATA ANALYSIS I时DATA ANALYSIS 4.31 431 (d)w=8 ESSEX ESSEX SUMMER SCHOOL SUMMER SCHOOL IN DATA ANALYSIS IN DATA ANALYSIS 4.311 431 (e)两个尺度结合 图3谱残差显著性效果图 Fig.3 Spectral residue saliency map 1.3显著性区域 以上两种显著性图的取值范围是介于0~1之 间,对二者计算显著性图,本质是进行二值化。因 此可以使用改进的大津法求取显著图的二值化阈 值T,,二值化阈值T,将显著图分为显著性区域与 非显著性区域。 1)首先采用大津法得到阈值t,然后在训练数 ()两个通道显著性图结合 据集中设定显著区域中文字召回率的阈值T,初始 图2颜色通道的显著性效果图 化系数α为1,以0.01为步长递减系数a,直到首次 Fig.2 Saliency map of color channel 显著区域中文字召回率R首次达到阈值T即停止,(b)红色-绿色通道与蓝色-黄色通道原图 (c)σ= 5 (d)σ= 8 (e)两个尺度结合 (f)两个通道显著性图结合 图 2 颜色通道的显著性效果图 Fig.2 Saliency map of color channel 1.2 谱残差视觉显著性模型 谱残差视觉显著性算法[7] 是快速可靠且无需 先验知识的显著性算法,它分为 3 步:1) 将彩色图 像灰度化并进行适当缩放和预处理;2)对前一步产 生的灰度图像傅里叶幅度对数谱进行卷积均值滤 波;3)从图像傅里叶幅度对数谱中减去上一步的均 值滤波结果,最终得到显著性图 S 。 式(4) 描述谱 残差视觉显著性模型的求解 S = log (A(I) ) - h(I) ∗log (A(I) ) (4) 式中: A(I) 表示图像的傅里叶幅度谱, log(A(I)) 表示图像的傅里叶幅度对数谱, h(I) 表示均值 滤波。 图 3 显示的是利用谱残差视觉显著性模型得到 的场景文字显著性图。 上面一行图像是场景文字 的原图,下面一行图像是对应的谱残差显著性图, 图像亮度代表显著性程度。 谱残差视觉显著性算 法有效检测自然场景中包含文字的边缘丰富区域, 但同时也会因为环境中其他边缘丰富的元素产生 虚警率。 图 3 谱残差显著性效果图 Fig.3 Spectral residue saliency map 1.3 显著性区域 以上两种显著性图的取值范围是介于 0 ~ 1 之 间,对二者计算显著性图,本质是进行二值化。 因 此可以使用改进的大津法求取显著图的二值化阈 值 T′s ,二值化阈值 T′s 将显著图分为显著性区域与 非显著性区域。 1)首先采用大津法得到阈值 t,然后在训练数 据集中设定显著区域中文字召回率的阈值 TR ,初始 化系数 α 为 1,以 0.01 为步长递减系数 α ,直到首次 显著区域中文字召回率 R 首次达到阈值 TR 即停止, 第 4 期 吕国宁,等:视觉感知式场景文字检测定位方法 ·565·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有