正在加载图片...
.564. 智能系统学报 第12卷 窗口的方法因为需要遍历图像各个尺度,故速度较 1.1颜色通道的对比度视觉显著性模型 慢,但抗干扰能力稍强于基于连通域的方法:基于 颜色通道的对比度视觉显著性模型是建立在 连通域的方法速度较快,但容易受到复杂背景干扰。 以上算法各有利弊,但都存在复杂背景干扰造 Opponent Color space上。式(1)中L是Opponent 成定位效果不佳的问题,并且两类性能远不如人类 Color Space中的亮度分量,RG是Opponent Color 自身。本文思路来源于文献[6]。针对该问题,本 Space中红色-绿色分量,BY是Opponent Color 文尝试参照人类视觉感知机制设计算法。人类视 Space中蓝色-黄色分量。 觉感知机制按照如下进行:首先进行快速简单的并 行预注意过程,此过程能够快速获得显著性目标, L=5+g+b 3 消除复杂背景的影响:然后完成一个较慢的复杂的 串行注意过程,有意识地剔除无效显著性目标,突 r-g RG= (1) 出感兴趣的显著性目标。 max(r,g,b) 参考以上两个步骤,本文方法分为3个步骤。 BY= b-min(r,g) 首先,本文方法采用颜色通道的对比度显著性算法 max(r,g,b) 与谱残差显著性算法获得显著性区域:然后,基于 式中:「、g与b代表彩色图像的红色、绿色与蓝色 显著性区域运用单极性笔画宽度变换获得文字候 选区域:最后,根据文字候选区域自身信息与相互 分量。 之间信息,利用图模型筛选得到文字区域。第一个 在以上三通道的基础上,针对每一个通道计算 步骤对应于人类的快速简单的并行预注意过程,后 对比度图。对比度图计算方法如式(2)所示是以滑 两个步骤相当于较慢的复杂的串行注意过程。 动窗口的方式遍历颜色通道图中每一像素,计算当 本文创新点在于利用颜色通道的对比度显著性与 谱残差显著性获得显著性区域以减少后续算法的虚警 前像素与周围邻域像素均值的差的绝对值作为相 率,并根据显著性算法设计单极性笔画宽度变换。 应像素的对比度值。式(2)中C(i,)表示当前颜 色通道在位置(i,j)的对比度值,I(i,)是该颜色通 1 视觉显著性算法 本节结合两种显著性模型获得显著性区域,颜色 道当前位置的强度值,I(i,)代表该颜色通道当前 通道的对比度视觉显著性模型侧重基于颜色的对比度 位置的邻域强度均值。同时,为了增加算法普适 较大的区域,而谱残差显著性模型则偏重于边缘丰富 性,需要考虑到滑动窗口尺寸问题。 的区域。这两种偏好均符合场景文字的对比度突出和 边缘丰富的特点,可以较好互补完成文字显著性区域 C(i,j)=abs(I(i,j)-I(i,j)) (2) 检测。视觉显著性算法流程图如图1。 ws=(1/2")×min(w,h) (3) 式中:σ=[45678]是滑动窗口的尺度因子,0 输人图像 与h为图像的宽度与高度。 最后,将不同尺寸的滑动窗口下得到的对比度 颜色通道的对比 谱残差显若 图进行线性叠加并进行归一化得到颜色通道的显 度显著性计算 性计算 著性图。本节选取了红色-绿色通道与蓝色-黄色 颜色通道的对比 谱残差显著性区 通道进行对比度显著性计算,并逐像素对二者取几 度显著性区域 域进行单极性 进行单极性SWT SWT 何平均与高斯滤波,如图2。 图模型场景文宁 候选区域验证 文字行聚合 ESSEX 巧 SUMMER SCHOOL IN DATA ANALYSIS 场景文字检测 4311 定位完成 图1算法流程图 Fig.1 Algorithm flow chart (a)原图窗口的方法因为需要遍历图像各个尺度,故速度较 慢,但抗干扰能力稍强于基于连通域的方法;基于 连通域的方法速度较快,但容易受到复杂背景干扰。 以上算法各有利弊,但都存在复杂背景干扰造 成定位效果不佳的问题,并且两类性能远不如人类 自身。 本文思路来源于文献[6]。 针对该问题,本 文尝试参照人类视觉感知机制设计算法。 人类视 觉感知机制按照如下进行:首先进行快速简单的并 行预注意过程,此过程能够快速获得显著性目标, 消除复杂背景的影响;然后完成一个较慢的复杂的 串行注意过程,有意识地剔除无效显著性目标,突 出感兴趣的显著性目标。 参考以上两个步骤,本文方法分为 3 个步骤。 首先,本文方法采用颜色通道的对比度显著性算法 与谱残差显著性算法获得显著性区域;然后,基于 显著性区域运用单极性笔画宽度变换获得文字候 选区域;最后,根据文字候选区域自身信息与相互 之间信息,利用图模型筛选得到文字区域。 第一个 步骤对应于人类的快速简单的并行预注意过程,后 两个步骤相当于较慢的复杂的串行注意过程。 本文创新点在于利用颜色通道的对比度显著性与 谱残差显著性获得显著性区域以减少后续算法的虚警 率,并根据显著性算法设计单极性笔画宽度变换。 1 视觉显著性算法 本节结合两种显著性模型获得显著性区域,颜色 通道的对比度视觉显著性模型侧重基于颜色的对比度 较大的区域,而谱残差显著性模型则偏重于边缘丰富 的区域。 这两种偏好均符合场景文字的对比度突出和 边缘丰富的特点,可以较好互补完成文字显著性区域 检测。 视觉显著性算法流程图如图 1。 图 1 算法流程图 Fig.1 Algorithm flow chart 1.1 颜色通道的对比度视觉显著性模型 颜色通道的对比度视觉显著性模型是建立在 Opponent Color space 上。 式 ( 1) 中 L 是 Opponent Color Space 中的亮度分量, RG 是 Opponent Color Space 中 红 色 - 绿 色 分 量, BY 是 Opponent Color Space 中蓝色-黄色分量。 L = r + g + b 3 RG = r - g max(r,g,b) BY = b - min(r,g) max(r,g,b) (1) 式中:r、g 与 b 代表彩色图像的红色、绿色与蓝色 分量。 在以上三通道的基础上,针对每一个通道计算 对比度图。 对比度图计算方法如式(2)所示是以滑 动窗口的方式遍历颜色通道图中每一像素,计算当 前像素与周围邻域像素均值的差的绝对值作为相 应像素的对比度值。 式(2)中 C( i, j) 表示当前颜 色通道在位置(i, j)的对比度值,I(i,j)是该颜色通 道当前位置的强度值, I - (i,j) 代表该颜色通道当前 位置的邻域强度均值。 同时,为了增加算法普适 性,需要考虑到滑动窗口尺寸问题。 C(i,j) = abs(I(i,j) - I - (i,j)) (2) ws = (1 / 2 σ ) × min(w,h) (3) 式中: σ = [4 5 6 7 8] 是 滑动窗口的尺度因子,w 与 h 为图像的宽度与高度。 最后,将不同尺寸的滑动窗口下得到的对比度 图进行线性叠加并进行归一化得到颜色通道的显 著性图。 本节选取了红色-绿色通道与蓝色-黄色 通道进行对比度显著性计算,并逐像素对二者取几 何平均与高斯滤波,如图 2。 (a)原图 ·564· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有