窗口的方法因为需要遍历图像各个尺度，故速度较慢，但抗干扰能力稍强于基于连

正在加载图片...

.564. 智能系统学报第12卷窗口的方法因为需要遍历图像各个尺度，故速度较 1.1颜色通道的对比度视觉显著性模型慢，但抗干扰能力稍强于基于连通域的方法：基于颜色通道的对比度视觉显著性模型是建立在连通域的方法速度较快，但容易受到复杂背景干扰。以上算法各有利弊，但都存在复杂背景干扰造 Opponent Color space上。式(1)中L是Opponent 成定位效果不佳的问题，并且两类性能远不如人类 Color Space中的亮度分量，RG是Opponent Color 自身。本文思路来源于文献[6]。针对该问题，本 Space中红色-绿色分量，BY是Opponent Color 文尝试参照人类视觉感知机制设计算法。人类视 Space中蓝色-黄色分量。觉感知机制按照如下进行：首先进行快速简单的并行预注意过程，此过程能够快速获得显著性目标， L=5+g+b 3 消除复杂背景的影响：然后完成一个较慢的复杂的串行注意过程，有意识地剔除无效显著性目标，突 r-g RG= (1) 出感兴趣的显著性目标。 max(r,g,b) 参考以上两个步骤，本文方法分为3个步骤。 BY= b-min(r,g) 首先，本文方法采用颜色通道的对比度显著性算法 max(r,g,b) 与谱残差显著性算法获得显著性区域：然后，基于式中：「、g与b代表彩色图像的红色、绿色与蓝色显著性区域运用单极性笔画宽度变换获得文字候选区域：最后，根据文字候选区域自身信息与相互分量。之间信息，利用图模型筛选得到文字区域。第一个在以上三通道的基础上，针对每一个通道计算步骤对应于人类的快速简单的并行预注意过程，后对比度图。对比度图计算方法如式(2)所示是以滑两个步骤相当于较慢的复杂的串行注意过程。动窗口的方式遍历颜色通道图中每一像素，计算当本文创新点在于利用颜色通道的对比度显著性与谱残差显著性获得显著性区域以减少后续算法的虚警前像素与周围邻域像素均值的差的绝对值作为相率，并根据显著性算法设计单极性笔画宽度变换。应像素的对比度值。式(2)中C(i,)表示当前颜色通道在位置(i,j)的对比度值，I(i,)是该颜色通 1 视觉显著性算法本节结合两种显著性模型获得显著性区域，颜色道当前位置的强度值，I(i,)代表该颜色通道当前通道的对比度视觉显著性模型侧重基于颜色的对比度位置的邻域强度均值。同时，为了增加算法普适较大的区域，而谱残差显著性模型则偏重于边缘丰富性，需要考虑到滑动窗口尺寸问题。的区域。这两种偏好均符合场景文字的对比度突出和边缘丰富的特点，可以较好互补完成文字显著性区域 C(i,j)=abs(I(i,j)-I(i,j)) (2) 检测。视觉显著性算法流程图如图1。 ws=(1/2")×min(w,h) (3) 式中：σ=[45678]是滑动窗口的尺度因子，0 输人图像与h为图像的宽度与高度。最后，将不同尺寸的滑动窗口下得到的对比度颜色通道的对比谱残差显若图进行线性叠加并进行归一化得到颜色通道的显度显著性计算性计算著性图。本节选取了红色-绿色通道与蓝色-黄色颜色通道的对比谱残差显著性区通道进行对比度显著性计算，并逐像素对二者取几度显著性区域域进行单极性进行单极性SWT SWT 何平均与高斯滤波，如图2。图模型场景文宁候选区域验证文字行聚合 ESSEX 巧 SUMMER SCHOOL IN DATA ANALYSIS 场景文字检测 4311 定位完成图1算法流程图 Fig.1 Algorithm flow chart (a)原图窗口的方法因为需要遍历图像各个尺度，故速度较慢，但抗干扰能力稍强于基于连通域的方法；基于连通域的方法速度较快，但容易受到复杂背景干扰。以上算法各有利弊，但都存在复杂背景干扰造成定位效果不佳的问题，并且两类性能远不如人类自身。本文思路来源于文献［６］。针对该问题，本文尝试参照人类视觉感知机制设计算法。人类视觉感知机制按照如下进行：首先进行快速简单的并行预注意过程，此过程能够快速获得显著性目标，消除复杂背景的影响；然后完成一个较慢的复杂的串行注意过程，有意识地剔除无效显著性目标，突出感兴趣的显著性目标。参考以上两个步骤，本文方法分为３个步骤。首先，本文方法采用颜色通道的对比度显著性算法与谱残差显著性算法获得显著性区域；然后，基于显著性区域运用单极性笔画宽度变换获得文字候选区域；最后，根据文字候选区域自身信息与相互之间信息，利用图模型筛选得到文字区域。第一个步骤对应于人类的快速简单的并行预注意过程，后两个步骤相当于较慢的复杂的串行注意过程。本文创新点在于利用颜色通道的对比度显著性与谱残差显著性获得显著性区域以减少后续算法的虚警率，并根据显著性算法设计单极性笔画宽度变换。１视觉显著性算法本节结合两种显著性模型获得显著性区域，颜色通道的对比度视觉显著性模型侧重基于颜色的对比度较大的区域，而谱残差显著性模型则偏重于边缘丰富的区域。这两种偏好均符合场景文字的对比度突出和边缘丰富的特点，可以较好互补完成文字显著性区域检测。视觉显著性算法流程图如图１。图１算法流程图Ｆｉｇ．１Ａｌｇｏｒｉｔｈｍｆｌｏｗｃｈａｒｔ１．１颜色通道的对比度视觉显著性模型颜色通道的对比度视觉显著性模型是建立在ＯｐｐｏｎｅｎｔＣｏｌｏｒｓｐａｃｅ上。式（１）中Ｌ是ＯｐｐｏｎｅｎｔＣｏｌｏｒＳｐａｃｅ中的亮度分量，ＲＧ是ＯｐｐｏｎｅｎｔＣｏｌｏｒＳｐａｃｅ中红色－绿色分量，ＢＹ是ＯｐｐｏｎｅｎｔＣｏｌｏｒＳｐａｃｅ中蓝色－黄色分量。Ｌ＝ｒ＋ｇ＋ｂ３ＲＧ＝ｒ－ｇｍａｘ（ｒ，ｇ，ｂ）ＢＹ＝ｂ－ｍｉｎ（ｒ，ｇ）ｍａｘ（ｒ，ｇ，ｂ）（１）式中：ｒ、ｇ与ｂ代表彩色图像的红色、绿色与蓝色分量。在以上三通道的基础上，针对每一个通道计算对比度图。对比度图计算方法如式（２）所示是以滑动窗口的方式遍历颜色通道图中每一像素，计算当前像素与周围邻域像素均值的差的绝对值作为相应像素的对比度值。式（２）中Ｃ（ｉ，ｊ）表示当前颜色通道在位置（ｉ，ｊ）的对比度值，Ｉ（ｉ，ｊ）是该颜色通道当前位置的强度值，Ｉ－ (ｉ，ｊ) 代表该颜色通道当前位置的邻域强度均值。同时，为了增加算法普适性，需要考虑到滑动窗口尺寸问题。Ｃ（ｉ，ｊ）＝ａｂｓ（Ｉ（ｉ，ｊ）－Ｉ－（ｉ，ｊ））（２）ｗｓ＝（１／２ σ ） × ｍｉｎ（ｗ，ｈ）（３）式中： σ ＝ [４５６７８] 是滑动窗口的尺度因子，ｗ与ｈ为图像的宽度与高度。最后，将不同尺寸的滑动窗口下得到的对比度图进行线性叠加并进行归一化得到颜色通道的显著性图。本节选取了红色－绿色通道与蓝色－黄色通道进行对比度显著性计算，并逐像素对二者取几何平均与高斯滤波，如图２。（ａ）原图 ·５６４· 智能系统学报第１２卷

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】视觉感知式场景文字检测定位方法