第2期 张亮,等:基于镜头的鲁棒视频广告检测 ·85* 变的位置)都是相对集中地落在一个固定的区间内 检测.如图4所示,R.表示第m帧中的第1个区 的.由此依据FDm的统计特性,可以近似地利用 域 Rayleigh分布来描述: RIFD]=ED。 ED2 e2 (2 式中:O表示高斯噪声的方差,而且FDm>0.为了 估计式2)内的0,本文采用了计算复杂度较低的 中值估计算法,即有 2 (3) 2Nn(2) 式中:M是RFDm的中值,并有 J∫RfFD.JdFD.=lV2. 图4基于局部特征时变一致性的消隐镜头检测方法 (4) Fig.4 Sketch map of dissolve shot detection based on 图3表明了电视节目FDm的的实际分布和经估计 local coherent temporal change 得到的Rayleigh分布.从图中可以看出,估计得到 设V"表示第m帧中的第i个区域Rm,的平均 的Rayleigh分布可以较好地拟合实际分布. 灰度值.为了叙述方便,S”表示第m帧中的第i个 区域的灰度变化趋势.”表示在第m帧之前的相 应的第ⅰ个区域具有单调灰度变化模式的连续帧的 数目.N”表示在第m帧的所有区域的统计特性,即 属于区间[m,内的”的数目.基于局部特征时 变一致性的检测算法流程如下: 0.050.150.250.35 1)计算样本区域V的平均灰度值 FDw 2)初始化:T=0,S=+1 FD的实际分布 ---·估计得到的Raleigh分布 3)如式5)、6)更新第n帧中的每一个区域的 S"和T": Vm-Vm1≥0, 图3FDm的实际分布和估计得到的Rayleigh分布 1 V".ym1<0 (5) Fig.3 The real distribution and estimated Rayleigh distribution of FD 7”=11+L+S1S (6) 2 为了确定相邻的2帧是否发生切变,本文利用 4)计算N:: FDm的估计分布的置信区间来计算得到阈值te.因 N贤=#fT四T"∈[m,欣]} (7) 此,如果第i帧的FDm大于阈值tct,就认为在第i 式中:#表示属于区间[m,历了”的数目 帧发生切变 图5给出了在一段测试视频的实验结果.从中 1.2消隐镜头检测 可以看出,此段广告视频包含3段消隐镜头,分别位 除了切变镜头外,在广告制作手法中还往往采 于2950~2980帧,3320~3350帧和3390~ 用另外一种很常见的技巧:消隐镜头.尤其在化妆品 的广告中,消隐镜头更加普遍.消隐镜头是指前一个 3410帧内,并且和实际的广告视频段相吻合.在此 镜头的后几帧在灰度上逐渐变暗同时后一个镜头的 3段镜头内,N:值的变化趋势是先增加然后减小, 前几帧在灰度上逐渐变亮,类似于淡出、淡入,不过 这和普通节目内部的N”的变化趋势有明显的区 在消隐中的淡出与淡入在时间上有一定的重叠.和 别 切变镜头的检测比起来,消隐镜头的检测更加困难. 2基于SVM的镜头分类 为能准确地检测到消隐镜头,本文提出了基于 局部特征时变一致性的检测算法.对于消隐镜头,在 V.Vapnikls提出的支持向量机(support vec- 一定时间内连续的帧中,平均灰度值的变化是连续 tor machine,SVM)方法是建立在统计学习理论的 的,并且这种单调性的变化通常持续一段时间.因 VC维理论和结构风险最小原理基础上的,根据有 此,本文利用这种变化的累积值来实现消隐镜头的 限的样本信息在模型的复杂性和学习能力之间寻求 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net变的位置) 都是相对集中地落在一个固定的区间内 的. 由此依据 FDm 的统计特性 , 可以近似地利用 Rayleigh 分布来描述 : R[FD ] = FD 2 σ2 g exp - FD 2 2σ2 g . (2) 式中 :σg 表示高斯噪声的方差 ,而且 FDm > 0. 为了 估计式(2) 内的σg ,本文采用了计算复杂度较低的 中值估计算法 ,即有 σ^ g = M 2 2 ln (2) . (3) 式中 : M 是 R [FDm ]的中值 ,并有 ∫ M 0 R[FDm ]dFDm = 1/ 2. (4) 图 3 表明了电视节目 FDm 的的实际分布和经估计 得到的 Rayleigh 分布. 从图中可以看出 ,估计得到 的 Rayleigh 分布可以较好地拟合实际分布. 图 3 FDm 的实际分布和估计得到的 Rayleigh 分布 Fig. 3 The real distribution and estimated Rayleigh distribution of FDm 为了确定相邻的 2 帧是否发生切变 ,本文利用 FDm 的估计分布的置信区间来计算得到阈值 t cut . 因 此 ,如果第 i 帧的 FDm 大于阈值 t cut ,就认为在第 i 帧发生切变. 1. 2 消隐镜头检测 除了切变镜头外 ,在广告制作手法中还往往采 用另外一种很常见的技巧 :消隐镜头. 尤其在化妆品 的广告中 ,消隐镜头更加普遍. 消隐镜头是指前一个 镜头的后几帧在灰度上逐渐变暗同时后一个镜头的 前几帧在灰度上逐渐变亮 ,类似于淡出、淡入 ,不过 在消隐中的淡出与淡入在时间上有一定的重叠. 和 切变镜头的检测比起来 ,消隐镜头的检测更加困难. 为能准确地检测到消隐镜头 ,本文提出了基于 局部特征时变一致性的检测算法. 对于消隐镜头 ,在 一定时间内连续的帧中 ,平均灰度值的变化是连续 的 ,并且这种单调性的变化通常持续一段时间. 因 此 ,本文利用这种变化的累积值来实现消隐镜头的 检测. 如图 4 所示 , Rm , i 表示第 m 帧中的第 i 个区 域. 图 4 基于局部特征时变一致性的消隐镜头检测方法 Fig. 4 Sketch map of dissolve shot detection based on local coherent temporal change 设 V m i 表示第 m 帧中的第 i 个区域 R m , i的平均 灰度值. 为了叙述方便 , S m i 表示第 m 帧中的第 i 个 区域的灰度变化趋势. T m i 表示在第 m 帧之前的相 应的第 i 个区域具有单调灰度变化模式的连续帧的 数目. N m h 表示在第 m 帧的所有区域的统计特性 ,即 属于区间[ n1 , n2 ]内的 T m i 的数目. 基于局部特征时 变一致性的检测算法流程如下 : 1) 计算样本区域 V m i 的平均灰度值. 2) 初始化 : T 1 i = 0 , S 1 i = + 1. 3) 如式(5) 、(6) 更新第 n 帧中的每一个区域的 S m i 和 T m i : S m i = 1 V m i - V m- 1 i ≥0 , - 1 V m i - V m- 1 i < 0. (5) T m i = T m- 1 i + 1 + S m- 1 i ·S m i 2 . (6) 4) 计算 N m h : N m h = # { T m i T m i ∈[ n1 , n2 ]} . (7) 式中 : # 表示属于区间[ n1 , n2 ] T m i 的数目. 图 5 给出了在一段测试视频的实验结果. 从中 可以看出 ,此段广告视频包含 3 段消隐镜头 ,分别位 于 2 950~2 980 帧 , 3 320~3 350 帧和 3 390~ 3 410帧内 ,并且和实际的广告视频段相吻合. 在此 3 段镜头内 , N m h 值的变化趋势是先增加然后减小 , 这和普通节目内部的 N m h 的变化趋势有明显的区 别. 2 基于 SVM 的镜头分类 V. Vap nik [ 8 ] 提出的支持向量机 (support vec2 tor machine ,SVM) 方法是建立在统计学习理论的 VC 维理论和结构风险最小原理基础上的 ,根据有 限的样本信息在模型的复杂性和学习能力之间寻求 第 2 期 张 亮 ,等 :基于镜头的鲁棒视频广告检测 · 58 ·