86- 智能系统学报 第2卷 头中间,那么这个镜头极有可能是被错分的,即它很 18 可能是一个广告镜头】 1 假设shot:(1≤≤W代表第i镜头.C代表镜 10 头的当前标识,shot,它用来确定这个镜头是否为广 告镜头.n表示镜头的数目.滑动窗口累积算法如下 所示 2 初始化C: 29 30313233 3435×10 +1如果第i个镜头属于广告镜头, 帧序列n C= ·1其他 (10) 图5消隐镜头的统计图 1)利用包含5个镜头的滑动窗口来更新C.假 Fig.5 Effectiveness of the statistical values N for characterizing the dissolve cuts 设W={ww,=1,f·2到≤+2}表示一个滑动 最佳折衷以期获得最好的推广能力.支持向量机理 窗口.C(i-2对+2)更新算法如下: 2 论因其坚实的理论基础和诸多良好特性在近年获得 C+1 if C+wk≥3, 了广泛的关注.其原理是首先通过非线性变换将输 C= (11) 入空间变换到一个高维空间,然后在这个新空间中 、G.1else. 求取最优线性分类面.经过优化求解,该最优分类超 2)通过判断C来确定是否为广告镜头.如果 平面由式(8)给出 shot,等于+1,镜头shot,就认为是广告镜头.否 则,shot,就是普通节目镜头: S(x划=ya,(x)·r划+b (8) +1ifC,>0 shot,= (12 式中:()是一个非线性的映射函数,X={x,∈ 0 else. R}-1.m和y,={-1,1}分别表示训练集合和相应 3)如果在一次循环中存在多于2个镜头从广告 的类标识,b是偏移量.其中任何一个对应于一个非 镜头转变成普通节目镜头,或者相反的情况出现,则 零值a的样本x,被称为支持向量.一般来说,采用 回到第一步从新开始.如果小于2个,则算法结束 不同的核函数将对最终求得的最优分类超平面产生 为了得到完整的广告视频段,不同的广告镜头 影响,在本文中采用高斯核函数K(x,以=(x)· 应该合并成数个相应的广告视频段.合并算法应该 遵循下列原则: ry以=exp d 因此,对于一个测试样 1)如果多于5个广告镜头是连续的,那么它们应 本,其最终判别输出为 该合并成一个广告视频段.如果小于5个,则定位距 +1ifS(x)>0, 离最近的广告段.如果在它们和这个广告段之间存在 L(x=8(S(x)= (9) -1ifS(x<0. 少于3个镜头,则它们应该并入这个广告视频段 式中:()为一指示函数 2)如果在两段连续的广告视频段之间存在少于 为了实现有效的镜头分类,提取了一些鲁棒性 3个的镜头,那么这2个广告段和它们中间的这些 的包括镜头切换频率、帧差的平均值和方差以及帧 镜头应该合并成一个完整的广告视频段 的主颜色空间占有率等在内的特征来对镜头进行描 3)重复上面的合并步骤,直到没有新的广告视 述.另外,在支持向量机的学习训练中,训练集由 频段出现 800个镜头组成,其中包括380个广告镜头 通过上述过程的后处理,就可以消除偶然的分 类错误并可以得到广告视频」 3广告镜头的重定界及合并 4 通过SVM分类,不可避免地会出现错分的镜 实验结果 头.为此本文还采用包括基于广告时间连续性的滑 在实验中,选取了国内不同电视台的30段普通 动窗口累积算法来精确定位广告边界以及合并不同 电视节目剪辑.首先,在这些电视节目上进行镜头检 的广告视频镜头的后处理方案,而得到广告序列.由 测的实验.实验结果包括本文的RBFD镜头检测算 于广告镜头内容上都是连续的而且它们成组地出 法和文献[7]中的检测算法的结果.图6所示为FD 现,因此如果一个非广告镜头存在于连续的广告镜 的计算分布图.其中图6(a)图所示为文献[7]镜头 1994-2008 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net图 5 消隐镜头的统计图 Fig. 5 Effectiveness of the statistical values N m h for characterizing the dissolve cuts 最佳折衷以期获得最好的推广能力. 支持向量机理 论因其坚实的理论基础和诸多良好特性在近年获得 了广泛的关注. 其原理是首先通过非线性变换将输 入空间变换到一个高维空间 ,然后在这个新空间中 求取最优线性分类面. 经过优化求解 ,该最优分类超 平面由式(8) 给出 : S ( x) = ∑ n i = 1 yαi i<( xi) ·<( x) + b. (8) 式中 : <( ·) 是一个非线性的映射函数 , X = { xi ∈ R d } i = 1 , …, n和 y i = { - 1 ,1}分别表示训练集合和相应 的类标识 , b是偏移量. 其中任何一个对应于一个非 零值αi 的样本 x i 被称为支持向量. 一般来说 ,采用 不同的核函数将对最终求得的最优分类超平面产生 影响 ,在本文中采用高斯核函数 K( x , y) = <( x) · <( y) = exp - ‖x - y ‖2 σ2 . 因此 ,对于一个测试样 本 ,其最终判别输出为 L ( x) =θ( S ( x) = + 1 if S ( x) > 0 , - 1 if S ( x) < 0. (9) 式中 :θ( ·) 为一指示函数. 为了实现有效的镜头分类 ,提取了一些鲁棒性 的包括镜头切换频率、帧差的平均值和方差以及帧 的主颜色空间占有率等在内的特征来对镜头进行描 述. 另外 ,在支持向量机的学习训练中 ,训练集由 800 个镜头组成 ,其中包括 380 个广告镜头. 3 广告镜头的重定界及合并 通过 SVM 分类 ,不可避免地会出现错分的镜 头. 为此本文还采用包括基于广告时间连续性的滑 动窗口累积算法来精确定位广告边界以及合并不同 的广告视频镜头的后处理方案 ,而得到广告序列. 由 于广告镜头内容上都是连续的而且它们成组地出 现 ,因此如果一个非广告镜头存在于连续的广告镜 头中间 ,那么这个镜头极有可能是被错分的 ,即它很 可能是一个广告镜头. 假设 shoti (1 ≤i ≤n) 代表第 i 镜头. Ci 代表镜 头的当前标识 ,shoti 它用来确定这个镜头是否为广 告镜头. n 表示镜头的数目. 滑动窗口累积算法如下 所示 : 初始化 Ci : Ci = + 1 如果第 i 个镜头属于广告镜头 , - 1 其他. (10) 1) 利用包含 5 个镜头的滑动窗口来更新 Ci . 假 设 W = { wj | wj = 1 ,if - 2 ≤j ≤+ 2}表示一个滑动 窗口. Cj ( i - 2 ≤j ≤i + 2) 更新算法如下 : Cj = Cj + 1 if ∑ 2 k = - 2 Ci+kw k ≥3 , Cj - 1 else. (11) 2) 通过判断 Cj 来确定是否为广告镜头. 如果 shoti 等于 + 1 , 镜头 shoti 就认为是广告镜头. 否 则 ,shoti 就是普通节目镜头 : shoti = + 1 if Ci > 0 , 0 else. (12) 3) 如果在一次循环中存在多于 2 个镜头从广告 镜头转变成普通节目镜头 ,或者相反的情况出现 ,则 回到第一步从新开始. 如果小于 2 个 ,则算法结束. 为了得到完整的广告视频段 ,不同的广告镜头 应该合并成数个相应的广告视频段. 合并算法应该 遵循下列原则 : 1)如果多于 5 个广告镜头是连续的 ,那么它们应 该合并成一个广告视频段. 如果小于 5 个 ,则定位距 离最近的广告段. 如果在它们和这个广告段之间存在 少于 3 个镜头 ,则它们应该并入这个广告视频段. 2) 如果在两段连续的广告视频段之间存在少于 3 个的镜头 ,那么这 2 个广告段和它们中间的这些 镜头应该合并成一个完整的广告视频段. 3) 重复上面的合并步骤 ,直到没有新的广告视 频段出现. 通过上述过程的后处理 ,就可以消除偶然的分 类错误并可以得到广告视频. 4 实验结果 在实验中 ,选取了国内不同电视台的 30 段普通 电视节目剪辑. 首先 ,在这些电视节目上进行镜头检 测的实验. 实验结果包括本文的 RBFID 镜头检测算 法和文献[ 7 ]中的检测算法的结果. 图 6 所示为 FD 的计算分布图. 其中图 6 (a) 图所示为文献[ 7 ]镜头 · 68 · 智 能 系 统 学 报 第 2 卷