·442 智能系统学报 第6卷 试视频的吸烟活动的检测识别,主要分3步来实现: 梯度方向直方图计算每个关键点的主方向,使兴趣 1)使用ST信息和外形-纯贝叶斯互信息最大化分 点的描述具有旋转不变性.值得注意的是,一个兴趣 类器(A-NBMM)对视频段的每一帧进行分类.如果 点可能存在多个主方向,这在实际使用中提高了局 判断出视频段中含1帧以上的吸烟图片,就将其视频 部描述器的鲁棒性。 段保留;否则,认为该视频段为“其他”类.通过这一步 4)生成特征点描述矢量:根据前面得到的兴趣 可以降低后续步骤分类对“其他”活动分类错误的概 点的位置、最优尺度以及主方向,将该图像块划分成 率.2)使用ST皿特征信息和运动纯贝叶斯互信息最 4×4的子块,每个子块量化成8个方向.因此,得到 大化分类器(M-NBMM)对提取的视频段进行分类. 一个128维的局部特征描述器,并将其归一化成2- 考虑到在测试样本的特征点数过少时进行分类会出 范数为1的矢量,量化后的局部描述器具有亮度不 现偶然性误差较大的情况和计算的分数相同不能判 变性. 断的情况,这里点数少于20个的视频段将不予以计 3.1.2STP特征 算,从而在这一步,将会分出“吸烟”、“其他”、“不能 本文把动作表示成一个时空目标,并且用一个 判断”这3类动作.3)针对第2步中出现的“不能判 时空兴趣点集(STPs)4]来描述它.与在二维图像 断”,根据前面使用SIFT信息和A-NBMM的分类结 中用到的SIFT特征不同,STP特征是对三维视频 果,统计吸烟帧数占视频段的比例,若大于50%,就将 中不变特征的扩展.提取完STP特征之后,可以用 这一段视频定义为“吸烟”,反之定义为“其他”.按照 以下2类特征来描述它们1:梯度直方图(histogram 以上算法完成对所有测试样本的识别并统计出电影 of oriented gradient,HOG)和光流直方图(histogram 中的抽烟活动 ofow,H0F).其中梯度直方图是一个72维的矢 量,描述的是外形特征;光流直方图是一个90维的 3 吸烟活动识别算法 矢量,描述的是局部运动特征.由于STP特征对于 3.1特征描述 三维视频来说是局部不变的,所以这种特征对于动 3.1.1SIFT特征 作变化相对鲁棒,而这种变化往往是由于动作的速 度、尺度、光照和衣服等引起的.图2中下面2幅图 SFT特征是图像的局部不变特征,它非常适合 为活动分析中基于视频序列提取的STP特征点, 对不同图像或场景中的同一目标进行匹配,具有很 3.2NBMM方法 高的鲁棒性.它对图像的光线亮度变化、尺度缩放以 纯贝叶斯互信息最大化(naive-Bayesian mutual 及旋转都能保持不变,对视角变化和噪声的出现也 information maximization,NBMM)的方法4]在活动 保持一定程度的稳定性,适用于海量数据库中进行 识别方面取得了比较好的效果.在本文系统中将采 快速的实时匹配,在目标识别中取得了良好的应用. 用此种方法结合各种特征来形成组合分类器 图2中上面2幅图为活动分析中基于视频帧提取的 本文用时空目标来表现动作,提取视频序列的 SIFT点. STP特征,用V={L,}表示一个视频序列,其中每一 帧L,由收集的STPs构成,那么L,={d:{.然后用 Q={d}表示一个视频段的STP,C={1,2,…,c, …,N}代表种类的标记集合 基于纯贝叶斯假设和每个STP间相互独立的 (a)SIFT特征 假设可以得到一个视频段Q与一个特定类别c∈C 的互信息为 M(C=c,Q)=∑eoS(d, 先假定各类别出现概率相等,也就是P(C=)=, (b)STIP特征 S(d,)可以由式(1)表示: 图2活动识别中的SFT和STP点 Fig.2 The SIFT and STIP points in action recognition S(d)log- (1) 提取SIFT特征步骤如下[s] (d,IC≠c(N-1) 1+ p(d。IC=c) 1)检测潜在兴趣点及其尺度:首先建立图像金 通过高斯核与最近邻近似得到其中的似然率如式(2). 字塔,然后利用高斯微分(difference-of-Gaussian, p(d21C≠c) DOG)识别对尺度和方向不变的潜在兴趣点, p(dI C=c) 2)检测兴趣点:对上述产生的潜在兴趣点,根 据稳定性度量选择稳定的兴趣点, Aep2a(1d-云2-1d-0} 3)赋予兴趣点主方向:利用兴趣点邻域像素的 (2)