第5期 叶果,等:电影中吸烟活动识别 ·443 式中:A=T T-1 .下+={V}代表c类的正训练样 本,V,∈T+是c类样本的一个视频段,这里将正训 练样本的STPs数据表示为T+={d,};同样,负样 本可以表示为T,其包含所有的负STIPs, 因此,对于每一个与c类相关的STP,这里调整 其分数为 S(d)= log1+Ae-o四J(N-1) (a)训练样本 (凸测试样本 式中:r(d)=‖d-dmI2-‖d-d‖2,并且 图3实验中使用的训练样本与测试样本 “,(d)2立是d周围训练样本的纯度 Fig.3 Examples of training samples and testing sam- ples in our experiments 最后,本文可以通过计算每一视频段中STIP或 4.3实验结果及分析 者SIFT点的得分来判断其属于哪一类, 本文实验中参数为经验参数入=1,σ=2.6,可 以达到最优的实验效果,分别使用文献[4-5]提供的 4 实验结果及分析 方法来提取STP特征和SFT特征. 本文使用文献[1,15]中提供的视频段以及在 使用M-NBMIM方法进行分类实验,其结果如 《风声》等电影中截取的吸烟片段,这些活动就出现 表1所示.可以看出,只使用STP特征,系统的识别 在不同场景,被不同的人表现出来,并且从不同的角 率并不高.原因在于ST亚P不包含静态外形信息,所 度被拍摄记录.然后分别提取其视频段的STP和每 以“衔烟”这样的活动STIP点较少,或者没有特征 一帧的SFT特征点。 点的动作不能判断,并且会有较多的“其他”类被误 4.1训练数据 判为“吸烟”类,从而总体识别率不高 对于“吸烟”活动,采用的《风声》、《热血高校》 表1基于M-NBMIM的实验结果 《革命之路》电影中的吸烟片段作为训练样本,共110 Table 1 The results based on M-NBMIM 个小视频段.然后提取其ST亚P点特征,共89908个点, 标记 实验结果 同时,为避免大量重复的特征带来的计算浪费,每隔 类别 吸烟 其他 点少于20正确率/% 25帧提取其SFT特征,共37687个点. 吸烟 24 11 7 57.1 对于“其他”活动,采用《阿甘正传》、《蝴蝶效 其他 8 34 0 81.0 应》等电影中的片段,包含站立、坐下、握手、拥抱、 下面将按照本文提出的纯贝叶斯互信息最大化 坐起、打电话、走出车、接吻等多种主要动作以及其 组合分类器进行分类.先用SFT信息找出不含吸烟 他杂乱动作☐.使用了12个大视频片段,使提取点 片段的视频段,将其定义为“其他”.然后对剩下的 数相接近,以避免训练样本不均匀带来的影响,共提 视频段使用STP信息进行初步分类.由于吸烟这个 取了86810个STP点,以及38326个SIFT特征点. 动作的时间短暂性和拥有大量“衔烟”这样的静态 4.2测试数据 行为,因此出现了许多点数过少的情况.这种情况用 对于测试数据,使用电影《咖啡和烟》中的吸烟 于计算会导致大量偶然因素,使得结果不能真实稳 片段]以及《低俗小说》、《火星任务》等电影的非 定,所以实验中直接将此种情况提取出来,不使用 吸烟活动片段.由于电影《咖啡和烟》按场景与主 STP点计算分类.然后再使用点数少于20的视频 题分为了11个片段,相当于从11部电影中提取数 段包含的所有帧的SIFT特征进行计算,得到最终分 据,所以就只在这些数据中进行实验.测试数据共 类结果,结果如表2所示, 84个视频段,包含42个吸烟样本和42个其他活动 表2基于提出的组合分类器的实验结果 样本,分别提取其每一帧的SFT特征点和视频段的 Table 2 The results based on combined classifier STP特征. 实验结果 这些训练数据和测试数据使用的电影不相同, 标记 类别 所以均没有主题和背景上的重叠.训练与测试样本 吸烟 其他 正确率/% 示例如图3所示,图中上2行对应的为“吸烟”动 吸烟 29 13 69.0 作,下2行对应的为“非吸烟”动作,即“其他”类 其他 5 37 88.1 详细视频数据见网址www.uestcrobot.net/smokings. 从表2结果可以看出,在使用了ST特征后, 在第1步中,能够将“其他”这类动作的识别错误率