机器学习：累积方向-数量级光流梯度直方图的人体动作识别

团购合买资源类别：文库，文档格式：PDF，文档页数：5，文件大小：2.66MB

第9卷第1期智能系统学报 Vol.9 No.1 2014年2月 CAAI Transactions on Intelligent Systems Feb.2014 D0:10.3969/j.issn.1673-4785.201305001 网s络出版地址：http:/www.cnki.net/kcms/doi/10.3969/j-issn.1673-4785.201305001.html 累积方向-数量级光流梯度直方图的人体动作识别郭利，曹江涛，李平1，姬晓飞2 (1.辽宁石油化工大学信息与控制工程学院，辽宁抚顺113001：2.沈阳航空航天大学自动化学院，辽宁沈阳 110136) 摘要：为了提高光流信息在人体动作识别系统中应用的效果和效率，提出一种累计方向-数量级光流梯度直方图的人体动作特征表示方法。该方法首先利用Hom-Schunck充流算法计算图像光流，然后将光流矢量按照不同的方向-数量级进行直方图统计，得到单帧图像的方向-数量级的光流梯度直方图，最后将单帧图像的直方图特征在时间维上进行累积来表示整个视频动作的特征。利用该特征在KTH动作视频库上进行动作识别测试，4个场景的混合测试得到了87.5%的平均正确识别率，验证了算法的有效性。关键词：人体动作识别：Hom-Schunck光流：方向-数量级直方图；梯度直方图中图分类号：TP391.41文献标志码：A文章编号：1673-4785(2014)01-0104-05 中文引用格式：郭利，曹江涛，李平，等.累积方向-数量级光流梯度直方图的人体动作识别[J].智能系统学报，2014,9(1)：104-108. 英文引用格式：GUOi,CAO Jiangtao,LI Ping,etal.Human action recognition based on accumulated orientation-magnitude his. tograms of optical flow[J].CAAI Transactions on Intelligent Systems,2014,9(1):104-108. Human action recognition based on accumulated orientation-magnitude histograms of optical flow GUO Li',CAO Jiangtao',LI Ping',JI Xiaofei (1.School of Information and Control Engineering,Liaoning Shihua University,Fushun 113001,China;2.School of Automation, Shenyang Aerospace University,Shenyang 110136,China) Abstract:In order to improve the recognition rate and efficiency of optical flow in the human action recognition sys- tem,a novel method for human action representation based on the accumulated orientation-magnitude gradient his- tograms of the optical flow is proposed in this paper.First the image optical flow is computed,and then every flow vector is counted according to the orientation-magnitude to obtain orientation-magnitude histograms of single frame image.Finally information of the video sequence can be represented by accumulating orientation-magnitude histo- grams in time dimension.The proposed feature is evaluated on a standard database of human actions:KTH.The ex- periment conducted on the four scenes demonstrates that this algorithm is effective and achieves a correct recogni- tion rate of 87.5%with the KTH dataset. Keywords:human action recognition;Hom-Schunck optical flow;orientation-magnitude histograms;gradient histograms 基于视频的人体动作识别是当今计算机视觉领动人体的外观，通常利用背景减除法获得精准人体域富有挑战性的热门研究方向。从视频序列中提取剪影，因此该类方法易受背景噪声的干扰，对部分遮出相对有辨识力的动作特征是影响动作识别效果的挡、视角的变化比较敏感。重要研究内容。视频序列图像中可提取的动作特征兴趣点就是视频中动作突然发生变化的位置，有很多，主要分为基于剪影的特征、基于兴趣点的特该位置包含丰富的运动信息。基于兴趣点的方征、基于光流的特征等。法[4]对视角、遮挡和噪声等干扰不敏感，处理过程在动作识别中，基于剪影的特征]依赖于运简单，但此类方法的缺点是检测出来的稳定兴趣点数量太少，且缺失全局信息。基于光流的特征能够清晰地表示人体的动作，收稿日期：2013-05-02.网络出版日期：2014-02-20 基金项目：国家自然科学青年基金资助项目(61103123) 受外观特征的干扰最小，也不易受周围环境的影响，通信作者：曹江涛.E-mail:jiangtao.cao08@gail.com. 有很好的鲁棒性，因此该类方法较适用于实际环境

第９卷第１期智能系统学报Ｖｏｌ．９ №．１２０１４年２月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＦｅｂ．２０１４ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１３０５００１网络出版地址：ｈｔｔｐ：／／ｗｗｗ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｏｉ／１０．３９６９／ｊ．ｉｓｓｎ．１６７３⁃４７８５．２０１３０５００１．ｈｔｍｌ累积方向－数量级光流梯度直方图的人体动作识别郭利１，曹江涛１，李平１，姬晓飞２（１．辽宁石油化工大学信息与控制工程学院，辽宁抚顺１１３００１；２．沈阳航空航天大学自动化学院，辽宁沈阳１１０１３６）摘要：为了提高光流信息在人体动作识别系统中应用的效果和效率，提出一种累计方向－数量级光流梯度直方图的人体动作特征表示方法。该方法首先利用Ｈｏｒｎ⁃Ｓｃｈｕｎｃｋ充流算法计算图像光流，然后将光流矢量按照不同的方向－数量级进行直方图统计，得到单帧图像的方向－数量级的光流梯度直方图，最后将单帧图像的直方图特征在时间维上进行累积来表示整个视频动作的特征。利用该特征在ＫＴＨ动作视频库上进行动作识别测试，４个场景的混合测试得到了８７．５％的平均正确识别率，验证了算法的有效性。关键词：人体动作识别；Ｈｏｒｎ⁃Ｓｃｈｕｎｃｋ光流；方向－数量级直方图；梯度直方图中图分类号：ＴＰ３９１．４１文献标志码：Ａ文章编号：１６７３⁃４７８５（２０１４）０１⁃０１０４⁃０５中文引用格式：郭利，曹江涛，李平，等．累积方向－数量级光流梯度直方图的人体动作识别［Ｊ］．智能系统学报，２０１４，９（１）：１０４⁃１０８．英文引用格式：ＧＵＯＬｉ，ＣＡＯＪｉａｎｇｔａｏ，ＬＩＰｉｎｇ，ｅｔａｌ．Ｈｕｍａｎａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎｂａｓｅｄｏｎａｃｃｕｍｕｌａｔｅｄｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｈｉｓ⁃ ｔｏｇｒａｍｓｏｆｏｐｔｉｃａｌｆｌｏｗ［Ｊ］．ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓ，２０１４，９（１）：１０４⁃１０８．Ｈｕｍａｎａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎｂａｓｅｄｏｎａｃｃｕｍｕｌａｔｅｄｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｈｉｓｔｏｇｒａｍｓｏｆｏｐｔｉｃａｌｆｌｏｗＧＵＯＬｉ１，ＣＡＯＪｉａｎｇｔａｏ１，ＬＩＰｉｎｇ１，ＪＩＸｉａｏｆｅｉ２（１．ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎａｎｄＣｏｎｔｒｏｌＥｎｇｉｎｅｅｒｉｎｇ，ＬｉａｏｎｉｎｇＳｈｉｈｕａＵｎｉｖｅｒｓｉｔｙ，Ｆｕｓｈｕｎ１１３００１，Ｃｈｉｎａ；２．ＳｃｈｏｏｌｏｆＡｕｔｏｍａｔｉｏｎ，ＳｈｅｎｙａｎｇＡｅｒｏｓｐａｃｅＵｎｉｖｅｒｓｉｔｙ，Ｓｈｅｎｙａｎｇ１１０１３６，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｉｎｏｒｄｅｒｔｏｉｍｐｒｏｖｅｔｈｅｒｅｃｏｇｎｉｔｉｏｎｒａｔｅａｎｄｅｆｆｉｃｉｅｎｃｙｏｆｏｐｔｉｃａｌｆｌｏｗｉｎｔｈｅｈｕｍａｎａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎｓｙｓ⁃ ｔｅｍ，ａｎｏｖｅｌｍｅｔｈｏｄｆｏｒｈｕｍａｎａｃｔｉｏｎｒｅｐｒｅｓｅｎｔａｔｉｏｎｂａｓｅｄｏｎｔｈｅａｃｃｕｍｕｌａｔｅｄｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｇｒａｄｉｅｎｔｈｉｓ⁃ ｔｏｇｒａｍｓｏｆｔｈｅｏｐｔｉｃａｌｆｌｏｗｉｓｐｒｏｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒ．Ｆｉｒｓｔｔｈｅｉｍａｇｅｏｐｔｉｃａｌｆｌｏｗｉｓｃｏｍｐｕｔｅｄ，ａｎｄｔｈｅｎｅｖｅｒｙｆｌｏｗｖｅｃｔｏｒｉｓｃｏｕｎｔｅｄａｃｃｏｒｄｉｎｇｔｏｔｈｅｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｔｏｏｂｔａｉｎｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｈｉｓｔｏｇｒａｍｓｏｆｓｉｎｇｌｅｆｒａｍｅｉｍａｇｅ．Ｆｉｎａｌｌｙｉｎｆｏｒｍａｔｉｏｎｏｆｔｈｅｖｉｄｅｏｓｅｑｕｅｎｃｅｃａｎｂｅｒｅｐｒｅｓｅｎｔｅｄｂｙａｃｃｕｍｕｌａｔｉｎｇｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｈｉｓｔｏ⁃ ｇｒａｍｓｉｎｔｉｍｅｄｉｍｅｎｓｉｏｎ．Ｔｈｅｐｒｏｐｏｓｅｄｆｅａｔｕｒｅｉｓｅｖａｌｕａｔｅｄｏｎａｓｔａｎｄａｒｄｄａｔａｂａｓｅｏｆｈｕｍａｎａｃｔｉｏｎｓ：ＫＴＨ．Ｔｈｅｅｘ⁃ ｐｅｒｉｍｅｎｔｃｏｎｄｕｃｔｅｄｏｎｔｈｅｆｏｕｒｓｃｅｎｅｓｄｅｍｏｎｓｔｒａｔｅｓｔｈａｔｔｈｉｓａｌｇｏｒｉｔｈｍｉｓｅｆｆｅｃｔｉｖｅａｎｄａｃｈｉｅｖｅｓａｃｏｒｒｅｃｔｒｅｃｏｇｎｉ⁃ ｔｉｏｎｒａｔｅｏｆ８７．５％ｗｉｔｈｔｈｅＫＴＨｄａｔａｓｅｔ．Ｋｅｙｗｏｒｄｓ：ｈｕｍａｎａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎ；Ｈｏｒｎ⁃Ｓｃｈｕｎｃｋｏｐｔｉｃａｌｆｌｏｗ；ｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｈｉｓｔｏｇｒａｍｓ；ｇｒａｄｉｅｎｔｈｉｓｔｏｇｒａｍｓ收稿日期：２０１３⁃０５⁃０２．网络出版日期：２０１４⁃０２⁃２０．基金项目：国家自然科学青年基金资助项目（６１１０３１２３）．通信作者：曹江涛．Ｅ⁃ｍａｉｌ：ｊｉａｎｇｔａｏ．ｃａｏ０８＠ｇｍａｉｌ．ｃｏｍ．基于视频的人体动作识别是当今计算机视觉领域富有挑战性的热门研究方向。从视频序列中提取出相对有辨识力的动作特征是影响动作识别效果的重要研究内容。视频序列图像中可提取的动作特征有很多，主要分为基于剪影的特征、基于兴趣点的特征、基于光流的特征等。在动作识别中，基于剪影的特征［１⁃３］依赖于运动人体的外观，通常利用背景减除法获得精准人体剪影，因此该类方法易受背景噪声的干扰，对部分遮挡、视角的变化比较敏感。兴趣点就是视频中动作突然发生变化的位置，该位置包含丰富的运动信息。基于兴趣点的方法［４⁃６］对视角、遮挡和噪声等干扰不敏感，处理过程简单，但此类方法的缺点是检测出来的稳定兴趣点数量太少，且缺失全局信息。基于光流的特征能够清晰地表示人体的动作，受外观特征的干扰最小，也不易受周围环境的影响，有很好的鲁棒性，因此该类方法较适用于实际环境

第1期郭利，等：累积方向-数量级光流梯度直方图的人体动作识别 ·105· 下的应用。文献[7]提出了基于网格的光流表 2 示方法，将兴趣区域按照人体比例大致划分为头颈、累积方向-数量级光流直方图上半身、腿三部分，然后在每个部分利用径向直方图 2.1图像预处理统计光流特征在横纵方向的光流幅度。此方法识别提取图像中的兴趣区域是为了减少计算量。通结果不够理想，用Harris角点检测运动人体，计算量常利用背景减除法确定出运动的大致区域，再利用大、计算速度慢。文献[8]将兴趣区域划分为均分中值滤波得到人体剪影，根据人体剪影信息确定兴的小区域，在每个子区域内仍然利用径向直方图统趣区域，如图2中4张图像的虚线矩形框内所示。计横纵方向的光流幅度。该方法不需要对人体部分根据背景减除法得到粗略的兴趣区域，有时不进行划分，识别结果较好，但是它在计算整帧图像的能完全包含运动人体，会出现兴趣区域内不包含头光流后再对提取的光流做处理，导致计算速度较慢。部、运动的手臂或腿部，如图2(b)~(d)中虚线矩形以上的光流特征表示方法均利用直方图统计小区域框所示。为了避免这种情况，在确定兴趣区域时，将内光流在横纵方向的分量幅度作为特征，因此均忽边界按照定宽高比例的方法进行扩展，使其包含完略了光流的方向信息，而光流的方向信息对于区分整的运动人体，如图2中实线矩形框内，本文方法只相似动作是十分有益的。对兴趣区域内部进行处理。基于以上的分析，本文提出了一种新的光流特征表示方法。该方法首先对单帧图像提取兴趣区域并进行网格化处理，然后对网格内光流矢量同时在方向和数量级上进行直方图统计，最后利用累积方向-数量级的光流梯度直方图表示整个动作视频的特征。该特征与其他方法最大的不同是光流矢量按 (a)图例A b)图例B 照不同的方向和数量级进行直方图统计，而不是传统光流幅度的累加。 1 光流表示方法通过光流计算所得到的帧间光流场，是从视频图像得到的动作原始特征。一个光流矢量可以用四 (c)图例C (d)图例D 维向量(x,y,u,)表示，其中(x,y)代表了光流矢图2兴趣区域图例量在每帧图像中的位置信息，、分别表示光流矢 Fig.2 The examples of region of interest 量的横向分量和纵向分量的大小。若一帧图像的分辨率为X×Y,则光流场中有X×Y个光流矢量。一 2.2方向-数量级的光流梯度直方图个视频由多帧图像组成，提取的原始光流特征属于图像预处理后，将裁剪出的兴趣区域缩放到高维特征，计算量大，可用样本分布稀疏，不适用于 40×40像素大小，并转换为灰度图像。然后利用动作分类识别。 Horm-Schunck光流算法(HS光流算法)计算运动光本文所提出的累积方向-数量级的光流梯度直流，得出四维平面坐标的向量(x,y,u,),将其转换方图是对单帧光流矢量同时在方向和数量级上进行为极坐标(x,y,r,9),r为点(x,y)上光流的大小，投票，然后在时间维上进行累积得到。其具体实现 0为该点的光流方向。经计算得出，光流方向的范如图1所示，由以下4个步骤组成：1)图像预处理得围是[0°，360°]，单帧图像光流的大小范围基本在到兴趣区域：2)计算运动估计（光流计算），平面坐 [0,3]之间。将光流方向分成K个方向柱，以360/ 标(u,v)转化成极坐标(r,),r、0分别为点(x,y) K为间隔，光流大小分成M个数量级。计算单帧图的光流大小和方向：3)对所计算的光流数据进行处像的方向-数量级光流梯度直方图时，根据每个像理得到单帧图像的方向-数量级的光流梯度直方图素点上光流的方向和大小投票到相应的方向柱数量特征向量：4)沿着时间轴进行特征累积，归一化处理得级上。到累积方向-数量级的光流梯度直方图特征向量。将光流方向分成8个方向柱，分别为[0°，45°] [45°，90]、[90°，135]、[135°，180]、[180°，图像预处理计算光流数据处理 225°]、[225°，270]、[270°，315]、[315°，360°]，视频序列特征描述子特征累积光流大小分成4个数量级[0,0.5]、(0.5,1.5] 图1特征处理过程 (1.5,2]、(2,+0)。当极坐标为(0.3,30)，则投给第 Fig.1 Feature extraction process 1个方向柱的第1个数量级一票。为了避免出现零的情况，将每个方向柱的数量级上的值初始化为1

下的应用［７⁃８］。文献［７］提出了基于网格的光流表示方法，将兴趣区域按照人体比例大致划分为头颈、上半身、腿三部分，然后在每个部分利用径向直方图统计光流特征在横纵方向的光流幅度。此方法识别结果不够理想，用Ｈａｒｒｉｓ角点检测运动人体，计算量大、计算速度慢。文献［８］将兴趣区域划分为均分的小区域，在每个子区域内仍然利用径向直方图统计横纵方向的光流幅度。该方法不需要对人体部分进行划分，识别结果较好，但是它在计算整帧图像的光流后再对提取的光流做处理，导致计算速度较慢。以上的光流特征表示方法均利用直方图统计小区域内光流在横纵方向的分量幅度作为特征，因此均忽略了光流的方向信息，而光流的方向信息对于区分相似动作是十分有益的。基于以上的分析，本文提出了一种新的光流特征表示方法。该方法首先对单帧图像提取兴趣区域并进行网格化处理，然后对网格内光流矢量同时在方向和数量级上进行直方图统计，最后利用累积方向－数量级的光流梯度直方图表示整个动作视频的特征。该特征与其他方法最大的不同是光流矢量按照不同的方向和数量级进行直方图统计，而不是传统光流幅度的累加。１光流表示方法通过光流计算所得到的帧间光流场，是从视频图像得到的动作原始特征。一个光流矢量可以用四维向量（ｘ，ｙ，ｕ，ｖ）表示，其中（ｘ，ｙ）代表了光流矢量在每帧图像中的位置信息，ｕ、ｖ分别表示光流矢量的横向分量和纵向分量的大小。若一帧图像的分辨率为Ｘ × Ｙ，则光流场中有Ｘ × Ｙ个光流矢量。一个视频由多帧图像组成，提取的原始光流特征属于高维特征，计算量大，可用样本分布稀疏，不适用于动作分类识别。本文所提出的累积方向－数量级的光流梯度直方图是对单帧光流矢量同时在方向和数量级上进行投票，然后在时间维上进行累积得到。其具体实现如图１所示，由以下４个步骤组成：１）图像预处理得到兴趣区域；２）计算运动估计（光流计算），平面坐标（ｕ，ｖ）转化成极坐标（ｒ，θ），ｒ、θ 分别为点（ｘ，ｙ）的光流大小和方向；３）对所计算的光流数据进行处理得到单帧图像的方向－数量级的光流梯度直方图特征向量；４）沿着时间轴进行特征累积，归一化处理得到累积方向－数量级的光流梯度直方图特征向量。图１特征处理过程Ｆｉｇ．１Ｆｅａｔｕｒｅｅｘｔｒａｃｔｉｏｎｐｒｏｃｅｓｓ２累积方向－数量级光流直方图２．１图像预处理提取图像中的兴趣区域是为了减少计算量。通常利用背景减除法确定出运动的大致区域，再利用中值滤波得到人体剪影，根据人体剪影信息确定兴趣区域，如图２中４张图像的虚线矩形框内所示。根据背景减除法得到粗略的兴趣区域，有时不能完全包含运动人体，会出现兴趣区域内不包含头部、运动的手臂或腿部，如图２（ｂ）～（ｄ）中虚线矩形框所示。为了避免这种情况，在确定兴趣区域时，将边界按照定宽高比例的方法进行扩展，使其包含完整的运动人体，如图２中实线矩形框内，本文方法只对兴趣区域内部进行处理。图２兴趣区域图例Ｆｉｇ．２Ｔｈｅｅｘａｍｐｌｅｓｏｆｒｅｇｉｏｎｏｆｉｎｔｅｒｅｓｔ２．２方向－数量级的光流梯度直方图图像预处理后，将裁剪出的兴趣区域缩放到４０×４０像素大小，并转换为灰度图像。然后利用Ｈｏｒｎ⁃Ｓｃｈｕｎｃｋ光流算法（ＨＳ光流算法）计算运动光流，得出四维平面坐标的向量（ｘ，ｙ，ｕ，ｖ），将其转换为极坐标（ｘ，ｙ，ｒ，θ），ｒ为点（ｘ，ｙ）上光流的大小， θ 为该点的光流方向。经计算得出，光流方向的范围是［０°，３６０°］，单帧图像光流的大小范围基本在［０，３］之间。将光流方向分成Ｋ个方向柱，以３６０°／Ｋ为间隔，光流大小分成Ｍ个数量级。计算单帧图像的方向－数量级光流梯度直方图时，根据每个像素点上光流的方向和大小投票到相应的方向柱数量级上。将光流方向分成８个方向柱，分别为［０°，４５°］、［４５°，９０°］、［９０°，１３５°］、［１３５°，１８０°］、［１８０°，２２５°］、［２２５°，２７０°］、［２７０°，３１５°］、［３１５°，３６０°］，光流大小分成４个数量级［０，０．５］、（０．５，１．５］、（１．５，２］、（２，＋¥）。当极坐标为（０．３，３０），则投给第１个方向柱的第１个数量级一票。为了避免出现零的情况，将每个方向柱的数量级上的值初始化为１。第１期郭利，等：累积方向－数量级光流梯度直方图的人体动作识别 ·１０５·

·106. 智能系统学报第9卷为了使所提特征包含更多的细节，提高相似度累积方向-数量级的光流梯度直方图。较高的动作之间的识别精度，将每帧图像划分为L 个无重叠的网格，在每个网格内计算方向-数量级的光流梯度直方图，最后把所有网格的直方图合并在一起就构成了整帧图像的方向-数量级光流梯度直方图。如图3所示，图3(a)为网格化的初始兴趣区域，图3(b)为子网格的光流，图3(c)为此网格的方向-数量级的光流梯度直方图，图3(d)为图3(a) 对应的方向-数量级的光流梯度直方图。 (a)Box (b)Wave (c)Clap b)子网格光流 (d)方向-数量级光流梯 (a网格图像（⊙光流梯度直方图度直方图图3方向-数量级的光流梯度直方图计算过程 Fig.3 The process of accumulating orientation-magni- tude histograms of optical flow (d)Jog (e)Run (f)Walk 2.3光流梯度直方图特征提取图4累积方向-数量级的光流梯度直方图在获得每一帧图像方向-数量级的光流梯度直 Fig.4 The accumulated orientation-magnitude histo- 方图特征的基础上，计算累积方向-数量级的光流 grams of optical flow 梯度直方图特征向量来表示N帧连续图像序列的 3 实验结果与分析运动特征。累积特征向量是第t帧图像的前N帧图像特征的累积)]，具体计算过程如下。目前有很多解决统计分类问题的方法，本文主一段人体动作视频V有T帧图像，即V= 要测试新特征的辨识能力，因此选用支持向量机 {L1,12…,1},第t帧图像的方向-数量级的光流梯 SVM作为分类器，对视频中的每一帧进行类别标度直方图用H(L,)表示。则从I,到Ix连续N帧图像记，然后用投票表决的方法得到子序列的类别标号。序列的累积方向-数量级的光流梯度直方图H为实验利用台湾大学林智仁等[开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的 R=ΣHU,) (1) 软件包LIBSVM,在数据集上反复测试，其中的核函 1三1 每帧图像的方向-数量级的光流梯度直方图特数采用径向基核函数。征向量和累积方向-数量级的光流梯度直方图特征采用公开的KTH动作识别数据库进行测试。向量的维数相同。一个累积方向-数量级的光流梯 KTH数据库中有6种动作，分别为Box、Handcla即、度直方图的描述子由L个空间子网格、K个光流方 Handwave、Jog、Run、Walk,每种动作由25个人在4 向柱、M个光流大小数量级组成。这样就形成了个场景下完成，一共有2391段视频序列，背景相对静止，除了镜头的拉近拉远，摄像机的运动相对轻 L×K×M维图像特征向量。为避免不同动作或者不同人相同动作的特征之微。在实验中，将KTH看作是5个视频库，每一个场景作为一个视频库，混合4个场景作为第5个视间的数量级差别较大，对所得到的上述特征进行如频库，以下所有的实验结果均是将其中16个人作为下的归一化处理。训练数据，余下的9个人为测试数据，循环10次得 (l,k,m)←-H°(L,k,m)/G (2) 出的平均值。 Gu=∑.fL,k,m) (3) 3.1参数设置式中：H(L,k,m)表示第l个子网格，k个方向柱在不同的参数设置下进行测试实验。有2个主上，m个数量级。G4表示第l个子网格，k方向柱上要的参数影响动作识别结果：网格的数目L和累积所有数量级上值的和。图像帧数N。图4表示在KTH数据库中不同动作的累积方 1)网格数目L。预处理得到的兴趣区域被分割向-数量级的光流梯度直方图，第1行是当前帧图为L个网格，计算每个网格的方向-数量级光流直像，第2行是当前帧的前10帧图像进行计算得到的方图，L的取值范围为[1,64]，取值决定精细程度及

为了使所提特征包含更多的细节，提高相似度较高的动作之间的识别精度，将每帧图像划分为Ｌ个无重叠的网格，在每个网格内计算方向－数量级的光流梯度直方图，最后把所有网格的直方图合并在一起就构成了整帧图像的方向－数量级光流梯度直方图。如图３所示，图３（ａ）为网格化的初始兴趣区域，图３（ｂ）为子网格的光流，图３（ｃ）为此网格的方向－数量级的光流梯度直方图，图３（ｄ）为图３（ａ）对应的方向－数量级的光流梯度直方图。图３方向－数量级的光流梯度直方图计算过程Ｆｉｇ．３Ｔｈｅｐｒｏｃｅｓｓｏｆａｃｃｕｍｕｌａｔｉｎｇｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉ⁃ ｔｕｄｅｈｉｓｔｏｇｒａｍｓｏｆｏｐｔｉｃａｌｆｌｏｗ２．３光流梯度直方图特征提取在获得每一帧图像方向－数量级的光流梯度直方图特征的基础上，计算累积方向－数量级的光流梯度直方图特征向量来表示Ｎ帧连续图像序列的运动特征。累积特征向量是第ｔ帧图像的前Ｎ帧图像特征的累积［９］，具体计算过程如下。一段人体动作视频Ｖ有Ｔ帧图像，即Ｖ＝Ｉ１，Ｉ２…，ＩＴ { } ，第ｔ帧图像的方向－数量级的光流梯度直方图用ＨＩｔ ( ) 表示。则从Ｉ１到ＩＮ连续Ｎ帧图像序列的累积方向－数量级的光流梯度直方图ＨａＮ为ＨａＮ＝ ∑ Ｎｔ＝１ＨＩｔ ( ) （１）每帧图像的方向－数量级的光流梯度直方图特征向量和累积方向－数量级的光流梯度直方图特征向量的维数相同。一个累积方向－数量级的光流梯度直方图的描述子由Ｌ个空间子网格、Ｋ个光流方向柱、Ｍ个光流大小数量级组成。这样就形成了Ｌ ×Ｋ × Ｍ维图像特征向量。为避免不同动作或者不同人相同动作的特征之间的数量级差别较大，对所得到的上述特征进行如下的归一化处理。Ｈａ (ｌ，ｋ，ｍ) ← Ｈａ (ｌ，ｋ，ｍ) ／Ｇｌｋ（２）Ｇｌｋ＝ ∑ｍＨａ (ｌ，ｋ，ｍ) （３）式中：Ｈａ (ｌ，ｋ，ｍ) 表示第ｌ个子网格，ｋ个方向柱上，ｍ个数量级。Ｇｌｋ表示第ｌ个子网格，ｋ方向柱上所有数量级上值的和。图４表示在ＫＴＨ数据库中不同动作的累积方向－数量级的光流梯度直方图，第１行是当前帧图像，第２行是当前帧的前１０帧图像进行计算得到的累积方向－数量级的光流梯度直方图。图４累积方向－数量级的光流梯度直方图Ｆｉｇ．４Ｔｈｅａｃｃｕｍｕｌａｔｅｄｏｒｉｅｎｔａｔｉｏｎ⁃ｍａｇｎｉｔｕｄｅｈｉｓｔｏ⁃ ｇｒａｍｓｏｆｏｐｔｉｃａｌｆｌｏｗ３实验结果与分析目前有很多解决统计分类问题的方法，本文主要测试新特征的辨识能力，因此选用支持向量机ＳＶＭ作为分类器，对视频中的每一帧进行类别标记，然后用投票表决的方法得到子序列的类别标号。实验利用台湾大学林智仁等［１０］开发设计的一个简单、易于使用和快速有效的ＳＶＭ模式识别与回归的软件包ＬＩＢＳＶＭ，在数据集上反复测试，其中的核函数采用径向基核函数。采用公开的ＫＴＨ动作识别数据库进行测试。ＫＴＨ数据库中有６种动作，分别为Ｂｏｘ、Ｈａｎｄｃｌａｐ、Ｈａｎｄｗａｖｅ、Ｊｏｇ、Ｒｕｎ、Ｗａｌｋ，每种动作由２５个人在４个场景下完成，一共有２３９１段视频序列，背景相对静止，除了镜头的拉近拉远，摄像机的运动相对轻微。在实验中，将ＫＴＨ看作是５个视频库，每一个场景作为一个视频库，混合４个场景作为第５个视频库，以下所有的实验结果均是将其中１６个人作为训练数据，余下的９个人为测试数据，循环１０次得出的平均值。３．１参数设置在不同的参数设置下进行测试实验。有２个主要的参数影响动作识别结果：网格的数目Ｌ和累积图像帧数Ｎ。１）网格数目Ｌ。预处理得到的兴趣区域被分割为Ｌ个网格，计算每个网格的方向－数量级光流直方图，Ｌ的取值范围为［１，６４］，取值决定精细程度及 ·１０６· 智能系统学报第９卷

第1期郭利，等：累积方向-数量级光流梯度直方图的人体动作识别 ·107. 向量的维数，在实验时累积帧数设定为20，实验结 3.2最佳参数用于KTH数据库动作识别的结果果如图5(a)所示，其中横坐标的1~9分别对应网由3.1节得出最优参数，累积帧数为10，网格数格数为1×2、2×2、2×4、2×5、4×4、4×5、5×5、4×8、5× 为4×4。在最优参数设置下，进行不同场景的人体 8。从图中可以看出，随着网格数的增加识别结果动作识别，其结果如表1所示。越来越好，但是到达某个峰值之后，随着网格数的增表1不同的场景识别的结果加识别结果反而变坏，实验在网格数为4×4时识别 Table 1 Result of different Sceneries % 率达到最高。这表明网格数过少，得到的描述子所包含的信息量也相对少；网格数过多，每个网格对应场景 S S2 S S 的运动区域非常小，其中包含的运动信息量相应较少，提取的特征对识别的贡献不大。识别结果 91.66 88.89 86.11 91.66 87.5 2)图像序列累积帧数N。视频序列的每一帧图从表1可以看出，所提特征在KTH的数据库上像都包含动作的运动信息，但是多少帧图像能够完得到了较理想的识别结果，场景1下得到了91.66% 整地表达一个动作的属性，是一个非常重要的问题。的正确识别率。在场景2和场景3识别结果相对低由于动作数据库的各个视频的帧数不同，因此选取一些，主要是由于场景2的拍摄过程中摄像机有轻 5~35帧作为累积帧数，分别进行动作识别的测试。如果某个视频图像序列少于累积帧数，则选取视频微运动或镜头拉远拉近，场景3下运动执行人的穿序列的所有帧进行累积。将网格数设定为4×4，不着有明显的变化，如穿上大衣、带上帽子或者背上书同累积帧数对应的识别结果如图5(b)所示，可以看包等使人体外观有了较大的改变。在场景2、3下进出识别率不是随着累积帧数的增加而增大，当累积行算法的测试具有一定的挑战性，本文方法分别得帧数为10时识别率最高。这主要归因于人体动作到了88.89%和86.11%的正确识别率，这样的识别结执行过程是周期性的，累计帧数刚好对应一个人体果是令人满意的。这也进一步证明了所提出的特征运动周期时，得到的识别效果最好。对于摄像机的轻微运动和人体外观的变化具有一定 0.90 的鲁棒性。动作识别的混淆矩阵如图6所示，可以看出累 0.85 积方向-数量级的光流梯度直方图对挥手有较好的 0.80 识别结果，正确识别率达100%：对“跑”这一动作识书别较差，多被识别为“慢跑”，因为“跑”和“慢跑”动 0.75 作在运动过程中表现比较相近。 0.70 Box 2.0 Clap 0.65 4567 Wave 网格数类型标号 1.0 (a网格数 Jog 0.91 Run 0.5 Walk 0.89 0 Box Clap Wave Jog Run Walk 0.871 图6S12u不同动作识别的混淆矩阵 0.85 Fig.6 Confusion matrix on KTH:scenario S 0.83H 3.3与其他方法比较本文所提出方法与近期的相关方法在KTH数 0.8 5 0 据库的识别性能比较见表2。 15 2025 30 35 帧数从表2可以看出，新方法比文献[7,11]仅使用 )累积帧数兴趣点特征和原始的分区域光流表示方法所得到的图5不同累积帧数及网格数的识别结果识别效果要好。与文献[12]得到的正确识别率相 Fig.5 The results of different frames and numbers of grids 当，但文献[12]使用了3种混合特征用于动作识

向量的维数，在实验时累积帧数设定为２０，实验结果如图５（ａ）所示，其中横坐标的１～９分别对应网格数为１×２、２×２、２×４、２×５、４×４、４×５、５×５、４×８、５× ８。从图中可以看出，随着网格数的增加识别结果越来越好，但是到达某个峰值之后，随着网格数的增加识别结果反而变坏，实验在网格数为４×４时识别率达到最高。这表明网格数过少，得到的描述子所包含的信息量也相对少；网格数过多，每个网格对应的运动区域非常小，其中包含的运动信息量相应较少，提取的特征对识别的贡献不大。２）图像序列累积帧数Ｎ。视频序列的每一帧图像都包含动作的运动信息，但是多少帧图像能够完整地表达一个动作的属性，是一个非常重要的问题。由于动作数据库的各个视频的帧数不同，因此选取５～３５帧作为累积帧数，分别进行动作识别的测试。如果某个视频图像序列少于累积帧数，则选取视频序列的所有帧进行累积。将网格数设定为４×４，不同累积帧数对应的识别结果如图５（ｂ）所示，可以看出识别率不是随着累积帧数的增加而增大，当累积帧数为１０时识别率最高。这主要归因于人体动作执行过程是周期性的，累计帧数刚好对应一个人体运动周期时，得到的识别效果最好。图５不同累积帧数及网格数的识别结果Ｆｉｇ．５Ｔｈｅｒｅｓｕｌｔｓｏｆｄｉｆｆｅｒｅｎｔｆｒａｍｅｓａｎｄｎｕｍｂｅｒｓｏｆｇｒｉｄｓ３．２最佳参数用于ＫＴＨ数据库动作识别的结果由３．１节得出最优参数，累积帧数为１０，网格数为４×４。在最优参数设置下，进行不同场景的人体动作识别，其结果如表１所示。表１不同的场景识别的结果Ｔａｂｌｅ１ＲｅｓｕｌｔｏｆｄｉｆｆｅｒｅｎｔＳｃｅｎｅｒｉｅｓ％场景Ｓ１Ｓ２Ｓ３Ｓ４Ｓ１２３４识别结果９１．６６８８．８９８６．１１９１．６６８７．５从表１可以看出，所提特征在ＫＴＨ的数据库上得到了较理想的识别结果，场景１下得到了９１．６６％的正确识别率。在场景２和场景３识别结果相对低一些，主要是由于场景２的拍摄过程中摄像机有轻微运动或镜头拉远拉近，场景３下运动执行人的穿着有明显的变化，如穿上大衣、带上帽子或者背上书包等使人体外观有了较大的改变。在场景２、３下进行算法的测试具有一定的挑战性，本文方法分别得到了８８．８９％和８６．１１％的正确识别率，这样的识别结果是令人满意的。这也进一步证明了所提出的特征对于摄像机的轻微运动和人体外观的变化具有一定的鲁棒性。动作识别的混淆矩阵如图６所示，可以看出累积方向－数量级的光流梯度直方图对挥手有较好的识别结果，正确识别率达１００％；对“跑”这一动作识别较差，多被识别为“慢跑”，因为“跑”和“慢跑”动作在运动过程中表现比较相近。图６Ｓ１２３４不同动作识别的混淆矩阵Ｆｉｇ．６ＣｏｎｆｕｓｉｏｎｍａｔｒｉｘｏｎＫＴＨ：ｓｃｅｎａｒｉｏＳ１２３４３．３与其他方法比较本文所提出方法与近期的相关方法在ＫＴＨ数据库的识别性能比较见表２。从表２可以看出，新方法比文献［７，１１］仅使用兴趣点特征和原始的分区域光流表示方法所得到的识别效果要好。与文献［１２］得到的正确识别率相当，但文献［１２］使用了３种混合特征用于动作识第１期郭利，等：累积方向－数量级光流梯度直方图的人体动作识别 ·１０７·

·108 智能系统学报第9卷别，其特征的复杂度远远高于本文方法。本文方法 ics-Part B:Cybernetics,2006,36(3):710-719. 的特征易于提取和表示，且具有较高的可靠性。此 [7]DANAFAR S,GHEISSARI N.Action recognition for sur- 外，利用新方法计算100帧图像特征仅需要10.35s, veillance applications using optic flow and SVM[C]//Pro- 因此该方法可以应用于实际的系统中。 ceedings of the Asian Conference on Computer Vision.To- 表2不同方法的识别结果 kyo,Japan,2007:457-466. Table 2 Results of different methods % [8]TRAN D,SOROKIN A.Human activity recognition with metric learning[C]//Proceedings of the European Confer- 方法所用特征识别结果 ence on Computer Vision.Marseille,France,2008:61-66. Liu的方法[ 兴趣点 82.3 [9]ZHANG Ziming,HU Yiqun,CHAN Syin,et al.Motion context:a new representation for human action recognition Danafar的方法] 分区域的光流直方图 85.0 [C]//Proceedings of the European Conference on Comput- er Vision.Marseille,France,2008:817-829. Qin的方法[a)PCRM+EOH+MOH混合特征87.3 [10]FAN Rongen,CHEN Paihsuen,LIN Chihjen.Working set 本文方法累积光流直方图 87.5 selection using second order information for training SVM [J].Journal of Machine Learning Research,2005,6: 4 结束语 1889-1918. [11]LIU Jingen,LUO Jiebo,SHAN M.Recognizing realistic 本文提出一种新的人体动作特征描述方法，即 actions from videos"in the wild"[C]//Proceedings of the 累积方向-数量级光流直方图。该描述方法与其他 IEEE Conference on Computer Vision and Pattem Recogni- 方法最大的不同是光流矢量按照不同的方向和数量 tion.Miami,USA,2009:1996-2003. 级同时进行直方图统计，而不是传统光流幅度的累 [12]QIN Yaohui,LI Hongliang,LIU Guanghui,et al.Human 加。在KTH动作视频库上的大量测试实验证明，该 action recognition using PEM histogram C//IEEE Inter- 特征描述方法提取速度快、识别率高，具有应用于实 national Conference on Computational Problem Solving. Singapore,2010:323-325. 时系统的潜力。下一步的工作是研究如何将该人体作者简介：动作特征描述方法应用在实际的智能监控系统中，郭利，女，1987年生，硕士研究生进一步提高现有智能监控系统的性能。主要研究方向为模式识别、图像处理。参考文献： [1]BLANK M,GORELICK L,SHECHTMAN E,et al.Actions as space-time shapes[C]//Proceedings of the International Conference on Computer Vision.Beijing,China,2005: 1395-1402 曹江涛，男，1978年生，教授、博士， [2]GORELICK L,BLANK M,SHECHTMAN E,et al.Actions 中国自动化学会机器人专业委员会委 as space-time shapes[J].IEEE Transactions on Pattern A- 员和青工委委员，主要研究方向为智能 nalysis and Machine Intelligence,2007,29(12):2247- 方法及其在工业控制和视频信息处理 2253. 上的应用。承担国家自然科学基金等 [3]YILMAZ A,SHAH M.A differential geometric approach to 项目多项，发表学术论文40余篇，其中 representing the human actions[].Computer Vision and 被SCI检索6篇、EI检索22篇。 Image Understanding,2008,119(3):335-351. [4]LAPTEV I,LINDEBERG T.Space-time interest points 李平，男，1964年生，教授、博士生 [C]//Proceedings of the International Conference on Com- 导师，EEE高级会员，中国自动化学会 puter Vision.Nice,France,2003:432-439. 过程控制专业委员会委员，主要研究方 [5]LAPTEV I,CAPUTO B,SCHULDT C,et al.Local veloci- 向为工业过程的先进控制理论及其应 ty-adapted motion events for spatio-temporal recognition[J]. 用。承担国家“863”计划项目、国家自 Computer Vision and Image Understanding,2007,108(3): 然科学基金等项目多项，发表学术论 207-229. 文100余篇，其中被sCI,EI检索50余篇。 [6]OIKONOMOPOULOS A,PATRAS I,PANTIC M.Spatio- temporal salient points for visual recognition of human ac- tions[J].IEEE Transactions on Systems Man and Cybernet-

曹江涛，男，１９７８年生，教授、博士，中国自动化学会机器人专业委员会委员和青工委委员，主要研究方向为智能别，其特征的复杂度远远高于本文方法。本文方法的特征易于提取和表示，且具有较高的可靠性。此外，利用新方法计算１００帧图像特征仅需要１０．３５ｓ，因此该方法可以应用于实际的系统中。表２不同方法的识别结果Ｔａｂｌｅ２Ｒｅｓｕｌｔｓｏｆｄｉｆｆｅｒｅｎｔｍｅｔｈｏｄｓ％方法所用特征识别结果Ｌｉｕ的方法［１１］兴趣点８２．３Ｄａｎａｆａｒ的方法［７］分区域的光流直方图８５．０Ｑｉｎ的方法［１２］ＰＣＲＭ＋ＥＯＨ＋ＭＯＨ混合特征８７．３本文方法累积光流直方图８７．５４结束语本文提出一种新的人体动作特征描述方法，即累积方向－数量级光流直方图。该描述方法与其他方法最大的不同是光流矢量按照不同的方向和数量级同时进行直方图统计，而不是传统光流幅度的累加。在ＫＴＨ动作视频库上的大量测试实验证明，该特征描述方法提取速度快、识别率高，具有应用于实时系统的潜力。下一步的工作是研究如何将该人体动作特征描述方法应用在实际的智能监控系统中，进一步提高现有智能监控系统的性能。参考文献：［１］ＢＬＡＮＫＭ，ＧＯＲＥＬＩＣＫＬ，ＳＨＥＣＨＴＭＡＮＥ，ｅｔａｌ．Ａｃｔｉｏｎｓａｓｓｐａｃｅ⁃ｔｉｍｅｓｈａｐｅｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ｂｅｉｊｉｎｇ，Ｃｈｉｎａ，２００５：１３９５⁃１４０２．［２］ＧＯＲＥＬＩＣＫＬ，ＢＬＡＮＫＭ，ＳＨＥＣＨＴＭＡＮＥ，ｅｔａｌ．Ａｃｔｉｏｎｓａｓｓｐａｃｅ⁃ｔｉｍｅｓｈａｐｅｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡ⁃ ｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ，２００７，２９（１２）：２２４７⁃ ２２５３．［３］ＹＩＬＭＡＺＡ，ＳＨＡＨＭ．Ａｄｉｆｆｅｒｅｎｔｉａｌｇｅｏｍｅｔｒｉｃａｐｐｒｏａｃｈｔｏｒｅｐｒｅｓｅｎｔｉｎｇｔｈｅｈｕｍａｎａｃｔｉｏｎｓ［Ｊ］．ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＩｍａｇｅＵｎｄｅｒｓｔａｎｄｉｎｇ，２００８，１１９（３）：３３５⁃３５１．［４］ＬＡＰＴＥＶＩ，ＬＩＮＤＥＢＥＲＧＴ．Ｓｐａｃｅ⁃ｔｉｍｅｉｎｔｅｒｅｓｔｐｏｉｎｔｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍ⁃ ｐｕｔｅｒＶｉｓｉｏｎ．Ｎｉｃｅ，Ｆｒａｎｃｅ，２００３：４３２⁃４３９．［５］ＬＡＰＴＥＶＩ，ＣＡＰＵＴＯＢ，ＳＣＨÜＬＤＴＣ，ｅｔａｌ．Ｌｏｃａｌｖｅｌｏｃｉ⁃ ｔｙ⁃ａｄａｐｔｅｄｍｏｔｉｏｎｅｖｅｎｔｓｆｏｒｓｐａｔｉｏ⁃ｔｅｍｐｏｒａｌｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．ＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＩｍａｇｅＵｎｄｅｒｓｔａｎｄｉｎｇ，２００７，１０８（３）：２０７⁃２２９．［６］ＯＩＫＯＮＯＭＯＰＯＵＬＯＳＡ，ＰＡＴＲＡＳＩ，ＰＡＮＴＩＣＭ．Ｓｐａｔｉｏ⁃ ｔｅｍｐｏｒａｌｓａｌｉｅｎｔｐｏｉｎｔｓｆｏｒｖｉｓｕａｌｒｅｃｏｇｎｉｔｉｏｎｏｆｈｕｍａｎａｃ⁃ ｔｉｏｎｓ［Ｊ］．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｙｓｔｅｍｓＭａｎａｎｄＣｙｂｅｒｎｅｔ⁃ ｉｃｓ—ＰａｒｔＢ：Ｃｙｂｅｒｎｅｔｉｃｓ，２００６，３６（３）：７１０⁃７１９．［７］ＤＡＮＡＦＡＲＳ，ＧＨＥＩＳＳＡＲＩＮ．Ａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎｆｏｒｓｕｒ⁃ ｖｅｉｌｌａｎｃｅａｐｐｌｉｃａｔｉｏｎｓｕｓｉｎｇｏｐｔｉｃｆｌｏｗａｎｄＳＶＭ［Ｃ］／／Ｐｒｏ⁃ ｃｅｅｄｉｎｇｓｏｆｔｈｅＡｓｉａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ｔｏ⁃ ｋｙｏ，Ｊａｐａｎ，２００７：４５７⁃４６６．［８］ＴＲＡＮＤ，ＳＯＲＯＫＩＮＡ．Ｈｕｍａｎａｃｔｉｖｉｔｙｒｅｃｏｇｎｉｔｉｏｎｗｉｔｈｍｅｔｒｉｃｌｅａｒｎｉｎｇ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＥｕｒｏｐｅａｎＣｏｎｆｅｒ⁃ ｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎ．Ｍａｒｓｅｉｌｌｅ，Ｆｒａｎｃｅ，２００８：６１⁃６６．［９］ＺＨＡＮＧＺｉｍｉｎｇ，ＨＵＹｉｑｕｎ，ＣＨＡＮＳｙｉｎ，ｅｔａｌ．Ｍｏｔｉｏｎｃｏｎｔｅｘｔ：ａｎｅｗｒｅｐｒｅｓｅｎｔａｔｉｏｎｆｏｒｈｕｍａｎａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＥｕｒｏｐｅａｎＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔ⁃ ｅｒＶｉｓｉｏｎ．Ｍａｒｓｅｉｌｌｅ，Ｆｒａｎｃｅ，２００８：８１７⁃８２９．［１０］ＦＡＮＲｏｎｇｅｎ，ＣＨＥＮＰａｉｈｓｕｅｎ，ＬＩＮＣｈｉｈｊｅｎ．ＷｏｒｋｉｎｇｓｅｔｓｅｌｅｃｔｉｏｎｕｓｉｎｇｓｅｃｏｎｄｏｒｄｅｒｉｎｆｏｒｍａｔｉｏｎｆｏｒｔｒａｉｎｉｎｇＳＶＭ［Ｊ］．ＪｏｕｒｎａｌｏｆＭａｃｈｉｎｅＬｅａｒｎｉｎｇＲｅｓｅａｒｃｈ，２００５，６：１８８９⁃１９１８．［１１］ＬＩＵＪｉｎｇｅｎ，ＬＵＯＪｉｅｂｏ，ＳＨＡＮＭ．Ｒｅｃｏｇｎｉｚｉｎｇｒｅａｌｉｓｔｉｃａｃｔｉｏｎｓｆｒｏｍｖｉｄｅｏｓ “ｉｎｔｈｅｗｉｌｄ”［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩＥＥＥＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔｅｒＶｉｓｉｏｎａｎｄＰａｔｔｅｒｎＲｅｃｏｇｎｉ⁃ ｔｉｏｎ．Ｍｉａｍｉ，ＵＳＡ，２００９：１９９６⁃２００３．［１２］ＱＩＮＹａｏｈｕｉ，ＬＩＨｏｎｇｌｉａｎｇ，ＬＩＵＧｕａｎｇｈｕｉ，ｅｔａｌ．ＨｕｍａｎａｃｔｉｏｎｒｅｃｏｇｎｉｔｉｏｎｕｓｉｎｇＰＥＭｈｉｓｔｏｇｒａｍ［Ｃ］／／ＩＥＥＥＩｎｔｅｒ⁃ ｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＣｏｍｐｕｔａｔｉｏｎａｌＰｒｏｂｌｅｍＳｏｌｖｉｎｇ．Ｓｉｎｇａｐｏｒｅ，２０１０：３２３⁃３２５．作者简介：郭利，女，１９８７年生，硕士研究生，主要研究方向为模式识别、图像处理。被ＳＣＩ检索６篇、ＥＩ检索２２篇。１０８· 李平，男，１９６４年生，教授、博士生导师，ＩＥＥＥ高级会员，中国自动化学会过程控制专业委员会委员，主要研究方向为工业过程的先进控制理论及其应用。承担国家“ ８６３” 计划项目、国家自然科学基金等项目多项，发表学术论文１００余篇，其中被ＳＣＩ、ＥＩ检索５０余篇。 · 智能系统学报第９卷方法及其在工业控制和视频信息处理上的应用。承担国家自然科学基金等项目多项，发表学术论文４０余篇，其中

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录