征提取会因为严重的背景噪声而变得效率低下．７）其他环境因素（ｅｎｖｉｒ

正在加载图片...

第3期孙倩茹，等：视频序列的人体运动描述方法综述 ·191· 征提取会因为严重的背景噪声而变得效率低下 Bobick和Davis2)于2001年提出使用人体轮廓 7)其他环境因素(environmental conditions).录模板训练分类器的方法，他们采集单一视角的轮廓并像设置和场景选择也是影响运动分析的重要因素. 对其进行聚类以提取可计算的特征向量.首先利用连例如，室外场景中存在的阴影、光照变化以及人群拥续的轮廓形状建立一种运动能量图(MEI),用于表征挤都会严重影响人体运动识别结果运动发生的位置信息：再建立一种运动历史图 2 经典的人体运动描述方法 (MⅢ)，用于表征轮廓序列的灰度值变化情况：最后通过对这2种特征图像的参数化描述建立运动特征通常来说，不同的运动具有不同的计算复杂度向量（如图2）.Blank4)和Yilmaz先后提出了结合运运动表示方法的不同会直接影响后续识别的效率，动信息的人体3D体积模型，通过获取轮廓序列计算 Bobick[将人的运动分为3类：动作(movement)、行 3D体积的特征值（如体积大小、时空角点位置等）来动(action)和行为(activity),这3类运动分别处于3 计算运动描述向量.除了利用单纯的轮廓和体积信息个不同复杂度的层次上.动作是运动的基元，是最基之外，Wang6]为了探索人体轮廓的运动流形轨迹的本的运动，是形成其他复杂、高级运动的基础.一般内在结构，于2007年提出采用LPp)(R变换)对提来说人体动作在执行过程中会持续较短的时间，其取的人体轮廓序列进行轨迹分析，他们在多个具有挑识别方法一般可以采用几何或概率统计的方法3)] 战性的数据库上对这种方法的鲁棒性进行了实验验一般来说，运动的表示与应用场合有紧密的关系，对证，均取得了较好的识别效果。于不同的情况通常会选择不同的运动表示方法.譬如，在对一个大的场景下进行较远距离的监控时，只需要提取运动目标的轨迹就可以满足需要，而在识别近距离人体动作时，对人的肢体进行2D或者3D 建模则会起到更好的效果[)」动作描述是指给定一段包含人体运动的视频，需要建立起视频（观察）到高维特征空间一种合理的映射，用特征或者特征的组合形式来表述这段运动.参考在第1节中提到的人体运动识别的难点，主要解决途径就是探求具备高类间区分度且对类内元素具有很好的“聚类”作用的特征描述方法.好的运动描述方法可以使人体运动识别系统实现高识别效率，因此近些年来，运动的特征描述成为运动识别的重点研究之一 (a)关键顿 (b)MEI (e)MHI 根据近些年的相关研究成果，关于运动的特征图2人体运动描述子：MEI和MHI 描述方法主要可以分为四大类2]：1)基于时空形状 Fig.2 Human action descriptors:MEI and MHI 模板(spatio-temporal shape template)的运动描述方后续的很多文献致力于获取对视角和尺度变化法；2)基于光流(optical flow)特征的运动描述方法；较为鲁棒的轮廓描述方法，但是在处理实际视频中 3)基于运动轨迹(trajectories)的运动描述方法；4) 出现的遮挡、拥挤、大视角大尺度视频变化等问题基于兴趣点(interest points)的运动描述方法. 时，基于时空形状模板的运动描述方法难以满足识 2.1基于时空形状模板的运动描述方法别要求时空形状模板是一种较早的用于运动识别的方 2.2基于光流特征的运动描述方法法该方法在训练过程中通过对视频序列中检测到基于光流特征的运动描述方法是将人体运动联的人体形状建立起一组与特定运动相对应的人体形合背景变化作为一个变化的整体，然后通过获取主状序列运动识别的过程实际就是模板匹配的过程，运动区域来定位人体运动.光流法不需要预先获取获得训练样本的高质量轮廓模板是这类方法的前图像背景，而且计算结果仅仅依靠连续帧的相对运提.因此，这类方法要求以高精度的人体轮廓分割动，不受复杂背景的影响，因而在基于对象的运动估 (一般会使用背景减除)为前提，因此当出现复杂背计、运动检测和跟踪等领域都有广阔的应用前景[) 景情形时，如相机晃动、人体阴影、人体遮挡或者多光流的基本计算以2帧图像亮度恒定为前提，用泰个运动目标，此类方法的识别率会变得比较低，甚至勒级数一阶展开，使得光流计算受限于2帧图像间会完全失效，征提取会因为严重的背景噪声而变得效率低下．７）其他环境因素（ｅｎｖｉｒｏｎｍｅｎｔａｌｃｏｎｄｉｔｉｏｎｓ）．录像设置和场景选择也是影响运动分析的重要因素．例如，室外场景中存在的阴影、光照变化以及人群拥挤都会严重影响人体运动识别结果．２经典的人体运动描述方法通常来说，不同的运动具有不同的计算复杂度，运动表示方法的不同会直接影响后续识别的效率．Ｂｏｂｉｃｋ［２］将人的运动分为３类：动作（ｍｏｖｅｍｅｎｔ）、行动（ａｃｔｉｏｎ）和行为（ａｃｔｉｖｉｔｙ），这３类运动分别处于３个不同复杂度的层次上．动作是运动的基元，是最基本的运动，是形成其他复杂、高级运动的基础．一般来说人体动作在执行过程中会持续较短的时间，其识别方法一般可以采用几何或概率统计的方法［３］．一般来说，运动的表示与应用场合有紧密的关系，对于不同的情况通常会选择不同的运动表示方法．譬如，在对一个大的场景下进行较远距离的监控时，只需要提取运动目标的轨迹就可以满足需要，而在识别近距离人体动作时，对人的肢体进行２Ｄ或者３Ｄ建模则会起到更好的效果［３］．动作描述是指给定一段包含人体运动的视频，需要建立起视频（观察）到高维特征空间一种合理的映射，用特征或者特征的组合形式来表述这段运动．参考在第１节中提到的人体运动识别的难点，主要解决途径就是探求具备高类间区分度且对类内元素具有很好的“聚类”作用的特征描述方法．好的运动描述方法可以使人体运动识别系统实现高识别效率，因此近些年来，运动的特征描述成为运动识别的重点研究之一．根据近些年的相关研究成果，关于运动的特征描述方法主要可以分为四大类［２］：１）基于时空形状模板（ｓｐａｔｉｏ⁃ｔｅｍｐｏｒａｌｓｈａｐｅｔｅｍｐｌａｔｅ）的运动描述方法；２）基于光流（ｏｐｔｉｃａｌｆｌｏｗ）特征的运动描述方法；３）基于运动轨迹（ｔｒａｊｅｃｔｏｒｉｅｓ）的运动描述方法；４）基于兴趣点（ｉｎｔｅｒｅｓｔｐｏｉｎｔｓ）的运动描述方法．２．１基于时空形状模板的运动描述方法时空形状模板是一种较早的用于运动识别的方法．该方法在训练过程中通过对视频序列中检测到的人体形状建立起一组与特定运动相对应的人体形状序列．运动识别的过程实际就是模板匹配的过程，获得训练样本的高质量轮廓模板是这类方法的前提．因此，这类方法要求以高精度的人体轮廓分割（一般会使用背景减除）为前提，因此当出现复杂背景情形时，如相机晃动、人体阴影、人体遮挡或者多个运动目标，此类方法的识别率会变得比较低，甚至会完全失效．Ｂｏｂｉｃｋ和Ｄａｖｉｓ［２］于２００１年提出使用人体轮廓模板训练分类器的方法，他们采集单一视角的轮廓并对其进行聚类以提取可计算的特征向量．首先利用连续的轮廓形状建立一种运动能量图（ＭＥＩ），用于表征运动发生的位置信息；再建立一种运动历史图（ＭＨＩ），用于表征轮廓序列的灰度值变化情况；最后通过对这２种特征图像的参数化描述建立运动特征向量（如图２）．Ｂｌａｎｋ［４］和Ｙｉｌｍａｚ［５］先后提出了结合运动信息的人体３Ｄ体积模型，通过获取轮廓序列计算３Ｄ体积的特征值（如体积大小、时空角点位置等）来计算运动描述向量．除了利用单纯的轮廓和体积信息之外，Ｗａｎｇ［６］为了探索人体轮廓的运动流形轨迹的内在结构，于２００７年提出采用ＬＰＰ［７］（Ｒ变换）对提取的人体轮廓序列进行轨迹分析，他们在多个具有挑战性的数据库上对这种方法的鲁棒性进行了实验验证，均取得了较好的识别效果．图２人体运动描述子：ＭＥＩ和ＭＨＩＦｉｇ．２Ｈｕｍａｎａｃｔｉｏｎｄｅｓｃｒｉｐｔｏｒｓ：ＭＥＩａｎｄＭＨＩ后续的很多文献致力于获取对视角和尺度变化较为鲁棒的轮廓描述方法，但是在处理实际视频中出现的遮挡、拥挤、大视角大尺度视频变化等问题时，基于时空形状模板的运动描述方法难以满足识别要求．２．２基于光流特征的运动描述方法基于光流特征的运动描述方法是将人体运动联合背景变化作为一个变化的整体，然后通过获取主运动区域来定位人体运动．光流法不需要预先获取图像背景，而且计算结果仅仅依靠连续帧的相对运动，不受复杂背景的影响，因而在基于对象的运动估计、运动检测和跟踪等领域都有广阔的应用前景［８］．光流的基本计算以２帧图像亮度恒定为前提，用泰勒级数一阶展开，使得光流计算受限于２帧图像间第３期孙倩茹，等：视频序列的人体运动描述方法综述 ·１９１·

<<向上翻页向下翻页>>

点击下载：【学术论文】视频序列的人体运动描述方法综述