图８使用ＰａｇｅＲａｎｋ方法得到的特征选择结果Ｆｉｇ．８Ｆｅａ

正在加载图片...

第3期孙倩茹，等：视频序列的人体运动描述方法综述 ·195· 合要求严格正确的归一化操作.如果特征之间存在严重的维度差异，就必须调整特征空间的维度，否则特征融合之后的性能反而会变得很差， 4.2决策层面的融合方法决策层面的融合是指首先使用多种特征分别训 (a)特征选择结果1 练分类器，然后将得到的几个分类决策进行判决得到最终的分类或者识别结果.显然，这种方法是以独立特征的识别结果为前提的。表1是典型人体运动特征建立、特征选择和特征融合等方法在典型人体运动数据库[4,1]上的识别率的比较。表1典型的运动描述方法的识别率比较 (b)特征选择结果2 Table 1 Recognition rates of traditional action representa- 图8使用PageRank方法得到的特征选择结果 tion methods % Fig.8 Feature selection using PageRank 人体描 KTH WEIZMANN 上述2种特征选择方法利用了特征在分类时表述方法数据库数据库现的不同类间区分能力，其中滤纸法在不进行任何 Sun[2s] 100.00 训练的情况下，力求得到可以实现最优二分类的独 Sun(3s] 94.00 97.80 立特征也就是说，该方法在选择特征的时候不考虑 Lint36] 93.43 类间公共特征.与此不同的是包装器法利用同一特 Wang[) 92.51 100.00 征在不同运动类别上表现出来的特性，通过训练分 Liu(35) 92.30 一类器根据类间独立特征和类间共享特征对运动分类 Ikizler[0] 94.00 90.50 100.00 的影响进行评估，进而评价特征的优劣，实现最终的 Fathito] Zhang(a) 91.33 92.89 特征选择 Klaser[22) 91.40 84.30 4特征融合方法 Niebles[27] 83.30 90.00 Liul4] 94.16 特征融合是指为了得到更好的运动表示模型和 Zhaol4] 91.17 89.92 更高的运动识别率，将来自不同获取渠道的特征进 Gilbert[45] Savaresel4 86.83 行合理的信息融合.一般来说，只有对具有互补作用 Nowozin【4J 84.72 的特征进行融合时才会提高运动识别率.另外，由于 Dollar[20) 81.17 85.20 不同特征在维度、尺度和可行性上都有区别，所以直接融合反而会带来性能的降低.由此可见，合理有效总结与展望的融合算法是极为重要的现有的特征融合方法一视频中的人体运动描述作为一个新的研究领般可以划分为2种：特征层面的融合和决策层面的域，在实际应用上存在着很多问题，在今后的若干年融合中仍会是一个研究热点如下几个方面已经成为未 4.1特征层面的融合方法来的发展趋势。所谓特征层面的融合，是指对不同特征的特征 1)从视频中获取足够显著的人体运动特征.基空间进行合并，最终使用一个融合之后的特征对运于视频的人体运动特征提取是人体运动识别领域的动进行表示.这是最常见的一种融合思路.Lin等[36 重要研究内容.由于人体是非刚性结构，且运动过程指出可以将运动特征和形状特征进行加权融合，其中存在遮挡等问题，使得基于视频的人体运动捕获中各项的最优权值利用部分训练样本的交叉验证计非常困难：然而目前国内外的研究成果对诸多问题算得到.Schindler等[3]将3类局部特征（时空梯度、进行简化，且大多只能对标准数据库中的运动进行光流、ST)进行了融合，在统一框架的实验中提升有效的捕获.从实际场景的运动视频中捕获、提取出了4.5%的人体运动识别率. 显著的人体运动信息始终是推动整个运动识别领域这类方法比较直观简单，但是特征直方图的融发展的重要研究方向.图８使用ＰａｇｅＲａｎｋ方法得到的特征选择结果Ｆｉｇ．８ＦｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｕｓｉｎｇＰａｇｅＲａｎｋ上述２种特征选择方法利用了特征在分类时表现的不同类间区分能力，其中滤纸法在不进行任何训练的情况下，力求得到可以实现最优二分类的独立特征．也就是说，该方法在选择特征的时候不考虑类间公共特征．与此不同的是包装器法利用同一特征在不同运动类别上表现出来的特性，通过训练分类器根据类间独立特征和类间共享特征对运动分类的影响进行评估，进而评价特征的优劣，实现最终的特征选择．４特征融合方法特征融合是指为了得到更好的运动表示模型和更高的运动识别率，将来自不同获取渠道的特征进行合理的信息融合．一般来说，只有对具有互补作用的特征进行融合时才会提高运动识别率．另外，由于不同特征在维度、尺度和可行性上都有区别，所以直接融合反而会带来性能的降低．由此可见，合理有效的融合算法是极为重要的．现有的特征融合方法一般可以划分为２种：特征层面的融合和决策层面的融合．４．１特征层面的融合方法所谓特征层面的融合，是指对不同特征的特征空间进行合并，最终使用一个融合之后的特征对运动进行表示．这是最常见的一种融合思路．Ｌｉｎ等［３６］指出可以将运动特征和形状特征进行加权融合，其中各项的最优权值利用部分训练样本的交叉验证计算得到．Ｓｃｈｉｎｄｌｅｒ等［３７］将３类局部特征（时空梯度、光流、ＳＩＦＴ）进行了融合，在统一框架的实验中提升了４．５％的人体运动识别率．这类方法比较直观简单，但是特征直方图的融合要求严格正确的归一化操作．如果特征之间存在严重的维度差异，就必须调整特征空间的维度，否则特征融合之后的性能反而会变得很差．４．２决策层面的融合方法决策层面的融合是指首先使用多种特征分别训练分类器，然后将得到的几个分类决策进行判决得到最终的分类或者识别结果．显然，这种方法是以独立特征的识别结果为前提的．表１是典型人体运动特征建立、特征选择和特征融合等方法在典型人体运动数据库［４，１９］上的识别率的比较．表１典型的运动描述方法的识别率比较Ｔａｂｌｅ１Ｒｅｃｏｇｎｉｔｉｏｎｒａｔｅｓｏｆｔｒａｄｉｔｉｏｎａｌａｃｔｉｏｎｒｅｐｒｅｓｅｎｔａ⁃ ｔｉｏｎｍｅｔｈｏｄｓ％人体描述方法ＫＴＨ数据库［１９］ＷＥＩＺＭＡＮＮ数据库［４］Ｓｕｎ［２８］ — １００．００Ｓｕｎ［３８］９４．００９７．８０Ｌｉｎ［３６］９３．４３ — Ｗａｎｇ［３９］９２．５１１００．００Ｌｉｕ［３５］９２．３０ — Ｉｋｉｚｌｅｒ［４０］９４．００ — Ｆａｔｈｉ［１０］９０．５０１００．００Ｚｈａｎｇ［４１］９１．３３９２．８９Ｋｌäｓｅｒ［４２］９１．４０８４．３０Ｎｉｅｂｌｅｓ［２７］８３．３０９０．００Ｌｉｕ［４３］９４．１６ — Ｚｈａｏ［４４］９１．１７ — Ｇｉｌｂｅｒｔ［４５］８９．９２ — Ｓａｖａｒｅｓｅ［４６］８６．８３ — Ｎｏｗｏｚｉｎ［４７］８４．７２ — Ｄｏｌｌａｒ［２０］８１．１７８５．２０５总结与展望视频中的人体运动描述作为一个新的研究领域，在实际应用上存在着很多问题，在今后的若干年中仍会是一个研究热点．如下几个方面已经成为未来的发展趋势．１）从视频中获取足够显著的人体运动特征．基于视频的人体运动特征提取是人体运动识别领域的重要研究内容．由于人体是非刚性结构，且运动过程中存在遮挡等问题，使得基于视频的人体运动捕获非常困难；然而目前国内外的研究成果对诸多问题进行简化，且大多只能对标准数据库中的运动进行有效的捕获．从实际场景的运动视频中捕获、提取出显著的人体运动信息始终是推动整个运动识别领域发展的重要研究方向．第３期孙倩茹，等：视频序列的人体运动描述方法综述 ·１９５·

<<向上翻页向下翻页>>

点击下载：【学术论文】视频序列的人体运动描述方法综述