第6卷第1期 智能系统学报 Vol.6 No.1 2011年2月 CAAI Transactions on Intelligent Systems Feb.2011 doi:10.3969/i.i8sn.1673-4785.2011.01.004 基于区域分割和蒙特卡洛采样的 静态图片人体姿态估计 肖锋,周杰 (清华大学自动化系,北京100084) 摘要:静态图片中的人体姿态估计是近年来图像分析领域的重要问题之一.由于静态图片中可利用的信息较少, 且存在多关节引起的形状畸变、着装变化、背景干扰及遮挡等难点,使得这一问题具有很大挑战性.考虑到现有算法 的不足,提出了一种基于区域分割和置信传播蒙特卡洛采样的人体姿态估计算法,将前景区域分割加入到姿态估计 中,在概率图模型中引人非树状的约束,采用蒙特卡洛采样来进行概率推理.实验表明该算法比经典的算法在公共 数据集上给出了更加精确的估计结果,同时运行时间也减少了25%, 关键词:静态图片;人体姿态估计;区域分割:蒙特卡洛采样;置信传播 中图分类号:TP391.4文献标识码:A文章编号:16734785(2011)01003806 Human pose estimation in static images based on region segmentation and Monte Carlo sampling XIAO Feng,ZHOU Jie (Department of Automation,Tsinghua University,Beijing 100084,China) Abstract:Human pose estimation in static images is one of the important issues in the field of image analysis in re- cent years.The main difficulties are that there's less available information in static image,besides,there're figure distortion due to multiple joints,change in clothes,background disturbance and shading,etc.,which make the problem challenging.Aiming at the deficiency of existing algorithm,a new algorithm was proposed for human pose estimation in static images based on region segmentation,belief propagation and Monte-Carlo sampling,in which foreground region segmentation was incorporated into the pose estimation,non-tree constraints were introduced in the probabilistic graphical model,and Monte-Carlo sampling was utilized to carry out probabilistic inference.Ex- perimental results demonstrate that the proposed algorithm performs better on a common database compared with classical algorithm,producing a more precise estimate result and reducing 25%running time. Keywords:static images;human pose estimation;region segmentation;Monte Carlo sampling;belief propagation 静态图片中的人体姿态估计问题是计算机视觉系,可以将不同部分的检测结果组合起来,组合的算 领域中的一个重要问题,在基于内容的图片检索和 法框架一般是基于图形结构(pictorial structure)的 过滤方面有广泛的应用13].考虑到人体的多关节 物体检测算法416].在文献[4]中,假设每个部分的 特性,一般估计人的姿态时都需要将人分成多个部 前景是一个矩形框,而环绕该矩形框的区域是该部 分来分别检测(通常是按照关节来进行划分),因此 分的背景,利用前景和背景的差异作为特征,进而采 静态图片中的人体姿态估计问题可以等同于检测每 用能量函数最小化或后验概率最大化的表示,来解 个部分的位置、角度及大小.多关节引起的形状畸 决结构模型匹配问题.文献[56]在区域分割或边缘 变、人的着装变化、背景干扰以及遮挡都使得这一问 聚合的基础上,建立一个综合各部分外观和人体结 题具有很大的挑战性。 构的能量函数,通过对该能量函数寻优来判断各分 考虑到人体各个部分有着比较固定的连接关 割块是否属于某个部分.文献[7]将各部分的形状 和外观同时作为特征训练得到前景和背景的差异模 收稿日期:2010-1105. 基金项目:国家自然科学基金资助项目(60573062,60673106) 型,此外还建立了相邻部分之间的差异模型.基于后 通信作者:肖锋.E-mail:xiao99@mails..tsinghua.cu.cn. 验概率最大化的代表性的有文献[8-15].文献[8]
第1期 肖锋,等:基于区域分割和蒙特卡洛采样的静态图片人体姿态估计 ·39· 采用数据驱动的马尔可夫链蒙特卡洛算法(data 表示第i部分的中心的横坐标,y:表示纵坐标,0:表 driven Markov chain Monte Carlo,DDMCMC),对人 示倾角.图1给出了样本上的标注, 的三维结构进行建模,能够从静态图片中估计出人 的三维姿态,但是其参数设定很复杂,状态维度很 高.文献[9]通过蒙特卡洛采样来减少状态数目,利 用人脸信息和肤色信息来选择初始状态.文献[10] 采用多特征融合的方法来提高DDMCMC算法的精 度和效率.文献[11]采用人检测和人脸检测来逐步 减小搜索的状态空间,而文献[12]提出了2种在 DDMCMC框架下加速状态转移的策略.文献[13]采 用全连接的网络结构来刻画人的结构,对前期检测 的要求较高,只能用在外观特征较显著的图片中.文 献[14]预先利用人的检测得到人体的大致区域,然 后结合形状模型进行更加细致的分割,最后通过轮 廓形状分类的方法得到人的姿态.文献[15]定义了 新的“姿态块”的特征,这些姿态块能够给出其所在 图1人体模型及样本上的标注 的较大部分的3-D状态信息,因此可以通过分类的 Fig.1 Human model and sample annotation 方法得到整体的姿态估计.文献[16]采用边缘特征 1.2非树状概率图模型 与区域特征相结合的方法来提高姿态估计的精度, 本文采用如图2所示的非树状贝叶斯网络作为 不需要借助其他算法进行初始的检测,取得了较好 姿态估计用的概率图模型.这一模型与视觉上直立 的效果。 的人体的连接关系是基本对应的,其中每个圆圈代 本文提出了一种新的静态图片的估计姿态算 表对应人体各部分的隐节点,每个方框代表与其相 法.首先建立人体各部分关系的非树状贝叶斯网络, 对应的隐节点的观测信息.图中X1为躯干的参数 利用边缘模板匹配得到各部分的初始分布,提取边 化表示,也即躯干的位置和朝向,Z,表示躯于所对 缘特征、皮肤特征和对称性特征等特征,采用置信传 应的图像特征,X。为头部的参数化表示,其余四肢 播蒙特卡洛算法进行推理得到新的边缘分布.然后 的对应关系可对照图1和图2得到.与文献[4,9] 利用得到的新的边缘分布来进行区域分割,对分割 中的概率图模型不同,发现头部和左右上胳膊之间 得到的前景区域提取区域相关特征,再次利用置信 的联系更为紧密,因此在图2中头部和左右上胳膊 传播蒙特卡洛算法得到新的近似边缘分布.这样反 之间也有连接,这使得整个概率图模型的结构不再 复进行迭代,在迭代多次之后就能达到一个比较理 是树状结构.该贝叶斯网络的联合概率的表示式如 想的姿态估计结果.与已有相关工作相比,本文的主 式(1). 要创新如下:1)采用非树状的概率图模型,可以利 用空间结构上不相邻的部分的约束;2)针对人体特 点引入一些新的描述特征,包括相对皮肤比例、对称 性等特征,能够更好地刻画人体特点;3)采用蒙特 卡洛采样来进行概率推理,减少了计算量,所用时间 更短 1人体姿态模型 1.1人体姿态的参数化表示 Z. Z. 我们将姿态估计问题抽象为一个贝叶斯估计问 图2姿态估计的概率图模型 题,即通过图像特征的观测来推理对应的隐状态,因 Fig.2 Graphical models for pose estimation 此首先需要将人的姿态表示为参数化的状态.在状 态表示上,选择用矩形框来表示人体每个部分的形 P(X1Z)=Π(X,X)Πb(ZIX) 状及其在图像平面所占据的区域,用三维向量X三 (x,y,0)来表示每个部分的隐状态.其中元素 (1)
·40 智能系统学报 第6卷 式中:e是各个隐节点之间的连接的集合,而v则是 图3给出了对于一张样本图片中躯干的前景区 从隐节点到观测节点的连接的集合;中:(Z:IX)是单 域分割的结果,该图中四肢的颜色和躯干的颜色相 个节点似然度函数,在后续论述中简记为中:(X); 差不多,边缘特征区分度也不大,因此仅靠颜色进行 中(X:,X)是2个节点之间的势函数,主要表示2 分割时,有可能会包含部分四肢以及其他一些干扰 个部分之间的关系.为减少计算量,本文采用的贝叶 区域 斯网络中仅包括单个节点和2个节点的势函数,这 些函数的定义在第2节中介绍.在定义了上述后验 概率以及结构模型之后,姿态估计问题就化为估计 边缘分布P(X:IZ)的问题. 2特征描述 图3样本图片和对应的躯干前景区域 2.1单节点的似然度模型 Fig.3 Foreground regions for torso 各部分的似然度函数的定义如式(2)所示,其 区域特征定义如式(4)所示,其中T:表示一个 中四肢的似然度函数由边缘特征(X:)和前景区 部分的前景区域的模板6(X)表示前景区域F: 域特征f(X:)(见第2.1.2小节)组合而成.头部和 与平移和旋转到X:处的模板的匹配程度, 躯干的似然度函数由边缘特征、对称性特征(X:) (见第2.1.1小节)和前景区域特征组合而成。 f(X:)=>F:*TR(x-xy-y).(4) 中:(X)= 2.22个节点的势函数 exp(f(X:)+f(X)),i=2,3,…,9, 2个节点的势函数由结构似然度和皮肤特征对 应相乘得到. expf(X:)+f(X)-f(X)),i=1,10. (2) 2.2.1结构似然度 2.1.1边缘特征和对称性特征 本文采用的边缘特征如式(3)所示[9],其中的 边缘1为对应于人的四肢的矩形的较长的2条边, 或者对应于头部和躯干的4条边.8.(x,y:)和 6,(x:y:)分别表示在(x,y:)处x方向和y方向的 边缘强度,£m表示整条边缘1上边缘强度的最大 值,N表示整条边缘上的点的数目,是一个归一化 的量.这一特征既考虑了边缘的强度,又考虑了边缘 的方向性, f(X:) I (xi,Yi)sin 0:-,(x,yi)cos 0:1 ()1 Niom 图4结构模型及链接点的图示 (3) Fig.4 Structural model and joint points 对称性特征f(X:)通过计算第i部分左半和右 在单个部分的外观特征不明显的情况下,结构 半区域的颜色直方图的卡方距离(chi-square dis- 似然度是对2个部分的匹配程度进行评价的重要指 tance)得到. 标.结构似然度的定义如式(5)所示,它包含两部分 2.1.2前景区域特征 特征,一部分度量了相对位置的似然度,另一部分是 采用基于边缘的模板匹配算法16,可以得到一 相对朝向的似然度.其中J,表示第i部分到第j部 个较粗略的各部分状态的分布,记为I:(X:).以这一 分的链接点,J,表示第j部分到第i部分的链接点, 分布为重要性函数,通过置信传播蒙特卡洛算法的 σ:是通过样本训练得到的链接点的距离的方差.图 概率推理,可以得到一个新的分布P(X:IZ).将这 4是结构模型和链接点的图示,其中用三角形和圆 一分布对应到图像上,可以得到各个部分的颜色分 形标出了对应的链接点.相对朝向的似然度定义为 布的直方图,根据这一直方图对图像进行前景区域 2个部件的相对朝向在训练样本中出现的频率, 的分割.由于使用了重要性函数来进行采样,因此可 以避免对不重要状态的计算. 6黑y). ,(5)
第1期 肖锋,等:基于区域分割和蒙特卡洛采样的静态图片人体姿态估计 ·41… 2.2.2皮肤特征 示,将图像中的每个位置都作为一个状态,带来了很 通常利用皮肤信息的方式是直接计算单个部分 大的计算量.文献[9]则采用蒙特卡洛算法来对这 所覆盖区域的皮肤似然度9],也即统计当前肢体所 一积分进行近似计算.我们认为颜色特征以及由此 覆盖区域内每个像素的皮肤似然度的均值.这种处 得到的前景区域分割是一种比较稳定的特征,因此 理方法有2个问题.首先,不同样本中同一部分的皮 结合区域分割与置信蒙特卡洛采样(belief propaga~ 肤区域的范围差异很大.一些样本中某个部分完全 tion Monte Carlo,BPMC)算法[91,提出基于区域分 暴露因而皮肤区域较大,而另外一些样本中同样的 割的置信蒙特卡洛采样(region segmentation belief 部分皮肤区域很小.其次,皮肤区域特征的变化区间 propagation Monte Carlo,RSBPMC)算法. 也很大 RSBPMC算法的基本步骤如下(下文用sR=,代表 为了解决这2个问题,采用皮肤似然度的相对 从1:中采样得到的X:的样本,注意式(9)和式(10)可 强度关系来对皮肤区域似然度进行约束.首先计算 分别看作式(7)和式(8)在离散状态下的近似). 单个部分的皮肤似然度,采用皮肤像素似然度分布 1)按照重要性函数I(X),从状态空间中采集 模型计算该部分覆盖区域内每个点是皮肤的似 样本{s} 然度,然后对整个部分取平均,即可得到X:对应的 状态是皮肤的可能性P(X:),采用式(6)所示的 2)重新计算权重:对每个s1以及每个j∈ 势函数来表达皮肤特征,利用了如下部分之间的皮 N(),定义: 肤似然度的关系:头部与左大臂、头部与右大臂,头 ω知=G(sR)/1.(s), 部与躯干.当i为左大臂、右大臂或者躯干,j为头部 G(s41)=∑[π*中,(s)* 时,选择前者似然度小于后者的样本,即认为左右上 臂及躯干的区域是皮肤的可能性均应该小于头部 (s,s)Πω]. (9) 的.若i和j的顺序与上述相反,则选择前者似然度 3)计算每个样本的概率:按照各样本传递的信息 大于后者的样本. 对ω0JeN(i)进行概率归一化,公式如式(10): m=(s)o。 (10) 1,Pa(X:)p(X), (6 5)重新计算特征,按照步骤2)~3)进行推理. 6)迭代:kk+1,进行迭代 i=10,j=1,2,3; 0. 其他 7)输出推理结果: P(XlZ)~{s,π}0= 3基于区域分割的置信蒙特卡洛采样 式中:s=s,π=π,推理结果中概率最大的 状态就是该算法的估计状态。 算法 在RSBPMC算法中,重要性函数的选择对于算 置信传播算法是在概率图模型中进行概率推 法能够较快采样到正确的样本很重要.文献[9]的 理,即由式(1)得到边缘分布P(X:1Z)的一种算法, 主要目的是分析足球运动员的姿态,在这些图片中 计算公式如式(7)和式(8)所示,更详细的论述可参 4个下半肢体(小腿和小臂)的皮肤区域是暴露的. 考文献[18].在理想状况下,置信传播算法中的状 在处理过程中,利用人脸检测算法检测出人脸,利用 态假设为连续的,传递的信息通过积分计算,从X 皮肤信息检测出4个下半肢体,然后利用顺序检测 到X:传递的信息如式(7)所示。 的方法找到4个上半肢体和躯干,这种算法比较简 mg(X)= 单和直观,但对处理的图片有较强的限制.我们用文 [(X)(x,)m()], (7) 献[16]中的基于边缘的模板匹配算法作为初始化 keNG)li 算法,避免了对着装的限制. P(XIZ)x中(X)Πm(X). (8) 在概率推理方面,文献[4,16]均假设了树状模 由式(7)可以看出,该算法中信息m的计算需 型.文献[19]指出,对于非树状的概率图模型,采用 要对所有可能的状态进行积分.而对一般的函数积 有环的置信传播算法往往可以保证收敛.由于本文 分无法得到解析解,因此需要对状态进行离散化,并 采用了蒙特卡洛采样,状态数大大减少,因此可以采 将积分转化为求和.文献[16]采用离散的状态表 用非树状的概率图模型,同时还能保证识别的效率
42 智能系统学报 第6卷 4实验结果与分析 200 ·基于形变模板的算法 -RSBPMC算法 当前进行静态图片的姿态估计算法研究的公共 160 数据集较少,只有文献[16]的作者提供了算法代码 期 120 和公开数据集,选择该数据集进行实验并与文献 [16]中的算法进行对比. 80L 与文献[16]一样,实验也采用前100张图片作 40f 为训练数据,对第101~170张图片进行测试.2种 算法的实验结果都是取边缘分布最大的状态,然后 10 20 304050 60 70 计算各个关节点的坐标差的均方误差.对每张图片, 图像标号 每次选择N=150个状态,共迭代4次,算法采用 图5本文算法与文献[16]算法的性能比较 Matlab实现.统计表明,本文算法处理一张图片平均 Fig.5 Comparison of the performance of our algo 耗时200s,而在同一台计算机上文献[16]的算法 rithm with the algorithm in refrence [16] 处理一张图片平均耗时2668,在计算时间上减少了 图6是RSBPMC算法与文献[16]中的算法的 25%.在算法精度上,图5给出了RSBPMC算法与 部分实验结果的对比图,其中奇数列是RSBPMC的 文献[16]的算法的估计关节点与标注关节点的均 实验结果,偶数列是文献[16]中的算法的实验结 方误差结果对比,2种算法在所有样本上的平均误 果.图6中的2和c2的左腿以及b2都错误地选择 差分别是24.3和49.8个像素,RSBPMC算法比文 了边缘特征较强的区域,b2的结果整体发生了较大 献[16]中的算法的估计精度平均提高了51.1%.此 偏移:d2和a4没有利用皮肤特征,所以有较多的肢 外还可以通过正确估计的部分数占总的部分数的百 体都出现了很大的偏差;b4既没有利用皮肤特征, 分比来评价一个算法的好坏.当一个部分的2个端 也没有利用对称性特征,因此实验结果与人的构型 点的估计位置与标定位置之间的距离均小于该部分 相去甚远;c4误差的主要原因是没有利用皮肤特征 的长度的一半时,则认为该部分的估计是正确的.按 以及受到草地边缘的干扰;d4的错误原因是其模型 照这一准则RSBPMC算法的正确率为57.4%,文献 受到中左腿和躯干的强边缘的影响.而本文提出的 [16]的算法的正确率为30.4%,因此按这一指标本 RSBPMC算法,由于考虑了人体对称性以及肤色均 文算法也大幅优于文献[16]的算法. 衡性等特征,采用了更合理的非树状约束模型,其检 测精度比较理想。 图6本文算法与文献[16]中的算法的实验结果对比 Fig.6 Comparison of experimental results of our algorithm and the algorithm of reference[16]
第1期 肖锋等:基于区域分割和蒙特卡洛采样的静态图片人体姿态估计 43. 5结束语 [10]HU Zhilan,WANG Guijin,LIN Xinggang,et al.Recov- ery of upper body poses in static images based on joints de- 本文提出了一种新的姿态估计的算法,与现有 tection[J].Pattern Recognition Letters,2009,30(5): 方法相比,存在如下改进:在采用特征方面,考虑了 503-512. 人体的对称性以及皮肤、各部分颜色的均衡性等更 [11]FERRARI V.MARIN-JIMENEZ M.ZISSERMAN A.Pro-- gressive search space reduction for human pose estimation 适合描述人体的特征:在推理算法方面,采用蒙特卡 [C]/IEE Computer Society Conference on Computer Vi- 洛算法提高了计算速度;同时采用了非树状的约束 sion and Pattern Recognition.Anchorage,USA,2008:1-8. 关系,使得精度得到了提高.在后续工作中,将研究 [12]ZHANG Xiaogin,LI Changcheng,TONG Xiaofeng.et al. 如何改进特征描述,以期提出更好的特征描述方法, Efficient human pose estimation via parsing a tree structure 提高人体姿态检测的性能 based human model[C]//IEEE International Conference 参考文献: on Computer Vision.Kyoto,Japan,2009:1349-1356. [3]JBERGTHOLDT M,JAPPES J,SCHMIDT S,et al.A. [1]EICHNER M,FERRARI V.Better appearance models for study of parts-based object class detection using complete pictorial structures[C]//Proceedings of British Machine Vi- graphs[J].International Journal of Computer Vision,, sion Conference.London,UK,2009::6-17. 2010,87(1/2):93-117. [2)杨金锋付惆宇,谭铁牛,等一种新型的基于内容的图 [14]CHEN Qiang,ZHENG Enliang,LIU Yuncai.Pose estima- 像识别与过滤方法[J]:.通信学报,2004,25(7):98 tion based on human detection and segmentationJ].Sci- 106. ence in China Series F:Information Sciences,2009,52 YANG Jinfeng,FU Zhouyu,TAN Tieniu,et al.A novel al- ②):244-251. gorithm for content-based image recognition and filtering 15]]BOURDEV L.MALIK J.Poselets:body part detectors .Journal of China Institute of Communications,2004, trained using 3D human pose annotation[C]//IEEE Inter-. 25(7):93-106 national Conference on Computer Vision.Kyoto,Japan,. 3 HU Weiming,WU Ou,CHEN Zhouyao,et al.Recognition 2009::1365-1374. of pornographic web pages by classifying texts and images [16]RAMANAN D.Learning to parse images of articulated [IEEE Transactions on Pattern Analysis and Machine bodies[C]//Proceedings of the Twentieth Annual Confer-- Intelligence,2007,29(6):1019-1034. ence on Neural Information Processing Systems.Vancou-- 4]FELZENSZWALB P.HUTTENLOCHER D.Pictorial struc- ver,Canada,2006::1129-l136. ures for object recognition[J].International Journal of [17]JONES M,REHG J.Statistical color models with applica- Computer Vision,2005,61(1)):55-79. tion to skin detection[J].International Joumal of Comput- ]MORI G,REN Xiaofeng,EFROS A,et al.Recovering hu- er Vision,2002,46(1):81-96. man body configurations:combining segmentation and rec- 18]YEDIDIA J,FREEMAN W.WEISS Y.Understanding be- ognition[C]//IEEE Computer Society Conference on Com- lief propagation and its generalizations[J].Exploring Arti- puter Vision and Pattern Recognition.Washington,DC, ficial Intelligence in the New Millennium,2002,8(1)): USA,2004:326-333. 236-239」 6 IREN Xiaofeng,BERG A,MALIK J.Recovering human 作者简介: body configurations using pairwise constraints between parts 肖锋,男,1982年生,博士研究生 [C]//EEE Intemational Conference on Computer Vision. 主要研究方向为姿态估计、图像处理、 Beijing,China,2005:824-831. 图片分类 [7]ROBERTS T,MCKENNA S,RICKETTS I.Human pose estimation using partial configurations and probabilistic re- gions[J].International Journal of Computer Vision,2007, 73(3)1:285-306. LEE M,COHEN I.A model-based approach for estimating 周杰,男,1968年生,教授、博士生 human 3D poses in static images[J].IEEE Transactions on 导师,主要研究方向为模式识别、计算】 Pattern Analysis and Machine Intelligence,2006,28(6)): 机视觉、多媒体信息处理、信息服务科 905-916. 学与技术.承担或完成国家自然科学基 [9]HUA Gang,YANG Minghsuan,WU Ying.Learning to esti 金、“863“计划项目等10余项,中国航 mate human pose with data driven belief propagation[C]// 海学会科学技术奖二等奖等多项奖励, EEE Computer Society Conference on Computer Vision and 在国外重要学术期刊上发表学术论文20余篇: Pattem Recognition.San Diego,USA,2005::747-754
[8] LEE M,COHEN I. A model-based approach for estimating human 3D poses in static images[J] . IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(6) : 905-916. [12]ZHANG Xiaoqin,LI Changcheng,TONG Xiaofeng,et al. Efficient human pose estimation via parsing a tree structure based human model[C] //IEEE International Conference on Computer Vision. Kyoto,Japan,2009: 1349-1356. 肖锋,等: 周杰,男,1968年生,教授、博士生 导师,主要研究方向为模式识别、计算 机视觉、多媒体信息处理、信息服务科 学与技术.承担或完成国家自然科学基 金、"863"计划项目等10余项,中国航 海学会科学技术奖二等奖等多项奖励, 在国外重要学术期刊上发表学术论文20余篇. 基于区域分割和蒙特卡洛采样的静态图片人体姿态估计 [16] RAMANAN D. Learning to parse images of articulated bodies[C]//Proceedings of the Twentieth Annual Conference on Neural Information Processing Systems. Vancouver,Canada,2006: 1129-1136. [1] EICHNER M,FERRARI V. Better appearance models for pictorial structures[ C]//Proceedings of British Machine Vision Conference. London,UK,2009: 6-17. YANG Jinfeng,FU Zhouyu,TAN Tieniu,et al. A novel algorithm for content-based image recognition and filtering [J].Journal of China Institute of Communications,2004, 25(7) : 93-106. [13] BERGTHOLDT M,JAPPES J,SCHMIDT S,et al. A study of parts-based object class detection using complete graphs[ J]. International Journal of Computer Vision, 2010,87(1/2) : 93-117. 6 ] REN Xiaofeng,BERG A,MALIK J. Recovering human body configurations using pairwise constraints between parts [C] //IEEE International Conference on Computer Vision. Beijing,China,2005: 824-831. [10] HU Zhilan,WANG Guijin,LIN Xinggang,et al. Recovery of upper body poses in static images based on joints detection[ J]. Pattern Recognition Letters,2009,30(5) : 503-512. [14] CHEN Qiang,ZHENG Enliang,LIU Yuncai. Pose estimation based on human detection and segmentation[J] . Science in China Series F: Information Sciences,2009,52 (2) : 244-251. 4 ] FELZENSZWALB P,HUTTENLOCHER D. Pictorial strucures for object recognition[J]. International Journal of Computer Vision,2005,61(1) :55-79. 5结束语 本文提出了一种新的姿态估计的算法,与现有 方法相比,存在如下改进: 在采用特征方面,考虑了 人体的对称性以及皮肤、各部分颜色的均衡性等更 适合描述人体的特征;在推理算法方面,采用蒙特卡 洛算法提高了计算速度;同时采用了非树状的约束 关系,使得精度得到了提高.在后续工作中,将研究 如何改进特征描述,以期提出更好的特征描述方法, 提高人体姿态检测的性能. [11] FERRARI V,MARIN-JIMENEZ M,ZISSERMAN A. Progressive search space reduction for human pose estimation [C] //IEE Computer Society Conference on Computer Vision and Pattern Recognition. Anchorage,USA,2008: 1-8. 3 ] HU Weiming,WU Ou,CHEN Zhouyao,et al. Recognition of pornographic web pages by classifying texts and images [J] . IEEE Transactions on Pattern Analysis and Machine Intelligence,2007,29(6) : 1019-1034. [9] HUA Gang,YANG Minghsuan,WU Ying. Learning to esti mate human pose with data driven belief propagation[C]// EEE Computer Society Conference on Computer Vision and Pattem Recognition. San Diego,USA,2005: 747-754. 参考文献: 43. [18] YEDIDIA J,FREEMAN W,WEISS Y. Understanding belief propagation and its generalizations[J]. Exploring Artificial Intelligence in the New Millennium,2002,8(1) : 236-239 15] BOURDEV L,MALIK J. Poselets: body part detectors trained using 3D human pose annotation[ C] //IEEE International Conference on Computer Vision. Kyoto,Japan, 2009: 1365-1374. 肖锋,男,1982年生,博士研究生, 主要研究方向为姿态估计、图像处理、 图片分类. 2]杨金锋,付周宇,谭铁牛,等.一种新型的基于内容的图 像识别与过滤方法[J] .通信学报,2004,25(7) : 93- 106. 第1期 [5] MORI G,REN Xiaofeng,EFROS A,et al. Recovering human body configurations: combining segmentation and recognition[ C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington,DC, USA,2004: 326-333. [7] ROBERTS T,MCKENNA S,RICKETTS I. Human pose estimation using partial configurations and probabilistic regions[J]. International Journal of Computer Vision,2007, 73(3) :285-306. [17]JONES M,REHG J. Statistical color models with application to skin detection[J]. International Journal of Computer Vision,2002,46(1) : 81-96. 作者简介: