第1期 肖锋,等:基于区域分割和蒙特卡洛采样的静态图片人体姿态估计 ·39· 采用数据驱动的马尔可夫链蒙特卡洛算法(data 表示第i部分的中心的横坐标,y:表示纵坐标,0:表 driven Markov chain Monte Carlo,DDMCMC),对人 示倾角.图1给出了样本上的标注, 的三维结构进行建模,能够从静态图片中估计出人 的三维姿态,但是其参数设定很复杂,状态维度很 高.文献[9]通过蒙特卡洛采样来减少状态数目,利 用人脸信息和肤色信息来选择初始状态.文献[10] 采用多特征融合的方法来提高DDMCMC算法的精 度和效率.文献[11]采用人检测和人脸检测来逐步 减小搜索的状态空间,而文献[12]提出了2种在 DDMCMC框架下加速状态转移的策略.文献[13]采 用全连接的网络结构来刻画人的结构,对前期检测 的要求较高,只能用在外观特征较显著的图片中.文 献[14]预先利用人的检测得到人体的大致区域,然 后结合形状模型进行更加细致的分割,最后通过轮 廓形状分类的方法得到人的姿态.文献[15]定义了 新的“姿态块”的特征,这些姿态块能够给出其所在 图1人体模型及样本上的标注 的较大部分的3-D状态信息,因此可以通过分类的 Fig.1 Human model and sample annotation 方法得到整体的姿态估计.文献[16]采用边缘特征 1.2非树状概率图模型 与区域特征相结合的方法来提高姿态估计的精度, 本文采用如图2所示的非树状贝叶斯网络作为 不需要借助其他算法进行初始的检测,取得了较好 姿态估计用的概率图模型.这一模型与视觉上直立 的效果。 的人体的连接关系是基本对应的,其中每个圆圈代 本文提出了一种新的静态图片的估计姿态算 表对应人体各部分的隐节点,每个方框代表与其相 法.首先建立人体各部分关系的非树状贝叶斯网络, 对应的隐节点的观测信息.图中X1为躯干的参数 利用边缘模板匹配得到各部分的初始分布,提取边 化表示,也即躯干的位置和朝向,Z,表示躯于所对 缘特征、皮肤特征和对称性特征等特征,采用置信传 应的图像特征,X。为头部的参数化表示,其余四肢 播蒙特卡洛算法进行推理得到新的边缘分布.然后 的对应关系可对照图1和图2得到.与文献[4,9] 利用得到的新的边缘分布来进行区域分割,对分割 中的概率图模型不同,发现头部和左右上胳膊之间 得到的前景区域提取区域相关特征,再次利用置信 的联系更为紧密,因此在图2中头部和左右上胳膊 传播蒙特卡洛算法得到新的近似边缘分布.这样反 之间也有连接,这使得整个概率图模型的结构不再 复进行迭代,在迭代多次之后就能达到一个比较理 是树状结构.该贝叶斯网络的联合概率的表示式如 想的姿态估计结果.与已有相关工作相比,本文的主 式(1). 要创新如下:1)采用非树状的概率图模型,可以利 用空间结构上不相邻的部分的约束;2)针对人体特 点引入一些新的描述特征,包括相对皮肤比例、对称 性等特征,能够更好地刻画人体特点;3)采用蒙特 卡洛采样来进行概率推理,减少了计算量,所用时间 更短 1人体姿态模型 1.1人体姿态的参数化表示 Z. Z. 我们将姿态估计问题抽象为一个贝叶斯估计问 图2姿态估计的概率图模型 题,即通过图像特征的观测来推理对应的隐状态,因 Fig.2 Graphical models for pose estimation 此首先需要将人的姿态表示为参数化的状态.在状 态表示上,选择用矩形框来表示人体每个部分的形 P(X1Z)=Π(X,X)Πb(ZIX) 状及其在图像平面所占据的区域,用三维向量X三 (x,y,0)来表示每个部分的隐状态.其中元素 (1)