区域ｂｉ，ｂｊ；计算其重叠面积Ｓｂｉ∩ｂｊ。如果Ｓｂｉ∩ｂｊ＞

点击下载：【机器学习】一种鲁棒的Multi-Egocentric视频中的多目标检测及匹配算法

正在加载图片...

·622 智能系统学报第11卷区域b:,;计算其重叠面积Sn。如果Sn>82,其 H(p:)=1,P:∈边界超像素 (2) 中0，为阈值，则根据式(1)更新显著目标区域并删 H(P:)=0,P:∈非边界超像素除队中面积较小的那个显著目标候选区域对任意超像素p:,计算其属于显著目标可能性为 fb:=[min(x:,x)min(yy)max(元：，)max(:,）s+ D(p:)= （ω中.（P:P)+w.(p:,P)）·H(P) s],S:>S i=1*i (3) b=[min(x:,x）min(y:y)max(元：，x)max(y:,y)s:+ 式中：山(P:P)表示超像素P:和p的颜色相似度， si],S;>S: 由颜色直方图特征向量的k2距离确定，中(P:,P)表 (1) 示超像素P:和P,之间的运动相似度，由光流模直方 4)重复执行3)，直至无重叠的显著目标候选区图特征向量的K2距离确定，ω。和ω。为权值。域，算法结束。计算所有超像素的显著目标可能性后，保留 1.2基于局部相似度的目标区域优化算法超像素集合P中D(P:)≥0，(0，为阈值)的超像由基于空间位置关系的区域融合算法得到融合素P:,从而得到优化后的显著目标区域，基于局后的显著目标区域中包含了较多的非目标区域，为部相似度的D计算式(3)的区域优化算法示意了更精确地检测目标区域，本文提出基于局部相似如图3。度的区域优化算法对目标区域进行进一步的优化。由于，经过两步层进目标检测后，得到了各个视首先对显著目标区域b∈B进行超像素分割，得超角的Egocentric视频每帧中的显著目标检测结果，像素集合P={p,|i=1,2,…,n},由超像素空间位置下面将对各个视角中的显著目标进行匹配。设置超像素的边界属性： D(p) D(p.) D(p,) 区域优化 (Dp)≥0) 粗检测结果 D(p) 局部相似度计算显著目标区域b 超像素分割区域优化后的目标区域图3基于局部相似度的区域优化算法 Fig.3 Bounding box area optimization based on local similarity 2基于HOG特征的目标匹配算法 (HOG),并将不同level的直方图特征连接起来组成特征向量，：为了实现muli-egocentric中的多目标匹配，首 4)最后将'，和B,输入SVM分类器中进行先对数据集中关键帧的显著目标进行人工标注得到训练显著目标区域h,以及对应目标编号B,构建训练集 5)重复执行3)、4)直到所有显著目标区域训练 H={(hnBn)1m=1,2,…,Q:Bn∈{0,1，…，Q},其完毕，输出SVM目标匹配模型。基于HOG特征的目标匹配分类器训练流程如中Q为标注的目标个数，Q为目标分类数。基于图4所示。 HOG特征的目标匹配算法如下：由两步层进法检测得到多视角的显著目标后，算法2基于H0G特征的目标匹配算法基于HOG特征的目标匹配分类器实现多视角中多 1)输入H={(hn,Bn)17=1,2,…,Q,B,∈{0，目标的匹配流程如图5所示。 1,…,Q}作为输入： 3实验结果 2)初始化sVM分类器参数，bins以及level;: 3)将h,按不同level划分为固定大小的矩形为了验证本文算法的有效性，采用Hyun Soo 块：在每一个矩形块上统计梯度向量直方图 Park[)的Party Scene数据集进行目标检测和目标区域ｂｉ，ｂｊ；计算其重叠面积Ｓｂｉ∩ｂｊ。如果Ｓｂｉ∩ｂｊ＞θ２，其中 θ２为阈值，则根据式（１）更新显著目标区域并删除Ｂｊｅ中面积较小的那个显著目标候选区域ｂｉ＝［ｍｉｎ（ｘｉ，ｘｊ）ｍｉｎ（ｙｉ，ｙｊ）ｍａｘ（ｘ～ｉ，ｘ～ｊ）ｍａｘ（ｙ～ｉ，ｙ～ｊ）ｓｉ＋ｓｊ］，Ｓｉ＞Ｓｊｂｊ＝［ｍｉｎ（ｘｉ，ｘｊ）ｍｉｎ（ｙｉ，ｙｊ）ｍａｘ（ｘ～ｉ，ｘ～ｊ）ｍａｘ（ｙ～ｉ，ｙ～ｊ）ｓｉ＋ｓｊ］，Ｓｊ＞Ｓｉ ì î í ï ï ï ï ïï （１）４）重复执行３），直至无重叠的显著目标候选区域，算法结束。１．２基于局部相似度的目标区域优化算法由基于空间位置关系的区域融合算法得到融合后的显著目标区域中包含了较多的非目标区域，为了更精确地检测目标区域，本文提出基于局部相似度的区域优化算法对目标区域进行进一步的优化。首先对显著目标区域ｂ∈Ｂｉｌ进行超像素分割，得超像素集合Ｐ＝｛ｐｉ｜ｉ＝１，２，…，ｎ｝，由超像素空间位置设置超像素的边界属性：Ｈ（ｐｉ）＝１，ｐｉ ∈ 边界超像素Ｈ（ｐｉ）＝０，ｐ { ｉ ∈ 非边界超像素（２）对任意超像素ｐｉ，计算其属于显著目标可能性为Ｄ（ｐｉ）＝ ∑ ｎｊ＝１，ｊ≠ｉ（ωａψａ（ｐｉ，ｐｊ）＋ ωｏψｏ（ｐｉ，ｐｊ））·Ｈ（ｐｉ）（３）式中：ψａ（ｐｉ，ｐｊ）表示超像素ｐｉ和ｐｊ的颜色相似度，由颜色直方图特征向量的 κ ２距离确定，ψｏ（ｐｉ，ｐｊ）表示超像素ｐｉ和ｐｊ之间的运动相似度，由光流模直方图特征向量的 κ ２距离确定，ωａ和 ωｏ为权值。计算所有超像素的显著目标可能性后，保留超像素集合Ｐ中Ｄ（ｐｉ） ≥θ３（ θ３为阈值）的超像素ｐｉ，从而得到优化后的显著目标区域，基于局部相似度的Ｄ计算式（３）的区域优化算法示意如图３。由于，经过两步层进目标检测后，得到了各个视角的Ｅｇｏｃｅｎｔｒｉｃ视频每帧中的显著目标检测结果，下面将对各个视角中的显著目标进行匹配。图３基于局部相似度的区域优化算法Ｆｉｇ．３Ｂｏｕｎｄｉｎｇｂｏｘａｒｅａｏｐｔｉｍｉｚａｔｉｏｎｂａｓｅｄｏｎｌｏｃａｌｓｉｍｉｌａｒｉｔｙ２基于ＨＯＧ特征的目标匹配算法为了实现ｍｕｌｔｉ⁃ｅｇｏｃｅｎｔｒｉｃ中的多目标匹配，首先对数据集中关键帧的显著目标进行人工标注得到显著目标区域ｈη 以及对应目标编号 βη 构建训练集Ｈ＝｛（ｈη ，βη ）｜ η ＝１，２，…，Ｑ；βη∈｛０，１，…，Ｑ～｝｝，其中Ｑ为标注的目标个数，Ｑ～为目标分类数。基于ＨＯＧ特征的目标匹配算法如下：算法２基于ＨＯＧ特征的目标匹配算法１）输入Ｈ＝｛（ｈη ，βη ）｜ η ＝１，２，…，Ｑ，βη∈｛０，１，…，Ｑ～｝｝作为输入；２）初始化ＳＶＭ分类器参数，ｂｉｎｓ以及ｌｅｖｅｌ；３）将ｈη 按不同ｌｅｖｅｌ划分为固定大小的矩形块；在每一个矩形块上统计梯度向量直方图（ＨＯＧ），并将不同ｌｅｖｅｌ的直方图特征连接起来组成特征向量ｖη ；４）最后将ｖη 和 βη 输入ＳＶＭ分类器中进行训练；５）重复执行３）、４）直到所有显著目标区域训练完毕，输出ＳＶＭ目标匹配模型。基于ＨＯＧ特征的目标匹配分类器训练流程如图４所示。由两步层进法检测得到多视角的显著目标后，基于ＨＯＧ特征的目标匹配分类器实现多视角中多目标的匹配流程如图５所示。３实验结果为了验证本文算法的有效性，采用ＨｙｕｎＳｏｏＰａｒｋ［３］的ＰａｒｔｙＳｃｅｎｅ数据集进行目标检测和目标 ·６２２· 智能系统学报第１１卷

<<向上翻页向下翻页>>

点击下载：【机器学习】一种鲁棒的Multi-Egocentric视频中的多目标检测及匹配算法