速率进行训练，加快网络的训练速度，具体做法如图 2 所示。最后使用 OH

正在加载图片...

·970· 智能系统学报第13卷速率进行训练，加快网络的训练速度，具体做法 RPN模型再次初始化，但不更新RPN与FstR-CNN 如图2所示。最后使用OHEM算法选择难例进共享的卷积层参数，仅对RPN网铬特有层参数进行前向和后向传播，计算梯度并传播到卷积神经行更新，再进行训练，此时已实现了两个共享，之网络，以获得更低的训练损失和更高的类别和位后再对Fast R-CNN模型进行训练，如此交替进行置精度。改进算法的整体流程见图2。训练。在训练之前首先修改文件中的相关的参数，标准化x 标准化t 将类型换成人体行为数据集中的标签。将相应输出的类别数改为类别数加一（类别加上背景）。 4实验结果与对比分析隐藏层测试的结果见表1。表2为ZF+RPN、VGG+ No+E Rol (s)im RPN实验结果和改进算法的实验结果。表1改进Faster R-CNN算法检测各类别的AP值图2批量规范化处理 Table 1 AP of actions of improved Faster R-CN Fig.2 Batch normalization AP 3实验过程人体行为拍照 0.747 3.1数据集及实验环境打电话 0.786 本文实验数据是从VOC2012 Action选取包玩电脑 0.853 括8个目标类别的人体行为数据集，3347张标记阅读 0.735 图像，每类动作大约400张。在数据集中，训练验骑马 0.932 证集大约占整个数据集的50%，测试集大约占整骑车 0.891 个数据集的50%，训练集大约是训练验证集的跳 0.783 50%,验证集大约占训练验证集的50%。算法利玩乐器 0.696 用caffe开源框架，在Ubuntu14.04系统下实现，所表2ZF和VGG16的mAP 用的计算机配置是，显卡为GeForce GTX1080Ti, Table 2 mAP for ZF and VGG16 内存11GB。 3.2参数选择训练 propos 测试 proposals mAP/% als 使用变学习率策略训练改进的Faster R-CNN RPN+ZF 300 RPN+ZF 300 0.58 算法模型，初始学习率Base Ir为：0.001，批大小 RPN+VGG16 300 RPN+VGG16 300 0.68 Batchs为128，训练步数Stepsize为6000，变学习 RPN+OHEM+BN 300 RPN+OHEM+BN 300 0.825 率参数gamma为0.l。采用了变学习率策略公式： r=baserxgammaoo号 (1) 图3为ZF+RPN、VGG+RPN和改进算法识式中iter为当前的迭代次数。别：8个类别的平均精度(AP)柱状图。合硬件条件和学习效率之后，在用Fast R-CNN 1.0 0.9 进行人体行为检测时选择Batch size为l28。 0.8 3.3模型训练 0.7 Faster R-CNN模型训练阶段使用训练好的 0.6 20.5 ResNet模型参数对RPN模型进行初始化，然后独 0.4 立地对RPN模型进行训练，之后依旧采用在 0.3 0.2 ImageNet上训练好的ResNet模型参数对Fast 0.1 Rpn+VGG16 Rpn+Resnet101 R-CNN模型参数进行初始化，可以看出RPN网 0 络与Fast R-CNN模型的训练是单独进行的，两个打电话玩乐器网络不进行参数共享，将上一步中RPN模型生成行为类别的建议窗口作为输入样本对Fast R-CNN模型进图33种方法的AP比较行训练，再使用训练后的Fast R-CNN模型参数对 Fig.3 AP comparison of three methods速率进行训练，加快网络的训练速度，具体做法如图 2 所示。最后使用 OHEM 算法选择难例进行前向和后向传播，计算梯度并传播到卷积神经网络，以获得更低的训练损失和更高的类别和位置精度。改进算法的整体流程见图 2。 3 实验过程 3.1 数据集及实验环境本文实验数据是从 VOC 2012 Action 选取包括 8 个目标类别的人体行为数据集，3 347 张标记图像，每类动作大约 400 张。在数据集中，训练验证集大约占整个数据集的 50%，测试集大约占整个数据集的 50%，训练集大约是训练验证集的 50%，验证集大约占训练验证集的 50%。算法利用 caffe 开源框架，在 Ubuntu14.04 系统下实现，所用的计算机配置是，显卡为 GeForce GTX1080Ti，内存 11 GB。 3.2 参数选择使用变学习率策略训练改进的 Faster R-CNN 算法模型，初始学习率 Base_lr 为：0.001，批大小 Batchs 为 128，训练步数 Stepsize 为 6 000，变学习率参数 gamma 为 0.1。采用了变学习率策略公式： lr = baselr×gammafloor iter stepsize (1) 式中 iter 为当前的迭代次数。合硬件条件和学习效率之后，在用 Fast R-CNN 进行人体行为检测时选择 Batch_size 为 128。 3.3 模型训练 Faster R-CNN 模型训练阶段使用训练好的 ResNet 模型参数对 RPN 模型进行初始化，然后独立地对 RPN 模型进行训练，之后依旧采用在 ImageNet 上训练好的 ResNet 模型参数对 Fast R-CNN 模型参数进行初始化，可以看出 RPN 网络与 Fast R-CNN 模型的训练是单独进行的，两个网络不进行参数共享，将上一步中 RPN 模型生成的建议窗口作为输入样本对 Fast R-CNN 模型进行训练，再使用训练后的 Fast R-CNN 模型参数对 RPN 模型再次初始化，但不更新 RPN 与 Fast R-CNN 共享的卷积层参数，仅对 RPN 网络特有层参数进行更新，再进行训练，此时已实现了两个共享，之后再对 Fast R-CNN 模型进行训练，如此交替进行训练。在训练之前首先修改文件中的相关的参数，将类型换成人体行为数据集中的标签。将相应输出的类别数改为类别数加一 (类别加上背景)。 4 实验结果与对比分析测试的结果见表 1。表 2 为 ZF+RPN、VGG+ RPN 实验结果和改进算法的实验结果。图 3 为 ZF+RPN、VGG+RPN 和改进算法识别：8 个类别的平均精度 (AP) 柱状图。表 1 改进 Faster R-CNN 算法检测各类别的 AP 值 Table 1 AP of actions of improved Faster R-CN 人体行为 AP 拍照 0.747 打电话 0.786 玩电脑 0.853 阅读 0.735 骑马 0.932 骑车 0.891 跳 0.783 玩乐器 0.696 表 2 ZF 和 VGG16 的 mAP Table 2 mAP for ZF and VGG16 训练 propos als 测试 proposals mAP/% RPN+ZF 300 RPN+ZF 300 0.58 RPN+VGG16 300 RPN+VGG16 300 0.68 RPN+OHEM+BN 300 RPN+OHEM+BN 300 0.825 标准化 x 标准化 t 第 1 层 h1 h2 h3 h4 隐藏层 x Wh 2 ·x s1 s2 s3 h1 s1−μ2 σ 2 s+ξ r·s2+β RoI (s2 ) 图 2 批量规范化处理 Fig. 2 Batch normalization 拍照打电话玩电脑阅读骑马骑车跳玩乐器 1.0 0.8 0.9 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 行为类别 Rpn+ZF Rpn+VGG16 Rpn+Resnet101 AP 图 3 3 种方法的 AP 比较 Fig. 3 AP comparison of three methods ·970· 智能系统学报第 13 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】基于Faster R-CNN的人体行为检测研究