在测试数据中随机选取了 12 张人体行为图片进行抽样测试，测试的结果分别

正在加载图片...

第6期莫宏伟，等：基于Faster R-CNN的人体行为检测研究 ·971· 在测试数据中随机选取了12张人体行为图但是相对于原始算法识别类别和位置的精度都有片进行抽样测试，测试的结果分别展现在图4~5 着较为明显的改善。并且对于这8种动作，改进Fast 中。图4表示未改进算法的测试结果，从左至右 R-CNN算法识别效果有着显著提升，平均分类效从上至下的人体行为分别为骑马(1.000)、用电脑果和位置精确度均达到80%以上，证明改进算法 (0.954)、玩乐器(0.981)、打电话(0.994)、阅读(0.997)、对人体行为检测任务的有效性。骑车(0.996)、阅读(1.000)、玩乐器(1.000)、跳 (0897)、阅读（未检测出）、拍照（未检测出）和骑车（未检测出），其中括号中为检测的位置精确度。图5表示改进算法的测试效果，从左至右从上至下的人体行为分别为骑马(1.000)、用电脑 (1.000)、玩乐器(1.000)、打电话(1.000)、阅读 (0.999)、骑车(0.996)、阅读(1.000)、玩乐器(1.000)、跳(0.999)、阅读(0.987)、拍照(0.934)和骑车 (0.926),其中括号中为检测的位置精确度。对比随机选取的测试数据，图4中最后3个动作分别为阅读、拍照和骑车，使用VGGNet时算法并未检测出图中的动作。在图5中同样的图片、同样的行为，改进算法对3种动作均作出了精确的识别，并且图片中的动作均比原始算法的识别精确度要高。相比两种算法，改进的算法不仅能准确地识别出抽样测试图像中所有的人体行为，并且图5改进算法检测结果在精度上有所提升。 Fig.5 The improved algorithm detection results 5结束语 Faster R-CNN算法在物体检测方面有着较好的识别效果，本文针对人体行为检测关键问题将 OHEM算法和批量规范化算法与Faster R-CNN算法进行结合改进。在改进算法中，利用OHEM算法的优势可以有效地识别出静态图像中存在的小样本难例，对于人体行为识别整体的识别正确率都有所改善。今后将在通过搜集更多测试样本，增加类别，来测试所提出方法的有效性。参考文献： [1]IOFFE S,SZEGEDY C.Batch normalization:accelerating deep network training by reducing internal covariate shift[Cl//Proceedings of the 32nd International Conference 图4原始算法检测结果 on International Conference on Machine Learning.Lille. Fig.4 The original algorithm detection results. France,.2015:448-456 结合表2和图5的实验结果以及随机抽样测 [2]GIRSHICK R.DONAHUE J,DARRELL T,et al.Region- 试的结果可知，在8种不同的人体行为中，改进 based convolutional networks for accurate object detection 的Faster R-CNN算法对玩电脑、骑马和骑车这 and segmentation[J].IEEE transactions on pattern analysis 3种动作的识别效果较好，虽然阅读和玩乐器这 and machine intelligence,2016,38(1):142-158. 两种动作的识别效果相比于其他动作效果略差， [3]李航.统计学习方法[M).北京：清华大学出版社，2012在测试数据中随机选取了 12 张人体行为图片进行抽样测试，测试的结果分别展现在图 4~5 中。图 4 表示未改进算法的测试结果，从左至右从上至下的人体行为分别为骑马 (1.000)、用电脑 (0.954)、玩乐器 (0.981)、打电话 (0.994)、阅读 (0.997)、骑车 (0.996)、阅读 (1.000)、玩乐器 (1.000)、跳 (0.897)、阅读 (未检测出)、拍照 (未检测出) 和骑车 (未检测出)，其中括号中为检测的位置精确度。图 5 表示改进算法的测试效果，从左至右从上至下的人体行为分别为骑马 (1.000)、用电脑 (1.000)、玩乐器 (1.000)、打电话 (1.000)、阅读 (0.999)、骑车 (0.996)、阅读 (1.000)、玩乐器 (1.000)、跳 (0.999)、阅读 (0.987)、拍照 (0.934) 和骑车 (0.926)，其中括号中为检测的位置精确度。对比随机选取的测试数据，图 4 中最后 3 个动作分别为阅读、拍照和骑车，使用 VGGNet 时算法并未检测出图中的动作。在图 5 中同样的图片、同样的行为，改进算法对 3 种动作均作出了精确的识别，并且图片中的动作均比原始算法的识别精确度要高。相比两种算法，改进的算法不仅能准确地识别出抽样测试图像中所有的人体行为，并且在精度上有所提升。结合表 2 和图 5 的实验结果以及随机抽样测试的结果可知，在 8 种不同的人体行为中，改进的 Faster R-CNN 算法对玩电脑、骑马和骑车这 3 种动作的识别效果较好，虽然阅读和玩乐器这两种动作的识别效果相比于其他动作效果略差，但是相对于原始算法识别类别和位置的精度都有着较为明显的改善。并且对于这 8 种动作，改进 Faster R-CNN 算法识别效果有着显著提升，平均分类效果和位置精确度均达到 80% 以上，证明改进算法对人体行为检测任务的有效性。 5 结束语 Faster R-CNN 算法在物体检测方面有着较好的识别效果，本文针对人体行为检测关键问题将 OHEM 算法和批量规范化算法与 Faster R-CNN 算法进行结合改进。在改进算法中，利用 OHEM 算法的优势可以有效地识别出静态图像中存在的小样本难例，对于人体行为识别整体的识别正确率都有所改善。今后将在通过搜集更多测试样本，增加类别，来测试所提出方法的有效性。参考文献： IOFFE S, SZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shift[C]//Proceedings of the 32nd International Conference on International Conference on Machine Learning. Lille, France, 2015: 448–456. [1] GIRSHICK R, DONAHUE J, DARRELL T, et al. Regionbased convolutional networks for accurate object detection and segmentation[J]. IEEE transactions on pattern analysis and machine intelligence, 2016, 38(1): 142–158. [2] [3] 李航. 统计学习方法[M]. 北京: 清华大学出版社, 2012: 图 4 原始算法检测结果 Fig. 4 The original algorithm detection results. 图 5 改进算法检测结果 Fig. 5 The improved algorithm detection results 第 6 期莫宏伟，等：基于 Faster R-CNN 的人体行为检测研究 ·971·

<<向上翻页向下翻页>>

点击下载：【机器学习】基于Faster R-CNN的人体行为检测研究