正在加载图片...
第6期 莫宏伟,等:基于Faster R-CNN的人体行为检测研究 ·971· 在测试数据中随机选取了12张人体行为图 但是相对于原始算法识别类别和位置的精度都有 片进行抽样测试,测试的结果分别展现在图4~5 着较为明显的改善。并且对于这8种动作,改进Fast 中。图4表示未改进算法的测试结果,从左至右 R-CNN算法识别效果有着显著提升,平均分类效 从上至下的人体行为分别为骑马(1.000)、用电脑 果和位置精确度均达到80%以上,证明改进算法 (0.954)、玩乐器(0.981)、打电话(0.994)、阅读(0.997)、 对人体行为检测任务的有效性。 骑车(0.996)、阅读(1.000)、玩乐器(1.000)、跳 (0897)、阅读(未检测出)、拍照(未检测出)和骑 车(未检测出),其中括号中为检测的位置精确 度。图5表示改进算法的测试效果,从左至右从 上至下的人体行为分别为骑马(1.000)、用电脑 (1.000)、玩乐器(1.000)、打电话(1.000)、阅读 (0.999)、骑车(0.996)、阅读(1.000)、玩乐器(1.000)、 跳(0.999)、阅读(0.987)、拍照(0.934)和骑车 (0.926),其中括号中为检测的位置精确度。对比 随机选取的测试数据,图4中最后3个动作分别 为阅读、拍照和骑车,使用VGGNet时算法并未 检测出图中的动作。在图5中同样的图片、同样 的行为,改进算法对3种动作均作出了精确的识 别,并且图片中的动作均比原始算法的识别精确 度要高。相比两种算法,改进的算法不仅能准确 地识别出抽样测试图像中所有的人体行为,并且 图5改进算法检测结果 在精度上有所提升。 Fig.5 The improved algorithm detection results 5结束语 Faster R-CNN算法在物体检测方面有着较好 的识别效果,本文针对人体行为检测关键问题将 OHEM算法和批量规范化算法与Faster R-CNN算 法进行结合改进。在改进算法中,利用OHEM算 法的优势可以有效地识别出静态图像中存在的小 样本难例,对于人体行为识别整体的识别正确率 都有所改善。今后将在通过搜集更多测试样本, 增加类别,来测试所提出方法的有效性。 参考文献: [1]IOFFE S,SZEGEDY C.Batch normalization:accelerating deep network training by reducing internal covariate shift[Cl//Proceedings of the 32nd International Conference 图4原始算法检测结果 on International Conference on Machine Learning.Lille. Fig.4 The original algorithm detection results. France,.2015:448-456 结合表2和图5的实验结果以及随机抽样测 [2]GIRSHICK R.DONAHUE J,DARRELL T,et al.Region- 试的结果可知,在8种不同的人体行为中,改进 based convolutional networks for accurate object detection 的Faster R-CNN算法对玩电脑、骑马和骑车这 and segmentation[J].IEEE transactions on pattern analysis 3种动作的识别效果较好,虽然阅读和玩乐器这 and machine intelligence,2016,38(1):142-158. 两种动作的识别效果相比于其他动作效果略差, [3]李航.统计学习方法[M).北京:清华大学出版社,2012在测试数据中随机选取了 12 张人体行为图 片进行抽样测试,测试的结果分别展现在图 4~5 中。图 4 表示未改进算法的测试结果,从左至右 从上至下的人体行为分别为骑马 (1.000)、用电脑 (0.954)、玩乐器 (0.981)、打电话 (0.994)、阅读 (0.997)、 骑车 (0.996)、阅读 (1.000)、玩乐器 (1.000)、跳 (0.897)、阅读 (未检测出)、拍照 (未检测出) 和骑 车 (未检测出),其中括号中为检测的位置精确 度。图 5 表示改进算法的测试效果,从左至右从 上至下的人体行为分别为骑马 (1.000)、用电脑 (1.000)、玩乐器 (1.000)、打电话 (1.000)、阅读 (0.999)、骑车 (0.996)、阅读 (1.000)、玩乐器 (1.000)、 跳 (0.999)、阅读 (0.987)、拍照 (0.934) 和骑车 (0.926),其中括号中为检测的位置精确度。对比 随机选取的测试数据,图 4 中最后 3 个动作分别 为阅读、拍照和骑车,使用 VGGNet 时算法并未 检测出图中的动作。在图 5 中同样的图片、同样 的行为,改进算法对 3 种动作均作出了精确的识 别,并且图片中的动作均比原始算法的识别精确 度要高。相比两种算法,改进的算法不仅能准确 地识别出抽样测试图像中所有的人体行为,并且 在精度上有所提升。 结合表 2 和图 5 的实验结果以及随机抽样测 试的结果可知,在 8 种不同的人体行为中,改进 的 Faster R-CNN 算法对玩电脑、骑马和骑车这 3 种动作的识别效果较好,虽然阅读和玩乐器这 两种动作的识别效果相比于其他动作效果略差, 但是相对于原始算法识别类别和位置的精度都有 着较为明显的改善。并且对于这 8 种动作,改进 Faster R-CNN 算法识别效果有着显著提升,平均分类效 果和位置精确度均达到 80% 以上,证明改进算法 对人体行为检测任务的有效性。 5 结束语 Faster R-CNN 算法在物体检测方面有着较好 的识别效果,本文针对人体行为检测关键问题将 OHEM 算法和批量规范化算法与 Faster R-CNN 算 法进行结合改进。在改进算法中,利用 OHEM 算 法的优势可以有效地识别出静态图像中存在的小 样本难例,对于人体行为识别整体的识别正确率 都有所改善。今后将在通过搜集更多测试样本, 增加类别,来测试所提出方法的有效性。 参考文献: IOFFE S, SZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shift[C]//Proceedings of the 32nd International Conference on International Conference on Machine Learning. Lille, France, 2015: 448–456. [1] GIRSHICK R, DONAHUE J, DARRELL T, et al. Region￾based convolutional networks for accurate object detection and segmentation[J]. IEEE transactions on pattern analysis and machine intelligence, 2016, 38(1): 142–158. [2] [3] 李航. 统计学习方法[M]. 北京: 清华大学出版社, 2012: 图 4 原始算法检测结果 Fig. 4 The original algorithm detection results. 图 5 改进算法检测结果 Fig. 5 The improved algorithm detection results 第 6 期 莫宏伟,等:基于 Faster R-CNN 的人体行为检测研究 ·971·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有