正在加载图片...
李梅等:基于TATLNet的输电场景威胁检测 511 习方法已经取得了一定的效果,但是在检测准确 数据增强方式对数据集进行扩充,包括传统的几 率和效率方面仍有一定的提升空间,并且在限定 何变换数据增强和GAN生成新图像的数据增强 能耗的条件下也不再适用.因此,针对输电场景大 方法.在用GAN对数据集进行扩充时,采用深度 型机械入侵的偶然性和图像特征,需要提出一整 卷积对抗生成网络(Deep convolutional generative 套新的输电场景大型机械入侵检测方法. adversarial network,DCGAN)来生成新的图像P 考虑计算机显存的限制,在训练时统一将图像在 2设计与实现 960×640像素的尺寸上进行训练,每16张图像为 2.1架构设计 一个批次,训练过程中生成的图像样本如图2(a) 基于TATLNet的输电场景下的威胁报警方法 所示.对于传统的图像几何变换方法,采用随机裁 通过开启或者关闭红外传感器控制系统来减少运 剪、水平翻转、图像倾斜、添加噪声和图像缩放的 行能耗,当红外传感器探测到大型机械的运行时 方式对数据集进行了扩充,图2(b)为添加椒盐噪 会唤醒摄像头并加载神经网络,在对摄像头采集 声的图像 的视频解码后将图像传输至输电线路威胁检测 (a) (b) 网络TATLNet.TATLNet分为可疑区域生成网络 VRGNet(Vehicle regions generation network)和威胁 判别网络VTCNet(Vehicle threat classification network).VRGNet提取图像中可能存在目标的区 域,VTCNet实现与VRGNet的特征共享并对候选 图2数据增强图像.(a)GAN生成图像:(b)椒盐噪声图像 区域进行进一步的分类.检测结果通过无线传输 Fig.2 Images from data enhancement:(a)image generated from GAN; 发送至服务器,在服务器上实现对大型机械入侵 (b)image with salt and pepper noise 的报警,流程图如图1所示. 2.3 TATLNet设计 针对计算平台低能耗的需求以及入侵输电 Infared sensor 场地的机械在图像中的特点,设计了一种端到 端的输电线路威胁检测网络TATLNet,分别设计 可疑区域生成网络VRGNet和吊车分类网络 Waking camera up VTCNet两部分,并采用模型压缩的方式来对模型 进行压缩以减少非必要参数数量、缩小模型体 Video decoding 积、提高运算速度.其中,VRGNet负责输电场景 Loading model 下吊车的粗略检测,VTCNet负责对VRGNet的检 测结果进行进一步判断(可以将VRGNet视为一个 更为精确的RPNP),VTCNet与VRGNet共享部 TLTANet 分卷积层以减少检测的计算量,TATLNet结构图 VRGNet VTCNet 如图3所示 2.3.1 VRGNet结构设计 VRGNet借鉴了YOLO边框回归计算的思想, Detection result 并对其主体网络做了一定的精简以尽可能缩小模 型的体积,网络结构如图4所示,其中Conv为卷 积层(Convolutional layer),同时包含一个最大池化 Control server 层(Max pooling layer)和relu激活层(Rectified linear 图1系统流程图 unit layer),Fc为全连接层(Fully connection layer) Fig.I System flow chart 首先将输入图像缩放至统一尺寸后在图像中划分 出多个网格,如果目标中心点落在某个网格中,则 2.2数据增强 该网格就负责对该目标的检测.由于大型机械在 由于可以获得的数据集样本较少,采用多种 运作时不会十分密集,并且该网络的主要任务为习方法已经取得了一定的效果,但是在检测准确 率和效率方面仍有一定的提升空间,并且在限定 能耗的条件下也不再适用. 因此,针对输电场景大 型机械入侵的偶然性和图像特征,需要提出一整 套新的输电场景大型机械入侵检测方法. 2    设计与实现 2.1    架构设计 基于 TATLNet 的输电场景下的威胁报警方法 通过开启或者关闭红外传感器控制系统来减少运 行能耗,当红外传感器探测到大型机械的运行时 会唤醒摄像头并加载神经网络,在对摄像头采集 的视频解码后将图像传输至输电线路威胁检测 网络 TATLNet. TATLNet 分为可疑区域生成网络 VRGNet(Vehicle regions generation network)和威胁 判 别 网 络 VTCNet( Vehicle  threat  classification network). VRGNet 提取图像中可能存在目标的区 域,VTCNet 实现与 VRGNet 的特征共享并对候选 区域进行进一步的分类. 检测结果通过无线传输 发送至服务器,在服务器上实现对大型机械入侵 的报警,流程图如图 1 所示. 2.2    数据增强 由于可以获得的数据集样本较少,采用多种 数据增强方式对数据集进行扩充,包括传统的几 何变换数据增强和 GAN 生成新图像的数据增强 方法. 在用 GAN 对数据集进行扩充时,采用深度 卷积对抗生成网络( Deep convolutional generative adversarial  network, DCGAN)来生成新的图像 [24] . 考虑计算机显存的限制,在训练时统一将图像在 960×640 像素的尺寸上进行训练,每 16 张图像为 一个批次,训练过程中生成的图像样本如图 2(a) 所示. 对于传统的图像几何变换方法,采用随机裁 剪、水平翻转、图像倾斜、添加噪声和图像缩放的 方式对数据集进行了扩充,图 2(b)为添加椒盐噪 声的图像. 2.3    TATLNet 设计 针对计算平台低能耗的需求以及入侵输电 场地的机械在图像中的特点,设计了一种端到 端的输电线路威胁检测网络 TATLNet,分别设计 可 疑 区 域 生 成 网 络 VRGNet 和 吊 车 分 类 网 络 VTCNet 两部分,并采用模型压缩的方式来对模型 进行压缩以减少非必要参数数量、缩小模型体 积、提高运算速度. 其中,VRGNet 负责输电场景 下吊车的粗略检测,VTCNet 负责对 VRGNet 的检 测结果进行进一步判断(可以将 VRGNet 视为一个 更为精确的 RPN[25] ) ,VTCNet 与 VRGNet 共享部 分卷积层以减少检测的计算量,TATLNet 结构图 如图 3 所示. 2.3.1    VRGNet 结构设计 VRGNet 借鉴了 YOLO 边框回归计算的思想, 并对其主体网络做了一定的精简以尽可能缩小模 型的体积,网络结构如图 4 所示,其中 Conv 为卷 积层(Convolutional layer),同时包含一个最大池化 层(Max pooling layer)和 relu 激活层(Rectified linear unit layer) ,Fc 为全连接层(Fully connection layer). 首先将输入图像缩放至统一尺寸后在图像中划分 出多个网格,如果目标中心点落在某个网格中,则 该网格就负责对该目标的检测. 由于大型机械在 运作时不会十分密集,并且该网络的主要任务为 Infared sensor Waking camera up Loading model Video decoding Detection result Control server TLTANet VRGNet VTCNet 图 1    系统流程图 Fig.1    System flow chart (a) (b) 图 2    数据增强图像. (a) GAN 生成图像;(b)椒盐噪声图像 Fig.2    Images from data enhancement: (a)image generated from GAN; (b) image with salt and pepper noise 李    梅等: 基于 TATLNet 的输电场景威胁检测 · 511 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有