正在加载图片...
·94· 智能系统学报 第15卷 本时,为1,反之为0;d为平衡参数。L表示二 的绝缘子识别模型输入原始图像;然后,按照 值分类损失,L表示位置回归损失,分别由N 1.2节的步骤1)对原始图像进行尺寸放缩,限制 和Ne进行归一化,Ns为mini-batch大小,Ne等 图像长边不超过1000,短边不超过600:最后,将 于anchor数量;t:表示预测的anchorl的4个参数 尺寸放缩后的绝缘子图像输出到特征提取网络。 化坐标向量;t;表示前景anchor对应的真实框 2.2引入SENet结构的特征提取网络 (ground truth,GT)的坐标向量。 使用VGG16特征提取网络,对经过尺寸放缩 4)ROI池化。步骤3)中提取的目标建议框形 后的原始绝缘子图像提取特征。 状差异较大,对应在特征图上的区域同样有较大差 为使特征提取网络能够利用全局信息,而不 异,因此将每一个区域特征图划分为均等的7×7 受限于局部感受野,本文在特征提取网络VGG16 块,对每一块执行最大池化,由此将所有区域特征 的每个卷积模块(共5个卷积模块)之后引入SENt 图大小固定为7×7,便于固定全连接层参数。 结构。在特征通道维度进行特征压缩,生成权重 5)输入步骤4)中固定大小的特征图,通过全 并加权更新通道,得到表达能力更强的特征图。 连接层与Softmax分类器计算每个目标建议框识 实验结果表明,引入该结构后,网络识别性能得 别为目标的概率;同时利用边界框回归对目标建 到提升。SENet包含以下3个步骤: 议框进行精确微调,输出识别结果。 1)输入卷积之后的特征图,对每一个特征图 2改进Faster RCNN的绝缘子识别 使用全局平均池化,得到长度等于通道数M的实 数列Zp。压缩率r设置为16。特征图X=[x, 图2为本文所提出的注意力机制和Faster x2,…,xJ通过全局平均池化Fp计算如式(2)和 RCNN相结合的绝缘子识别模型,主要由特征提 式(3)所示: 取网络,RPN区域建议网络和检测网络3部分组 1 成。首先,在特征提取阶段引入SENet结构;其 Zp=Fp(xc)= HxW x(m,n) (2) m=1n=1 次,对RPN生成基础anchor的长宽比例和尺度进 行调整;最后,在全连接层1上对目标建议框的特 F1∈R华xM,F2∈Rw9 (3) 征向量与周围建议框的特征向量融合更新。 式中:c为特征图索引;F,表示进行降维的全连接 层参数;F2表示进行升维的全连接层参数。 原始图像尺寸放缩特征提取网络 卷积模块 2)分别经过两个全连接层输出特征,对特征 使用Sigmoid函数激活,生成每个通道对应的权 SENet 重信息S=[,52,…,s],如式(4)所示: S=Sigmoid(F(ReLU(F1×Zgp)》 (4) 特征图 3)根据权值对输入的特征图加权更新,得到 更新后的通道特征Y=y1,y2,…y,如式(⑤)所示: 滑动窗口 ROI池化 Ye=Se.xc (5) 最终得到第5层SENet输出的特征图,并将 全连接层1 边界框回归 分类 该特征图输入到RPN区域建议网络中。 建议框融合 2.3改进区域建议网络 NMS 首先,将2.2节得到的特征图输入到RPN中, 全连接层2 在特征图上滑动窗口遍历每个点,每个点上生成 目标建议框 不同长宽比例和尺度的anchor。. 边界框回归 分类 在传统Faster RCNN算法中,为识别公共数 据集中的大多数目标,将生成基础anchor的长宽 输出结果 比例设置为(1:2、1:1、2:1),但这种比例设置并不 适用于识别绝缘子这类特殊的电力设备,需要对 图2注意力机制和Faster RCNN相结合的绝缘子识别 生成基础anchor的长宽比进行改进。本文从 模型 Fig.2 Insulator recognition model based on attention RPN生成基础anchor的原理出发,对绝缘子图像 mechanism and Faster RCNN 数据中绝缘子长宽比进行的统计,统计结果如图3 2.1尺寸放缩 所示,其中绝缘子的长宽比范围按数量依次排序 首先,向注意力机制和Faster RCNN相结合 为(4:1、5:1、6:1、2:1).在此基础之上,将生成基础λ Lcls Lreg Ncls Nreg Ncls Nreg ti t ∗ i 本时,为 1,反之为 0; 为平衡参数。 表示二 值分类损失, 表示位置回归损失,分别由 和 进行归一化, 为 mini-batch大小, 等 于 anchor 数量; 表示预测的 anchor的 4 个参数 化坐标向量; 表示前景 anchor 对应的真实框 (ground truth,GT) 的坐标向量。 7×7 7×7 4) ROI 池化。步骤 3) 中提取的目标建议框形 状差异较大,对应在特征图上的区域同样有较大差 异,因此将每一个区域特征图划分为均等的 块,对每一块执行最大池化,由此将所有区域特征 图大小固定为 ,便于固定全连接层参数。 5) 输入步骤 4) 中固定大小的特征图,通过全 连接层与 Softmax 分类器计算每个目标建议框识 别为目标的概率;同时利用边界框回归对目标建 议框进行精确微调,输出识别结果。 2 改进 Faster RCNN 的绝缘子识别 图 2 为本文所提出的注意力机制和 Faster RCNN 相结合的绝缘子识别模型,主要由特征提 取网络,RPN 区域建议网络和检测网络 3 部分组 成。首先,在特征提取阶段引入 SENet 结构;其 次,对 RPN 生成基础 anchor 的长宽比例和尺度进 行调整;最后,在全连接层 1 上对目标建议框的特 征向量与周围建议框的特征向量融合更新。 特征图 滑动窗口 NMS ROI池化 建议框融合 卷积模块 SENet 全连接层1 边界框回归 全连接层2 边界框回归 分类 输出结果 原始图像 尺寸放缩 特征提取网络 分类 目标建议框 图 2 注意力机制和 Faster RCNN 相结合的绝缘子识别 模型 Fig. 2 Insulator recognition model based on attention mechanism and Faster RCNN 2.1 尺寸放缩 首先,向注意力机制和 Faster RCNN 相结合 的绝缘子识别模型输入原始图像;然后,按照 1.2 节的步骤 1) 对原始图像进行尺寸放缩,限制 图像长边不超过 1 000,短边不超过 600;最后,将 尺寸放缩后的绝缘子图像输出到特征提取网络。 2.2 引入 SENet 结构的特征提取网络 使用 VGG16 特征提取网络,对经过尺寸放缩 后的原始绝缘子图像提取特征。 为使特征提取网络能够利用全局信息,而不 受限于局部感受野,本文在特征提取网络 VGG16 的每个卷积模块 (共 5 个卷积模块) 之后引入 SENet 结构。在特征通道维度进行特征压缩,生成权重 并加权更新通道,得到表达能力更强的特征图。 实验结果表明,引入该结构后,网络识别性能得 到提升。SENet 包含以下 3 个步骤: Zgap X = [x1, x2,··· , xc] Fgap 1) 输入卷积之后的特征图,对每一个特征图 使用全局平均池化,得到长度等于通道数 M 的实 数列 。压缩率 r 设置为 16。特征图 通过全局平均池化 计算如式 (2) 和 式 (3) 所示: Zgap = Fgap(xc) = 1 H × W ∑H m=1 ∑W n=1 xc(m,n) (2) F1 ∈ R M r ×M ,F2 ∈ R M× M r (3) F1 F2 式中:c 为特征图索引; 表示进行降维的全连接 层参数; 表示进行升维的全连接层参数。 S = [s1,s2,··· ,sc] 2) 分别经过两个全连接层输出特征,对特征 使用 Sigmoid 函数激活,生成每个通道对应的权 重信息 ,如式 (4) 所示: S = Sigmoid(F2(ReLU(F1 ×Zgap))) (4) Y = [y1, y2,··· , yc] 3) 根据权值对输入的特征图加权更新,得到 更新后的通道特征 ,如式 (5) 所示: Yc = sc · xc (5) 最终得到第 5 层 SENet 输出的特征图,并将 该特征图输入到 RPN 区域建议网络中。 2.3 改进区域建议网络 首先,将 2.2 节得到的特征图输入到 RPN 中, 在特征图上滑动窗口遍历每个点,每个点上生成 不同长宽比例和尺度的 anchor。 在传统 Faster RCNN 算法中,为识别公共数 据集中的大多数目标,将生成基础 anchor 的长宽 比例设置为 (1:2、1:1、2:1),但这种比例设置并不 适用于识别绝缘子这类特殊的电力设备,需要对 生成基础 anchor 的长宽比进行改进。本文从 RPN 生成基础 anchor 的原理出发,对绝缘子图像 数据中绝缘子长宽比进行的统计,统计结果如图 3 所示,其中绝缘子的长宽比范围按数量依次排序 为 (4:1、5:1、6:1、2:1),在此基础之上,将生成基础 ·94· 智 能 系 统 学 报 第 15 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有