集样本的多样性能增强算法检测的泛化能力。现有的行人数据集如 Daimle

正在加载图片...

·308· 智能系统学报第14卷集样本的多样性能增强算法检测的泛化能力。现和类别的检测算法，整个网络没有生成候选窗口有的行人数据集如Daimler行人数据集P含训练的过程。SSD算法的骨干网络结构是VGG16I町样本集有正样本大小为18×36和48×96的图像。将VGG16最后两个全连接层改成卷积层再增加较早公开的MT行人数据集2)含924张宽高为 4个卷积层构造网络结构。表1展示了整个 64×128行人图像，肩到脚的距离约80像素。该 SSD网络中每个卷积层中卷积核的大小、数目，数据库只含正面和背面两个视角，无负样本，并卷积的步长，特征图有无填充以及每层输出特征且未区分训练集和测试集。NICTA行人数据集2 图的大小。图2为SSD算法的目标检测流程图，标注要求行人高度至少要大于40个像素。这些 SSD检测算法分别把conv4_3、fc7、conv6_2 数据集训练样本存在从大图像中剪切出的单个行 conv7_2、conv82和conv9_2等6个不同卷积层人图像、分辨率偏低、对小目标行人无标注的问的特征图引出做检测，其特征图与两个3×3的卷题，且行人数据集训练样本背景单一。因此，这积核卷积后得到两个输出，分别作为分类时使用些数据集不适合用于训练深度卷积网络模型。的置信度以及回归时使用的位置信息。将每层计 2 SSD网络算结果合并后传递给损失层，该层对所有层的检测结果进行综合，通过非极大值抑制输出目标的 SSD算法是一种直接预测目标边界框的坐标检测结果。表1SSD网络参数表 Table 1 Parameters of SSD Network 卷积层卷积核卷积核数量步长填充输出特征图像素大小 Conv1 1 3×3 64 1 300×300 Conv1_2 3×3 64 1 300×300 Maxpooll 2×2 1 2 0 150×150 Conv2_I 3×3 128 1 1 150×150 Conv2_2 3×3 128 1 150×150 Maxpool2 2×2 1 2 0 75×75 Conv3_1 3×3 256 1 75×75 Conv3_2 3×3 256 1 1 75×75 Conv3_3 3×3 256 1 75×75 Maxpool3 2×2 1 2 0 38×38 Conv4_1 3x3 512 1 38×38 Conv4 2 3×3 512 1 38×38 Conv4 3 3×3 512 1 38×38 Maxpool4 2×2 1 2 0 19×19 Conv5_1 3×3 512 1 19×19 Conv5 2 3×3 512 1 19×19 Conv5_3 3×3 512 1 19×19 Maxpool5 3×3 1 1 1 19×19 Fc6 3×3 1024 1 19×19 Fc7 1×1 1024 0 19×19 Conv6_1 1×1 256 1 0 19×19 Conv6_2 3x3 512 2 1 10×10 Conv7_1 1×1 128 0 10×10 Conv7_2 3×3 256 2 5x5 Conv8_1 1x1 128 1 0 5x5 Conv8_2 3×3 256 0 3×3 Conv9 1 1x1 128 0 3×3 Conv9 2 3×3 256 0 1×1集样本的多样性能增强算法检测的泛化能力。现有的行人数据集如 Daimler 行人数据集[26]含训练样本集有正样本大小为 18×36 和 48×96 的图像。较早公开的 MIT 行人数据集[27]含 924 张宽高为 64×128 行人图像，肩到脚的距离约 80 像素。该数据库只含正面和背面两个视角，无负样本，并且未区分训练集和测试集。NICTA 行人数据集[28] 标注要求行人高度至少要大于 40 个像素。这些数据集训练样本存在从大图像中剪切出的单个行人图像、分辨率偏低、对小目标行人无标注的问题，且行人数据集训练样本背景单一。因此，这些数据集不适合用于训练深度卷积网络模型。 2 SSD 网络 SSD 算法是一种直接预测目标边界框的坐标和类别的检测算法，整个网络没有生成候选窗口的过程。SSD 算法的骨干网络结构是 VGG16[15] ，将 VGG16 最后两个全连接层改成卷积层再增加 4 个卷积层构造网络结构。表 1 展示了整个 SSD 网络中每个卷积层中卷积核的大小、数目，卷积的步长，特征图有无填充以及每层输出特征图的大小。图 2 为 SSD 算法的目标检测流程图， SSD 检测算法分别把 conv4_3、fc7、conv6_2、 conv7_2、conv8_2 和 conv9_2 等 6 个不同卷积层的特征图引出做检测，其特征图与两个 3×3 的卷积核卷积后得到两个输出，分别作为分类时使用的置信度以及回归时使用的位置信息。将每层计算结果合并后传递给损失层，该层对所有层的检测结果进行综合，通过非极大值抑制输出目标的检测结果。表 1 SSD 网络参数表 Table 1 Parameters of SSD Network 卷积层卷积核卷积核数量步长填充输出特征图像素大小 Conv1_1 3×3 64 1 1 300×300 Conv1_2 3×3 64 1 1 300×300 Maxpool1 2×2 1 2 0 150×150 Conv2_1 3×3 128 1 1 150×150 Conv2_2 3×3 128 1 1 150×150 Maxpool2 2×2 1 2 0 75×75 Conv3_1 3×3 256 1 1 75×75 Conv3_2 3×3 256 1 1 75×75 Conv3_3 3×3 256 1 1 75×75 Maxpool3 2×2 1 2 0 38×38 Conv4_1 3×3 512 1 1 38×38 Conv4_2 3×3 512 1 1 38×38 Conv4_3 3×3 512 1 1 38×38 Maxpool4 2×2 1 2 0 19×19 Conv5_1 3×3 512 1 1 19×19 Conv5_2 3×3 512 1 1 19×19 Conv5_3 3×3 512 1 1 19×19 Maxpool5 3×3 1 1 1 19×19 Fc6 3×3 1 024 1 1 19×19 Fc7 1×1 1 024 1 0 19×19 Conv6_1 1×1 256 1 0 19×19 Conv6_2 3×3 512 2 1 10×10 Conv7_1 1×1 128 1 0 10×10 Conv7_2 3×3 256 2 1 5×5 Conv8_1 1×1 128 1 0 5×5 Conv8_2 3×3 256 1 0 3×3 Conv9_1 1×1 128 1 0 3×3 Conv9_2 3×3 256 1 0 1×1 ·308· 智能系统学报第 14 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】多层卷积特征的真实场景下行人检测研究