共性的特征数据与信息，是可以被不同任务或者对象之间共享的。迁移学习是要迁

正在加载图片...

第2期闫涵，等：多感知兴趣区域特征融合的图像识别方法 ·265· 共性的特征数据与信息，是可以被不同任务或者快速学习。迁移学习微调示意图如图1所示，为对象之间共享的。迁移学习是要迁移那些共性特了方便图像进行卷积操作，首先使用函数F(O)对征数据与信息，从而避免再次学习这些知识，实现图像进行预处理，去掉边缘像素值，缩小图像尺寸。卷积层分类层第一第二层 64个7 7 64个特征图 64个5×5的16个特征图1000神经元1000神经元卷1核步长为2127×127 卷积核 127×127 256×256 252×252 预处理图像 FO) 后图基于ImageNet预训练模型微调门图1迁移学习微调示意 Fig.1 Schematic diagram of migration learning fine-tuning 以上模型分为两部分，一部分是基于ImageN- 训练集 t训练的深度学习模型，另一部分为根据自身任务微调的网络模型。在训练时可针对特定任务，自主采集法或自主采集法或自主采集法或固定原始网络的相关层，修改网络的输出层，以交叉验证法交叉验证法交叉验证法使结果更符合任务需要。 1.2集成学习集成学习(ensemble learning)是使用一系列学训练子集1 训练子集2 训练子集：习器进行学习，并使用某种规则把各个学习器结果进行整合，从而获得比单个学习器更加优越的泛学习算法1 学习算法2 学习算法n 化性能刘。集成学习算法策略主要有Bagging算法、Boosting算法以及Stacking算法。本文涉及到学习器1 学习器2 学习器n 的算法为Bagging算法，算法示意图如图2所示。集成学习优势在于：投票法 1)使用相同数据对不同的个体学习器进行训练会得到不同结果，进而导致分类器的分类边界则试集集成学习器预测不同，还可能影响最终分类结果，产生错误输结果出。将多个体学习器合并后，可获得更为合理的图2集成学习Bagging算法示意分类边界，提升分类准确率。 Fig.2 Schematic diagram of integrated learning Bagging 2)对于数据集包含样本数量差异较大的情 algorithm 况，可以对样本数量较大的数据集进行划分操作 1.3CAM可视化并对样本数量较小的数据集进行放回操作，进而 CAM是深度学习中一种常用的网络可视化产生不同数据子集，再使用数据子集训练不同学方法。利用GAP(global average pooling)替换掉全习器，最终合并成为一个强学习器。连接层，以把GAP视为一个特殊的平均值池化层，其池化核尺寸和整个特征图一样大，即求每 3)当数据划分边界过于复杂时，单一使用线张特征图所有像素的均值。GAP的优点在于由性分类器很难获得较好结果。可以考虑训练多个于没有了全连接层，输入不需固定大小，因此可模型，再进行模型融合。支持任意大小的输入。此外，引入GAP更充分地 4)对于多个难以直接融合的异构特征集，可利用了空间信息，且没有了全连接层的各种参以考虑使用每个数据集单独构建分类模型，再将数，避免过拟合。同时在最后的卷积层生成了和多个模型进行融合。目标类别数量一致的特征图，经过GAP以后再通共性的特征数据与信息，是可以被不同任务或者对象之间共享的。迁移学习是要迁移那些共性特征数据与信息，从而避免再次学习这些知识，实现快速学习[18]。迁移学习微调示意图如图 1 所示，为了方便图像进行卷积操作，首先使用函数 F(0) 对图像进行预处理，去掉边缘像素值，缩小图像尺寸。 256×256 252×252 F(0) 输入图像预处理后图像卷积层基于 ImageNet 预训练模型微调第一层 64 个 7×7 卷积核步长为 2 第二层 64 个 5×5 的卷积核 64 个特征图 127×127 16 个特征图 127×127 1 000 神经元 1 000 神经元分类层图 1 迁移学习微调示意 Fig. 1 Schematic diagram of migration learning fine-tuning 以上模型分为两部分，一部分是基于 ImageNet 训练的深度学习模型，另一部分为根据自身任务微调的网络模型。在训练时可针对特定任务，固定原始网络的相关层，修改网络的输出层，以使结果更符合任务需要。 1.2 集成学习集成学习 (ensemble learning) 是使用一系列学习器进行学习，并使用某种规则把各个学习器结果进行整合，从而获得比单个学习器更加优越的泛化性能[19-20]。集成学习算法策略主要有 Bagging 算法、Boosting 算法以及 Stacking 算法。本文涉及到的算法为 Bagging 算法，算法示意图如图 2 所示。集成学习优势在于： 1) 使用相同数据对不同的个体学习器进行训练会得到不同结果，进而导致分类器的分类边界不同，还可能影响最终分类结果，产生错误输出。将多个体学习器合并后，可获得更为合理的分类边界，提升分类准确率。 2) 对于数据集包含样本数量差异较大的情况，可以对样本数量较大的数据集进行划分操作并对样本数量较小的数据集进行放回操作，进而产生不同数据子集，再使用数据子集训练不同学习器，最终合并成为一个强学习器。 3) 当数据划分边界过于复杂时，单一使用线性分类器很难获得较好结果。可以考虑训练多个模型，再进行模型融合。 4) 对于多个难以直接融合的异构特征集，可以考虑使用每个数据集单独构建分类模型，再将多个模型进行融合。训练集自主采集法或交叉验证法训练子集 1 训练子集 2 ... 训练子集 n ... ... 学习算法 1 学习算法 2 学习算法 n 学习器 1 学习器 2 投票法测试集集成学习器预测结果学习器 n 自主采集法或交叉验证法自主采集法或交叉验证法图 2 集成学习 Bagging 算法示意 Fig. 2 Schematic diagram of integrated learning Bagging algorithm 1.3 CAM 可视化 CAM 是深度学习中一种常用的网络可视化方法。利用 GAP(global average pooling) 替换掉全连接层，以把 GAP 视为一个特殊的平均值池化层，其池化核尺寸和整个特征图一样大，即求每张特征图所有像素的均值。GAP 的优点在于由于没有了全连接层，输入不需固定大小，因此可支持任意大小的输入。此外，引入 GAP 更充分地利用了空间信息，且没有了全连接层的各种参数，避免过拟合。同时在最后的卷积层生成了和目标类别数量一致的特征图，经过 GAP 以后再通第 2 期闫涵，等：多感知兴趣区域特征融合的图像识别方法 ·265·

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】多感知兴趣区域特征融合的图像识别方法