100 99 98 97 resnet18 resnet50 模型 (a)_中国高校课件下载中心

正在加载图片...

第5期黄庆康，等：应用于不平衡多分类问题的损失平衡函数 ·957· 100 98 94 96 98 ●CE ●CE ●CE ×OS *0S 92 ×OS 9 4PE AP APE ✉LE LE 90 LE resnet18 resnet50 resnet101 resnet18 resnet50 resnet101 resnet18 resnet50 resnet101 模型模型模型 (a)caltech PART (b)ILSVRC PARTI (c)ILSVRC PART2 图2不同算法在各数据集上正确率及其标准差 Fig.2 The accuracy and standard deviation of different algorithms for each dataset 由图3可知，在训练集上交叉嫡损失函数和陷入局部极小点。LE损失函数在训练集上正确过采样方法模型正确率曲线处于几乎完全一致状率低于交叉嫡损失函数和过采样方法，在测试集态，但在测试集上，过采样方法的正确率要比交上却高于其他算法。这证明该方法一定程度上避叉熵损失函数方法高，说明过采样方法能够提高免了模型的过拟合问题，实现了更好泛化能力。模型的泛化能力。而基于PE方法的结果在训练这是该方法能够优于与其思想类似的过采样方法集出现较大的波动，表明其在寻找最优参数过程的主要原因。中搜索的范围更为广泛，同时也不够稳定，容易 100 95 % 90 85 ●CE CE 70 xOS 80 ×OS APE 75 PE 60 ✉LE 70 LE 10 20 30.40 50 60 70 0 10 20 3040 50 6070 迭代次数迭代次数 (a)训练阶段 (b)测试阶段图3不同算法在数据集ILSVRC PART2上各阶段正确率 Fig.3 The accuracy of different algorithms in each epoch with respect to the ILSVRC PART2 dataset 3结束语 nition,2018.77:354-377. [3]JEATRAKUL P,WONG K W.FUNG CC.Using mis- 本文基于传统处理类别不平衡问题的手段， classification analysis for data cleaning[C]//Proceedings of 结合过采样和代价敏感学习的优点，利用模型在 International Workshop on Advanced Computational Intel- 小批量训练过程中动态产生的类别信息，实现了 ligence and Intelligent Informatics.Tokyo,Japan,2009: 在小批量内样本的损失平衡。在提高算法便利性 297-302. 的同时，进一步提高了模型在不平衡数据集上的 [4]BATISTA GE A P A,PRATI R C.MONARD MC.A 分类精度。将该方法应用于3个不平衡图像数据 study of the behavior of several methods for balancing ma- 集分类实验中，结果证明该方法的可行性。在视 chine learning training data[J].ACM SIGKDD explora- 觉领域一阶段的目标检测模型中，背景和目标的 tions newsletter,2004,6(1):20-29. 不平衡性严重影响了模型的分类效果。因此将该 [5]XIAO Jianxiong,HAYS J,EHINGER K A,et al.SUN database:Large-scale scene recognition from abbey to 算法应用于目标检测领域，以验证该算法的有效 zoo[C]//Proceedings of 2010 IEEE Computer Society Con- 性是接下来的工作之一。 ference on Computer Vision and Pattern Recognition.San 参考文献： Francisco,USA,2010:3485-3492 [6]GRZYMALA-BUSSE J W,GOODWIN L K, [1]LECUN Y,BENGIO Y,HINTON G.Deep learning[J]. GRZYMALA-BUSSE W J,et al.An approach to imbal- Nature,2015,521(7553):436-444 anced data sets based on changing rule strength[M]/PAL S [2]GU Jiuxiang,WANG Zhenhua,KUEN J,et al.Recent ad- K,POLKOWSKI L,SKOWRON A.Rough-Neural Com- vances in convolutional neural networks[J].Pattern recog- puting.Berlin,Heidelberg:Springer,2004:543-553.100 99 98 97 resnet18 resnet50 模型 (a) caltech PART (b) ILSVRC PART1 (c) ILSVRC PART2 正确率/% resnet101 94 96 92 90 88 resnet18 resnet50 模型正确率/% resnet101 96 98 94 92 90 resnet18 resnet50 模型正确率/% resnet101 CE OS PE LE CE OS PE LE CE OS PE LE 图 2 不同算法在各数据集上正确率及其标准差 Fig. 2 The accuracy and standard deviation of different algorithms for each dataset 由图 3 可知，在训练集上交叉熵损失函数和过采样方法模型正确率曲线处于几乎完全一致状态，但在测试集上，过采样方法的正确率要比交叉熵损失函数方法高，说明过采样方法能够提高模型的泛化能力。而基于 PE 方法的结果在训练集出现较大的波动，表明其在寻找最优参数过程中搜索的范围更为广泛，同时也不够稳定，容易陷入局部极小点。LE 损失函数在训练集上正确率低于交叉熵损失函数和过采样方法，在测试集上却高于其他算法。这证明该方法一定程度上避免了模型的过拟合问题，实现了更好泛化能力。这是该方法能够优于与其思想类似的过采样方法的主要原因。 (b) 测试阶段 CE OS PE LE 90 100 80 70 60 0 10 20 迭代次数 (a) 训练阶段正确率/% 30 40 50 CE OS PE LE 60 70 70 90 95 85 80 75 70 0 10 20 迭代次数正确率/% 30 40 50 60 图 3 不同算法在数据集 ILSVRC PART2 上各阶段正确率 Fig. 3 The accuracy of different algorithms in each epoch with respect to the ILSVRC PART2 dataset 3 结束语本文基于传统处理类别不平衡问题的手段，结合过采样和代价敏感学习的优点，利用模型在小批量训练过程中动态产生的类别信息，实现了在小批量内样本的损失平衡。在提高算法便利性的同时，进一步提高了模型在不平衡数据集上的分类精度。将该方法应用于 3 个不平衡图像数据集分类实验中，结果证明该方法的可行性。在视觉领域一阶段的目标检测模型中，背景和目标的不平衡性严重影响了模型的分类效果。因此将该算法应用于目标检测领域，以验证该算法的有效性是接下来的工作之一。参考文献： LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436–444. [1] GU Jiuxiang, WANG Zhenhua, KUEN J, et al. Recent advances in convolutional neural networks[J]. Pattern recog- [2] nition, 2018, 77:354–377. JEATRAKUL P, WONG K W, FUNG C C. Using misclassification analysis for data cleaning[C]//Proceedings of International Workshop on Advanced Computational Intelligence and Intelligent Informatics. Tokyo, Japan, 2009: 297−302. [3] BATISTA G E A P A, PRATI R C, MONARD M C. A study of the behavior of several methods for balancing machine learning training data[J]. ACM SIGKDD explorations newsletter, 2004, 6(1): 20–29. [4] XIAO Jianxiong, HAYS J, EHINGER K A, et al. SUN database: Large-scale scene recognition from abbey to zoo[C]//Proceedings of 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco, USA, 2010: 3485−3492. [5] GRZYMALA-BUSSE J W, GOODWIN L K, GRZYMALA-BUSSE W J, et al. An approach to imbalanced data sets based on changing rule strength[M]//PAL S K, POLKOWSKI L, SKOWRON A. Rough-Neural Computing. Berlin, Heidelberg: Springer, 2004: 543−553. [6] 第 5 期黄庆康，等：应用于不平衡多分类问题的损失平衡函数 ·957·

<<向上翻页向下翻页>>

点击下载：【人工智能基础】应用于不平衡多分类问题的损失平衡函数