波动表明 ML-EKELM 算法在收敛过程中遇到局部最小值并成功寻找到全

正在加载图片...

·840· 智能系统学报第14卷波动表明ML-EKELM算法在收敛过程中遇到局数据集上，指标性能最优，在平均性能指标位列部最小值并成功寻找到全局最小值，这也进一步第2位，与平均指标性能最优的ML-KNN算法仅说明该算法求解弹性网络具有较强的鲁棒性，并相差1.9%；在AP↑指标上如表8所示，ML-EKELM 且效率较高。算法在各个数据集上的性能指标均为最优。在雅表2中，在Yeast Gene数据集上与其他算法虎网页数据集中，可以看出在CV)和RL评价指对比，ML-EKELM算法在5种评价指标中均为第标上，ML-KNN具有一定优势，但HL↓、OE!和 1,在HL指标中较第2位算法降低3.5%损失；如 AP↑则排名靠后。而本文提出的算法在HL↓、表3所示，在Scene数据集中，本文ML-EKELM OE和AP↑上都具有较大优势，在CV和RL↓上算法同样在5种评价指标中最为优秀，在OE指对比其他算法也处于优势地位。标中比第2位算法降低11.8%错误率，同时在AP↑ 各算法在多个数据集实验的时间消耗如表9 指标中比第2位算法提高1.7%准确率：雅虎网页所示，本文提出的算法ML-EKELM由于采用坐标数据集包含11个子数据集，其中分别对每个评价下降法求解弹性网络，是一种迭代算法，所以在指标在各个子数据集中做出比较，如表4所示，平均时间消耗上高于直接求解矩阵解析解的在HLl指标上，Arts、Business、Computers、Educa- 3种ELM算法77.5%~91.4%，但该算法平均时间 tion、Entertainment、Health、Reference,Science和消耗低于ML-RBF算法24.9%，平均时间消耗低 Society等数据集中ML-EKELM性能最优，在Re- 于ML-KNN算法196.9%。从时间消耗可以看出 creation数据集上，该算法位列第2，与第1位算法 ML-EKELM算法对比传统ELM算法有一定差相差仅1.6%，在数据集Social上，ML-EKELM与距，但是对于其他多标记学习算法具有一定优 ML-KELM性能并列第1，在HL的平均指标中可势，ML-EKELM兼具准确率高与时间消耗较低的以看出，ML-EKELM算法性能最优。在表5 特点。中，对比了不同算法在各个数据集上的OE!指标为了更清晰地展示各算法在13个数据集上数值，其中在Social数据集上，ML-EKELM较的相对性能，采用显著性水平为5%的Nemenyi ML-KELM相差仅为0.3%，排位第2，在其他数据检验。当两个对比算法在各数据集中的平均排集中该指标均为最优；11个子数据集在CV)指标序差值小于或等于临界差(critical difference,CD), 上如表6所示，ML-EKELM算法在Computers、则认为这两个算法没有显著性差异；反之则2个 Entertainment和Recreation数据集中指标上最优，算法有显著性差异。图3给出了在5种评价指标其他数据均为第2，与平均指标性能最优的ML-KNN 下各算法的性能，其CD值为2.0913，没有显著性算法相差10.4%。差异的算法用实线相连，在图3评价指标子图中在RL指标上如表7所示，该算法在Ats、各算法坐标即平均排序位置，数值越小则算法性 Computers、Entertainment、Health和Recreation等能越高。 CD CD 63 ML-EKELM ELM ML-EKELM ELM ML-RBF ML-KNN ML-RBF ML-KNN ML-KELM RELM ML-KELM -RELM (a)海明损失 (b)1-错误率 CD CD 6 ML-EKELM ELM ML-EKELM ELM ML-KNN ML-RBF ML-KNN ML-RBF ML-KELM RELM ML-KELM RELM (c)覆盖率 (d排序损失 CD 6 ML-EKELM ELM ML-KNN ML-RBF ML-KELM RELM (e)平均精度图3算法性能比较 Fig.3 The performance comparison of algorithms波动表明 ML-EKELM 算法在收敛过程中遇到局部最小值并成功寻找到全局最小值，这也进一步说明该算法求解弹性网络具有较强的鲁棒性，并且效率较高。表 2 中，在 Yeast Gene 数据集上与其他算法对比，ML-EKELM 算法在 5 种评价指标中均为第 1，在 HL↓指标中较第 2 位算法降低 3.5% 损失；如表 3 所示，在 Scene 数据集中，本文 ML-EKELM 算法同样在 5 种评价指标中最为优秀，在 OE↓指标中比第 2 位算法降低 11.8% 错误率，同时在 AP↑ 指标中比第 2 位算法提高 1.7% 准确率；雅虎网页数据集包含 11 个子数据集，其中分别对每个评价指标在各个子数据集中做出比较，如表 4 所示，在 HL↓指标上，Arts、Business、Computers、Education、Entertainment、Health、Reference，Science 和 Society 等数据集中 ML-EKELM 性能最优，在 Recreation 数据集上，该算法位列第 2，与第 1 位算法相差仅 1.6%，在数据集 Social 上，ML-EKELM 与 ML-KELM 性能并列第 1，在 HL↓的平均指标中可以看出， ML-EKELM 算法性能最优。在表 5 中，对比了不同算法在各个数据集上的 OE↓指标数值，其中在 Social 数据集上，ML-EKELM 较 ML-KELM 相差仅为 0.3%，排位第 2，在其他数据集中该指标均为最优；11 个子数据集在 CV↓指标上如表 6 所示，ML-EKELM 算法在 Computers、 Entertainment 和 Recreation 数据集中指标上最优，其他数据均为第 2，与平均指标性能最优的 ML-KNN 算法相差 10.4%。在 RL↓指标上如表 7 所示，该算法在 Arts、 Computers、Entertainment、Health 和 Recreation 等数据集上，指标性能最优，在平均性能指标位列第 2 位，与平均指标性能最优的 ML-KNN 算法仅相差 1.9%；在 AP↑指标上如表 8 所示，ML-EKELM 算法在各个数据集上的性能指标均为最优。在雅虎网页数据集中，可以看出在 CV↓和 RL↓评价指标上，ML-KNN 具有一定优势，但 HL↓、OE↓和 AP↑则排名靠后。而本文提出的算法在 HL↓、 OE↓和 AP↑上都具有较大优势，在 CV↓和 RL↓上对比其他算法也处于优势地位。各算法在多个数据集实验的时间消耗如表 9 所示，本文提出的算法 ML-EKELM 由于采用坐标下降法求解弹性网络，是一种迭代算法，所以在平均时间消耗上高于直接求解矩阵解析解的 3 种 ELM 算法 77.5%~91.4%，但该算法平均时间消耗低于 ML-RBF 算法 24.9%，平均时间消耗低于 ML-KNN 算法 196.9%。从时间消耗可以看出 ML-EKELM 算法对比传统 ELM 算法有一定差距，但是对于其他多标记学习算法具有一定优势，ML-EKELM 兼具准确率高与时间消耗较低的特点。为了更清晰地展示各算法在 13 个数据集上的相对性能，采用显著性水平为 5% 的 Nemenyi 检验[29]。当两个对比算法在各数据集中的平均排序差值小于或等于临界差 (critical difference，CD)，则认为这两个算法没有显著性差异；反之则 2 个算法有显著性差异。图 3 给出了在 5 种评价指标下各算法的性能，其 CD 值为 2.0913，没有显著性差异的算法用实线相连，在图 3 评价指标子图中各算法坐标即平均排序位置，数值越小则算法性能越高。 CD 1 ML-EKELM ML-RBF ML-KELM ELM ML-KNN RELM 2 3 4 5 6 CD 1 ML-EKELM ML-RBF ML-KELM ELM ML-KNN RELM 2 3 4 5 6 CD 1 ML-EKELM ML-KNN ML-KELM ELM ML-RBF RELM 2 3 4 5 6 CD 1 ML-EKELM ML-KNN ML-KELM ELM ML-RBF RELM 2 3 4 5 6 CD 1 ML-EKELM ML-KNN ML-KELM ELM ML-RBF RELM 2 3 4 5 6 (a) 海明损失 (b) 1-错误率 (c) 覆盖率 (d) 排序损失 (e) 平均精度图 3 算法性能比较 Fig. 3 The performance comparison of algorithms ·840· 智能系统学报第 14 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】弹性网络核极限学习机的多标记学习算法