正在加载图片...
·840· 智能系统学报 第14卷 波动表明ML-EKELM算法在收敛过程中遇到局 数据集上,指标性能最优,在平均性能指标位列 部最小值并成功寻找到全局最小值,这也进一步 第2位,与平均指标性能最优的ML-KNN算法仅 说明该算法求解弹性网络具有较强的鲁棒性,并 相差1.9%;在AP↑指标上如表8所示,ML-EKELM 且效率较高。 算法在各个数据集上的性能指标均为最优。在雅 表2中,在Yeast Gene数据集上与其他算法 虎网页数据集中,可以看出在CV)和RL评价指 对比,ML-EKELM算法在5种评价指标中均为第 标上,ML-KNN具有一定优势,但HL↓、OE!和 1,在HL指标中较第2位算法降低3.5%损失;如 AP↑则排名靠后。而本文提出的算法在HL↓、 表3所示,在Scene数据集中,本文ML-EKELM OE和AP↑上都具有较大优势,在CV和RL↓上 算法同样在5种评价指标中最为优秀,在OE指 对比其他算法也处于优势地位。 标中比第2位算法降低11.8%错误率,同时在AP↑ 各算法在多个数据集实验的时间消耗如表9 指标中比第2位算法提高1.7%准确率:雅虎网页 所示,本文提出的算法ML-EKELM由于采用坐标 数据集包含11个子数据集,其中分别对每个评价 下降法求解弹性网络,是一种迭代算法,所以在 指标在各个子数据集中做出比较,如表4所示, 平均时间消耗上高于直接求解矩阵解析解的 在HLl指标上,Arts、Business、Computers、Educa- 3种ELM算法77.5%~91.4%,但该算法平均时间 tion、Entertainment、Health、Reference,Science和 消耗低于ML-RBF算法24.9%,平均时间消耗低 Society等数据集中ML-EKELM性能最优,在Re- 于ML-KNN算法196.9%。从时间消耗可以看出 creation数据集上,该算法位列第2,与第1位算法 ML-EKELM算法对比传统ELM算法有一定差 相差仅1.6%,在数据集Social上,ML-EKELM与 距,但是对于其他多标记学习算法具有一定优 ML-KELM性能并列第1,在HL的平均指标中可 势,ML-EKELM兼具准确率高与时间消耗较低的 以看出,ML-EKELM算法性能最优。在表5 特点。 中,对比了不同算法在各个数据集上的OE!指标 为了更清晰地展示各算法在13个数据集上 数值,其中在Social数据集上,ML-EKELM较 的相对性能,采用显著性水平为5%的Nemenyi ML-KELM相差仅为0.3%,排位第2,在其他数据 检验。当两个对比算法在各数据集中的平均排 集中该指标均为最优;11个子数据集在CV)指标 序差值小于或等于临界差(critical difference,CD), 上如表6所示,ML-EKELM算法在Computers、 则认为这两个算法没有显著性差异;反之则2个 Entertainment和Recreation数据集中指标上最优, 算法有显著性差异。图3给出了在5种评价指标 其他数据均为第2,与平均指标性能最优的ML-KNN 下各算法的性能,其CD值为2.0913,没有显著性 算法相差10.4%。 差异的算法用实线相连,在图3评价指标子图中 在RL指标上如表7所示,该算法在Ats、 各算法坐标即平均排序位置,数值越小则算法性 Computers、Entertainment、Health和Recreation等 能越高。 CD CD 63 ML-EKELM ELM ML-EKELM ELM ML-RBF ML-KNN ML-RBF ML-KNN ML-KELM RELM ML-KELM -RELM (a)海明损失 (b)1-错误率 CD CD 6 ML-EKELM ELM ML-EKELM ELM ML-KNN ML-RBF ML-KNN ML-RBF ML-KELM RELM ML-KELM RELM (c)覆盖率 (d排序损失 CD 6 ML-EKELM ELM ML-KNN ML-RBF ML-KELM RELM (e)平均精度 图3算法性能比较 Fig.3 The performance comparison of algorithms波动表明 ML-EKELM 算法在收敛过程中遇到局 部最小值并成功寻找到全局最小值,这也进一步 说明该算法求解弹性网络具有较强的鲁棒性,并 且效率较高。 表 2 中,在 Yeast Gene 数据集上与其他算法 对比,ML-EKELM 算法在 5 种评价指标中均为第 1,在 HL↓指标中较第 2 位算法降低 3.5% 损失;如 表 3 所示,在 Scene 数据集中,本文 ML-EKELM 算法同样在 5 种评价指标中最为优秀,在 OE↓指 标中比第 2 位算法降低 11.8% 错误率,同时在 AP↑ 指标中比第 2 位算法提高 1.7% 准确率;雅虎网页 数据集包含 11 个子数据集,其中分别对每个评价 指标在各个子数据集中做出比较,如表 4 所示, 在 HL↓指标上,Arts、Business、Computers、Educa￾tion、Entertainment、Health、Reference,Science 和 Society 等数据集中 ML-EKELM 性能最优,在 Re￾creation 数据集上,该算法位列第 2,与第 1 位算法 相差仅 1.6%,在数据集 Social 上,ML-EKELM 与 ML-KELM 性能并列第 1,在 HL↓的平均指标中可 以看出, ML-EKELM 算法性能最优。在 表 5 中,对比了不同算法在各个数据集上的 OE↓指标 数值,其中在 Social 数据集上,ML-EKELM 较 ML-KELM 相差仅为 0.3%,排位第 2,在其他数据 集中该指标均为最优;11 个子数据集在 CV↓指标 上如表 6 所示,ML-EKELM 算法在 Computers、 Entertainment 和 Recreation 数据集中指标上最优, 其他数据均为第 2,与平均指标性能最优的 ML-KNN 算法相差 10.4%。 在 RL↓指标上如表 7 所示,该算法在 Arts、 Computers、Entertainment、Health 和 Recreation 等 数据集上,指标性能最优,在平均性能指标位列 第 2 位,与平均指标性能最优的 ML-KNN 算法仅 相差 1.9%;在 AP↑指标上如表 8 所示,ML-EKELM 算法在各个数据集上的性能指标均为最优。在雅 虎网页数据集中,可以看出在 CV↓和 RL↓评价指 标上,ML-KNN 具有一定优势,但 HL↓、OE↓和 AP↑则排名靠后。而本文提出的算法在 HL↓、 OE↓和 AP↑上都具有较大优势,在 CV↓和 RL↓上 对比其他算法也处于优势地位。 各算法在多个数据集实验的时间消耗如表 9 所示,本文提出的算法 ML-EKELM 由于采用坐标 下降法求解弹性网络,是一种迭代算法,所以在 平均时间消耗上高于直接求解矩阵解析解的 3 种 ELM 算法 77.5%~91.4%,但该算法平均时间 消耗低于 ML-RBF 算法 24.9%,平均时间消耗低 于 ML-KNN 算法 196.9%。从时间消耗可以看出 ML-EKELM 算法对比传统 ELM 算法有一定差 距,但是对于其他多标记学习算法具有一定优 势,ML-EKELM 兼具准确率高与时间消耗较低的 特点。 为了更清晰地展示各算法在 13 个数据集上 的相对性能,采用显著性水平为 5% 的 Nemenyi 检验[29]。当两个对比算法在各数据集中的平均排 序差值小于或等于临界差 (critical difference,CD), 则认为这两个算法没有显著性差异;反之则 2 个 算法有显著性差异。图 3 给出了在 5 种评价指标 下各算法的性能,其 CD 值为 2.0913,没有显著性 差异的算法用实线相连,在图 3 评价指标子图中 各算法坐标即平均排序位置,数值越小则算法性 能越高。 CD 1 ML-EKELM ML-RBF ML-KELM ELM ML-KNN RELM 2 3 4 5 6 CD 1 ML-EKELM ML-RBF ML-KELM ELM ML-KNN RELM 2 3 4 5 6 CD 1 ML-EKELM ML-KNN ML-KELM ELM ML-RBF RELM 2 3 4 5 6 CD 1 ML-EKELM ML-KNN ML-KELM ELM ML-RBF RELM 2 3 4 5 6 CD 1 ML-EKELM ML-KNN ML-KELM ELM ML-RBF RELM 2 3 4 5 6 (a) 海明损失 (b) 1-错误率 (c) 覆盖率 (d) 排序损失 (e) 平均精度 图 3 算法性能比较 Fig. 3 The performance comparison of algorithms ·840· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有