正在加载图片...
·200· 智能系统学报 第13卷 率有较大提高。且更窄的置信区间表明结果更稳 4结束语 定、显著。基于线性核函数的SVM(L-SVM)一直 表现欠佳,在两个数据集中识别效果不如逻辑回归 针对现有钢琴乐谱难度分类主要由人工方式完 (LR),基于多项式核函数的SVM(PSVM)表现良 成,效率不高,区别于传统将乐谱难度等级识别归 好,在FourS数据集中识别效果仅次于本文算法。 结为回归问题,本文直接将其建模为基于支持向量 机的分类问题。并结合钢琴乐谱分类主观性强、特 表2各算法的识别准确率及90%置信区间 Table 2 Recognition accuracy and 90%confidence inter- 征之间普遍存在相关性等特点,利用测度学习改进 val of each algorithm % 高斯径向基核函数,从而提出一种测度学习支持向 NineS数据集 FourS数据集 量机分类算法一ML-SVM算法。经过在9类和 算法 识别 90%置 识别 90%置 4类难度两个乐谱数据集上的对比实验,结果表明 准确率 信区间 准确率 信区间 本文所提算法的识别准确率优于现有算法,且有效 LR 64 53.774.3 70.28 64.6-80.8 提高了基于高斯径向基核函数SVM的分类性能。 实验结果说明,利用测度学习理论,保留特征之间 L-SVM 61 55.3-66.7 71.30 66.7-75.9 的相关关系,更适合乐谱难度识别数据与分布特 P-SVM 65.42 56.22-74.62 78.37 72.37-84.37 点,并能够有效识别算法的性能。未来的工作可以 GRB-SVM 66 59.8-72.2 75.63 70.21-81.05 考虑应用半监督算法,以充分利用大量无难度标签 ML-SVM 68.74 60.9478.54 84.67 80.4288.92 数据,预期将会大大提高分类器的训练效果,进而 提高算法的识别准确率。 为进一步验证本文所提算法的有效性,我们将 ML-SVM算法与另一种主要用来实现特征降维的 参考文献: 投影算法一主成分分析结合SVM的分类准确率 [1]CHIU S C,CHEN M S.A study on difficulty level recogni- 进行对比。在对原始特征数据进行PCA处理时,保 tion of piano sheet music[Cl//IEEE International Symposi- 留原始特征95%信息量的投影特征。PCA投影处 um on Multimedia.Irvine.CA.USA:IEEE.2012:17-23. 理后,最终NineS数据集中的特征降到l3维,而 [2]ROBNIK-SIKONJA M,KONONENKO I.Theoretical and FouS数据集的特征降到8维。之后再用基于各个 empirical analysis of Relief[J].Machine learning,2003, 核函数的SVM算法对PCA降维后的数据进行分 53(1/2):23-69. 类。实验结果如表3所示。从表中可以看出,原始 [3]JAMES G,WITTEN D,HASTIE T,et al.An introduction 特征数据经过PCA处理后,最终各个SVM的分类 to statistical learning with applications in R[M].New York: Springer,2013:59-102. 准确率都有所提高。这是因为原始特征数据经过 [4]SMOLA A J,SCHOLKOPF B.A tutorial on support vector PCA投影、降维之后,可以有效减少混叠以及冗余 regression[J].Statistics and computing,2003,14(3):199- 信息,进而提高最终分类的准确率。 222 表3PCA处理后,各算法的识别准确率 [5]SEBASTIEN V,RALAMBONDRAINY H,SEBASTIEN Table 3 After features are processed by PCA,each SVM algo- O.et al.Score analyzer:automatically determining scores rithm's recognition accuracy in two data sets difficulty level for instrumental e-learning[C]//Proceedings NineS数据集中 FourS数据集中 of the 13th International Society for Music Information Re- 算法 识别准确率 识别准确率 trieval Conference.Porto,Portugal:ISMIR,2012:571-576. L-SVM 61.58 72.56 [6]CASTAN G,GOOD M,ROLAND P.Extensible markup P-SVM 66.12 80.15 language(XML)for music applications:an introduction,the virtual score:representation,retrieval,restoration[M].Cam GRB-SVM 67.2 78.42 bridge:MIT Press,2001:95-102 虽然原始特征数据经过PCA投影、降维处理 [7]WARD JR J H.Hierarchical grouping to optimize an ob- jective function[J].Journal of the American statistical asso- 后,利用GRB-SVM分类的准确率较之前有所提 ciation,1963,58(301):236-244. 高,但分类准确率与本文提出的ML-SVM算法仍有 [8]丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综 差距,尤其在FourS数据集中,ML-SVM仍有较大 述).电子科技大学学报,2011,40(1)2-10. 优势,这也再次验证了本文提出的ML-SVM算法是 DING Shifei,QI Bingjuan,TAN Hongyan.An overview on 有效的。 theory and algorithm of support vector machines[J].Journal率有较大提高。且更窄的置信区间表明结果更稳 定、显著。基于线性核函数的 SVM(L-SVM) 一直 表现欠佳,在两个数据集中识别效果不如逻辑回归 (LR),基于多项式核函数的 SVM(P-SVM) 表现良 好,在 FourS 数据集中识别效果仅次于本文算法。 表 2 各算法的识别准确率及 90% 置信区间 Table 2 Recognition accuracy and 90% confidence inter￾val of each algorithm % 算法 NineS 数据集 FourS 数据集 识别 准确率 90% 置 信区间 识别 准确率 90% 置 信区间 LR 64 53.7~74.3 70.28 64. 6~80.8 L-SVM 61 55.3~66.7 71.30 66.7~75.9 P-SVM 65.42 56.22~74.62 78.37 72.37~84.37 GRB-SVM 66 59.8~72.2 75.63 70.21~81.05 ML-SVM 68.74 60.94~78.54 84.67 80.42~88.92 为进一步验证本文所提算法的有效性,我们将 ML-SVM 算法与另一种主要用来实现特征降维的 投影算法——主成分分析结合 SVM 的分类准确率 进行对比。在对原始特征数据进行 PCA 处理时,保 留原始特征 95% 信息量的投影特征。PCA 投影处 理后,最终 NineS 数据集中的特征降到 13 维,而 FourS 数据集的特征降到 8 维。之后再用基于各个 核函数的 SVM 算法对 PCA 降维后的数据进行分 类。实验结果如表 3 所示。从表中可以看出,原始 特征数据经过 PCA 处理后,最终各个 SVM 的分类 准确率都有所提高。这是因为原始特征数据经过 PCA 投影、降维之后,可以有效减少混叠以及冗余 信息,进而提高最终分类的准确率。 表 3 PCA 处理后,各算法的识别准确率 Table 3 After features are processed by PCA, each SVM algo￾rithm’s recognition accuracy in two data sets % 算法 NineS 数据集中 识别准确率 FourS 数据集中 识别准确率 L-SVM 61.58 72.56 P-SVM 66.12 80.15 GRB-SVM 67. 2 78.42 虽然原始特征数据经过 PCA 投影、降维处理 后,利用 GRB-SVM 分类的准确率较之前有所提 高,但分类准确率与本文提出的 ML-SVM 算法仍有 差距,尤其在 FourS 数据集中,ML-SVM 仍有较大 优势,这也再次验证了本文提出的 ML-SVM 算法是 有效的。 4 结束语 针对现有钢琴乐谱难度分类主要由人工方式完 成,效率不高,区别于传统将乐谱难度等级识别归 结为回归问题,本文直接将其建模为基于支持向量 机的分类问题。并结合钢琴乐谱分类主观性强、特 征之间普遍存在相关性等特点,利用测度学习改进 高斯径向基核函数,从而提出一种测度学习支持向 量机分类算法——ML-SVM 算法。经过在 9 类和 4 类难度两个乐谱数据集上的对比实验,结果表明 本文所提算法的识别准确率优于现有算法,且有效 提高了基于高斯径向基核函数 SVM 的分类性能。 实验结果说明,利用测度学习理论,保留特征之间 的相关关系,更适合乐谱难度识别数据与分布特 点,并能够有效识别算法的性能。未来的工作可以 考虑应用半监督算法,以充分利用大量无难度标签 数据,预期将会大大提高分类器的训练效果,进而 提高算法的识别准确率。 参考文献: CHIU S C, CHEN M S. A study on difficulty level recogni￾tion of piano sheet music[C]//IEEE International Symposi￾um on Multimedia. Irvine, CA, USA: IEEE, 2012: 17–23. [1] ROBNIK-ŠIKONJA M, KONONENKO I. Theoretical and empirical analysis of Relief[J]. Machine learning, 2003, 53(1/2): 23–69. [2] JAMES G, WITTEN D, HASTIE T, et al. An introduction to statistical learning with applications in R[M]. New York: Springer, 2013: 59–102. [3] SMOLA A J, SCHÖLKOPF B. A tutorial on support vector regression[J]. Statistics and computing, 2003, 14(3): 199– 222. [4] SÉBASTIEN V, RALAMBONDRAINY H, SÉBASTIEN O, et al. Score analyzer: automatically determining scores difficulty level for instrumental e-learning[C]//Proceedings of the 13th International Society for Music Information Re￾trieval Conference. Porto, Portugal: ISMIR, 2012: 571–576. [5] CASTAN G, GOOD M, ROLAND P. Extensible markup language (XML) for music applications: an introduction, the virtual score: representation, retrieval, restoration[M]. Cam￾bridge: MIT Press, 2001: 95–102. [6] WARD JR J H. Hierarchical grouping to optimize an ob￾jective function[J]. Journal of the American statistical asso￾ciation, 1963, 58(301): 236–244. [7] 丁世飞, 齐丙娟, 谭红艳. 支持向量机理论与算法研究综 述[J]. 电子科技大学学报, 2011, 40(1): 2–10. DING Shifei, QI Bingjuan, TAN Hongyan. An overview on theory and algorithm of support vector machines[J]. Journal [8] ·200· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有