率有较大提高。且更窄的置信区间表明结果更稳定、显著。基于线性核函数的 S

正在加载图片...

·200· 智能系统学报第13卷率有较大提高。且更窄的置信区间表明结果更稳 4结束语定、显著。基于线性核函数的SVM(L-SVM)一直表现欠佳，在两个数据集中识别效果不如逻辑回归针对现有钢琴乐谱难度分类主要由人工方式完 (LR),基于多项式核函数的SVM(PSVM)表现良成，效率不高，区别于传统将乐谱难度等级识别归好，在FourS数据集中识别效果仅次于本文算法。结为回归问题，本文直接将其建模为基于支持向量机的分类问题。并结合钢琴乐谱分类主观性强、特表2各算法的识别准确率及90%置信区间 Table 2 Recognition accuracy and 90%confidence inter- 征之间普遍存在相关性等特点，利用测度学习改进 val of each algorithm % 高斯径向基核函数，从而提出一种测度学习支持向 NineS数据集 FourS数据集量机分类算法一ML-SVM算法。经过在9类和算法识别 90%置识别 90%置 4类难度两个乐谱数据集上的对比实验，结果表明准确率信区间准确率信区间本文所提算法的识别准确率优于现有算法，且有效 LR 64 53.774.3 70.28 64.6-80.8 提高了基于高斯径向基核函数SVM的分类性能。实验结果说明，利用测度学习理论，保留特征之间 L-SVM 61 55.3-66.7 71.30 66.7-75.9 的相关关系，更适合乐谱难度识别数据与分布特 P-SVM 65.42 56.22-74.62 78.37 72.37-84.37 点，并能够有效识别算法的性能。未来的工作可以 GRB-SVM 66 59.8-72.2 75.63 70.21-81.05 考虑应用半监督算法，以充分利用大量无难度标签 ML-SVM 68.74 60.9478.54 84.67 80.4288.92 数据，预期将会大大提高分类器的训练效果，进而提高算法的识别准确率。为进一步验证本文所提算法的有效性，我们将 ML-SVM算法与另一种主要用来实现特征降维的参考文献：投影算法一主成分分析结合SVM的分类准确率 [1]CHIU S C,CHEN M S.A study on difficulty level recogni- 进行对比。在对原始特征数据进行PCA处理时，保 tion of piano sheet music[Cl//IEEE International Symposi- 留原始特征95%信息量的投影特征。PCA投影处 um on Multimedia.Irvine.CA.USA:IEEE.2012:17-23. 理后，最终NineS数据集中的特征降到l3维，而 [2]ROBNIK-SIKONJA M,KONONENKO I.Theoretical and FouS数据集的特征降到8维。之后再用基于各个 empirical analysis of Relief[J].Machine learning,2003, 核函数的SVM算法对PCA降维后的数据进行分 53(1/2):23-69. 类。实验结果如表3所示。从表中可以看出，原始 [3]JAMES G,WITTEN D,HASTIE T,et al.An introduction 特征数据经过PCA处理后，最终各个SVM的分类 to statistical learning with applications in R[M].New York: Springer,2013:59-102. 准确率都有所提高。这是因为原始特征数据经过 [4]SMOLA A J,SCHOLKOPF B.A tutorial on support vector PCA投影、降维之后，可以有效减少混叠以及冗余 regression[J].Statistics and computing,2003,14(3):199- 信息，进而提高最终分类的准确率。 222 表3PCA处理后，各算法的识别准确率 [5]SEBASTIEN V,RALAMBONDRAINY H,SEBASTIEN Table 3 After features are processed by PCA,each SVM algo- O.et al.Score analyzer:automatically determining scores rithm's recognition accuracy in two data sets difficulty level for instrumental e-learning[C]//Proceedings NineS数据集中 FourS数据集中 of the 13th International Society for Music Information Re- 算法识别准确率识别准确率 trieval Conference.Porto,Portugal:ISMIR,2012:571-576. L-SVM 61.58 72.56 [6]CASTAN G,GOOD M,ROLAND P.Extensible markup P-SVM 66.12 80.15 language(XML)for music applications:an introduction,the virtual score:representation,retrieval,restoration[M].Cam GRB-SVM 67.2 78.42 bridge:MIT Press,2001:95-102 虽然原始特征数据经过PCA投影、降维处理 [7]WARD JR J H.Hierarchical grouping to optimize an ob- jective function[J].Journal of the American statistical asso- 后，利用GRB-SVM分类的准确率较之前有所提 ciation,1963,58(301):236-244. 高，但分类准确率与本文提出的ML-SVM算法仍有 [8]丁世飞，齐丙娟，谭红艳.支持向量机理论与算法研究综差距，尤其在FourS数据集中，ML-SVM仍有较大述).电子科技大学学报，2011,40(1)2-10. 优势，这也再次验证了本文提出的ML-SVM算法是 DING Shifei,QI Bingjuan,TAN Hongyan.An overview on 有效的。 theory and algorithm of support vector machines[J].Journal率有较大提高。且更窄的置信区间表明结果更稳定、显著。基于线性核函数的 SVM(L-SVM) 一直表现欠佳，在两个数据集中识别效果不如逻辑回归 (LR)，基于多项式核函数的 SVM(P-SVM) 表现良好，在 FourS 数据集中识别效果仅次于本文算法。表 2 各算法的识别准确率及 90% 置信区间 Table 2 Recognition accuracy and 90% confidence interval of each algorithm % 算法 NineS 数据集 FourS 数据集识别准确率 90% 置信区间识别准确率 90% 置信区间 LR 64 53.7~74.3 70.28 64. 6~80.8 L-SVM 61 55.3~66.7 71.30 66.7~75.9 P-SVM 65.42 56.22~74.62 78.37 72.37~84.37 GRB-SVM 66 59.8~72.2 75.63 70.21~81.05 ML-SVM 68.74 60.94~78.54 84.67 80.42~88.92 为进一步验证本文所提算法的有效性，我们将 ML-SVM 算法与另一种主要用来实现特征降维的投影算法——主成分分析结合 SVM 的分类准确率进行对比。在对原始特征数据进行 PCA 处理时，保留原始特征 95% 信息量的投影特征。PCA 投影处理后，最终 NineS 数据集中的特征降到 13 维，而 FourS 数据集的特征降到 8 维。之后再用基于各个核函数的 SVM 算法对 PCA 降维后的数据进行分类。实验结果如表 3 所示。从表中可以看出，原始特征数据经过 PCA 处理后，最终各个 SVM 的分类准确率都有所提高。这是因为原始特征数据经过 PCA 投影、降维之后，可以有效减少混叠以及冗余信息，进而提高最终分类的准确率。表 3 PCA 处理后，各算法的识别准确率 Table 3 After features are processed by PCA, each SVM algorithm’s recognition accuracy in two data sets % 算法 NineS 数据集中识别准确率 FourS 数据集中识别准确率 L-SVM 61.58 72.56 P-SVM 66.12 80.15 GRB-SVM 67. 2 78.42 虽然原始特征数据经过 PCA 投影、降维处理后，利用 GRB-SVM 分类的准确率较之前有所提高，但分类准确率与本文提出的 ML-SVM 算法仍有差距，尤其在 FourS 数据集中，ML-SVM 仍有较大优势，这也再次验证了本文提出的 ML-SVM 算法是有效的。 4 结束语针对现有钢琴乐谱难度分类主要由人工方式完成，效率不高，区别于传统将乐谱难度等级识别归结为回归问题，本文直接将其建模为基于支持向量机的分类问题。并结合钢琴乐谱分类主观性强、特征之间普遍存在相关性等特点，利用测度学习改进高斯径向基核函数，从而提出一种测度学习支持向量机分类算法——ML-SVM 算法。经过在 9 类和 4 类难度两个乐谱数据集上的对比实验，结果表明本文所提算法的识别准确率优于现有算法，且有效提高了基于高斯径向基核函数 SVM 的分类性能。实验结果说明，利用测度学习理论，保留特征之间的相关关系，更适合乐谱难度识别数据与分布特点，并能够有效识别算法的性能。未来的工作可以考虑应用半监督算法，以充分利用大量无难度标签数据，预期将会大大提高分类器的训练效果，进而提高算法的识别准确率。参考文献： CHIU S C, CHEN M S. A study on difficulty level recognition of piano sheet music[C]//IEEE International Symposium on Multimedia. Irvine, CA, USA: IEEE, 2012: 17–23. [1] ROBNIK-ŠIKONJA M, KONONENKO I. Theoretical and empirical analysis of Relief[J]. Machine learning, 2003, 53(1/2): 23–69. [2] JAMES G, WITTEN D, HASTIE T, et al. An introduction to statistical learning with applications in R[M]. New York: Springer, 2013: 59–102. [3] SMOLA A J, SCHÖLKOPF B. A tutorial on support vector regression[J]. Statistics and computing, 2003, 14(3): 199– 222. [4] SÉBASTIEN V, RALAMBONDRAINY H, SÉBASTIEN O, et al. Score analyzer: automatically determining scores difficulty level for instrumental e-learning[C]//Proceedings of the 13th International Society for Music Information Retrieval Conference. Porto, Portugal: ISMIR, 2012: 571–576. [5] CASTAN G, GOOD M, ROLAND P. Extensible markup language (XML) for music applications: an introduction, the virtual score: representation, retrieval, restoration[M]. Cambridge: MIT Press, 2001: 95–102. [6] WARD JR J H. Hierarchical grouping to optimize an objective function[J]. Journal of the American statistical association, 1963, 58(301): 236–244. [7] 丁世飞, 齐丙娟, 谭红艳. 支持向量机理论与算法研究综述[J]. 电子科技大学学报, 2011, 40(1): 2–10. DING Shifei, QI Bingjuan, TAN Hongyan. An overview on theory and algorithm of support vector machines[J]. Journal [8] ·200· 智能系统学报第 13 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】基于测度学习支持向量机的钢琴乐谱难度等级识别