第13卷第2期 智能系统学报 Vol.13 No.2 2018年4月 CAAI Transactions on Intelligent Systems Apr.2018 D0:10.11992/tis.201612012 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20170508.0922.002.html 基于测度学习支持向量机的钢琴乐谱难度等级识别 郭龙伟,关欣,李锵 (天津大学电子信息工程学院,天津300072) 摘要:现有钢琴乐谱难度分类主要由人工方式完成.效率不高,而自动识别乐谱难度等级的算法对类别的拟合度较 低。因此,与传统将乐谱难度等级识别归结为回归问题不同,本文直接将其建模为基于支持向量机的分类问题。并 结合钢琴乐谱分类主观性强、特征之间普遍存在相关性等特点,利用测度学习理论有难度等级标签乐谱的先验知识 依据特征对难度区分的贡献度,改进高斯径向基核函数,从而提出一种测度学习支持向量机分类算法一一ML SVM算法。在9类和4类难度两个乐谱数据集上,我们将ML-SVM算法与逻辑回归,基于线性核函数、多项式核函 数、高斯径向基核函数的支持向量机算法以及结合主成分分析的各个支持向量机算法进行了对比,实验结果表明我 们提出算法的识别正确率优于现有算法,分别为68.74%和84.67%。所提算法有效提高了基于高斯径向基核函数支 持向量机算法在本应用问题中的分类性能。 关键词:数字钢琴乐谱:难度等级识别:分类算法;支持向量机:测度学习;高斯径向基核函数 中图分类号:TP391.4文献标志码:A文章编号:1673-4785(2018)02-0196-06 中文引用格式:郭龙伟,关欣,李锵.基于测度学习支持向量机的钢琴乐谱难度等级识别.智能系统学报,2018,13(2:196-201. 英文引用格式:GUO Longwei,,GUAN Xin,LI Qiang.Recognition of difficulty level of piano score based on metric learning sup- port vector machineJ.CAAI transactions on intelligent systems,2018,13(2):196-201. Recognition of difficulty level of piano score based on metric learning support vector machine GUO Longwei,GUAN Xin,LI Qiang (Department of Electronic Information Engineering.Tianjin University,Tianjin 300072,China) Abstract:The existing classification work about piano score's level is mainly done manually and inefficient,while the algorithm automatically recognizing the difficulty class of music scopre has a low classification fitting degree.There- fore,different from the traditional method that takes the recognition for the difficulty class of music scope as a regres- sion issue,the paper directly modelled it as a classification based on the support vector machine,in addition,in combin- ation with such characteristics of the score classification as intense subjectivity and common dependency among fea- tures,the metric learning theory was utilized.The prior knowledge of the score with difficult level tag was sufficiently utilized,according to the contribution of feature in difficulty distinguishment,the Gauss radial basis kernel function was improved,so as to propose a kind of metric learning support vector machine classification algorithm-ML-SVM al- gorithm.In the score datasets with level 9 and level 4 difficulty,ML-SVM algorithm was compared with logistic regres- sion,the support vector machine algorithm based on linear kernel function,polynomial kernel function,Gauss radical basis(GRB)kernel function,and various support vector machine algorithms combining principal component analysis. The results show that the proposed algorithm is much more accurate than the existing algorithms,reaching the accuracy rate 68.74%and 84.67%respectively.The proposed algorithm effectively improves the classification performance of SVM algorithm based on GRB kernel function in this application. Keywords:digital piano score;recognition of difficulty level;classification algorithm;support vector machine;metric learning;Gauss radial basis kernel function 收稿日期:2016-12-08.网络出版日期:2017-05-08 虽然互联网中存在海量的钢琴乐谱资源,但其 基金项目:国家自然科学基金项目(60802049,61471263):天津市 自然科学基金重点项目(16 JCZDJC31100). 难易程度不一,对于业余和初级乐器学习者来说, 通信作者:关欣.E-mail:guanxin@tju.edu.cn. 由于缺乏专业知识和指导,难以有效地找到与自身
DOI: 10.11992/tis.201612012 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20170508.0922.002.html 基于测度学习支持向量机的钢琴乐谱难度等级识别 郭龙伟,关欣,李锵 (天津大学 电子信息工程学院,天津 300072) 摘 要:现有钢琴乐谱难度分类主要由人工方式完成,效率不高,而自动识别乐谱难度等级的算法对类别的拟合度较 低。因此,与传统将乐谱难度等级识别归结为回归问题不同,本文直接将其建模为基于支持向量机的分类问题。并 结合钢琴乐谱分类主观性强、特征之间普遍存在相关性等特点,利用测度学习理论有难度等级标签乐谱的先验知识, 依据特征对难度区分的贡献度,改进高斯径向基核函数,从而提出一种测度学习支持向量机分类算法——MLSVM 算法。在 9 类和 4 类难度两个乐谱数据集上,我们将 ML-SVM 算法与逻辑回归,基于线性核函数、多项式核函 数、高斯径向基核函数的支持向量机算法以及结合主成分分析的各个支持向量机算法进行了对比,实验结果表明我 们提出算法的识别正确率优于现有算法,分别为 68.74% 和 84.67%。所提算法有效提高了基于高斯径向基核函数支 持向量机算法在本应用问题中的分类性能。 关键词:数字钢琴乐谱;难度等级识别;分类算法;支持向量机;测度学习;高斯径向基核函数 中图分类号:TP391.4 文献标志码:A 文章编号:1673−4785(2018)02−0196−06 中文引用格式:郭龙伟, 关欣, 李锵. 基于测度学习支持向量机的钢琴乐谱难度等级识别[J]. 智能系统学报, 2018, 13(2): 196–201. 英文引用格式:GUO Longwei, GUAN Xin, LI Qiang. Recognition of difficulty level of piano score based on metric learning support vector machine[J]. CAAI transactions on intelligent systems, 2018, 13(2): 196–201. Recognition of difficulty level of piano score based on metric learning support vector machine GUO Longwei,GUAN Xin,LI Qiang (Department of Electronic Information Engineering, Tianjin University, Tianjin 300072, China) Abstract: The existing classification work about piano score’s level is mainly done manually and inefficient, while the algorithm automatically recognizing the difficulty class of music scopre has a low classification fitting degree. Therefore, different from the traditional method that takes the recognition for the difficulty class of music scope as a regression issue, the paper directly modelled it as a classification based on the support vector machine, in addition, in combination with such characteristics of the score classification as intense subjectivity and common dependency among features, the metric learning theory was utilized. The prior knowledge of the score with difficult level tag was sufficiently utilized, according to the contribution of feature in difficulty distinguishment, the Gauss radial basis kernel function was improved, so as to propose a kind of metric learning support vector machine classification algorithm —ML-SVM algorithm. In the score datasets with level 9 and level 4 difficulty, ML-SVM algorithm was compared with logistic regression, the support vector machine algorithm based on linear kernel function, polynomial kernel function, Gauss radical basis (GRB) kernel function, and various support vector machine algorithms combining principal component analysis. The results show that the proposed algorithm is much more accurate than the existing algorithms, reaching the accuracy rate 68.74% and 84.67% respectively. The proposed algorithm effectively improves the classification performance of SVM algorithm based on GRB kernel function in this application. Keywords: digital piano score; recognition of difficulty level; classification algorithm; support vector machine; metric learning; Gauss radial basis kernel function 虽然互联网中存在海量的钢琴乐谱资源,但其 难易程度不一,对于业余和初级乐器学习者来说, 由于缺乏专业知识和指导,难以有效地找到与自身 收稿日期:2016−12−08. 网络出版日期:2017−05−08. 基金项目:国家自然科学基金项目 (60802049,61471263);天津市 自然科学基金重点项目 (16JCZDJC31100). 通信作者:关欣. E-mail:guanxin@tju.edu.cn. 第 13 卷第 2 期 智 能 系 统 学 报 Vol.13 No.2 2018 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2018
第2期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·197· 学习难度匹配的乐谱来学习。专业音乐学习者一般 人满意。与有监督算法相比,非监督算法,如分层 依据固定进阶教材,但缺乏个性化、灵活的学习方 聚类,虽能充分利用特征与难度等级之间的自然分 案。此外,一些经典但难度高的乐谱,会有诸多简 布关系,但无法利用已有的难度等级标签作为先验 化版本存在。因此,有必要对海量的钢琴乐谱资源 知识提高识别效果。例如,实验中,原始乐谱数据 的难度等级进行区分。 是4个类别,Veronique Sebastien经过PCA降维, 现在绝大部分乐谱难度等级仍然依赖于专业人 应用聚类算法,最终仅得到3个难度类别 士主观判断。对于海量的数字乐谱,人工判断难度 在现有有监督的回归拟合算法识别钢琴乐谱难 等级会是一个耗时耗力的巨大工程。人工主观判断 度等级的研究中,支持向量回归有最好的拟合效果 也很难稳定、可靠地把握每个难度等级之间的区 (其R2统计量值为39.9%)。但支持向量回归,更适 别,尤其对于多类别问题。不同的人对于同一首乐 合逼近、拟合连续分布数据,对于此离散类别的分 谱可能会给出不同的难度等级,甚至对于同一首乐 类问题能力有限。所以本文利用一种与支持向量回 谱,同一个人在不同的时间也会给出不同的难度等 归算法原理相近,但更适用于解决分类问题的支持 级。因此,自动识别乐谱难度等级的系统具有重要 向量机分类算法实现数字钢琴乐谱难度等级识别。 的理论意义和应用价值。 为网络中存在的数字乐谱提供难度等级标签将 1支持向量机理论 会大大提高寻找合适难度等级乐谱的效率,并能提 SVM是基于统计学习理论中经验风险最小化 高音乐网站的用户体验。通常研究中将乐谱难度识 原则的一种机器学习算法。SVM已广泛应用于 别归为模式分类问题,从符号乐谱中定义并提取难 纹理分类(texture classification)、文本分类Io、人 度相关特征,利用分类思想实现乐谱难度等级的识 脸识别山、语音识别]等各个领域。理论和实践证 别。下面将针对不同的技术来回顾钢琴乐谱难度等 明,SVM对噪声和离群点鲁棒性好,泛化能力强,经 级识别领域的研究现状。 过扩展可解决多分类问题。 Shih-Chuan Chiu等最先开始钢琴乐谱难度等 SVM实现分类的关键是核函数,利用核函数 级识别研究。由于钢琴乐谱难度识别是一个相对较 可以将低维线性不可分的问题转化到高维空间实现 新的研究问题,现有的符号音乐特征(symbolic mu- 线性可分,同时避免因维数增加而导致过大的计算 sic feature)较少直接用于难度等级识别。所以他们 量。常用的核函数有线性核函数(linear kernel func-. 首先定义8个与乐谱难度密切相关的特征,将此 tion)、多项式核函数(polynomial kernel function)、高 8个难度相关特征与语义特征一起作为特征空间。 斯径向基核函数(Gauss radical basis kernel func- 后用特征选择算法ReliefFP按照特征重要程度(即 tion,GRB)等。由于本研究问题的特征数目远小 各个特征对难度等级的辨别能力大小)分配权值, 于样本数目,并且为降低分类模型的参数复杂度, 选择权值最大的10个特征作为后续实现难度等级 本文考虑采用高斯径向基核函数。 识别的特征空间。最终用3个回归算法:多元线性 然而传统的基于高斯径向基核函数的SVM 回归、逐步回归)、支持向量回归实现难度等级识 (GRB-SVM)算法假设特征不相关且权重相同,即不 别。实验中,支持向量回归算法得到最好的效果 能根据特征对难度等级的贡献度差别对待。而在本 其R统计量为39.9% 应用问题中,特征对难度区分的贡献度不同。为弥 Veronique Sebastien等也将乐谱难度等级识 补GRB-SVM不能根据特征重要程度差别对待的不 别看作分类问题,他们利用无监督的聚类算法实现 足,本文结合测度学习(metric learning)理论,充分 乐谱难度等级识别。首先定义7个难度相关特征, 利用训练乐谱中关于难度等级的先验知识,从带难 这些特征从MusicXML格式乐谱文件提取。之后 度等级标签的乐谱特征空间中有监督地学习到能更 用主成分分析(principal component analysis,PCA) 好区分钢琴难度的投影矩阵,保留特征之间的相关 将特征投影到低维空间,以降低特征维数。然后, 关系,从而利用该矩阵改进高斯径向基核函数,提 用分层聚类(hierarchical clustering)将乐谱聚成 出一种测度学习支持向量机分类算法一ML-SVM 3类,即3个难度类别。 算法,实现数字钢琴乐谱难度等级识别。 总的来说,无论是多元线性回归还是逐步回归 2算法原理与算法描述 都假设特征与难度等级之间为线性关系,此假设过 于简化特征与难度等级之间的实际关系。而支持向 本文提出的ML-SVM乐谱难度识别算法主要 量回归虽然可实现非线性拟合,但拟合结果尚不令 包括以下3部分:基于测度学习从训练数据中有监
学习难度匹配的乐谱来学习。专业音乐学习者一般 依据固定进阶教材,但缺乏个性化、灵活的学习方 案。此外,一些经典但难度高的乐谱,会有诸多简 化版本存在。因此,有必要对海量的钢琴乐谱资源 的难度等级进行区分。 现在绝大部分乐谱难度等级仍然依赖于专业人 士主观判断。对于海量的数字乐谱,人工判断难度 等级会是一个耗时耗力的巨大工程。人工主观判断 也很难稳定、可靠地把握每个难度等级之间的区 别,尤其对于多类别问题。不同的人对于同一首乐 谱可能会给出不同的难度等级,甚至对于同一首乐 谱,同一个人在不同的时间也会给出不同的难度等 级。因此,自动识别乐谱难度等级的系统具有重要 的理论意义和应用价值。 为网络中存在的数字乐谱提供难度等级标签将 会大大提高寻找合适难度等级乐谱的效率,并能提 高音乐网站的用户体验。通常研究中将乐谱难度识 别归为模式分类问题,从符号乐谱中定义并提取难 度相关特征,利用分类思想实现乐谱难度等级的识 别。下面将针对不同的技术来回顾钢琴乐谱难度等 级识别领域的研究现状。 Shih-Chuan Chiu 等 [1]最先开始钢琴乐谱难度等 级识别研究。由于钢琴乐谱难度识别是一个相对较 新的研究问题,现有的符号音乐特征 (symbolic music feature) 较少直接用于难度等级识别。所以他们 首先定义 8 个与乐谱难度密切相关的特征,将此 8 个难度相关特征与语义特征一起作为特征空间。 后用特征选择算法 ReliefF[2]按照特征重要程度 (即 各个特征对难度等级的辨别能力大小) 分配权值, 选择权值最大的 10 个特征作为后续实现难度等级 识别的特征空间。最终用 3 个回归算法:多元线性 回归、逐步回归[3] 、支持向量回归[4]实现难度等级识 别。实验中,支持向量回归算法得到最好的效果, 其 R 2 统计量为 39.9%[3]。 Véronique Sébastien 等 [5]也将乐谱难度等级识 别看作分类问题,他们利用无监督的聚类算法实现 乐谱难度等级识别。首先定义 7 个难度相关特征, 这些特征从 MusicXML 格式[6]乐谱文件提取。之后 用主成分分析 (principal component analysis,PCA) 将特征投影到低维空间,以降低特征维数。然后, 用分层聚类 (hierarchical clustering)[7]将乐谱聚成 3 类,即 3 个难度类别。 总的来说,无论是多元线性回归还是逐步回归 都假设特征与难度等级之间为线性关系,此假设过 于简化特征与难度等级之间的实际关系。而支持向 量回归虽然可实现非线性拟合,但拟合结果尚不令 人满意。与有监督算法相比,非监督算法,如分层 聚类,虽能充分利用特征与难度等级之间的自然分 布关系,但无法利用已有的难度等级标签作为先验 知识提高识别效果。例如,实验中,原始乐谱数据 是 4 个类别,Véronique Sébastien 经过 PCA 降维, 应用聚类算法,最终仅得到 3 个难度类别。 在现有有监督的回归拟合算法识别钢琴乐谱难 度等级的研究中,支持向量回归有最好的拟合效果 (其 R 2 统计量值为 39.9%)。但支持向量回归,更适 合逼近、拟合连续分布数据,对于此离散类别的分 类问题能力有限。所以本文利用一种与支持向量回 归算法原理相近,但更适用于解决分类问题的支持 向量机分类算法实现数字钢琴乐谱难度等级识别。 1 支持向量机理论 SVM 是基于统计学习理论中经验风险最小化 原则的一种机器学习算法[8]。SVM 已广泛应用于 纹理分类 (texture classification)[9] 、文本分类[10] 、人 脸识别[11] 、语音识别[12]等各个领域。理论和实践证 明,SVM 对噪声和离群点鲁棒性好,泛化能力强,经 过扩展可解决多分类问题[8]。 SVM 实现分类的关键是核函数,利用核函数[13] 可以将低维线性不可分的问题转化到高维空间实现 线性可分,同时避免因维数增加而导致过大的计算 量。常用的核函数有线性核函数 (linear kernel function)、多项式核函数 (polynomial kernel function)、高 斯径向基核函数 (Gauss radical basis kernel function,GRB) 等 [13]。由于本研究问题的特征数目远小 于样本数目,并且为降低分类模型的参数复杂度, 本文考虑采用高斯径向基核函数。 然而传统的基于高斯径向基核函数的 SVM (GRB-SVM) 算法假设特征不相关且权重相同,即不 能根据特征对难度等级的贡献度差别对待。而在本 应用问题中,特征对难度区分的贡献度不同。为弥 补 GRB-SVM 不能根据特征重要程度差别对待的不 足,本文结合测度学习 (metric learning) 理论,充分 利用训练乐谱中关于难度等级的先验知识,从带难 度等级标签的乐谱特征空间中有监督地学习到能更 好区分钢琴难度的投影矩阵,保留特征之间的相关 关系,从而利用该矩阵改进高斯径向基核函数,提 出一种测度学习支持向量机分类算法——ML-SVM 算法,实现数字钢琴乐谱难度等级识别。 2 算法原理与算法描述 本文提出的 ML-SVM 乐谱难度识别算法主要 包括以下 3 部分:基于测度学习从训练数据中有监 第 2 期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·197·
·198· 智能系统学报 第13卷 督的学习到能增加钢琴乐谱难度区分度的投影矩 本算法的关键在于找到最佳的特征投影矩阵 阵;得到新的距离测度,并利用该测度改进高斯径 L。考虑用变换矩阵L∈Rmx(n表示特征的维数)实 向基核函数,建立ML-SVM算法模型;最后利用网 现特征投影: 格搜索算法得到核函数参数的最优组合,建立分类 x=Lxi (3) 模型,实现数字钢琴乐谱难度等级的识别。ML 则投影后的特征向量x;是原始特征向量x:和投 SVM乐谱难度识别算法框图,如图1所示。 影矩阵L元素的一个线性组合,则投影空间中距离 难度等级了 测度d,为 训练 标签 d(x,x)=IL(x:-x)= (4) MDI乐谱 特征提取预处理测度学习 V[L(x:-x,'[L(x-x初 为避免求均方并保证距离为正值,取距离的平 GRB-SVM M矩阵 方并用矩阵形式表示,则新的距离测度D,为 DM=dL2=[L(x:-xj)][L(xi-xj)]= MDI乐谱 特征 预处理 ML-SVM 提取 算法模型 模型参数 (x:-x)TLTL(x-x))= (5) (xi-xj)M(xi-xj) 难度等级了入 标签 式中:矩阵M=LL。希望投影后,相同难度标签的 测试 乐谱之间距离减小,不同难度标签的乐谱之间距离 ML-SVM MDI乐 特征提取 预处理 算法模型 难度标签 增大。求解M的过程归结为求解如下优化问题: min∑DM(x,x) 图1ML-SVM算法的框图 M30 (i.iEs (6) Fig.1 The frame chart of ML-SVM algorithm s.t∑[D(c,x)-DM(x,x】≥1 (i.ik)eR 2.1特征空间的建立 式中:S表示由相同难度等级的两个乐谱组成的数 为获取更多的钢琴乐谱难度相关特征,本文采 据对集(x、x难度等级相同),R表示在S的基础 用文献[1]与文献[5]中的难度相关特征作为本文的 上,每个对集加人一个不同难度等级的乐谱组成的 特征空间。所以本文中的特征空间包括:文献[1]中 三集合(x、x难度等级相同,x,和x难度等级不 除指法复杂度(属于乐谱标注层面信息,MDI乐谱 同)。此优化目标与大间隔近邻算法(large margin 中不包含此信息),调号(key signature是元标签信 nearest neighbor,,LMNN)l有相似之处。由于M是 息)之外的全部难度和语义特征;文献[5]中除去指 半正定对称矩阵,所以此优化问题是凸的,可以用 法特征(同样属于标注层面特征)的全部特征,共 梯度下降法有效求解,并且只有全局最优解。 22个特征,组成一个22维的特征向量来表示MDI 2.3ML-SVM算法 乐谱。 对于给定数据样本{(xy),i=1,2,…,pl,其中 2.2测度学习得到距离测度DM,改进GRB核函数 x∈R"为n维向量,∈{-1,+1)为样本标签,表示两个 由于传统的SVM算法无法根据特征对类别的 不同的类别,p为样本个数。则基于测度学习得到 辨别能力差别对待,所以本文考虑利用测度学习从 新的距离测度D,改进高斯径向基核函数后的 训练乐谱中有监督地学习到一个投影矩阵,充分考 ML-SVM算法模型求解最优超平面的问题即为求 虑特征对难度等级的贡献度,为特征分配不同的权 重,进而得到新的距离测度D,改进原始高斯径向 解下列目标函数: 基核函数,改进后的高斯径向基核函数为 maxf(a)=2a-2∑awkw 16 1 i.=1 kux)=exp(-2Dx,x》 (1) s.t.=0 (7) 1 式中:σ是高斯径向基核函数参数,可用网格搜索算 0≤a,≤C,i=1,2,…,p 法得到,x、x表示特征向量,exp表示以自然常数c 为底的指数函数,D4为新的距离测度: L1Dwxx》o 式中kM=exp(-2 Du=(x:-xj)M(x;-xj) (2) 得到最优解a=[(a…。选择ar的一 通过矩阵M,依据特征对难度等级的区别能力 个小于C的正分量,并据此计算: 及特征之间的相关关系,将特征投影到一个类别区 b=y- (8) 分度更高的空间。Dy的构建及投影矩阵L(LTL= 动 i= 0的学习过程如下。 构造决策函数:
督的学习到能增加钢琴乐谱难度区分度的投影矩 阵;得到新的距离测度,并利用该测度改进高斯径 向基核函数,建立 ML-SVM 算法模型;最后利用网 格搜索算法得到核函数参数的最优组合,建立分类 模型,实现数字钢琴乐谱难度等级的识别。MLSVM 乐谱难度识别算法框图,如图 1 所示。 ➥ᒭं 䶰ะ⤲ 䯪Ꮢふ㏓ ᴳオ ≷Ꮢ႒Ό GRB-SVM Mⴕ䭡 ML-SVM ッ∁Ὅಷ ➥ᒭ ं 䶰ะ⤲ 䯪Ꮢふ㏓ ᴳオ ࣮Ὅಷ 䃙㏯ ≷䄁 MIDIͼ䅝 MIDIͼ䅝 MIDIͼ䅝 ➥ᒭं 䶰ะ⤲ 䯪Ꮢᴳオ ML-SVM ッ∁Ὅಷ 图 1 ML-SVM 算法的框图 Fig. 1 The frame chart of ML-SVM algorithm 2.1 特征空间的建立 为获取更多的钢琴乐谱难度相关特征,本文采 用文献[1]与文献[5]中的难度相关特征作为本文的 特征空间。所以本文中的特征空间包括:文献[1]中 除指法复杂度 (属于乐谱标注层面信息,MIDI 乐谱 中不包含此信息),调号 (key signature 是元标签信 息) 之外的全部难度和语义特征;文献[5]中除去指 法特征 (同样属于标注层面特征) 的全部特征,共 22 个特征,组成一个 22 维的特征向量来表示 MIDI 乐谱。 2.2 测度学习得到距离测度 DM,改进 GRB 核函数 由于传统的 SVM 算法无法根据特征对类别的 辨别能力差别对待,所以本文考虑利用测度学习从 训练乐谱中有监督地学习到一个投影矩阵,充分考 虑特征对难度等级的贡献度,为特征分配不同的权 重,进而得到新的距离测度 DM,改进原始高斯径向 基核函数,改进后的高斯径向基核函数为 kM(xi , xj) = exp(− 1 2σ2 DM(xi , xj)) (1) xi、xj 式中:σ 是高斯径向基核函数参数,可用网格搜索算 法得到, 表示特征向量,exp 表示以自然常数 e 为底的指数函数,DM 为新的距离测度: DM = (xi − xj) TM(xi − xj) (2) L(L T L = 通过矩阵 M,依据特征对难度等级的区别能力 及特征之间的相关关系,将特征投影到一个类别区 分度更高的空间[14]。DM 的构建及投影矩阵 M) 的学习过程如下。 L ∈ R n×n 本算法的关键在于找到最佳的特征投影矩阵 L。考虑用变换矩阵 (n 表示特征的维数) 实 现特征投影: x ′ i = Lxi (3) x ′ i xi L dL 则投影后的特征向量 是原始特征向量 和投 影矩阵 元素的一个线性组合,则投影空间中距离 测度 为 dL(xi , xj) = ||L(xi − xj)||2 = √ [L(xi − xj)]T [L(xi − xj)] (4) 为避免求均方并保证距离为正值,取距离的平 方并用矩阵形式表示,则新的距离测度 DM 为 DM = dL 2 = [L(xi − xj)]T [L(xi − xj)] = (xi − xj) T L T L(xi − xj) = (xi − xj) TM(xi − xj) (5) M = L T 式中:矩阵 L 。希望投影后,相同难度标签的 乐谱之间距离减小,不同难度标签的乐谱之间距离 增大。求解 M 的过程归结为求解如下优化问题: min M⩾0 ∑ (i, j)∈s DM(xi , xj) s.t. ∑ (i, j,k)∈R [DM(xi , xj)− DM(xi , xj)] ⩾ 1 (6) xi、xj xi、xj xi xk 式中:S 表示由相同难度等级的两个乐谱组成的数 据对集 ( 难度等级相同),R 表示在 S 的基础 上,每个对集加入一个不同难度等级的乐谱组成的 三集合 ( 难度等级相同, 和 难度等级不 同)。此优化目标与大间隔近邻算法 (large margin nearest neighbor, LMNN)[15]有相似之处。由于 M 是 半正定对称矩阵,所以此优化问题是凸的,可以用 梯度下降法有效求解[15] ,并且只有全局最优解。 2.3 ML-SVM 算法 {(xi , yi),i = 1,2,··· , p} xi ∈ R n n yi ∈ {−1,+1} 对于给定数据样本 ,其中 为 维向量, 为样本标签,表示两个 不同的类别,p 为样本个数。则基于测度学习得到 新的距离测度 D M ,改进高斯径向基核函数后的 ML-SVM 算法模型求解最优超平面的问题即为求 解下列目标函数: max α f(α) = ∑p i=1 αi − 1 2 ∑p i, j=1 αiαjyiyjkM s.t. ∑p i=1 αiyi = 0 0 ⩽ αi ⩽ C, i = 1,2,···, p (7) kM = exp(− 1 2σ2 DM(xi 式中 , xj))。 α ∗ = [ (α ∗ 1 α ∗ 2 ··· α ∗ n ) ]T α ∗ α ∗ j 得到最优解 。选择 的一 个小于 C 的正分量 ,并据此计算: b ∗ = yj − ∑p i=1 yiα ∗ i k ( xi , xj ) (8) 构造决策函数: ·198· 智 能 系 统 学 报 第 13 卷
第2期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·199· 乐谱。为书写及引用方便,9个难度等级的数据集 f(x)=sgn(y:a;k(x.xi)+b*) (9) 简称为NineS数据集,4个难度等级的数据集简称 依据决策函数可以得到待分类乐谱x所属类 为FourS数据集。 别。其中α是拉格朗日系数,C是错误分类的惩 3.2数据预处理 罚参数,ky是改进后的高斯径向基核函数,核函数 特征提取后,一些特征对应的值较大,而另一 表达式中的Dw(x,x)是测度学习得到的距离测度。 些特征对应的值较小,甚至相差超过两个数量级, 另外,原始SVM是二分类的,本文采用一对余 为避免数值较大的特征对整体分类的影响,利用 (one versus rest)方法s,Io将ML-SVM扩展到多分 Min-Max归一化方法: 类。主要思想是:对于一个m类分类问题,通过建 x'=x-min (10) max-min 立m个二分类ML-SVM模型,每一个ML-SVM模 将特征向量归一化到[0,1]。其中min和max 型需要训练所有的训练样本,但训练样本中只将某 分别表示特征x的最小和最大值,x表示特征x经过 一个类别记为正,其余所有类别记为负。对于待识 归一化处理后的特征。 别的样本,依次调用训练好的m个ML-SVM模型, 3.3 实验与结果分析 计算它在各个ML-SVM模型中决策函数的值,选择 仿真试验中,将ML-SVM算法与逻辑回归(Io 决策函数值最大的ML-SVM模型给出的类别,作为 gistic regression,LR)I),基于线性核函数的SVM 待识别乐谱难度类别。 (记为L-SVM),基于多项式核函数的SVM(记为P 3实验 SVM)和基于高斯径向基核函数的SVM算法(记 为GRB-SVM)160-2进行对比。每个实验独立重复 本文算法全部用MATLAB软件实现,所用的 5次,每次用5折交叉验证,取平均准确率作为分类 计算机环境为32位Windows7操作系统,内置In- 性能指标,同时计算出结果的90%置信区间。 telI5-4200M处理器和4GB的内存。 各个SVM算法中核函数参数利用网格搜索算 在实验中,为更好地评估本文提出的ML-SVM 法2四,在2102°内,以步长0.5,5折交叉验证寻找 算法的分类性能和泛化能力,在9类和4类难度两 最优的参数设置。其中L-SVM,PSVM(多项式阶 个乐谱数据集中,将ML-SVM算法与逻辑回归、基 数d=3)只需优化惩罚因子C,GRB-SVM与ML- 于线性核函数的SVM、基于多项式核函数的SVM、 SVM需要优化惩罚因子C与核函数参数g(g= 1 基于原始高斯径向基核函数的SVM(均用one versus )的最优组合。最终的最优参数组合如表1所示。 rest扩展到多分类)算法以及结合主成分分析的各 表1各个算法的最优参数组合 个SVM算法进行对比试验,以识别准确率作为算 Table 1 Optimal parameter combination of each algorithm 法性能的评价指标。每个实验独立重复5次,并用 NineS数据集 FourS数据集 五折交叉验证,取平均准确率作为最终识别准确 算法 惩罚 核函数 惩罚 核函数 率。同时为更全面评估识别算法性能,也给出各个 因子C 参数 因子C 参数 算法结果的90%置信区间。 L-SVM 16 181.0193 3.1实验数据集 P-SVM 22.6274 128 钢琴乐谱数据集采用包含音高、节拍、时间、和 GRB-SVM 1.4142 0.7071 弦、速度和信道等钢琴乐谱信息的MDI格式数字 ML-SVM 22.6274 0.1768 45.2548 0.08839 乐谱文件。MDI文件小,易于获得。为和现有的 研究作对比,我们采用了文献[]中包含9个难度等 表2给出了本文提出的ML-SVM算法与LR、 级,共176个MDI文件的数据集。 L-SVM、P-SVM、GRB-SVM算法在NineS数据集 另外考虑到实际钢琴学习与教学中很多情况会 和FourS数据集中的识别准确率及结果的90%置 将乐谱分为4个难度等级,大量音乐网站也普遍提 信区间。从表2中可以看出,在两个数据集上,本 供4个难度等级(easy,beginner,.intermediate,ad- 文提出的ML-SVM算法,识别准确率最高,分别达 vanced)的数字乐谱,所以为更好地评估本文算法的 到68.74%和84.67%。两个数据集中,本文提出的 可拓展性,切合实际应用情况,我们还从大型音乐 算法最终识别准确率均高于GRB-SVM算法,尤其 网站8 notes18收集到400首MDI乐谱组成有4个 在FouS数据集中,本文所提算法得到84.67%的 难度等级的数据集,每一个难度等级有100个MDI 识别准确率,相对75.63%的GRB-SVM,识别准确
f(x) = sgn(∑p i=1 yiα ∗ i k (x, xi)+b ∗ ) (9) DM(xi , xj) 依据决策函数可以得到待分类乐谱 x 所属类 别 [8]。其中 α 是拉格朗日系数,C 是错误分类的惩 罚参数,kM 是改进后的高斯径向基核函数,核函数 表达式中的 是测度学习得到的距离测度。 另外,原始 SVM 是二分类的,本文采用一对余 (one versus rest) 方法[8,16]将 ML-SVM 扩展到多分 类。主要思想是:对于一个 m 类分类问题,通过建 立 m 个二分类 ML-SVM 模型,每一个 ML-SVM 模 型需要训练所有的训练样本,但训练样本中只将某 一个类别记为正,其余所有类别记为负。对于待识 别的样本,依次调用训练好的 m 个 ML-SVM 模型, 计算它在各个 ML-SVM 模型中决策函数的值,选择 决策函数值最大的 ML-SVM 模型给出的类别,作为 待识别乐谱难度类别。 3 实验 本文算法全部用 MATLAB 软件实现,所用的 计算机环境为 32 位 Windows 7 操作系统,内置 Intel I5-4200M 处理器和 4 GB 的内存。 在实验中,为更好地评估本文提出的 ML-SVM 算法的分类性能和泛化能力,在 9 类和 4 类难度两 个乐谱数据集中,将 ML-SVM 算法与逻辑回归、基 于线性核函数的 SVM、基于多项式核函数的 SVM、 基于原始高斯径向基核函数的 SVM(均用 one versus rest 扩展到多分类) 算法以及结合主成分分析的各 个 SVM 算法进行对比试验,以识别准确率作为算 法性能的评价指标。每个实验独立重复 5 次,并用 五折交叉验证,取平均准确率作为最终识别准确 率。同时为更全面评估识别算法性能,也给出各个 算法结果的 90% 置信区间。 3.1 实验数据集 钢琴乐谱数据集采用包含音高、节拍、时间、和 弦、速度和信道等钢琴乐谱信息的 MIDI 格式数字 乐谱文件[17]。MIDI 文件小,易于获得。为和现有的 研究作对比,我们采用了文献[1]中包含 9 个难度等 级,共 176 个 MIDI 文件的数据集。 另外考虑到实际钢琴学习与教学中很多情况会 将乐谱分为 4 个难度等级,大量音乐网站也普遍提 供 4 个难度等级 (easy,beginner,intermediate,advanced) 的数字乐谱,所以为更好地评估本文算法的 可拓展性,切合实际应用情况,我们还从大型音乐 网站 8notes[18]收集到 400 首 MIDI 乐谱组成有 4 个 难度等级的数据集,每一个难度等级有 100 个 MIDI 乐谱。为书写及引用方便,9 个难度等级的数据集 简称为 NineS 数据集,4 个难度等级的数据集简称 为 FourS 数据集。 3.2 数据预处理 特征提取后,一些特征对应的值较大,而另一 些特征对应的值较小,甚至相差超过两个数量级, 为避免数值较大的特征对整体分类的影响,利用 Min-Max 归一化方法: x ∗ = x−min max−min (10) x x ∗ x 将特征向量归一化到[0, 1]。其中 min 和 max 分别表示特征 的最小和最大值, 表示特征 经过 归一化处理后的特征。 3.3 实验与结果分析 仿真试验中,将 ML-SVM 算法与逻辑回归 (logistic regression,LR)[19] ,基于线性核函数的 SVM (记为 L-SVM),基于多项式核函数的 SVM(记为 PSVM) 和基于高斯径向基核函数的 SVM 算法 (记 为 GRB-SVM)[16, 20-21]进行对比。每个实验独立重复 5 次,每次用 5 折交叉验证,取平均准确率作为分类 性能指标,同时计算出结果的 90% 置信区间。 1 σ2 各个 SVM 算法中核函数参数利用网格搜索算 法 [22] ,在 2 –10~210 内,以步长 0.5,5 折交叉验证寻找 最优的参数设置。其中 L-SVM,P-SVM(多项式阶 数 d=3) 只需优化惩罚因子 C,GRB-SVM 与 MLSVM 需要优化惩罚因子 C 与核函数参数 g(g = ) 的最优组合。最终的最优参数组合如表 1 所示。 表 1 各个算法的最优参数组合 Table 1 Optimal parameter combination of each algorithm 算法 NineS 数据集 FourS 数据集 惩罚 因子 C 核函数 参数 惩罚 因子 C 核函数 参数 L-SVM 16 — 181.019 3 — P-SVM 22.627 4 — 128 — GRB-SVM 8 1.414 2 8 0.707 1 ML-SVM 22.627 4 0.176 8 45.254 8 0.088 39 表 2 给出了本文提出的 ML-SVM 算法与 LR、 L-SVM、P-SVM、GRB-SVM 算法在 NineS 数据集 和 FourS 数据集中的识别准确率及结果的 90% 置 信区间。从表 2 中可以看出,在两个数据集上,本 文提出的 ML-SVM 算法,识别准确率最高,分别达 到 68.74% 和 84.67%。两个数据集中,本文提出的 算法最终识别准确率均高于 GRB-SVM 算法,尤其 在 FourS 数据集中,本文所提算法得到 84.67% 的 识别准确率,相对 75.63% 的 GRB-SVM,识别准确 第 2 期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·199·
·200· 智能系统学报 第13卷 率有较大提高。且更窄的置信区间表明结果更稳 4结束语 定、显著。基于线性核函数的SVM(L-SVM)一直 表现欠佳,在两个数据集中识别效果不如逻辑回归 针对现有钢琴乐谱难度分类主要由人工方式完 (LR),基于多项式核函数的SVM(PSVM)表现良 成,效率不高,区别于传统将乐谱难度等级识别归 好,在FourS数据集中识别效果仅次于本文算法。 结为回归问题,本文直接将其建模为基于支持向量 机的分类问题。并结合钢琴乐谱分类主观性强、特 表2各算法的识别准确率及90%置信区间 Table 2 Recognition accuracy and 90%confidence inter- 征之间普遍存在相关性等特点,利用测度学习改进 val of each algorithm % 高斯径向基核函数,从而提出一种测度学习支持向 NineS数据集 FourS数据集 量机分类算法一ML-SVM算法。经过在9类和 算法 识别 90%置 识别 90%置 4类难度两个乐谱数据集上的对比实验,结果表明 准确率 信区间 准确率 信区间 本文所提算法的识别准确率优于现有算法,且有效 LR 64 53.774.3 70.28 64.6-80.8 提高了基于高斯径向基核函数SVM的分类性能。 实验结果说明,利用测度学习理论,保留特征之间 L-SVM 61 55.3-66.7 71.30 66.7-75.9 的相关关系,更适合乐谱难度识别数据与分布特 P-SVM 65.42 56.22-74.62 78.37 72.37-84.37 点,并能够有效识别算法的性能。未来的工作可以 GRB-SVM 66 59.8-72.2 75.63 70.21-81.05 考虑应用半监督算法,以充分利用大量无难度标签 ML-SVM 68.74 60.9478.54 84.67 80.4288.92 数据,预期将会大大提高分类器的训练效果,进而 提高算法的识别准确率。 为进一步验证本文所提算法的有效性,我们将 ML-SVM算法与另一种主要用来实现特征降维的 参考文献: 投影算法一主成分分析结合SVM的分类准确率 [1]CHIU S C,CHEN M S.A study on difficulty level recogni- 进行对比。在对原始特征数据进行PCA处理时,保 tion of piano sheet music[Cl//IEEE International Symposi- 留原始特征95%信息量的投影特征。PCA投影处 um on Multimedia.Irvine.CA.USA:IEEE.2012:17-23. 理后,最终NineS数据集中的特征降到l3维,而 [2]ROBNIK-SIKONJA M,KONONENKO I.Theoretical and FouS数据集的特征降到8维。之后再用基于各个 empirical analysis of Relief[J].Machine learning,2003, 核函数的SVM算法对PCA降维后的数据进行分 53(1/2):23-69. 类。实验结果如表3所示。从表中可以看出,原始 [3]JAMES G,WITTEN D,HASTIE T,et al.An introduction 特征数据经过PCA处理后,最终各个SVM的分类 to statistical learning with applications in R[M].New York: Springer,2013:59-102. 准确率都有所提高。这是因为原始特征数据经过 [4]SMOLA A J,SCHOLKOPF B.A tutorial on support vector PCA投影、降维之后,可以有效减少混叠以及冗余 regression[J].Statistics and computing,2003,14(3):199- 信息,进而提高最终分类的准确率。 222 表3PCA处理后,各算法的识别准确率 [5]SEBASTIEN V,RALAMBONDRAINY H,SEBASTIEN Table 3 After features are processed by PCA,each SVM algo- O.et al.Score analyzer:automatically determining scores rithm's recognition accuracy in two data sets difficulty level for instrumental e-learning[C]//Proceedings NineS数据集中 FourS数据集中 of the 13th International Society for Music Information Re- 算法 识别准确率 识别准确率 trieval Conference.Porto,Portugal:ISMIR,2012:571-576. L-SVM 61.58 72.56 [6]CASTAN G,GOOD M,ROLAND P.Extensible markup P-SVM 66.12 80.15 language(XML)for music applications:an introduction,the virtual score:representation,retrieval,restoration[M].Cam GRB-SVM 67.2 78.42 bridge:MIT Press,2001:95-102 虽然原始特征数据经过PCA投影、降维处理 [7]WARD JR J H.Hierarchical grouping to optimize an ob- jective function[J].Journal of the American statistical asso- 后,利用GRB-SVM分类的准确率较之前有所提 ciation,1963,58(301):236-244. 高,但分类准确率与本文提出的ML-SVM算法仍有 [8]丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综 差距,尤其在FourS数据集中,ML-SVM仍有较大 述).电子科技大学学报,2011,40(1)2-10. 优势,这也再次验证了本文提出的ML-SVM算法是 DING Shifei,QI Bingjuan,TAN Hongyan.An overview on 有效的。 theory and algorithm of support vector machines[J].Journal
率有较大提高。且更窄的置信区间表明结果更稳 定、显著。基于线性核函数的 SVM(L-SVM) 一直 表现欠佳,在两个数据集中识别效果不如逻辑回归 (LR),基于多项式核函数的 SVM(P-SVM) 表现良 好,在 FourS 数据集中识别效果仅次于本文算法。 表 2 各算法的识别准确率及 90% 置信区间 Table 2 Recognition accuracy and 90% confidence interval of each algorithm % 算法 NineS 数据集 FourS 数据集 识别 准确率 90% 置 信区间 识别 准确率 90% 置 信区间 LR 64 53.7~74.3 70.28 64. 6~80.8 L-SVM 61 55.3~66.7 71.30 66.7~75.9 P-SVM 65.42 56.22~74.62 78.37 72.37~84.37 GRB-SVM 66 59.8~72.2 75.63 70.21~81.05 ML-SVM 68.74 60.94~78.54 84.67 80.42~88.92 为进一步验证本文所提算法的有效性,我们将 ML-SVM 算法与另一种主要用来实现特征降维的 投影算法——主成分分析结合 SVM 的分类准确率 进行对比。在对原始特征数据进行 PCA 处理时,保 留原始特征 95% 信息量的投影特征。PCA 投影处 理后,最终 NineS 数据集中的特征降到 13 维,而 FourS 数据集的特征降到 8 维。之后再用基于各个 核函数的 SVM 算法对 PCA 降维后的数据进行分 类。实验结果如表 3 所示。从表中可以看出,原始 特征数据经过 PCA 处理后,最终各个 SVM 的分类 准确率都有所提高。这是因为原始特征数据经过 PCA 投影、降维之后,可以有效减少混叠以及冗余 信息,进而提高最终分类的准确率。 表 3 PCA 处理后,各算法的识别准确率 Table 3 After features are processed by PCA, each SVM algorithm’s recognition accuracy in two data sets % 算法 NineS 数据集中 识别准确率 FourS 数据集中 识别准确率 L-SVM 61.58 72.56 P-SVM 66.12 80.15 GRB-SVM 67. 2 78.42 虽然原始特征数据经过 PCA 投影、降维处理 后,利用 GRB-SVM 分类的准确率较之前有所提 高,但分类准确率与本文提出的 ML-SVM 算法仍有 差距,尤其在 FourS 数据集中,ML-SVM 仍有较大 优势,这也再次验证了本文提出的 ML-SVM 算法是 有效的。 4 结束语 针对现有钢琴乐谱难度分类主要由人工方式完 成,效率不高,区别于传统将乐谱难度等级识别归 结为回归问题,本文直接将其建模为基于支持向量 机的分类问题。并结合钢琴乐谱分类主观性强、特 征之间普遍存在相关性等特点,利用测度学习改进 高斯径向基核函数,从而提出一种测度学习支持向 量机分类算法——ML-SVM 算法。经过在 9 类和 4 类难度两个乐谱数据集上的对比实验,结果表明 本文所提算法的识别准确率优于现有算法,且有效 提高了基于高斯径向基核函数 SVM 的分类性能。 实验结果说明,利用测度学习理论,保留特征之间 的相关关系,更适合乐谱难度识别数据与分布特 点,并能够有效识别算法的性能。未来的工作可以 考虑应用半监督算法,以充分利用大量无难度标签 数据,预期将会大大提高分类器的训练效果,进而 提高算法的识别准确率。 参考文献: CHIU S C, CHEN M S. A study on difficulty level recognition of piano sheet music[C]//IEEE International Symposium on Multimedia. Irvine, CA, USA: IEEE, 2012: 17–23. [1] ROBNIK-ŠIKONJA M, KONONENKO I. Theoretical and empirical analysis of Relief[J]. Machine learning, 2003, 53(1/2): 23–69. [2] JAMES G, WITTEN D, HASTIE T, et al. An introduction to statistical learning with applications in R[M]. New York: Springer, 2013: 59–102. [3] SMOLA A J, SCHÖLKOPF B. A tutorial on support vector regression[J]. Statistics and computing, 2003, 14(3): 199– 222. [4] SÉBASTIEN V, RALAMBONDRAINY H, SÉBASTIEN O, et al. Score analyzer: automatically determining scores difficulty level for instrumental e-learning[C]//Proceedings of the 13th International Society for Music Information Retrieval Conference. Porto, Portugal: ISMIR, 2012: 571–576. [5] CASTAN G, GOOD M, ROLAND P. Extensible markup language (XML) for music applications: an introduction, the virtual score: representation, retrieval, restoration[M]. Cambridge: MIT Press, 2001: 95–102. [6] WARD JR J H. Hierarchical grouping to optimize an objective function[J]. Journal of the American statistical association, 1963, 58(301): 236–244. [7] 丁世飞, 齐丙娟, 谭红艳. 支持向量机理论与算法研究综 述[J]. 电子科技大学学报, 2011, 40(1): 2–10. DING Shifei, QI Bingjuan, TAN Hongyan. An overview on theory and algorithm of support vector machines[J]. Journal [8] ·200· 智 能 系 统 学 报 第 13 卷
第2期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·201· of university of electronic science and technology of China, [19]HOSMER D W,LEMESHOW S.Applied logistic regres- 2011,40(1):2-10 sion[M].New York:Wiley,2000:31-46. [9]LI Shutao,KWOK J T,ZHU Hailong,et al.Texture clas-si- [20]WESTON J,WATKINS C.Multi-class support vector ma- fication using the support vector machines[J].Pattern recog- chines,CSD-TR-98-04[R/OL].Egham:Royal Holloway nition,2003.36(12):2883-2893. University of London,1998:1-10. [10]SIMON T,KOLLER D.Support vector machine active [21]CHANG C C,LIN C J.LIBSVM-a library for support learning with applications to text classification[J].The vector machines[J/OL].ACM transactions on intelligent journal of machine learning research,2002,2:45-66. systems and technology,2011,2(3):27. [11]OSUNA E,FREUND R,GIROSIT F.Training support [22]徐晓明.SVM参数寻优及其在分类中的应用[D].大连: vector machines:an application to face detection[Cl//IEEE 大连海事大学,2014:6-58. Computer Society Conference on Computer Vision and XU Xiaoming.SVM parameter optimization and its applic- Pattern Recognition.San Juan,Puerto Rico,USA:IEEE, ation in the classification[D].Dalian:Dalian Maritime Uni- 1997:130-136. versity,2014:6-58. [12]WAN V,CAMPBELL W M.Support vector machines for 作者简介: speaker verification and identification[C]//Neural Net- 郭龙伟,男,1990年生,硕士研究 works for Signal Processing X.Proceedings of the 2000 生,主要研究方向为音乐信息检索。 IEEE Signal Processing Society Workshop.Sydney,NSW, Australia:IEEE,2000,2:775-784. [13]SCHOLKOPF B,SMOLA,A J.Learning with kernels[M]. GMD-For Schungszentrum Information Stechnik,1998: 5-93. [14]KULIS B.Metric learning:a survey[J].Foundations and 关欣,女,1977年生,研究员,主 trends in machine learning,2012,5(4):287-364. 要研究方向为音乐信息检索、统计学 [15]WEINBERGER K Q,SAUL L K.Distance metric learn- 习、凸优化理论和音乐信号处理。 ing for large margin nearest neighbor classification[J]. Journal of machine learning research,2009,10:207-244. [16]HSU C W,LIN C J.A comparison of methods for multi- class support vector machines[J].IEEE transactions on neural networks,2002,13(2):415-425. 李锵,男,1974年生,教授,博士 生导师,主要研究方向为医学图像处 [17]MIDI Manufacturers Association.An introduction to 理、智能信息处理、滤波器设计、数字 MIDI[M].California:MIDI Manufacturers Association, 系统和微系统设计。发表学术论文 2009:1-16. 30余篇,出版专著和教材8部。 [18]Fours set data sources[EB/OL].[2015-07-24].http://www. 8notes.com
of university of electronic science and technology of China, 2011, 40(1): 2–10. LI Shutao, KWOK J T, ZHU Hailong, et al. Texture clas-sification using the support vector machines[J]. Pattern recognition, 2003, 36(12): 2883–2893. [9] SIMON T, KOLLER D. Support vector machine active learning with applications to text classification[J]. The journal of machine learning research, 2002, 2: 45–66. [10] OSUNA E, FREUND R, GIROSIT F. Training support vector machines: an application to face detection[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Juan, Puerto Rico, USA: IEEE, 1997: 130–136. [11] WAN V, CAMPBELL W M. Support vector machines for speaker verification and identification[C]//Neural Networks for Signal Processing X. Proceedings of the 2000 IEEE Signal Processing Society Workshop. Sydney, NSW, Australia: IEEE, 2000, 2: 775–784. [12] SCHÖLKOPF B, SMOLA, A J. Learning with kernels[M]. GMD-For Schungszentrum Information Stechnik, 1998: 5–93. [13] KULIS B. Metric learning: a survey[J]. Foundations and trends in machine learning, 2012, 5(4): 287–364. [14] WEINBERGER K Q, SAUL L K. Distance metric learning for large margin nearest neighbor classification[J]. Journal of machine learning research, 2009, 10: 207–244. [15] HSU C W, LIN C J. A comparison of methods for multiclass support vector machines[J]. IEEE transactions on neural networks, 2002, 13(2): 415–425. [16] MIDI Manufacturers Association. An introduction to MIDI[M]. California: MIDI Manufacturers Association, 2009: 1–16. [17] Fours set data sources[EB/OL]. [2015-07-24]. http://www. 8notes.com. [18] HOSMER D W, LEMESHOW S. Applied logistic regression[M]. New York: Wiley, 2000: 31–46. [19] WESTON J, WATKINS C. Multi-class support vector machines, CSD-TR-98-04[R/OL]. Egham: Royal Holloway University of London, 1998: 1–10. [20] CHANG C C, LIN C J. LIBSVM——a library for support vector machines[J/OL]. ACM transactions on intelligent systems and technology, 2011, 2(3): 27. [21] 徐晓明. SVM 参数寻优及其在分类中的应用[D]. 大连: 大连海事大学, 2014: 6–58. XU Xiaoming. SVM parameter optimization and its application in the classification[D]. Dalian: Dalian Maritime University, 2014: 6–58. [22] 作者简介: 郭龙伟,男,1990 年生,硕士研究 生,主要研究方向为音乐信息检索。 关欣,女,1977 年生,研究员,主 要研究方向为音乐信息检索、统计学 习、凸优化理论和音乐信号处理。 李锵,男,1974 年生,教授,博士 生导师,主要研究方向为医学图像处 理、智能信息处理、滤波器设计、数字 系统和微系统设计。发表学术论文 30 余篇,出版专著和教材 8 部。 第 2 期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·201·