正在加载图片...
第2期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·197· 学习难度匹配的乐谱来学习。专业音乐学习者一般 人满意。与有监督算法相比,非监督算法,如分层 依据固定进阶教材,但缺乏个性化、灵活的学习方 聚类,虽能充分利用特征与难度等级之间的自然分 案。此外,一些经典但难度高的乐谱,会有诸多简 布关系,但无法利用已有的难度等级标签作为先验 化版本存在。因此,有必要对海量的钢琴乐谱资源 知识提高识别效果。例如,实验中,原始乐谱数据 的难度等级进行区分。 是4个类别,Veronique Sebastien经过PCA降维, 现在绝大部分乐谱难度等级仍然依赖于专业人 应用聚类算法,最终仅得到3个难度类别 士主观判断。对于海量的数字乐谱,人工判断难度 在现有有监督的回归拟合算法识别钢琴乐谱难 等级会是一个耗时耗力的巨大工程。人工主观判断 度等级的研究中,支持向量回归有最好的拟合效果 也很难稳定、可靠地把握每个难度等级之间的区 (其R2统计量值为39.9%)。但支持向量回归,更适 别,尤其对于多类别问题。不同的人对于同一首乐 合逼近、拟合连续分布数据,对于此离散类别的分 谱可能会给出不同的难度等级,甚至对于同一首乐 类问题能力有限。所以本文利用一种与支持向量回 谱,同一个人在不同的时间也会给出不同的难度等 归算法原理相近,但更适用于解决分类问题的支持 级。因此,自动识别乐谱难度等级的系统具有重要 向量机分类算法实现数字钢琴乐谱难度等级识别。 的理论意义和应用价值。 为网络中存在的数字乐谱提供难度等级标签将 1支持向量机理论 会大大提高寻找合适难度等级乐谱的效率,并能提 SVM是基于统计学习理论中经验风险最小化 高音乐网站的用户体验。通常研究中将乐谱难度识 原则的一种机器学习算法。SVM已广泛应用于 别归为模式分类问题,从符号乐谱中定义并提取难 纹理分类(texture classification)、文本分类Io、人 度相关特征,利用分类思想实现乐谱难度等级的识 脸识别山、语音识别]等各个领域。理论和实践证 别。下面将针对不同的技术来回顾钢琴乐谱难度等 明,SVM对噪声和离群点鲁棒性好,泛化能力强,经 级识别领域的研究现状。 过扩展可解决多分类问题。 Shih-Chuan Chiu等最先开始钢琴乐谱难度等 SVM实现分类的关键是核函数,利用核函数 级识别研究。由于钢琴乐谱难度识别是一个相对较 可以将低维线性不可分的问题转化到高维空间实现 新的研究问题,现有的符号音乐特征(symbolic mu- 线性可分,同时避免因维数增加而导致过大的计算 sic feature)较少直接用于难度等级识别。所以他们 量。常用的核函数有线性核函数(linear kernel func-. 首先定义8个与乐谱难度密切相关的特征,将此 tion)、多项式核函数(polynomial kernel function)、高 8个难度相关特征与语义特征一起作为特征空间。 斯径向基核函数(Gauss radical basis kernel func- 后用特征选择算法ReliefFP按照特征重要程度(即 tion,GRB)等。由于本研究问题的特征数目远小 各个特征对难度等级的辨别能力大小)分配权值, 于样本数目,并且为降低分类模型的参数复杂度, 选择权值最大的10个特征作为后续实现难度等级 本文考虑采用高斯径向基核函数。 识别的特征空间。最终用3个回归算法:多元线性 然而传统的基于高斯径向基核函数的SVM 回归、逐步回归)、支持向量回归实现难度等级识 (GRB-SVM)算法假设特征不相关且权重相同,即不 别。实验中,支持向量回归算法得到最好的效果 能根据特征对难度等级的贡献度差别对待。而在本 其R统计量为39.9% 应用问题中,特征对难度区分的贡献度不同。为弥 Veronique Sebastien等也将乐谱难度等级识 补GRB-SVM不能根据特征重要程度差别对待的不 别看作分类问题,他们利用无监督的聚类算法实现 足,本文结合测度学习(metric learning)理论,充分 乐谱难度等级识别。首先定义7个难度相关特征, 利用训练乐谱中关于难度等级的先验知识,从带难 这些特征从MusicXML格式乐谱文件提取。之后 度等级标签的乐谱特征空间中有监督地学习到能更 用主成分分析(principal component analysis,PCA) 好区分钢琴难度的投影矩阵,保留特征之间的相关 将特征投影到低维空间,以降低特征维数。然后, 关系,从而利用该矩阵改进高斯径向基核函数,提 用分层聚类(hierarchical clustering)将乐谱聚成 出一种测度学习支持向量机分类算法一ML-SVM 3类,即3个难度类别。 算法,实现数字钢琴乐谱难度等级识别。 总的来说,无论是多元线性回归还是逐步回归 2算法原理与算法描述 都假设特征与难度等级之间为线性关系,此假设过 于简化特征与难度等级之间的实际关系。而支持向 本文提出的ML-SVM乐谱难度识别算法主要 量回归虽然可实现非线性拟合,但拟合结果尚不令 包括以下3部分:基于测度学习从训练数据中有监学习难度匹配的乐谱来学习。专业音乐学习者一般 依据固定进阶教材,但缺乏个性化、灵活的学习方 案。此外,一些经典但难度高的乐谱,会有诸多简 化版本存在。因此,有必要对海量的钢琴乐谱资源 的难度等级进行区分。 现在绝大部分乐谱难度等级仍然依赖于专业人 士主观判断。对于海量的数字乐谱,人工判断难度 等级会是一个耗时耗力的巨大工程。人工主观判断 也很难稳定、可靠地把握每个难度等级之间的区 别,尤其对于多类别问题。不同的人对于同一首乐 谱可能会给出不同的难度等级,甚至对于同一首乐 谱,同一个人在不同的时间也会给出不同的难度等 级。因此,自动识别乐谱难度等级的系统具有重要 的理论意义和应用价值。 为网络中存在的数字乐谱提供难度等级标签将 会大大提高寻找合适难度等级乐谱的效率,并能提 高音乐网站的用户体验。通常研究中将乐谱难度识 别归为模式分类问题,从符号乐谱中定义并提取难 度相关特征,利用分类思想实现乐谱难度等级的识 别。下面将针对不同的技术来回顾钢琴乐谱难度等 级识别领域的研究现状。 Shih-Chuan Chiu 等 [1]最先开始钢琴乐谱难度等 级识别研究。由于钢琴乐谱难度识别是一个相对较 新的研究问题,现有的符号音乐特征 (symbolic mu￾sic feature) 较少直接用于难度等级识别。所以他们 首先定义 8 个与乐谱难度密切相关的特征,将此 8 个难度相关特征与语义特征一起作为特征空间。 后用特征选择算法 ReliefF[2]按照特征重要程度 (即 各个特征对难度等级的辨别能力大小) 分配权值, 选择权值最大的 10 个特征作为后续实现难度等级 识别的特征空间。最终用 3 个回归算法:多元线性 回归、逐步回归[3] 、支持向量回归[4]实现难度等级识 别。实验中,支持向量回归算法得到最好的效果, 其 R 2 统计量为 39.9%[3]。 Véronique Sébastien 等 [5]也将乐谱难度等级识 别看作分类问题,他们利用无监督的聚类算法实现 乐谱难度等级识别。首先定义 7 个难度相关特征, 这些特征从 MusicXML 格式[6]乐谱文件提取。之后 用主成分分析 (principal component analysis,PCA) 将特征投影到低维空间,以降低特征维数。然后, 用分层聚类 (hierarchical clustering)[7]将乐谱聚成 3 类,即 3 个难度类别。 总的来说,无论是多元线性回归还是逐步回归 都假设特征与难度等级之间为线性关系,此假设过 于简化特征与难度等级之间的实际关系。而支持向 量回归虽然可实现非线性拟合,但拟合结果尚不令 人满意。与有监督算法相比,非监督算法,如分层 聚类,虽能充分利用特征与难度等级之间的自然分 布关系,但无法利用已有的难度等级标签作为先验 知识提高识别效果。例如,实验中,原始乐谱数据 是 4 个类别,Véronique Sébastien 经过 PCA 降维, 应用聚类算法,最终仅得到 3 个难度类别。 在现有有监督的回归拟合算法识别钢琴乐谱难 度等级的研究中,支持向量回归有最好的拟合效果 (其 R 2 统计量值为 39.9%)。但支持向量回归,更适 合逼近、拟合连续分布数据,对于此离散类别的分 类问题能力有限。所以本文利用一种与支持向量回 归算法原理相近,但更适用于解决分类问题的支持 向量机分类算法实现数字钢琴乐谱难度等级识别。 1 支持向量机理论 SVM 是基于统计学习理论中经验风险最小化 原则的一种机器学习算法[8]。SVM 已广泛应用于 纹理分类 (texture classification)[9] 、文本分类[10] 、人 脸识别[11] 、语音识别[12]等各个领域。理论和实践证 明,SVM 对噪声和离群点鲁棒性好,泛化能力强,经 过扩展可解决多分类问题[8]。 SVM 实现分类的关键是核函数,利用核函数[13] 可以将低维线性不可分的问题转化到高维空间实现 线性可分,同时避免因维数增加而导致过大的计算 量。常用的核函数有线性核函数 (linear kernel func￾tion)、多项式核函数 (polynomial kernel function)、高 斯径向基核函数 (Gauss radical basis kernel func￾tion,GRB) 等 [13]。由于本研究问题的特征数目远小 于样本数目,并且为降低分类模型的参数复杂度, 本文考虑采用高斯径向基核函数。 然而传统的基于高斯径向基核函数的 SVM (GRB-SVM) 算法假设特征不相关且权重相同,即不 能根据特征对难度等级的贡献度差别对待。而在本 应用问题中,特征对难度区分的贡献度不同。为弥 补 GRB-SVM 不能根据特征重要程度差别对待的不 足,本文结合测度学习 (metric learning) 理论,充分 利用训练乐谱中关于难度等级的先验知识,从带难 度等级标签的乐谱特征空间中有监督地学习到能更 好区分钢琴难度的投影矩阵,保留特征之间的相关 关系,从而利用该矩阵改进高斯径向基核函数,提 出一种测度学习支持向量机分类算法——ML-SVM 算法,实现数字钢琴乐谱难度等级识别。 2 算法原理与算法描述 本文提出的 ML-SVM 乐谱难度识别算法主要 包括以下 3 部分:基于测度学习从训练数据中有监 第 2 期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·197·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有