正在加载图片...
第2期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·199· 乐谱。为书写及引用方便,9个难度等级的数据集 f(x)=sgn(y:a;k(x.xi)+b*) (9) 简称为NineS数据集,4个难度等级的数据集简称 依据决策函数可以得到待分类乐谱x所属类 为FourS数据集。 别。其中α是拉格朗日系数,C是错误分类的惩 3.2数据预处理 罚参数,ky是改进后的高斯径向基核函数,核函数 特征提取后,一些特征对应的值较大,而另一 表达式中的Dw(x,x)是测度学习得到的距离测度。 些特征对应的值较小,甚至相差超过两个数量级, 另外,原始SVM是二分类的,本文采用一对余 为避免数值较大的特征对整体分类的影响,利用 (one versus rest)方法s,Io将ML-SVM扩展到多分 Min-Max归一化方法: 类。主要思想是:对于一个m类分类问题,通过建 x'=x-min (10) max-min 立m个二分类ML-SVM模型,每一个ML-SVM模 将特征向量归一化到[0,1]。其中min和max 型需要训练所有的训练样本,但训练样本中只将某 分别表示特征x的最小和最大值,x表示特征x经过 一个类别记为正,其余所有类别记为负。对于待识 归一化处理后的特征。 别的样本,依次调用训练好的m个ML-SVM模型, 3.3 实验与结果分析 计算它在各个ML-SVM模型中决策函数的值,选择 仿真试验中,将ML-SVM算法与逻辑回归(Io 决策函数值最大的ML-SVM模型给出的类别,作为 gistic regression,LR)I),基于线性核函数的SVM 待识别乐谱难度类别。 (记为L-SVM),基于多项式核函数的SVM(记为P 3实验 SVM)和基于高斯径向基核函数的SVM算法(记 为GRB-SVM)160-2进行对比。每个实验独立重复 本文算法全部用MATLAB软件实现,所用的 5次,每次用5折交叉验证,取平均准确率作为分类 计算机环境为32位Windows7操作系统,内置In- 性能指标,同时计算出结果的90%置信区间。 telI5-4200M处理器和4GB的内存。 各个SVM算法中核函数参数利用网格搜索算 在实验中,为更好地评估本文提出的ML-SVM 法2四,在2102°内,以步长0.5,5折交叉验证寻找 算法的分类性能和泛化能力,在9类和4类难度两 最优的参数设置。其中L-SVM,PSVM(多项式阶 个乐谱数据集中,将ML-SVM算法与逻辑回归、基 数d=3)只需优化惩罚因子C,GRB-SVM与ML- 于线性核函数的SVM、基于多项式核函数的SVM、 SVM需要优化惩罚因子C与核函数参数g(g= 1 基于原始高斯径向基核函数的SVM(均用one versus )的最优组合。最终的最优参数组合如表1所示。 rest扩展到多分类)算法以及结合主成分分析的各 表1各个算法的最优参数组合 个SVM算法进行对比试验,以识别准确率作为算 Table 1 Optimal parameter combination of each algorithm 法性能的评价指标。每个实验独立重复5次,并用 NineS数据集 FourS数据集 五折交叉验证,取平均准确率作为最终识别准确 算法 惩罚 核函数 惩罚 核函数 率。同时为更全面评估识别算法性能,也给出各个 因子C 参数 因子C 参数 算法结果的90%置信区间。 L-SVM 16 181.0193 3.1实验数据集 P-SVM 22.6274 128 钢琴乐谱数据集采用包含音高、节拍、时间、和 GRB-SVM 1.4142 0.7071 弦、速度和信道等钢琴乐谱信息的MDI格式数字 ML-SVM 22.6274 0.1768 45.2548 0.08839 乐谱文件。MDI文件小,易于获得。为和现有的 研究作对比,我们采用了文献[]中包含9个难度等 表2给出了本文提出的ML-SVM算法与LR、 级,共176个MDI文件的数据集。 L-SVM、P-SVM、GRB-SVM算法在NineS数据集 另外考虑到实际钢琴学习与教学中很多情况会 和FourS数据集中的识别准确率及结果的90%置 将乐谱分为4个难度等级,大量音乐网站也普遍提 信区间。从表2中可以看出,在两个数据集上,本 供4个难度等级(easy,beginner,.intermediate,ad- 文提出的ML-SVM算法,识别准确率最高,分别达 vanced)的数字乐谱,所以为更好地评估本文算法的 到68.74%和84.67%。两个数据集中,本文提出的 可拓展性,切合实际应用情况,我们还从大型音乐 算法最终识别准确率均高于GRB-SVM算法,尤其 网站8 notes18收集到400首MDI乐谱组成有4个 在FouS数据集中,本文所提算法得到84.67%的 难度等级的数据集,每一个难度等级有100个MDI 识别准确率,相对75.63%的GRB-SVM,识别准确f(x) = sgn(∑p i=1 yiα ∗ i k (x, xi)+b ∗ ) (9) DM(xi , xj) 依据决策函数可以得到待分类乐谱 x 所属类 别 [8]。其中 α 是拉格朗日系数,C 是错误分类的惩 罚参数,kM 是改进后的高斯径向基核函数,核函数 表达式中的 是测度学习得到的距离测度。 另外,原始 SVM 是二分类的,本文采用一对余 (one versus rest) 方法[8,16]将 ML-SVM 扩展到多分 类。主要思想是:对于一个 m 类分类问题,通过建 立 m 个二分类 ML-SVM 模型,每一个 ML-SVM 模 型需要训练所有的训练样本,但训练样本中只将某 一个类别记为正,其余所有类别记为负。对于待识 别的样本,依次调用训练好的 m 个 ML-SVM 模型, 计算它在各个 ML-SVM 模型中决策函数的值,选择 决策函数值最大的 ML-SVM 模型给出的类别,作为 待识别乐谱难度类别。 3 实验 本文算法全部用 MATLAB 软件实现,所用的 计算机环境为 32 位 Windows 7 操作系统,内置 In￾tel I5-4200M 处理器和 4 GB 的内存。 在实验中,为更好地评估本文提出的 ML-SVM 算法的分类性能和泛化能力,在 9 类和 4 类难度两 个乐谱数据集中,将 ML-SVM 算法与逻辑回归、基 于线性核函数的 SVM、基于多项式核函数的 SVM、 基于原始高斯径向基核函数的 SVM(均用 one versus rest 扩展到多分类) 算法以及结合主成分分析的各 个 SVM 算法进行对比试验,以识别准确率作为算 法性能的评价指标。每个实验独立重复 5 次,并用 五折交叉验证,取平均准确率作为最终识别准确 率。同时为更全面评估识别算法性能,也给出各个 算法结果的 90% 置信区间。 3.1 实验数据集 钢琴乐谱数据集采用包含音高、节拍、时间、和 弦、速度和信道等钢琴乐谱信息的 MIDI 格式数字 乐谱文件[17]。MIDI 文件小,易于获得。为和现有的 研究作对比,我们采用了文献[1]中包含 9 个难度等 级,共 176 个 MIDI 文件的数据集。 另外考虑到实际钢琴学习与教学中很多情况会 将乐谱分为 4 个难度等级,大量音乐网站也普遍提 供 4 个难度等级 (easy,beginner,intermediate,ad￾vanced) 的数字乐谱,所以为更好地评估本文算法的 可拓展性,切合实际应用情况,我们还从大型音乐 网站 8notes[18]收集到 400 首 MIDI 乐谱组成有 4 个 难度等级的数据集,每一个难度等级有 100 个 MIDI 乐谱。为书写及引用方便,9 个难度等级的数据集 简称为 NineS 数据集,4 个难度等级的数据集简称 为 FourS 数据集。 3.2 数据预处理 特征提取后,一些特征对应的值较大,而另一 些特征对应的值较小,甚至相差超过两个数量级, 为避免数值较大的特征对整体分类的影响,利用 Min-Max 归一化方法: x ∗ = x−min max−min (10) x x ∗ x 将特征向量归一化到[0, 1]。其中 min 和 max 分别表示特征 的最小和最大值, 表示特征 经过 归一化处理后的特征。 3.3 实验与结果分析 仿真试验中,将 ML-SVM 算法与逻辑回归 (lo￾gistic regression,LR)[19] ,基于线性核函数的 SVM (记为 L-SVM),基于多项式核函数的 SVM(记为 P￾SVM) 和基于高斯径向基核函数的 SVM 算法 (记 为 GRB-SVM)[16, 20-21]进行对比。每个实验独立重复 5 次,每次用 5 折交叉验证,取平均准确率作为分类 性能指标,同时计算出结果的 90% 置信区间。 1 σ2 各个 SVM 算法中核函数参数利用网格搜索算 法 [22] ,在 2 –10~210 内,以步长 0.5,5 折交叉验证寻找 最优的参数设置。其中 L-SVM,P-SVM(多项式阶 数 d=3) 只需优化惩罚因子 C,GRB-SVM 与 ML￾SVM 需要优化惩罚因子 C 与核函数参数 g(g = ) 的最优组合。最终的最优参数组合如表 1 所示。 表 1 各个算法的最优参数组合 Table 1 Optimal parameter combination of each algorithm 算法 NineS 数据集 FourS 数据集 惩罚 因子 C 核函数 参数 惩罚 因子 C 核函数 参数 L-SVM 16 — 181.019 3 — P-SVM 22.627 4 — 128 — GRB-SVM 8 1.414 2 8 0.707 1 ML-SVM 22.627 4 0.176 8 45.254 8 0.088 39 表 2 给出了本文提出的 ML-SVM 算法与 LR、 L-SVM、P-SVM、GRB-SVM 算法在 NineS 数据集 和 FourS 数据集中的识别准确率及结果的 90% 置 信区间。从表 2 中可以看出,在两个数据集上,本 文提出的 ML-SVM 算法,识别准确率最高,分别达 到 68.74% 和 84.67%。两个数据集中,本文提出的 算法最终识别准确率均高于 GRB-SVM 算法,尤其 在 FourS 数据集中,本文所提算法得到 84.67% 的 识别准确率,相对 75.63% 的 GRB-SVM,识别准确 第 2 期 郭龙伟,等:基于测度学习支持向量机的钢琴乐谱难度等级识别 ·199·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有