f(x) = sgn(∑p i=1 yiα ∗ i k (x, xi)+b_中国高校课件下载中心

正在加载图片...

第2期郭龙伟，等：基于测度学习支持向量机的钢琴乐谱难度等级识别 ·199· 乐谱。为书写及引用方便，9个难度等级的数据集 f(x)=sgn(y:a;k(x.xi)+b*) (9) 简称为NineS数据集，4个难度等级的数据集简称依据决策函数可以得到待分类乐谱x所属类为FourS数据集。别。其中α是拉格朗日系数，C是错误分类的惩 3.2数据预处理罚参数，ky是改进后的高斯径向基核函数，核函数特征提取后，一些特征对应的值较大，而另一表达式中的Dw(x,x)是测度学习得到的距离测度。些特征对应的值较小，甚至相差超过两个数量级，另外，原始SVM是二分类的，本文采用一对余为避免数值较大的特征对整体分类的影响，利用 (one versus rest)方法s,Io将ML-SVM扩展到多分 Min-Max归一化方法：类。主要思想是：对于一个m类分类问题，通过建 x'=x-min (10) max-min 立m个二分类ML-SVM模型，每一个ML-SVM模将特征向量归一化到[0,1]。其中min和max 型需要训练所有的训练样本，但训练样本中只将某分别表示特征x的最小和最大值，x表示特征x经过一个类别记为正，其余所有类别记为负。对于待识归一化处理后的特征。别的样本，依次调用训练好的m个ML-SVM模型， 3.3 实验与结果分析计算它在各个ML-SVM模型中决策函数的值，选择仿真试验中，将ML-SVM算法与逻辑回归(Io 决策函数值最大的ML-SVM模型给出的类别，作为 gistic regression,LR)I),基于线性核函数的SVM 待识别乐谱难度类别。 (记为L-SVM),基于多项式核函数的SVM(记为P 3实验 SVM)和基于高斯径向基核函数的SVM算法（记为GRB-SVM)160-2进行对比。每个实验独立重复本文算法全部用MATLAB软件实现，所用的 5次，每次用5折交叉验证，取平均准确率作为分类计算机环境为32位Windows7操作系统，内置In- 性能指标，同时计算出结果的90%置信区间。 telI5-4200M处理器和4GB的内存。各个SVM算法中核函数参数利用网格搜索算在实验中，为更好地评估本文提出的ML-SVM 法2四，在2102°内，以步长0.5,5折交叉验证寻找算法的分类性能和泛化能力，在9类和4类难度两最优的参数设置。其中L-SVM,PSVM(多项式阶个乐谱数据集中，将ML-SVM算法与逻辑回归、基数d=3)只需优化惩罚因子C,GRB-SVM与ML- 于线性核函数的SVM、基于多项式核函数的SVM、 SVM需要优化惩罚因子C与核函数参数g(g= 1 基于原始高斯径向基核函数的SVM(均用one versus )的最优组合。最终的最优参数组合如表1所示。 rest扩展到多分类)算法以及结合主成分分析的各表1各个算法的最优参数组合个SVM算法进行对比试验，以识别准确率作为算 Table 1 Optimal parameter combination of each algorithm 法性能的评价指标。每个实验独立重复5次，并用 NineS数据集 FourS数据集五折交叉验证，取平均准确率作为最终识别准确算法惩罚核函数惩罚核函数率。同时为更全面评估识别算法性能，也给出各个因子C 参数因子C 参数算法结果的90%置信区间。 L-SVM 16 181.0193 3.1实验数据集 P-SVM 22.6274 128 钢琴乐谱数据集采用包含音高、节拍、时间、和 GRB-SVM 1.4142 0.7071 弦、速度和信道等钢琴乐谱信息的MDI格式数字 ML-SVM 22.6274 0.1768 45.2548 0.08839 乐谱文件。MDI文件小，易于获得。为和现有的研究作对比，我们采用了文献[]中包含9个难度等表2给出了本文提出的ML-SVM算法与LR、级，共176个MDI文件的数据集。 L-SVM、P-SVM、GRB-SVM算法在NineS数据集另外考虑到实际钢琴学习与教学中很多情况会和FourS数据集中的识别准确率及结果的90%置将乐谱分为4个难度等级，大量音乐网站也普遍提信区间。从表2中可以看出，在两个数据集上，本供4个难度等级(easy,beginner,.intermediate,ad- 文提出的ML-SVM算法，识别准确率最高，分别达 vanced)的数字乐谱，所以为更好地评估本文算法的到68.74%和84.67%。两个数据集中，本文提出的可拓展性，切合实际应用情况，我们还从大型音乐算法最终识别准确率均高于GRB-SVM算法，尤其网站8 notes18收集到400首MDI乐谱组成有4个在FouS数据集中，本文所提算法得到84.67%的难度等级的数据集，每一个难度等级有100个MDI 识别准确率，相对75.63%的GRB-SVM,识别准确f(x) = sgn(∑p i=1 yiα ∗ i k (x, xi)+b ∗ ) (9) DM(xi , xj) 依据决策函数可以得到待分类乐谱 x 所属类别 [8]。其中 α 是拉格朗日系数，C 是错误分类的惩罚参数，kM 是改进后的高斯径向基核函数，核函数表达式中的是测度学习得到的距离测度。另外，原始 SVM 是二分类的，本文采用一对余 (one versus rest) 方法[8,16]将 ML-SVM 扩展到多分类。主要思想是：对于一个 m 类分类问题，通过建立 m 个二分类 ML-SVM 模型，每一个 ML-SVM 模型需要训练所有的训练样本，但训练样本中只将某一个类别记为正，其余所有类别记为负。对于待识别的样本，依次调用训练好的 m 个 ML-SVM 模型，计算它在各个 ML-SVM 模型中决策函数的值，选择决策函数值最大的 ML-SVM 模型给出的类别，作为待识别乐谱难度类别。 3 实验本文算法全部用 MATLAB 软件实现，所用的计算机环境为 32 位 Windows 7 操作系统，内置 Intel I5-4200M 处理器和 4 GB 的内存。在实验中，为更好地评估本文提出的 ML-SVM 算法的分类性能和泛化能力，在 9 类和 4 类难度两个乐谱数据集中，将 ML-SVM 算法与逻辑回归、基于线性核函数的 SVM、基于多项式核函数的 SVM、基于原始高斯径向基核函数的 SVM(均用 one versus rest 扩展到多分类) 算法以及结合主成分分析的各个 SVM 算法进行对比试验，以识别准确率作为算法性能的评价指标。每个实验独立重复 5 次，并用五折交叉验证，取平均准确率作为最终识别准确率。同时为更全面评估识别算法性能，也给出各个算法结果的 90% 置信区间。 3.1 实验数据集钢琴乐谱数据集采用包含音高、节拍、时间、和弦、速度和信道等钢琴乐谱信息的 MIDI 格式数字乐谱文件[17]。MIDI 文件小，易于获得。为和现有的研究作对比，我们采用了文献[1]中包含 9 个难度等级，共 176 个 MIDI 文件的数据集。另外考虑到实际钢琴学习与教学中很多情况会将乐谱分为 4 个难度等级，大量音乐网站也普遍提供 4 个难度等级 (easy，beginner，intermediate，advanced) 的数字乐谱，所以为更好地评估本文算法的可拓展性，切合实际应用情况，我们还从大型音乐网站 8notes[18]收集到 400 首 MIDI 乐谱组成有 4 个难度等级的数据集，每一个难度等级有 100 个 MIDI 乐谱。为书写及引用方便，9 个难度等级的数据集简称为 NineS 数据集，4 个难度等级的数据集简称为 FourS 数据集。 3.2 数据预处理特征提取后，一些特征对应的值较大，而另一些特征对应的值较小，甚至相差超过两个数量级，为避免数值较大的特征对整体分类的影响，利用 Min-Max 归一化方法： x ∗ = x−min max−min (10) x x ∗ x 将特征向量归一化到[0, 1]。其中 min 和 max 分别表示特征的最小和最大值，表示特征经过归一化处理后的特征。 3.3 实验与结果分析仿真试验中，将 ML-SVM 算法与逻辑回归 (logistic regression，LR)[19] ，基于线性核函数的 SVM (记为 L-SVM)，基于多项式核函数的 SVM(记为 PSVM) 和基于高斯径向基核函数的 SVM 算法 (记为 GRB-SVM)[16, 20-21]进行对比。每个实验独立重复 5 次，每次用 5 折交叉验证，取平均准确率作为分类性能指标，同时计算出结果的 90% 置信区间。 1 σ2 各个 SVM 算法中核函数参数利用网格搜索算法 [22] ，在 2 –10~210 内，以步长 0.5，5 折交叉验证寻找最优的参数设置。其中 L-SVM，P-SVM(多项式阶数 d=3) 只需优化惩罚因子 C，GRB-SVM 与 MLSVM 需要优化惩罚因子 C 与核函数参数 g(g = ) 的最优组合。最终的最优参数组合如表 1 所示。表 1 各个算法的最优参数组合 Table 1 Optimal parameter combination of each algorithm 算法 NineS 数据集 FourS 数据集惩罚因子 C 核函数参数惩罚因子 C 核函数参数 L-SVM 16 — 181.019 3 — P-SVM 22.627 4 — 128 — GRB-SVM 8 1.414 2 8 0.707 1 ML-SVM 22.627 4 0.176 8 45.254 8 0.088 39 表 2 给出了本文提出的 ML-SVM 算法与 LR、 L-SVM、P-SVM、GRB-SVM 算法在 NineS 数据集和 FourS 数据集中的识别准确率及结果的 90% 置信区间。从表 2 中可以看出，在两个数据集上，本文提出的 ML-SVM 算法，识别准确率最高，分别达到 68.74% 和 84.67%。两个数据集中，本文提出的算法最终识别准确率均高于 GRB-SVM 算法，尤其在 FourS 数据集中，本文所提算法得到 84.67% 的识别准确率，相对 75.63% 的 GRB-SVM，识别准确第 2 期郭龙伟，等：基于测度学习支持向量机的钢琴乐谱难度等级识别 ·199·

<<向上翻页向下翻页>>

点击下载：【机器学习】基于测度学习支持向量机的钢琴乐谱难度等级识别