正在加载图片...
第4期 刘万军,等:基于增强AlexNet的音乐流派识别研究 ·755· 据表明,AlexNet--enhanced的验证集频谱识别准确 他机器学习模型对GTZAN数据集的测试集音乐 率比常用DCNN高出1.85%6.98%。 进行流派识别,识别准确率见表5。 AlexNet-.enhanced与常用DCNN以学习率 表5各模型测试集音乐识别准确率 0.001迭代31000次的验证集频谱识别损失函数 Table 5 Music recognition accuracy of each model in the 值变化曲线如图9所示。在迭代31000次后的验 test set 证集频谱识别损失函数值见表4。 模型 准确率% 2.5 SVM 73.00 AlexNet 2.0 VGGNet16 KNN☒ 59.00 VGGNet19 GoodLeNet -ResNet-34B Gradient Boosting 69.00 AlexNet-enhanced 10 Extra Trees4 72.00 0.5 LSTM 74.00 GRU I 75.00 0 0.5 10520253035×10 迭代次数 DCNN-MGR(AlexNet) 76.00 DCNN-MGR(VGGNet16) 77.00 图9各网络验证集频谱识别损失函数值变化曲线 Fig.9 Loss curve of each network in the validation set DCNN-MGR(VGGNet19) 76.00 表4各网络验证集频谱识别损失函数值 DCNN-MGR(GoogLeNet) 70.00 Table 4 Loss of each network in the validation set DCNN-MGR(ResNet-34B) 72.00 网络 损失函数值 DCNN-MGR(AlexNet-enhanced) 79.00 AlexNet 0.5874 实验结果表明,基于AlexNet-.enhanced的 VGGNet16 0.7008 DCNN-MGR模型在GTZAN数据集中测试集上 VGGNet19 0.6693 的音乐流派识别准确率达到79.00%,比基于其他 GoogLeNet 0.7762 DCNN的DCNN-MGR模型高出2.00%-9.00%;比 ResNet-34B 0.5995 其他机器学习模型高出4.00%~20.00%。由此可 AlexNet-enhanced 0.4653 以看出,相较于基于其他DCNN的DCNN-MGR 模型,基于AlexNet-enhanced的DCNN-MGR模型 根据图9可以看出,各网络在迭代31000次 具有更高的音乐流派识别准确率;相较于其他机 后,对验证集音乐的频谱识别损失函数值趋于稳 器学习模型,基于AlexNet-enhanced的DCNN- 定,且AlexNet-enhanced的损失函数值降到了最 MGR模型具有更高的音乐流派识别准确率。 低,表4数据表明,AlexNet-enhanced的验证集频 谱识别损失函数值比常用DCNN低0.1221~0.3109。 4结束语 对比实验结果表明,DCNN在经过31O00次 本文针对机器学习模型对音乐流派特征识别 迭代之后,频谱识别准确率和频谱识别损失函数 能力较弱的问题,提出了基于增强AlexNet的音 值均趋于稳定。AlexNet-.enhanced的训练集频谱 乐流派识别DCNN-MGR模型。一方面通过融合 识别准确率和验证集频谱识别准确率分别达到 Leaky ReLU函数、Tanh函数和Softplus分类器对 了99.43%和88.16%,训练集频谱识别损失函数 AlexNet做出增强,并对AlexNet做出了部分网络 值和验证集频谱识别损失函数值分别降低到0.0734 结构调整,得到了频谱识别准确率更高,网络收 和0.4653。由此可以看出,AlexNet-enhanced具有 敛效果更好的DCNN;另一方面通过FFT提取音 更好的频谱识别性能。 频信息,生成可以输入DCNN的频谱,并将频谱 3.4机器学习模型对比实验 进行切割后输入DCNN进行深度学习,以此构建 将基于AlexNet--enhanced的DCNN-MGR模 音乐流派识别模型。将本文模型与其他机器学习 型和基于AlexNet、VGGNetl6、VGGNetl9 模型在GTZAN数据集上进行对比实验,实验结 GoogLeNet、ResNet-.34B的DCNN-MGR模型与其 果表明,对于音乐流派的识别,基于AlexNet-.en-据表明,AlexNet-enhanced 的验证集频谱识别准确 率比常用 DCNN 高出 1.85%~6.98%。 AlexNet-enhanced 与常用 DCNN 以学习率 0.001 迭代 31 000 次的验证集频谱识别损失函数 值变化曲线如图 9 所示。在迭代 31 000 次后的验 证集频谱识别损失函数值见表 4。 2.5 2.0 1.5 1.0 0.5 0 0.5 1.0 1.5 迭代次数 损失函数值 2.0 AlexNet AlexNet-enhanced VGGNet16 VGGNet19 GoodLeNet ResNet-34B 2.5 3.0 3.5 × 104 图 9 各网络验证集频谱识别损失函数值变化曲线 Fig. 9 Loss curve of each network in the validation set 表 4 各网络验证集频谱识别损失函数值 Table 4 Loss of each network in the validation set 网络 损失函数值 AlexNet 0.587 4 VGGNet16 0.700 8 VGGNet19 0.669 3 GoogLeNet 0.776 2 ResNet-34B 0.599 5 AlexNet-enhanced 0.465 3 根据图 9 可以看出,各网络在迭代 31 000 次 后,对验证集音乐的频谱识别损失函数值趋于稳 定,且 AlexNet-enhanced 的损失函数值降到了最 低,表 4 数据表明,AlexNet-enhanced 的验证集频 谱识别损失函数值比常用 DCNN 低 0.122 1~0.310 9。 对比实验结果表明,DCNN 在经过 31 000 次 迭代之后,频谱识别准确率和频谱识别损失函数 值均趋于稳定。AlexNet-enhanced 的训练集频谱 识别准确率和验证集频谱识别准确率分别达到 了 99.43% 和 88.16%,训练集频谱识别损失函数 值和验证集频谱识别损失函数值分别降低到 0.073 4 和 0.465 3。由此可以看出,AlexNet-enhanced 具有 更好的频谱识别性能。 3.4 机器学习模型对比实验 将基于 AlexNet-enhanced 的 DCNN-MGR 模 型和基于 AlexNet、 VGGNet16、 VGGNet19、 GoogLeNet、ResNet-34B 的 DCNN-MGR 模型与其 他机器学习模型对 GTZAN 数据集的测试集音乐 进行流派识别,识别准确率见表 5。 表 5 各模型测试集音乐识别准确率 Table 5 Music recognition accuracy of each model in the test set 模型 准确率/% SVM [1] 73.00 KNN [2] 59.00 Gradient Boosting [4] 69.00 Extra Trees [4] 72.00 LSTM [7] 74.00 GRU [7] 75.00 DCNN-MGR(AlexNet) 76.00 DCNN-MGR(VGGNet16) 77.00 DCNN-MGR(VGGNet19) 76.00 DCNN-MGR(GoogLeNet) 70.00 DCNN-MGR(ResNet-34B) 72.00 DCNN-MGR(AlexNet-enhanced) 79.00 实验结果表明,基于 AlexNet-enhanced 的 DCNN-MGR 模型在 GTZAN 数据集中测试集上 的音乐流派识别准确率达到 79.00%,比基于其他 DCNN 的 DCNN-MGR 模型高出 2.00%~9.00%;比 其他机器学习模型高出 4.00%~20.00%。由此可 以看出,相较于基于其他 DCNN 的 DCNN-MGR 模型,基于 AlexNet-enhanced 的 DCNN-MGR 模型 具有更高的音乐流派识别准确率;相较于其他机 器学习模型,基于 AlexNet-enhanced 的 DCNN￾MGR 模型具有更高的音乐流派识别准确率。 4 结束语 本文针对机器学习模型对音乐流派特征识别 能力较弱的问题,提出了基于增强 AlexNet 的音 乐流派识别 DCNN-MGR 模型。一方面通过融合 Leaky ReLU 函数、Tanh 函数和 Softplus 分类器对 AlexNet 做出增强,并对 AlexNet 做出了部分网络 结构调整,得到了频谱识别准确率更高,网络收 敛效果更好的 DCNN;另一方面通过 FFT 提取音 频信息,生成可以输入 DCNN 的频谱,并将频谱 进行切割后输入 DCNN 进行深度学习,以此构建 音乐流派识别模型。将本文模型与其他机器学习 模型在 GTZAN 数据集上进行对比实验,实验结 果表明,对于音乐流派的识别,基于 AlexNet-en- 第 4 期 刘万军,等:基于增强 AlexNet 的音乐流派识别研究 ·755·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有