据表明，AlexNet-enhanced 的验证集频谱识别准确率比常用

正在加载图片...

第4期刘万军，等：基于增强AlexNet的音乐流派识别研究 ·755· 据表明，AlexNet--enhanced的验证集频谱识别准确他机器学习模型对GTZAN数据集的测试集音乐率比常用DCNN高出1.85%6.98%。进行流派识别，识别准确率见表5。 AlexNet-.enhanced与常用DCNN以学习率表5各模型测试集音乐识别准确率 0.001迭代31000次的验证集频谱识别损失函数 Table 5 Music recognition accuracy of each model in the 值变化曲线如图9所示。在迭代31000次后的验 test set 证集频谱识别损失函数值见表4。模型准确率% 2.5 SVM 73.00 AlexNet 2.0 VGGNet16 KNN☒ 59.00 VGGNet19 GoodLeNet -ResNet-34B Gradient Boosting 69.00 AlexNet-enhanced 10 Extra Trees4 72.00 0.5 LSTM 74.00 GRU I 75.00 0 0.5 10520253035×10 迭代次数 DCNN-MGR(AlexNet) 76.00 DCNN-MGR(VGGNet16) 77.00 图9各网络验证集频谱识别损失函数值变化曲线 Fig.9 Loss curve of each network in the validation set DCNN-MGR(VGGNet19) 76.00 表4各网络验证集频谱识别损失函数值 DCNN-MGR(GoogLeNet) 70.00 Table 4 Loss of each network in the validation set DCNN-MGR(ResNet-34B) 72.00 网络损失函数值 DCNN-MGR(AlexNet-enhanced) 79.00 AlexNet 0.5874 实验结果表明，基于AlexNet-.enhanced的 VGGNet16 0.7008 DCNN-MGR模型在GTZAN数据集中测试集上 VGGNet19 0.6693 的音乐流派识别准确率达到79.00%，比基于其他 GoogLeNet 0.7762 DCNN的DCNN-MGR模型高出2.00%-9.00%；比 ResNet-34B 0.5995 其他机器学习模型高出4.00%~20.00%。由此可 AlexNet-enhanced 0.4653 以看出，相较于基于其他DCNN的DCNN-MGR 模型，基于AlexNet-enhanced的DCNN-MGR模型根据图9可以看出，各网络在迭代31000次具有更高的音乐流派识别准确率；相较于其他机后，对验证集音乐的频谱识别损失函数值趋于稳器学习模型，基于AlexNet-enhanced的DCNN- 定，且AlexNet-enhanced的损失函数值降到了最 MGR模型具有更高的音乐流派识别准确率。低，表4数据表明，AlexNet-enhanced的验证集频谱识别损失函数值比常用DCNN低0.1221~0.3109。 4结束语对比实验结果表明，DCNN在经过31O00次本文针对机器学习模型对音乐流派特征识别迭代之后，频谱识别准确率和频谱识别损失函数能力较弱的问题，提出了基于增强AlexNet的音值均趋于稳定。AlexNet-.enhanced的训练集频谱乐流派识别DCNN-MGR模型。一方面通过融合识别准确率和验证集频谱识别准确率分别达到 Leaky ReLU函数、Tanh函数和Softplus分类器对了99.43%和88.16%，训练集频谱识别损失函数 AlexNet做出增强，并对AlexNet做出了部分网络值和验证集频谱识别损失函数值分别降低到0.0734 结构调整，得到了频谱识别准确率更高，网络收和0.4653。由此可以看出，AlexNet-enhanced具有敛效果更好的DCNN;另一方面通过FFT提取音更好的频谱识别性能。频信息，生成可以输入DCNN的频谱，并将频谱 3.4机器学习模型对比实验进行切割后输入DCNN进行深度学习，以此构建将基于AlexNet--enhanced的DCNN-MGR模音乐流派识别模型。将本文模型与其他机器学习型和基于AlexNet、VGGNetl6、VGGNetl9 模型在GTZAN数据集上进行对比实验，实验结 GoogLeNet、ResNet-.34B的DCNN-MGR模型与其果表明，对于音乐流派的识别，基于AlexNet-.en-据表明，AlexNet-enhanced 的验证集频谱识别准确率比常用 DCNN 高出 1.85%~6.98%。 AlexNet-enhanced 与常用 DCNN 以学习率 0.001 迭代 31 000 次的验证集频谱识别损失函数值变化曲线如图 9 所示。在迭代 31 000 次后的验证集频谱识别损失函数值见表 4。 2.5 2.0 1.5 1.0 0.5 0 0.5 1.0 1.5 迭代次数损失函数值 2.0 AlexNet AlexNet-enhanced VGGNet16 VGGNet19 GoodLeNet ResNet-34B 2.5 3.0 3.5 × 104 图 9 各网络验证集频谱识别损失函数值变化曲线 Fig. 9 Loss curve of each network in the validation set 表 4 各网络验证集频谱识别损失函数值 Table 4 Loss of each network in the validation set 网络损失函数值 AlexNet 0.587 4 VGGNet16 0.700 8 VGGNet19 0.669 3 GoogLeNet 0.776 2 ResNet-34B 0.599 5 AlexNet-enhanced 0.465 3 根据图 9 可以看出，各网络在迭代 31 000 次后，对验证集音乐的频谱识别损失函数值趋于稳定，且 AlexNet-enhanced 的损失函数值降到了最低，表 4 数据表明，AlexNet-enhanced 的验证集频谱识别损失函数值比常用 DCNN 低 0.122 1~0.310 9。对比实验结果表明，DCNN 在经过 31 000 次迭代之后，频谱识别准确率和频谱识别损失函数值均趋于稳定。AlexNet-enhanced 的训练集频谱识别准确率和验证集频谱识别准确率分别达到了 99.43% 和 88.16%，训练集频谱识别损失函数值和验证集频谱识别损失函数值分别降低到 0.073 4 和 0.465 3。由此可以看出，AlexNet-enhanced 具有更好的频谱识别性能。 3.4 机器学习模型对比实验将基于 AlexNet-enhanced 的 DCNN-MGR 模型和基于 AlexNet、 VGGNet16、 VGGNet19、 GoogLeNet、ResNet-34B 的 DCNN-MGR 模型与其他机器学习模型对 GTZAN 数据集的测试集音乐进行流派识别，识别准确率见表 5。表 5 各模型测试集音乐识别准确率 Table 5 Music recognition accuracy of each model in the test set 模型准确率/% SVM [1] 73.00 KNN [2] 59.00 Gradient Boosting [4] 69.00 Extra Trees [4] 72.00 LSTM [7] 74.00 GRU [7] 75.00 DCNN-MGR(AlexNet) 76.00 DCNN-MGR(VGGNet16) 77.00 DCNN-MGR(VGGNet19) 76.00 DCNN-MGR(GoogLeNet) 70.00 DCNN-MGR(ResNet-34B) 72.00 DCNN-MGR(AlexNet-enhanced) 79.00 实验结果表明，基于 AlexNet-enhanced 的 DCNN-MGR 模型在 GTZAN 数据集中测试集上的音乐流派识别准确率达到 79.00%，比基于其他 DCNN 的 DCNN-MGR 模型高出 2.00%~9.00%；比其他机器学习模型高出 4.00%~20.00%。由此可以看出，相较于基于其他 DCNN 的 DCNN-MGR 模型，基于 AlexNet-enhanced 的 DCNN-MGR 模型具有更高的音乐流派识别准确率；相较于其他机器学习模型，基于 AlexNet-enhanced 的 DCNNMGR 模型具有更高的音乐流派识别准确率。 4 结束语本文针对机器学习模型对音乐流派特征识别能力较弱的问题，提出了基于增强 AlexNet 的音乐流派识别 DCNN-MGR 模型。一方面通过融合 Leaky ReLU 函数、Tanh 函数和 Softplus 分类器对 AlexNet 做出增强，并对 AlexNet 做出了部分网络结构调整，得到了频谱识别准确率更高，网络收敛效果更好的 DCNN；另一方面通过 FFT 提取音频信息，生成可以输入 DCNN 的频谱，并将频谱进行切割后输入 DCNN 进行深度学习，以此构建音乐流派识别模型。将本文模型与其他机器学习模型在 GTZAN 数据集上进行对比实验，实验结果表明，对于音乐流派的识别，基于 AlexNet-en- 第 4 期刘万军，等：基于增强 AlexNet 的音乐流派识别研究 ·755·

<<向上翻页向下翻页>>

点击下载：【知识工程】基于增强AlexNet的音乐流派识别研究