1.4 音乐歌词及旋律表达形式由于本文使用的是英文的音乐数据集，而英文

正在加载图片...

·70· 智能系统学报第15卷 1.4音乐歌词及旋律表达形式 Vlyrics-VwordllVpiece 由于本文使用的是英文的音乐数据集，而英式中：Vod为词向量，”pe为词块向量。拼接得到文是表音的，在音乐中，单词的后缀发音等对音歌词向量。如对于单词womon,由词块wom,on 乐本身的节奏是有影响的。因此对于音乐中的歌组成，则：2=om+oaa,其中2。表示音乐片词，为了更好地捕捉歌词的含义及发音。采用分段中第j个词块；对于音乐旋律，将音符转换为音高布式形式表示门，同时将单词拆分为更小的词块音长、休止时长来进行表征，则在第j个词块对应 (word piece),考虑单词编码和词块编码，充分提取的音符编码向量表示为2ay=(pitch,.uration,res。英文歌词中发音的特征，即：如表3所示，为旋律编码结果。表3旋律编码结果 Table 3 Melody encode result American womon stay away from me A mer i can wom on stay a way from me 音符 B4 A5 A5 A5 A5 G5 B4 B4 D5 E5 E5 音长 0.5 0.5 0.5 0.5 1.5 4.0 0.75 0.5 1.5 1.0 2.0 休止 0 0 0 0 0 0 1 0 0 0 1.5音乐切分方法 ③构造旋律片段样本：本文将用于训练的单曲划分为多个片段，采 L;=L[start,end]: 用滑动窗口的方法对音乐进行切分，假设音乐长 3)重新构建M、L: 度N=10,每个窗口长短为I=4,窗口移动步长 M={Mo,M1,…,Mn}MeM s=2=2,则切分效果如图6。 L={Lo,L,…,Ln}LeL 2词曲匹配度评估算法 D7 通过数据处理，得到了用于训练词曲匹配算法模型的样本数据。本节综合考虑音乐词曲情感图6输入音乐切分效果示意 Fig.6 music segmentation diagram 及节奏特征，提出基于序列模型⑧的词曲匹配度智能评估算法。通过设置合理的窗口大小，能尽可能保证每 2.1算法原理及框图个片段的语意完整，且每个音乐片段长度固定。第一章中提到，对旋律或歌词进行单独的情本文中将窗口大小1设定为20。算法流程如下：感分析是不准确的，主要包含两点：1)缺少旋律算法2音乐切分算法衬托的歌词无法确定作曲者要突出的内容，从而输入音乐S=MUL,且len(S)=N。对情感的分析是不准确的：2)在没有旋律背景下参数窗口大小1，移动步长s=2。的歌词，容易忽略歌词中的节奏感，而节奏感在输出切分后的词曲片段数组M,L。音乐中，对情感表达是非常重要的，正如本文提流程如下：出的观点：情感很大程度上还是通过音乐节奏表 1)计算循环次数（乐曲片段数）：现出来的。因此本节设计的算法，将情感和节奏 N-l-1 (W-1-1)MODs=0 两者综合考虑，设计得到词曲匹配算法模型如图7。结合模型框图，给出算法定义如下： (N-l-1)MODs,≠0 给定输入音乐S=MUL,其中输入旋律M= 式中：L表向下取整，MOD表取余。 (Mo,M,…,Mn)包含n个旋律片段，每个输入旋律 2)对于整体循环次数i=0,1,2,…,: 片段包含I个音符，即M=(M,M,…,M1,同理 ①计算单个片段范围：对于输入歌词L={亿o,L1,…,Ln}包含n个歌词片 start=is,end=start+/; 段，每个歌词片段包含1个词块，即L={亿，L”,…, ②构造旋律片段样本： L}。音乐词曲匹配算法通过歌词编码器和旋律 M:M[start,end]; 编码器，对输入旋律片段M,、输入歌词片段L中1.4 音乐歌词及旋律表达形式由于本文使用的是英文的音乐数据集，而英文是表音的，在音乐中，单词的后缀发音等对音乐本身的节奏是有影响的。因此对于音乐中的歌词，为了更好地捕捉歌词的含义及发音。采用分布式形式表示[7] ，同时将单词拆分为更小的词块 (word piece)，考虑单词编码和词块编码，充分提取英文歌词中发音的特征，即： vlyrics = vword||vpiece wom,on v ⟨j⟩ lyrics = vwom +vwomon v ⟨j⟩ lyrics v ⟨j⟩ melody = { pitch,duration,rest} 式中：vword 为词向量，vpiece 为词块向量。拼接得到歌词向量。如对于单词 womon，由词块组成，则：，其中表示音乐片段中第 j 个词块；对于音乐旋律，将音符转换为音高、音长、休止时长来进行表征，则在第 j 个词块对应的音符编码向量表示为。如表 3 所示，为旋律编码结果。表 3 旋律编码结果 Table 3 Melody encode result American womon stay away from me A mer i can wom on stay a way from me 音符 B4 A5 A5 A5 A5 G5 B4 B4 D5 E5 E5 音长 0.5 0.5 0.5 0.5 1.5 4.0 0.75 0.5 1.5 1.0 2.0 休止 0 0 0 0 0 0 1 0 0 0 1 1.5 音乐切分方法本文将用于训练的单曲划分为多个片段，采用滑动窗口的方法对音乐进行切分，假设音乐长度 N=10，每个窗口长短为 l=4，窗口移动步长 s=l/2=2，则切分效果如图 6。 C Well. she was an merA - -- cani Well. wasit kind - a cold that night. __ __ D7 图 6 输入音乐切分效果示意 Fig. 6 music segmentation diagram 通过设置合理的窗口大小，能尽可能保证每个片段的语意完整，且每个音乐片段长度固定。本文中将窗口大小 l 设定为 20。算法流程如下：算法 2 音乐切分算法输入音乐 S = M ∪L ，且 len(S ) = N。参数窗口大小 l，移动步长 s=l/2。输出切分后的词曲片段数组 M,L。流程如下： 1）计算循环次数 (乐曲片段数)n： n =    ⌊ N −l−1 s ⌋ , (N −l−1)MODs = 0 ⌊ N −l−1 s +1 ⌋ , (N −l−1)MODs,, 0 式中：表向下取整， ⌊ ⌋ MOD 表取余。 2）对于整体循环次数 i = 0,1,2,··· ,n： ①计算单个片段范围： start=i·s，end=start+l； ②构造旋律片段样本： Mi = M [start, end] ； ③构造旋律片段样本： Li = L[start, end] ； 3）重新构建、 M L： M = {M0, M1,··· , Mn} MiϵM L = {L0,L1,··· ,Ln}LiϵL 2 词曲匹配度评估算法通过数据处理，得到了用于训练词曲匹配算法模型的样本数据。本节综合考虑音乐词曲情感及节奏特征，提出基于序列模型[8] 的词曲匹配度智能评估算法。 2.1 算法原理及框图第一章中提到，对旋律或歌词进行单独的情感分析是不准确的，主要包含两点：1）缺少旋律衬托的歌词无法确定作曲者要突出的内容，从而对情感的分析是不准确的；2）在没有旋律背景下的歌词，容易忽略歌词中的节奏感，而节奏感在音乐中，对情感表达是非常重要的，正如本文提出的观点：情感很大程度上还是通过音乐节奏表现出来的。因此本节设计的算法，将情感和节奏两者综合考虑，设计得到词曲匹配算法模型如图 7。结合模型框图，给出算法定义如下： M = {M0, M1, ···, Mn} {M ⟨0⟩ i , M ⟨1⟩ i ,··· , M ⟨l⟩ i } L = {L0,L1, ··· ,Ln} Li = { L ⟨0⟩ i ,L ⟨1⟩ i ,··· , L ⟨l⟩ i } 给定输入音乐 S=M∪L，其中输入旋律包含 n 个旋律片段，每个输入旋律片段包含 l 个音符，即 Mi= ，同理对于输入歌词包含 n 个歌词片段，每个歌词片段包含 l 个词块，即。音乐词曲匹配算法通过歌词编码器和旋律编码器，对输入旋律片段 Mi、输入歌词片段 Li 中 ·70· 智能系统学报第 15 卷

<<向上翻页向下翻页>>

点击下载：【机器感知与模式识别】基于序列模型的音乐词曲匹配度智能评估算法