正在加载图片...
·198· 智能系统学报 第13卷 督的学习到能增加钢琴乐谱难度区分度的投影矩 本算法的关键在于找到最佳的特征投影矩阵 阵;得到新的距离测度,并利用该测度改进高斯径 L。考虑用变换矩阵L∈Rmx(n表示特征的维数)实 向基核函数,建立ML-SVM算法模型;最后利用网 现特征投影: 格搜索算法得到核函数参数的最优组合,建立分类 x=Lxi (3) 模型,实现数字钢琴乐谱难度等级的识别。ML 则投影后的特征向量x;是原始特征向量x:和投 SVM乐谱难度识别算法框图,如图1所示。 影矩阵L元素的一个线性组合,则投影空间中距离 难度等级了 测度d,为 训练 标签 d(x,x)=IL(x:-x)= (4) MDI乐谱 特征提取预处理测度学习 V[L(x:-x,'[L(x-x初 为避免求均方并保证距离为正值,取距离的平 GRB-SVM M矩阵 方并用矩阵形式表示,则新的距离测度D,为 DM=dL2=[L(x:-xj)][L(xi-xj)]= MDI乐谱 特征 预处理 ML-SVM 提取 算法模型 模型参数 (x:-x)TLTL(x-x))= (5) (xi-xj)M(xi-xj) 难度等级了入 标签 式中:矩阵M=LL。希望投影后,相同难度标签的 测试 乐谱之间距离减小,不同难度标签的乐谱之间距离 ML-SVM MDI乐 特征提取 预处理 算法模型 难度标签 增大。求解M的过程归结为求解如下优化问题: min∑DM(x,x) 图1ML-SVM算法的框图 M30 (i.iEs (6) Fig.1 The frame chart of ML-SVM algorithm s.t∑[D(c,x)-DM(x,x】≥1 (i.ik)eR 2.1特征空间的建立 式中:S表示由相同难度等级的两个乐谱组成的数 为获取更多的钢琴乐谱难度相关特征,本文采 据对集(x、x难度等级相同),R表示在S的基础 用文献[1]与文献[5]中的难度相关特征作为本文的 上,每个对集加人一个不同难度等级的乐谱组成的 特征空间。所以本文中的特征空间包括:文献[1]中 三集合(x、x难度等级相同,x,和x难度等级不 除指法复杂度(属于乐谱标注层面信息,MDI乐谱 同)。此优化目标与大间隔近邻算法(large margin 中不包含此信息),调号(key signature是元标签信 nearest neighbor,,LMNN)l有相似之处。由于M是 息)之外的全部难度和语义特征;文献[5]中除去指 半正定对称矩阵,所以此优化问题是凸的,可以用 法特征(同样属于标注层面特征)的全部特征,共 梯度下降法有效求解,并且只有全局最优解。 22个特征,组成一个22维的特征向量来表示MDI 2.3ML-SVM算法 乐谱。 对于给定数据样本{(xy),i=1,2,…,pl,其中 2.2测度学习得到距离测度DM,改进GRB核函数 x∈R"为n维向量,∈{-1,+1)为样本标签,表示两个 由于传统的SVM算法无法根据特征对类别的 不同的类别,p为样本个数。则基于测度学习得到 辨别能力差别对待,所以本文考虑利用测度学习从 新的距离测度D,改进高斯径向基核函数后的 训练乐谱中有监督地学习到一个投影矩阵,充分考 ML-SVM算法模型求解最优超平面的问题即为求 虑特征对难度等级的贡献度,为特征分配不同的权 重,进而得到新的距离测度D,改进原始高斯径向 解下列目标函数: 基核函数,改进后的高斯径向基核函数为 maxf(a)=2a-2∑awkw 16 1 i.=1 kux)=exp(-2Dx,x》 (1) s.t.=0 (7) 1 式中:σ是高斯径向基核函数参数,可用网格搜索算 0≤a,≤C,i=1,2,…,p 法得到,x、x表示特征向量,exp表示以自然常数c 为底的指数函数,D4为新的距离测度: L1Dwxx》o 式中kM=exp(-2 Du=(x:-xj)M(x;-xj) (2) 得到最优解a=[(a…。选择ar的一 通过矩阵M,依据特征对难度等级的区别能力 个小于C的正分量,并据此计算: 及特征之间的相关关系,将特征投影到一个类别区 b=y- (8) 分度更高的空间。Dy的构建及投影矩阵L(LTL= 动 i= 0的学习过程如下。 构造决策函数:督的学习到能增加钢琴乐谱难度区分度的投影矩 阵;得到新的距离测度,并利用该测度改进高斯径 向基核函数,建立 ML-SVM 算法模型;最后利用网 格搜索算法得到核函数参数的最优组合,建立分类 模型,实现数字钢琴乐谱难度等级的识别。ML￾SVM 乐谱难度识别算法框图,如图 1 所示。 ➥ᒭ᣼ं 䶰ะ⤲ 䯪Ꮢふ㏓ ᴳオ ≷Ꮢ႒Ό GRB-SVM Mⴕ䭡 ML-SVM ッ∁Ὅಷ ➥ᒭ ᣼ं 䶰ะ⤲ 䯪Ꮢふ㏓ ᴳオ ᪜࣮Ὅಷ 䃙㏯ ≷䄁 MIDIͼ䅝 MIDIͼ䅝 MIDIͼ䅝 ➥ᒭ᣼ं 䶰ะ⤲ 䯪Ꮢᴳオ ML-SVM ッ∁Ὅಷ 图 1 ML-SVM 算法的框图 Fig. 1 The frame chart of ML-SVM algorithm 2.1 特征空间的建立 为获取更多的钢琴乐谱难度相关特征,本文采 用文献[1]与文献[5]中的难度相关特征作为本文的 特征空间。所以本文中的特征空间包括:文献[1]中 除指法复杂度 (属于乐谱标注层面信息,MIDI 乐谱 中不包含此信息),调号 (key signature 是元标签信 息) 之外的全部难度和语义特征;文献[5]中除去指 法特征 (同样属于标注层面特征) 的全部特征,共 22 个特征,组成一个 22 维的特征向量来表示 MIDI 乐谱。 2.2 测度学习得到距离测度 DM,改进 GRB 核函数 由于传统的 SVM 算法无法根据特征对类别的 辨别能力差别对待,所以本文考虑利用测度学习从 训练乐谱中有监督地学习到一个投影矩阵,充分考 虑特征对难度等级的贡献度,为特征分配不同的权 重,进而得到新的距离测度 DM,改进原始高斯径向 基核函数,改进后的高斯径向基核函数为 kM(xi , xj) = exp(− 1 2σ2 DM(xi , xj)) (1) xi、xj 式中:σ 是高斯径向基核函数参数,可用网格搜索算 法得到, 表示特征向量,exp 表示以自然常数 e 为底的指数函数,DM 为新的距离测度: DM = (xi − xj) TM(xi − xj) (2) L(L T L = 通过矩阵 M,依据特征对难度等级的区别能力 及特征之间的相关关系,将特征投影到一个类别区 分度更高的空间[14]。DM 的构建及投影矩阵 M) 的学习过程如下。 L ∈ R n×n 本算法的关键在于找到最佳的特征投影矩阵 L。考虑用变换矩阵 (n 表示特征的维数) 实 现特征投影: x ′ i = Lxi (3) x ′ i xi L dL 则投影后的特征向量 是原始特征向量 和投 影矩阵 元素的一个线性组合,则投影空间中距离 测度 为 dL(xi , xj) = ||L(xi − xj)||2 = √ [L(xi − xj)]T [L(xi − xj)] (4) 为避免求均方并保证距离为正值,取距离的平 方并用矩阵形式表示,则新的距离测度 DM 为 DM = dL 2 = [L(xi − xj)]T [L(xi − xj)] = (xi − xj) T L T L(xi − xj) = (xi − xj) TM(xi − xj) (5) M = L T 式中:矩阵 L 。希望投影后,相同难度标签的 乐谱之间距离减小,不同难度标签的乐谱之间距离 增大。求解 M 的过程归结为求解如下优化问题: min M⩾0 ∑ (i, j)∈s DM(xi , xj) s.t. ∑ (i, j,k)∈R [DM(xi , xj)− DM(xi , xj)] ⩾ 1 (6) xi、xj xi、xj xi xk 式中:S 表示由相同难度等级的两个乐谱组成的数 据对集 ( 难度等级相同),R 表示在 S 的基础 上,每个对集加入一个不同难度等级的乐谱组成的 三集合 ( 难度等级相同, 和 难度等级不 同)。此优化目标与大间隔近邻算法 (large margin nearest neighbor, LMNN)[15]有相似之处。由于 M 是 半正定对称矩阵,所以此优化问题是凸的,可以用 梯度下降法有效求解[15] ,并且只有全局最优解。 2.3 ML-SVM 算法 {(xi , yi),i = 1,2,··· , p} xi ∈ R n n yi ∈ {−1,+1} 对于给定数据样本 ,其中 为 维向量, 为样本标签,表示两个 不同的类别,p 为样本个数。则基于测度学习得到 新的距离测度 D M ,改进高斯径向基核函数后的 ML-SVM 算法模型求解最优超平面的问题即为求 解下列目标函数: max α f(α) = ∑p i=1 αi − 1 2 ∑p i, j=1 αiαjyiyjkM s.t. ∑p i=1 αiyi = 0 0 ⩽ αi ⩽ C, i = 1,2,···, p (7) kM = exp(− 1 2σ2 DM(xi 式中 , xj))。 α ∗ = [ (α ∗ 1 α ∗ 2 ··· α ∗ n ) ]T α ∗ α ∗ j 得到最优解 。选择 的一 个小于 C 的正分量 ,并据此计算: b ∗ = yj − ∑p i=1 yiα ∗ i k ( xi , xj ) (8) 构造决策函数: ·198· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有