正在加载图片...
84 工程科学学报,第44卷,第1期 的维数;∈{1,2,,m表示x对应的故障模式,n 其中,AVG表示所有类的平均训练样本数,这样可 为样本个数.诊断模型设计的本质是基于D寻 以减少少数群体和多数群体之间的平衡步长,使 找一个映射函数fx):Rd→R,使其可以将De中 其达到0.618:1的比率.在多类分类中,少数类是 的任一个样本实例x映射为相应的故障模式 指样本数量低于所有类平均样本数的那些类别,而 ∈(l,2,…,m.当使用Ip-MKELM作为诊断模型 多数类是指样本数高于所有类平均样本数的类别 寻找映射函数fx)时,其初始优化问题表示为 2 改进的1,范数约束加权多核多故障集 成学习诊断框架 q=1 st∑g=-i=12n 21正则化加权多核极限学习机 对于输入空间中的n组故障样本,假设其权重 ∑e=l,≥0,p>1 (1) 分布为w={w”并且有∑”W=1.为便于运算, 其中,小表示F范数,kg,川=为预定义的r个基核 将其扩展为主对角线元素为w的n×n对角矩阵,表 y=yg表示基核的组合权重,B=B阴,B阴,…,BT 示为W=diag[w1,…,wnl 表示模型总的输出权重,B,∈Rgm表示对应于 对于优化问题(1),令B,=V了B,可以得到 基核kg(,北的输出权重,仲gO北=为对应于基核 (5) kg(,)的特征映射;m表示ELM的输出节点个 数;东=[传,,m「表示对应于第个故障样本的 将式(3)代入优化问题(1),同时,将样本分布 训练误差向量,y:=y,…ymJT表示第个故障样 权重矩阵W融合到优化问题中,得到I,范数约束 本的理想输出向量;C为正则化因子,p为范数约 下正则化加权多核极限学习机: 束形式.对式(1)对应的Lagrange函数中各变量分 别求偏导,并采用两步交替优化策略求解Lagrange min5∑Bg+22%l. P.5Y2 乘子矩阵α以及基核组合权重y,得出模型最优化 参数a和y,则决策函数为 st∑a,=听-,i=12n ∑g=l%>0,p>1 (6) (2) =1 q=1 对比新的优化问题(4)与原优化问题(1),分 其中,a为Lagrange乘子,并且有ax=[a1,…,anJT, 布权重W的融入使得模型可以根据样本的类不平 i=[al,…,amJ 衡程度合理分配样本权重,确保诊断模型能够聚 1.2权重分配方式 焦到一些富含优化信息的训练样本上,从而有效 本文采用Vong等在文献[24中提出的权重 提高模型的解释能力 分配方法,为每个样本分配权重,寻求各类样本在 为了求解优化问题(4),给出其对应的Lagrange 规模上的再平衡,将分隔超边界推向多数类来减 函数 轻样本类不平衡的影响,实际上属于代价敏感学 习范畴.两种权重分配方式如下: LI(Bq.5i.Yq.i)= 2a+空f- w=diag[w1,…,wn],wi= 1 #0)mi=1,2,,m (3) 其中,#O)表示故障模式y的训练样本数.通过权 (7) 重分布,使得少数样本被赋予更大的权重.显然, 式中,由上文序=V了g,可知耶g1=VYgBǔ和A均为 数据的类不平衡程度越高,各类样本之间的分布 Lagrange乘子,且a=[a1,…,anJT,ai=[al,…,mJT 权重相差就越大 对式(5)中的优化变量分别求偏导,可得 w2=diag[w1,…,wnl, OLI(Ba.5i.Yi) 0.618 A,-2xa= Wi= ,if#(vi)>AVG aBq g=l isl #(y)m (4) 1 Wi= if#(y)≤AVG 0→Bg=yg ∑gx)a (8) #(y)myi ∈ {1,2,··· ,m} xi n DTr f(x) : R d → R DTe x ′ j y ′ j ∈ {1,2,··· ,m} f(x) 的维数; 表示 对应的故障模式, 为样本个数. 诊断模型设计的本质是基于 寻 找一个映射函数 ,使其可以将 中 的任一个样本实例 映射为相应的故障模式 . 当使用 lp -MKELM 作为诊断模型 寻找映射函数 时,其初始优化问题表示为 min β,ξ,γ 1 2 ∑r q=1 ||βq||2 F + C 2 ∑n i=1 ||ξi ||2 2 , s.t. ∑r q=1 √ γqϕq(xi)βq = y T i −ξ T i ,i = 1,2,··· ,n, ∑r q=1 γ p q = 1, γq ⩾ 0, p > 1 (1) || · ||F {kq(·,·)} r q=1 γ={γq} r q=1 β=[β T 1 ,β T 2 ,··· ,β T r ] T βq ∈ R |ϕq(·)|×m {kq(·,·)} r q=1 {ϕq(·)} r q=1 {kq(·,·)} r q=1 ξi = [ξi1,··· , ξim] T i yi = [yi1,··· , yim] T i α γ α ∗ γ ∗ 其中, 表示F 范数, 为预定义的r 个基核, 表示基核的组合权重, 表示模型总的输出权重, 表示对应于 基核 的输出权重, 为对应于基核 的特征映射;m 表示 ELM 的输出节点个 数 ; 表示对应于第 个故障样本的 训练误差向量, 表示第 个故障样 本的理想输出向量;C 为正则化因子,p 为范数约 束形式. 对式(1)对应的 Lagrange 函数中各变量分 别求偏导,并采用两步交替优化策略求解 Lagrange 乘子矩阵 以及基核组合权重 ,得出模型最优化 参数 和 ,则决策函数为 f(·) = ∑n i=1 (α ∗ i ) T∑r q=1 γ ∗ q kq(xi ,·) (2) α α = [α1,··· ,αn] T αi = [αi1,··· ,αim] T 其中 , 为 Lagrange 乘子 ,并且有 , . 1.2    权重分配方式 本文采用 Vong 等在文献 [24] 中提出的权重 分配方法,为每个样本分配权重,寻求各类样本在 规模上的再平衡,将分隔超边界推向多数类来减 轻样本类不平衡的影响,实际上属于代价敏感学 习范畴. 两种权重分配方式如下: W(1) = diag[w1,··· ,wn],wi = 1 #(yi)m ,i = 1,2,··· ,m (3) 其中, #(yi) 表示故障模式 yi 的训练样本数. 通过权 重分布,使得少数样本被赋予更大的权重. 显然, 数据的类不平衡程度越高,各类样本之间的分布 权重相差就越大. W(2) = diag[w1,··· ,wn],    wi = 0.618 #(yi)m ,if#(yi) > AVG wi = 1 #(yi)m ,if#(yi) ⩽ AVG (4) 其中,AVG 表示所有类的平均训练样本数,这样可 以减少少数群体和多数群体之间的平衡步长,使 其达到 0.618∶1 的比率. 在多类分类中,少数类是 指样本数量低于所有类平均样本数的那些类别,而 多数类是指样本数高于所有类平均样本数的类别. 2    改进的 lp 范数约束加权多核多故障集 成学习诊断框架 2.1    正则化加权多核极限学习机 w = {wi} n i=1 ∑n i=1wi = 1 wi n×n W = diag[w1,··· ,wn] 对于输入空间中的 n 组故障样本,假设其权重 分布为 ,并且有 . 为便于运算, 将其扩展为主对角线元素为 的 对角矩阵,表 示为 . β˜ q = √ 对于优化问题(1),令 γqβq ,可以得到 ∑r q=1 ||βq||2 F = ∑r q=1 ||β˜ q||2 F / γq (5) W 将式(3)代入优化问题(1),同时,将样本分布 权重矩阵 融合到优化问题中,得到 lp 范数约束 下正则化加权多核极限学习机: min β˜,ξ,γ 1 2 ∑r q=1 1 γq ||β˜ q||2 F + C 2 ∑n i=1 wi ||ξi ||2 2 , s.t.∑r q=1 ϕq(xi)β˜ q = y T i −ξ T i ,i = 1,2,··· ,n, ∑r q=1 γ p q = 1,γq ⩾ 0, p > 1 (6) W 对比新的优化问题(4)与原优化问题(1),分 布权重 的融入使得模型可以根据样本的类不平 衡程度合理分配样本权重,确保诊断模型能够聚 焦到一些富含优化信息的训练样本上,从而有效 提高模型的解释能力. 为了求解优化问题(4),给出其对应的 Lagrange 函数. L1(β˜ q,ξi , γq,αi) = 1 2 ∑r q=1 1 γq ||β˜ q||2 F + C 2 ∑n i=1 wi ||ξi ||2 − ∑n i=1 ∑m l=1 αil   ∑r q=1 ϕq(xi)β˜ ql −yil +ξil   +λ   ∑r q=1 γ p q −1   (7) β˜ q = √ γqβq β˜ ql = √ γqlβql α λ α = [α1,··· ,αn] T αi = [αi1,··· ,αim] T 式中,由上文 ,可知 , 和 均为 Lagrange 乘子,且 , . 对式(5)中的优化变量分别求偏导,可得 ∂L1(β˜ q,ξi , γq,αi) ∂β˜ q = ∑r q=1 1 γq β˜ q − ∑r q=1 ∑n i=1 ϕ T q (xi)α T i = 0 → β˜ q = γq ∑n i=1 ϕ T q (xi)α T i (8) · 84 · 工程科学学报,第 44 卷,第 1 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有