正在加载图片...
k)-Gf-e-r i,j=l d=l )c》 (6) =222xP-立Grx,》 =2nl 由于x是子空间中相互正交的单位向量,因此式(3)可简化为: 会,--g-空, i,i=l i.jal =2tT Dt-2tT KT 稿 (7 =2t L(K) 其中,Da=之K为对角矩阵,L因=D-K为拉普拉斯矩阵。 式(7)的解可由拉普拉斯矩阵(的的特征值分解中求得中t为矩阵L()的特征向量。由 前两个最大特征值所张成的特征向量子空间可以实现高维数据的2D缩放。高维数据经非线性同等 缩放后的效果,将在下一章节中讨论。 1.2核简支桌分类算法 实现产品质量在线判级需要建立工艺参数与质指标之向映射关系,根据工艺参数聚类结果确 定类标记,并对带有标记的质量指标样本划定类边办人分类方法有基于概率分布的Byes算法、 Anderson算法:基于规则的决策树,如随机森林和Boosted树:基于距离的支持向量机、K-邻近分 类以及二次规划分类、逻辑回归以及神经元网貉深度学习等。 基于距离的分类算法可分为两种形式,硬间隔和软间隔分类算法。硬间隔分类采用线性(超平 面)判别函数,软间隔采用非线性(曲面)判别函数。由于工艺参数与质量指标间存在多重耦合, 类边界往往较复杂,因此宜用非线性判别函数,即采用软间隔分类器。引入间隔松弛向量,即允 许训练集中个别样本被错误分类,《软间隔支持向量机分类方法可转化为求如下最优解 典7容数 (8) >约束条件:f(《W,y,)》+b)≥?-,5≥0,IW=1。 其中,参数C为权衡系数,表示允许错误分类比例,当松弛向量飞的上标p为1时,表示一范 数软间隔(Lsof托margin),p为2表示二范数软间隔(L2-soft margin)。式(8)可以通过拉格朗 日函数求得权同量7和截距b,对偶解α,和类间隔'。类边界可由分布在边界两侧的支持向量来确 定,但若类间存在交叉重叠区域,支持向量的数目会显著增加,造成类边界划分的复杂性,并增加 在线自动判级的时间和准确率。 为了简化类边界判定函数,提出通过少量简支集(Reduced Set,RS)来确定类边界判定函数 的方法。设Y-y,2,ym}为支持向量集,nsY为支持向量个数,则基于支持向量的类判别函数 f0)=2ak0,)+b=w,》+b (9) = 由若干简支集向量来替代原来的支持向量集,则简支集的类判别函数 f()-2Bk(yi.y)+6=aK(y.)+b (10) -12 2 , 1 , 1 1 2 1 , 1 2 1 1 , 1 ( ) ( ) ( ) ( )) ( ) ( )) 2 ( ( ) ( ) ( )) 2 x x x x x x x x x                                 ( ( - n n l i j d i d j i j i j d l n d i d j d i j l n n d i d i d j d i i j n nl (6) 由于 τ 是子空间中相互正交的单位向量,因此式(3)可简化为:   2 2 1 1 1 T T T 2 2 2 2 2 , , , K τ τ K K τ τ τ τ Dτ τ K τ τ L(K)τ n n n i j ij i ij i j i j i j i j ij             (7) 其中,  n ij j=1 D = K ii 为对角矩阵, L(K) = D - K 为拉普拉斯矩阵。 式(7)的解可由拉普拉斯矩阵 L(K)的特征值分解中求得,其中 为矩阵 L(K)的特征向量。由 前两个最大特征值所张成的特征向量子空间可以实现高维数据的 2D 缩放。高维数据经非线性同等 缩放后的效果,将在下一章节中讨论。 1.2 核简支集分类算法 实现产品质量在线判级需要建立工艺参数与质量指标之间映射关系,根据工艺参数聚类结果确 定类标记,并对带有标记的质量指标样本划定类边界。分类方法有基于概率分布的 Bayes 算法 、 Anderson 算法;基于规则的决策树,如随机森林和 Boosted 树;基于距离的支持向量机、K-邻近分 类以及二次规划分类、逻辑回归以及神经元网络、深度学习等。 基于距离的分类算法可分为两种形式,硬间隔和软间隔分类算法。硬间隔分类采用线性(超平 面)判别函数,软间隔采用非线性(曲面)判别函数[29]。由于工艺参数与质量指标间存在多重耦合, 类边界往往较复杂,因此宜用非线性判别函数,即采用软间隔分类器。引入间隔松弛向量 ξ,即允 许训练集中个别样本被错误分类,软间隔支持向量机分类方法可转化为求如下最优解 , , , min b  C n p i γ ξ i w =1 γ ξ (8) 约束条件: ( , ( ) ) , i i i i f      W  y b γ ξ   ξ  , 2    W 1。 其中,参数 C 为权衡系数,表示允许错误分类比例,当松弛向量 ξ 的上标 p 为 1 时,表示一范 数软间隔(L1-soft margin),p 为 2 表示二范数软间隔(L2-soft margin)。式(8)可以通过拉格朗 日函数求得权向量 W 和截距 b,对偶解i 和类间隔 γ。类边界可由分布在边界两侧的支持向量来确 定,但若类间存在交叉重叠区域,支持向量的数目会显著增加,造成类边界划分的复杂性,并增加 在线自动判级的时间和准确率。 为了简化类边界判定函数,提出通过少量简支集(Reduced Set,RS)来确定类边界判定函数 的方法。设 1 2 , ..., , Y y y ynsv  为支持向量集,nsv 为支持向量个数,则基于支持向量的类判别函数 1 ( ) ( , ) , ( ) nsv i i i f k y   y     α y W y   b b (9) 由若干简支集向量来替代原来的支持向量集,则简支集的类判别函数 1 * 1 1 ( ) ( , ) ( , ) RS l nsv i i i i i i f k y k y   y    β y    b b α y (10) 录用稿件,非最终出版稿
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有