工程科学学报,第 39 卷,第 1 期述了创建列向量编码二叉树的算法.

正在加载图片...

·42· 工程科学学报，第39卷，第1期述了创建列向量编码二叉树的算法.每一个树节点定 IC.C.C.C.C.C.C.C] 义了一个类集合分割的问题，每个节点的分割必须满足使判别率最大化的条件.通过最大化数据x和为分 C.C.C] 割结果所创建的类标签d之间的交互信息可以得到最终的列代码.算法中d是一个离散的随机变量，因此 IC.C (C.C.C 给定类集合S的一个分割结果{p,}=BP(S),d N 按如下形式定义： C..C IC 1, C d=d(x,BP(S))= if xECIC;EPL, (-1,if xEC;IC;Ei C (10) 表1列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 图1八元分类问题列向量编码二叉树列向量编码二叉树 Fig.1 Binary tree based on column vector coding for the 8-class classification problem 初始化：创建类集合{c的初始分制{6，} {e6,6}=1⑦，{C,C2,…,Cv.1 L0={6},k=1 步骤1S。是L4-1的第一个元素，L=L4-1/S。解码步骤2寻找最优的二元分割：BP(S) 1.=吗(x,d(BP(S)) 其中1(·)是交互信息准则，x是训练样本向量，d是与 C 分类标签相关的离散随机变量. C, 步骤3L2={U},如果11>1，ie{1,2} C C. 步骤4如果1L1≠0 别 C k=k+1返回步骤1 C C 将二叉树视为寻找码字的手段，第二步是填充纠 C. 错输出编码矩阵的过程.利用除了叶节点外的每个根 h hs 节点得到的列代码，组成了编码矩阵M.列代码作为 LS-SVM二元分类器矩阵M的列向量依次排列.为了创建每一个列代码，可以使用父节点和子节点的关系进行描述.对于给定图2纠错输出编码矩阵的类C,和节点k的类集合k:{pUp},其中pi和p Fig.2 Coding matrix for the error correction output 分别是节点k的子节点，矩阵M按如下方式填充：类器h区分{C,C6}和{C2}. 0, ifC,年p:； 1.2.2 Fisher线性判别浮动搜索法 M(r,i)= +1,ifC,∈9； (11) 在本小节，我们设计了一种Fisher线性判别率为 (-1,if c,eo. 标准的启发式纠错输出编码，并将其运用到判别纠错注意到列的数量n和内部节点的数量一致.容易输出编码算法中.该算法能够利用较少的支持向量机得出，在任何的二叉树中，如果叶节点的数量是N。,内分类器，实现高炉故障的多分类问题部节点的数量是N。-1,因此可以确定码字的长度是回顾表1中描述的算法，为了将类集合分割成两 N。-1. 个部分，需要一个最大化判别率的过程。但是，最好的图1展示了一个八元分类问题列向量编码二叉树分割子集需要在所有可能的分割中无遗漏的寻找，由构造的过程于这种方法是不切实际的，所以必须使用一种次优的图2显示了判别纠错输出编码矩阵的结果.其中策略.浮动搜索方法是一种次优的顺序搜索方法，能白色的方格表示相应的位置被编码为+1，黑色的方格够缓解穷举搜索法在进行分割选择时，产生的高额计表示-1，灰色的方格表示0.因此，C。类的码字是{1，算代价.而且，这种方法允许搜索方向是变化的，从而 0,-1,0-1,0,1}.编码矩阵的第i列定义了一个二元解决了许多顺序搜索方法的主要限制. 分类问题，将相应的二元分类器h,进行训练.例如，分表2中的方法为顺序前向浮动搜索法(sequential工程科学学报,第 39 卷,第 1 期述了创建列向量编码二叉树的算法. 每一个树节点定义了一个类集合分割的问题,每个节点的分割必须满足使判别率最大化的条件. 通过最大化数据 x 和为分割结果所创建的类标签 d 之间的交互信息可以得到最终的列代码. 算法中 d 是一个离散的随机变量,因此给定类集合 Sk 的一个分割结果{ 渍 1 k,渍 2 k } = BP( Sk ),d 按如下形式定义: d = d(x,BP(Sk)) = 1, if x沂Ci | Ci沂渍 1 k, - 1, if x沂Ci | Ci沂渍 2 k { . (10) 表 1 列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 列向量编码二叉树初始化: 创建类集合{ci}的初始分割{渍 1 0 ,渍 2 0 } {渍 1 0 ,渍 2 0 } = {芰,{C1 ,C2 ,…,CNc }} L0 = {渍 2 0 },k = 1 步骤 1 Sk 是 Lk - 1的第一个元素,L忆k = Lk - 1 / Sk 步骤 2 寻找最优的二元分割:BP(Sk) {渍 1 k ,渍 2 k } = arg max BP(Sk ) (I(x,d(BP(Sk)))) 其中 I(·)是交互信息准则,x 是训练样本向量,d 是与分类标签相关的离散随机变量. 步骤 3 Lk = {L忆k胰渍 i k},如果| 渍 i k | > 1,坌i沂{1,2} 步骤 4 如果| Lk |屹0 k = k + 1 返回步骤 1 将二叉树视为寻找码字的手段,第二步是填充纠错输出编码矩阵的过程. 利用除了叶节点外的每个根节点得到的列代码,组成了编码矩阵 M. 列代码作为矩阵 M 的列向量依次排列. 为了创建每一个列代码, 可以使用父节点和子节点的关系进行描述. 对于给定的类 Cr 和节点 k 的类集合 k:{渍 1 k胰渍 2 k },其中渍 1 k 和渍 2 k 分别是节点 k 的子节点,矩阵 M 按如下方式填充: M(r,i) = 0, if Cr埸渍i; + 1, if Cr沂渍 1 i ; - 1, if Cr沂渍 2 i ì î í ïï ïï . (11) 注意到列的数量 n 和内部节点的数量一致. 容易得出,在任何的二叉树中,如果叶节点的数量是 Nc,内部节点的数量是 Nc - 1,因此可以确定码字的长度是 Nc - 1. 图 1 展示了一个八元分类问题列向量编码二叉树构造的过程. 图 2 显示了判别纠错输出编码矩阵的结果. 其中白色的方格表示相应的位置被编码为 + 1,黑色的方格表示 - 1,灰色的方格表示 0. 因此,C6 类的码字是{1, 0, - 1,0 - 1,0,1}. 编码矩阵的第 i 列定义了一个二元分类问题,将相应的二元分类器 hi 进行训练. 例如,分图 1 八元分类问题列向量编码二叉树 Fig. 1 Binary tree based on column vector coding for the 8鄄class classification problem 图 2 纠错输出编码矩阵 Fig. 2 Coding matrix for the error correction output 类器 h5 区分{C5 ,C6 }和{C2 }. 1郾 2郾 2 Fisher 线性判别浮动搜索法在本小节,我们设计了一种 Fisher 线性判别率为标准的启发式纠错输出编码,并将其运用到判别纠错输出编码算法中. 该算法能够利用较少的支持向量机分类器,实现高炉故障的多分类问题. 回顾表 1 中描述的算法,为了将类集合分割成两个部分,需要一个最大化判别率的过程. 但是,最好的分割子集需要在所有可能的分割中无遗漏的寻找,由于这种方法是不切实际的,所以必须使用一种次优的策略. 浮动搜索方法是一种次优的顺序搜索方法,能够缓解穷举搜索法在进行分割选择时,产生的高额计算代价. 而且,这种方法允许搜索方向是变化的,从而解决了许多顺序搜索方法的主要限制. 表 2 中的方法为顺序前向浮动搜索法( sequential ·42·

<<向上翻页向下翻页>>

点击下载：基于全局优化支持向量机的多类别高炉故障诊断