正在加载图片...
·42· 工程科学学报,第39卷,第1期 述了创建列向量编码二叉树的算法.每一个树节点定 IC.C.C.C.C.C.C.C] 义了一个类集合分割的问题,每个节点的分割必须满 足使判别率最大化的条件.通过最大化数据x和为分 C.C.C] 割结果所创建的类标签d之间的交互信息可以得到最 终的列代码.算法中d是一个离散的随机变量,因此 IC.C (C.C.C 给定类集合S的一个分割结果{p,}=BP(S),d N 按如下形式定义: C..C IC 1, C d=d(x,BP(S))= if xECIC;EPL, (-1,if xEC;IC;Ei C (10) 表1列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 图1八元分类问题列向量编码二叉树 列向量编码二叉树 Fig.1 Binary tree based on column vector coding for the 8-class classification problem 初始化:创建类集合{c的初始分制{6,} {e6,6}=1⑦,{C,C2,…,Cv.1 L0={6},k=1 步骤1S。是L4-1的第一个元素,L=L4-1/S。 解码 步骤2寻找最优的二元分割:BP(S) 1.=吗(x,d(BP(S)) 其中1(·)是交互信息准则,x是训练样本向量,d是与 C 分类标签相关的离散随机变量. C, 步骤3L2={U},如果11>1,ie{1,2} C C. 步骤4如果1L1≠0 别 C k=k+1返回步骤1 C C 将二叉树视为寻找码字的手段,第二步是填充纠 C. 错输出编码矩阵的过程.利用除了叶节点外的每个根 h hs 节点得到的列代码,组成了编码矩阵M.列代码作为 LS-SVM二元分类器 矩阵M的列向量依次排列.为了创建每一个列代码, 可以使用父节点和子节点的关系进行描述.对于给定 图2纠错输出编码矩阵 的类C,和节点k的类集合k:{pUp},其中pi和p Fig.2 Coding matrix for the error correction output 分别是节点k的子节点,矩阵M按如下方式填充: 类器h区分{C,C6}和{C2}. 0, ifC,年p:; 1.2.2 Fisher线性判别浮动搜索法 M(r,i)= +1,ifC,∈9; (11) 在本小节,我们设计了一种Fisher线性判别率为 (-1,if c,eo. 标准的启发式纠错输出编码,并将其运用到判别纠错 注意到列的数量n和内部节点的数量一致.容易 输出编码算法中.该算法能够利用较少的支持向量机 得出,在任何的二叉树中,如果叶节点的数量是N。,内 分类器,实现高炉故障的多分类问题 部节点的数量是N。-1,因此可以确定码字的长度是 回顾表1中描述的算法,为了将类集合分割成两 N。-1. 个部分,需要一个最大化判别率的过程。但是,最好的 图1展示了一个八元分类问题列向量编码二叉树 分割子集需要在所有可能的分割中无遗漏的寻找,由 构造的过程 于这种方法是不切实际的,所以必须使用一种次优的 图2显示了判别纠错输出编码矩阵的结果.其中 策略.浮动搜索方法是一种次优的顺序搜索方法,能 白色的方格表示相应的位置被编码为+1,黑色的方格 够缓解穷举搜索法在进行分割选择时,产生的高额计 表示-1,灰色的方格表示0.因此,C。类的码字是{1, 算代价.而且,这种方法允许搜索方向是变化的,从而 0,-1,0-1,0,1}.编码矩阵的第i列定义了一个二元 解决了许多顺序搜索方法的主要限制. 分类问题,将相应的二元分类器h,进行训练.例如,分 表2中的方法为顺序前向浮动搜索法(sequential工程科学学报,第 39 卷,第 1 期 述了创建列向量编码二叉树的算法. 每一个树节点定 义了一个类集合分割的问题,每个节点的分割必须满 足使判别率最大化的条件. 通过最大化数据 x 和为分 割结果所创建的类标签 d 之间的交互信息可以得到最 终的列代码. 算法中 d 是一个离散的随机变量,因此 给定类集合 Sk 的一个分割结果{ 渍 1 k,渍 2 k } = BP( Sk ),d 按如下形式定义: d = d(x,BP(Sk)) = 1, if x沂Ci | Ci沂渍 1 k, - 1, if x沂Ci | Ci沂渍 2 k { . (10) 表 1 列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 列向量编码二叉树 初始化: 创建类集合{ci}的初始分割{渍 1 0 ,渍 2 0 } {渍 1 0 ,渍 2 0 } = {芰,{C1 ,C2 ,…,CNc }} L0 = {渍 2 0 },k = 1 步骤 1 Sk 是 Lk - 1的第一个元素,L忆k = Lk - 1 / Sk 步骤 2 寻找最优的二元分割:BP(Sk) {渍 1 k ,渍 2 k } = arg max BP(Sk ) (I(x,d(BP(Sk)))) 其中 I(·)是交互信息准则,x 是训练样本向量,d 是与 分类标签相关的离散随机变量. 步骤 3 Lk = {L忆k胰渍 i k},如果| 渍 i k | > 1,坌i沂{1,2} 步骤 4 如果| Lk |屹0 k = k + 1 返回步骤 1 将二叉树视为寻找码字的手段,第二步是填充纠 错输出编码矩阵的过程. 利用除了叶节点外的每个根 节点得到的列代码,组成了编码矩阵 M. 列代码作为 矩阵 M 的列向量依次排列. 为了创建每一个列代码, 可以使用父节点和子节点的关系进行描述. 对于给定 的类 Cr 和节点 k 的类集合 k:{渍 1 k胰渍 2 k },其中 渍 1 k 和 渍 2 k 分别是节点 k 的子节点,矩阵 M 按如下方式填充: M(r,i) = 0, if Cr埸渍i; + 1, if Cr沂渍 1 i ; - 1, if Cr沂渍 2 i ì î í ïï ïï . (11) 注意到列的数量 n 和内部节点的数量一致. 容易 得出,在任何的二叉树中,如果叶节点的数量是 Nc,内 部节点的数量是 Nc - 1,因此可以确定码字的长度是 Nc - 1. 图 1 展示了一个八元分类问题列向量编码二叉树 构造的过程. 图 2 显示了判别纠错输出编码矩阵的结果. 其中 白色的方格表示相应的位置被编码为 + 1,黑色的方格 表示 - 1,灰色的方格表示 0. 因此,C6 类的码字是{1, 0, - 1,0 - 1,0,1}. 编码矩阵的第 i 列定义了一个二元 分类问题,将相应的二元分类器 hi 进行训练. 例如,分 图 1 八元分类问题列向量编码二叉树 Fig. 1 Binary tree based on column vector coding for the 8鄄class classification problem 图 2 纠错输出编码矩阵 Fig. 2 Coding matrix for the error correction output 类器 h5 区分{C5 ,C6 }和{C2 }. 1郾 2郾 2 Fisher 线性判别浮动搜索法 在本小节,我们设计了一种 Fisher 线性判别率为 标准的启发式纠错输出编码,并将其运用到判别纠错 输出编码算法中. 该算法能够利用较少的支持向量机 分类器,实现高炉故障的多分类问题. 回顾表 1 中描述的算法,为了将类集合分割成两 个部分,需要一个最大化判别率的过程. 但是,最好的 分割子集需要在所有可能的分割中无遗漏的寻找,由 于这种方法是不切实际的,所以必须使用一种次优的 策略. 浮动搜索方法是一种次优的顺序搜索方法,能 够缓解穷举搜索法在进行分割选择时,产生的高额计 算代价. 而且,这种方法允许搜索方向是变化的,从而 解决了许多顺序搜索方法的主要限制. 表 2 中的方法为顺序前向浮动搜索法( sequential ·42·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有