LSTM 的独特结构是为了使其能够解决长期依赖问题而专门设计的。不同于

正在加载图片...

第6期刘牧雷，等：基于三支决策的序列数据代价敏感分类算法 ·1257· LSTM的独特结构是为了使其能够解决长期错误分类的代价；P(x)表示算法将x划分至类别依赖问题而专门设计的。不同于RNN网络， j的概率；c(亿，》表示将i分类划分至j所产生的 LSTM的重复结构是由更加复杂的3个门相互连代价。接而成。包括遗忘门、输人门与输出门。对于每个类别i,L(x,)表示x所有可能的划式(4)(9)描述了细胞内各个门的处理流程。分结果的代价的概率和。故由式(10)知，当分类 f=(W[h-1,x:]+b) (4) 代价最小时，其分类结果P(x)不一定取到最大 i=r(W[h-1,+b) (5) 值。即为了得到更小的分类代价，可能会放弃最 C,tanh(Wc.[h-1.x]+bc) (6) 大的分类结果。 C:=f-C-+iC (7) 在如何使算法获得倾向性的问题上，有两种 o=c(W。·[h-1,x]+bo) (8) 经典算法：1)通过预处理，使算法对某些结果具 h =o-tanh (C) (9) 式(4)描述了遗忘门决定了当细胞更新时细有敏感性，此方法称为rescaling;2)希望通过以胞状态会丢弃什么信息。该门会读取h-1和x, 代价为基准修改不同分类在算法中的成员可能输出在[0，)之间的数值与原先细胞状态C-1相性，从而产生不同的倾向性。此方法称为rewei-- 结合。其中，1表示完全保留，0表示完全遗忘。 ghted。其中，h-1表示上一个细胞的输出，x表示当前细 2基于LSTM的三支决策分类算法胞的输入，c表示sigmod函数。式(5)描述输入门决定了让多少新的信息基于三支决策的LSTM算法在原有的加入到细胞状态中。第一步，细胞输入x与细胞 LSTM基础上，增加了三支决策步骤，对前端分类的上个输出h,-1会通过sigmod元来决定更新的器给出的预测结果做出接受、拒绝、延迟3种不内容。同的方案，算法流程如图2所示。式(6)描述了更新内容C。与式（⑤）同时，同样的输入会通过一个tanh元，生成备用的更新内容C。前瓷分类器式(7)描述了更新内容C,。将式(5)与式延迟 (6两部分结果相乘，将细胞状态由C-1更新至C。最终输出数据由式(8)的输出与当前细胞状拒绝态的一部分共同决定输出的最终值，如式(9)描述。以上为LSTM模型的基本工作流。图2基于LSTM的三支决策算法流程 Fig.2 Flow of 3WD based on LSTM 1.3代价敏感分类一般的，对于分类算法的研究的核心与重点算法包括两部分：1)前置分类器，用于初步为如何取得更高的分类准确率，但事实上，只要分类：2)三支决策，考虑决策风险，通过算法的判有误差存在，分类过程总会产生代价。而代价敏断降低决策风险。感分类就是关注如何使分类过程中产生的代价最 2.1前置分类器小。根据问题的难易程度，代价敏感问题常被分前置分类器的作用主要体现在前置分类器的为二分类与多分类问题。对于二分类问题，目前分类精度最终决定了整体上的分类效果。此后的大部分的代价敏感分类多是从非代价敏感分类算三支决策对前置分类器的分类结果做出评判，决法加以转化得到的。定接受、拒绝、或者延迟推断。对于LSTM分类结合上述，可将代价敏感分类等价于一个优器，主要用来解决分类和时序问题预测。输出包化问题：将实例使用分类算法A划分至类别1时，括预测结果C和预测的分类概率p。分类概率p 使损失函数L(x,)达到最小o: 用于下一步中三支决策算法来判断是否采纳分类 Lx.=∑PUc6, (10) 结果。 2.2三支决策式中：x表示一个实例；L(,)表示x的类别为i时三支决策对前置分类器给出的结果进行分LSTM 的独特结构是为了使其能够解决长期依赖问题而专门设计的。不同于 RNN 网络， LSTM 的重复结构是由更加复杂的 3 个门相互连接而成。包括遗忘门、输入门与输出门。式 (4)~(9) 描述了细胞内各个门的处理流程。 ft = σ ( Wf ·[ht−1, xt]+bf ) (4) it = σ(Wi ·[ht−1, xt]+bi) (5) Cet = tanh(WC ·[ht−1 , xt]+bC) (6) Ct = ft ·Ct−1 +it ·Cet (7) ot = σ(Wo ·[ht−1, xt]+bo) (8) ht = ot ·tanh(Ct) (9) ht−1 xt [0,1] Ct−1 ht−1 xt σ 式 (4) 描述了遗忘门决定了当细胞更新时细胞状态会丢弃什么信息。该门会读取和，输出在之间的数值与原先细胞状态相结合。其中，1 表示完全保留，0 表示完全遗忘。其中，表示上一个细胞的输出，表示当前细胞的输入，表示 sigmod 函数。 xt ht−1 式 (5) 描述输入门决定了让多少新的信息加入到细胞状态中。第一步，细胞输入与细胞的上个输出会通过 sigmod 元来决定更新的内容。 Cet Cet 式 (6) 描述了更新内容。与式 (5) 同时，同样的输入会通过一个 tanh 元，生成备用的更新内容。 Ct Ct−1 Ct 式 (7) 描述了更新内容。将式 (5) 与式 (6) 两部分结果相乘，将细胞状态由更新至。最终输出数据由式 (8) 的输出与当前细胞状态的一部分共同决定输出的最终值，如式 (9) 描述。以上为 LSTM 模型的基本工作流。 1.3 代价敏感分类一般的，对于分类算法的研究的核心与重点为如何取得更高的分类准确率，但事实上，只要有误差存在，分类过程总会产生代价。而代价敏感分类就是关注如何使分类过程中产生的代价最小。根据问题的难易程度，代价敏感问题常被分为二分类与多分类问题。对于二分类问题，目前大部分的代价敏感分类多是从非代价敏感分类算法加以转化得到的。 A I L(x,i) 结合上述，可将代价敏感分类等价于一个优化问题: 将实例使用分类算法划分至类别时，使损失函数达到最小[10] ： L(x,i) = ∑ j P(j|x) c (i, j) (10) 式中：x 表示一个实例； L(x,i) 表示 x 的类别为 i 时 P(j|x) x j c (i, j) i j 错误分类的代价；表示算法将划分至类别的概率；表示将分类划分至所产生的代价。 i L(x,i) x P(j|x) 对于每个类别，表示所有可能的划分结果的代价的概率和。故由式 (10) 知，当分类代价最小时，其分类结果不一定取到最大值。即为了得到更小的分类代价，可能会放弃最大的分类结果。在如何使算法获得倾向性的问题上，有两种经典算法：1) 通过预处理，使算法对某些结果具有敏感性，此方法称为 rescaling[11] ；2) 希望通过以代价为基准修改不同分类在算法中的成员可能性，从而产生不同的倾向性。此方法称为 reweighted[12]。 2 基于 LSTM 的三支决策分类算法基于三支决策的 LST M 算法在原有的 LSTM 基础上，增加了三支决策步骤，对前端分类器给出的预测结果做出接受、拒绝、延迟 3 种不同的方案，算法流程如图 2 所示。分类三支决策结果前置分类器延迟拒绝接受图 2 基于 LSTM 的三支决策算法流程 Fig. 2 Flow of 3WD based on LSTM 算法包括两部分：1) 前置分类器，用于初步分类；2) 三支决策，考虑决策风险，通过算法的判断降低决策风险。 2.1 前置分类器 C p p 前置分类器的作用主要体现在前置分类器的分类精度最终决定了整体上的分类效果。此后的三支决策对前置分类器的分类结果做出评判，决定接受、拒绝、或者延迟推断。对于 LSTM 分类器，主要用来解决分类和时序问题预测。输出包括预测结果和预测的分类概率。分类概率用于下一步中三支决策算法来判断是否采纳分类结果。 2.2 三支决策三支决策对前置分类器给出的结果进行分第 6 期刘牧雷，等：基于三支决策的序列数据代价敏感分类算法 ·1257·

<<向上翻页向下翻页>>

点击下载：【机器学习】基于三支决策的序列数据代价敏感分类算法