Z (L ′′) a (L ′ ) L ′ 的关系特征和样本特征相结合

正在加载图片...

第17卷智能系统学报 ·890· 的关系特征ZL和样本特征α相结合得到样本的图如图2所示。预测标签分布，这里假设CNN模型共有L层，表开始示如下： =softmax(Zu)+H)) (12) SCUTTLE模型参数初始化 5)计算模型最终的损失函数： LCNN_GCN= 2, 数据集预处理，设置批次数量、每批次样本数 (13) 、每批次标记样本数、选代次数等超参数 2.4.2 SCUTTLE模型的训练算法描述将一个批次N。个样本传入 CNN网络中正向训练设训练样本总数为N,每个批次的样本数量挑选CNN任一隐层的也即batchsize设定为Nata,则批次数量为输出作为KNN的输入设每批次标记样本数量为Vabl,此时计算得到标 KNN+GCN模型进行记样木这数为N×心，后续哭到的所有标记样本隐含关系特征提取样本数量皆通过上式计算得到。将GCN的输出结果与CNN的输出结果进行融合操作算法1 SCUTTLE模型训练方法输入N个样本X=(c1,x2,…,xN)以及Nae个只计算Ne个标i记样本损失值并进行梯度反向传播样本的标签。输出N个样本的预测标签值。装本 1)随机初始化SCUTTLE模型的网络参数。 Y 2)将全部样本作数据预处理且随机打乱顺 SCUTTLE模型精度测试序，同时设定样本批次数量为一，，且设定每批次标记样本数量为Niable,epoch数量为e。 SCUTTLE模型N 收敛 3)将第一个批次的Nah个样本输入CNN模型中进行正向传播。结束 4)随机挑选步骤3)中CNN的任一隐层输出特征作为KNN图的输入，再经过GCN模型进行图2 SCUTTLE模型训练方法流程图 Fig.2 Flow chart of SCUTTLE model training method 正向传播。 5)步骤3)4)属于并行前向传播，在两个模型 2.4.3 SCUTTLE模型的关系函数解释最后输出层通过式(12)进行特征融合并计算损失对于常见的半监督学习模型（包括引言和相值，此时的损失值只包括步骤2)中提前设定好的关工作中提到的)，其优化目标函数为 L+U Viable个样本的损失，同时通过梯度反向传播优化 min∑Ifx)-yP+∑cfx,x,W） (14) 模型参数。 6)测试模型精度。式中：W即为表示相邻两个样本间的关系参数； )将步骤3小6)循环一次，为全部样本一次 L表示标签样本；U表示无标签样本。为了后续表迭代。述的方便，将式(14)中的两项分别记为(14)与 8)步骤3))循环e次，直至模型收敛。 (14)。(14)为标签样本的损失函数，(14)为反映上述算法即为SCUTTLE模型的批量训练算样本隐含关系的函数。根据前两小节所述的建模法，从步骤4)中可知，SCUTTLE融合算法对于任流程，CNN与GCN模型都利用标签样本的标签一批量的样本都会建立KNN图，相较于其他算信息来构建监督信息的损失函数，因此(14)可以法的随机参数化方法，本文所构建KNN图在很写为大程度上可以保证数据的先验性质，同时使模型 I+),-yl (15) 具有解释性。在步骤5)中，将CNN模型的特征与GCN模型的特征进行融合，可以看作二者之间在构建样本的隐含关系函数时，CNN模型不的相互约束过程，对于卷积特征不够清晰且明确具有建模样本间关系的能力，因此需依靠GCN模的样本可以通过GCN的关系特征进行补充，从而型来捕捉这些信息，因此对于(14)而言，结合式提升泛化性能。SCUTTLE模型的训练方法流程 (8)或(10)可得Z (L ′′) a (L ′ ) L ′ 的关系特征和样本特征相结合得到样本的预测标签分布，这里假设 CNN 模型共有层，表示如下： yˆ = softmax(Z (L ′′′) + H (L ′ ) ) (12) 5）计算模型最终的损失函数： LCNN_GCN = 1 N ∑N n=1 L(by (n)，y (n) ) (13) 2.4.2 SCUTTLE 模型的训练算法描述 N Nbatch Nlable × N Nbatch 设训练样本总数为 N，每个批次的样本数量也即 batch_size 设定为 Nbatch，则批次数量为，设每批次标记样本数量为 Nlable，此时计算得到标记样本总数为，后续提到的所有标记样本数量皆通过上式计算得到。算法 1 SCUTTLE 模型训练方法输入 N 个样本 X = (x1, x2,··· , xN) 以及 Nlable 个样本的标签。输出 N 个样本的预测标签值。 1) 随机初始化 SCUTTLE 模型的网络参数。 N Nbatch 2) 将全部样本作数据预处理且随机打乱顺序，同时设定样本批次数量为，且设定每批次标记样本数量为 Nlable，epoch 数量为 e。 3) 将第一个批次的 Nbatch 个样本输入 CNN 模型中进行正向传播。 4) 随机挑选步骤 3) 中 CNN 的任一隐层输出特征作为 KNN 图的输入，再经过 GCN 模型进行正向传播。 5) 步骤 3)~4) 属于并行前向传播，在两个模型最后输出层通过式 (12) 进行特征融合并计算损失值，此时的损失值只包括步骤 2) 中提前设定好的 Nlable 个样本的损失，同时通过梯度反向传播优化模型参数。 6) 测试模型精度。 N Nbatch 7) 将步骤 3)~6) 循环次，为全部样本一次迭代。 8) 步骤 3)~7) 循环 e 次，直至模型收敛。上述算法即为 SCUTTLE 模型的批量训练算法，从步骤 4) 中可知，SCUTTLE 融合算法对于任一批量的样本都会建立 KNN 图，相较于其他算法的随机参数化方法，本文所构建 KNN 图在很大程度上可以保证数据的先验性质，同时使模型具有解释性。在步骤 5) 中，将 CNN 模型的特征与 GCN 模型的特征进行融合，可以看作二者之间的相互约束过程，对于卷积特征不够清晰且明确的样本可以通过 GCN 的关系特征进行补充，从而提升泛化性能。SCUTTLE 模型的训练方法流程图如图 2 所示。 SCUTTLE 模型参数初始化数据集预处理，设置批次数量、每批次样本数 Nbatch、每批次标记样本数、迭代次数等超参数将一个批次 Nbatch 个样本传入 CNN 网络中正向训练只计算 Nlable 个标记样本损失值并进行梯度反向传播全部样本训练完毕 Y Y N N SCUTTLE 模型精度测试挑选 CNN 任一隐层的输出作为 KNN 的输入 KNN+GCN 模型进行样本隐含关系特征提取将 GCN 的输出结果与 CNN 的输出结果进行融合操作 SCUTTLE 模型收敛开始结束图 2 SCUTTLE 模型训练方法流程图 Fig. 2 Flow chart of SCUTTLE model training method 2.4.3 SCUTTLE 模型的关系函数解释对于常见的半监督学习模型（包括引言和相关工作中提到的），其优化目标函数为 min W ∑L i ∥ f(xi)−yi∥ 2 + ∑L+U i, j L(f(xi , xj ,Wi j) (14) Wi j L U 式中：即为表示相邻两个样本间的关系参数；表示标签样本；表示无标签样本。为了后续表述的方便，将式 (14) 中的两项分别记为 (141 ) 与 (142 )。(141 ) 为标签样本的损失函数，(142 ) 为反映样本隐含关系的函数。根据前两小节所述的建模流程，CNN 与 GCN 模型都利用标签样本的标签信息来构建监督信息的损失函数，因此 (141 ) 可以写为 ∑L i ||(fcnn + fgcn) i −yi ||2 (15) 在构建样本的隐含关系函数时，CNN 模型不具有建模样本间关系的能力，因此需依靠 GCN 模型来捕捉这些信息，因此对于 (142 ) 而言，结合式 (8) 或 (10)，可得第 17 卷智能系统学报 ·890·

<<向上翻页向下翻页>>

点击下载：【机器学习】融合关系特征的半监督图像分类方法研究