正在加载图片...
裴艳字等:一维卷积神经网络特征提取下微震能级时序预测 ·1005· Ki=Ig E; (3) 显著降低.考虑到学习率对模型训练效果影响较 其中,K表示第i次微震的能量级别. 大,人工确定最佳参数具有较大难度,故选用一种 基于以上内容构造模型,以前若干次的微震 学习率自适应算法Adam作为模型优化算法2阿. 事件能量级别为输入预测下一次微震事件能量 若设卷积神经网络模型为f(G:),则Cw+1与前 级别 N次微震能量关系如式(5)所示: CN+1=f(任:K1,K2,…,KN) (5) 2 基于一维卷积神经网络的微震能级时序 预测模型 其中,为模型内部权值参数0使得损失函数值最 小的最优估计,求解的过程即为模型的训练过 2.1模型构建 程.具体过程如式(6)所示: 为有效提取微震能量数据特征,预测微震能 0=arg min0Loss[f(0:E1.E2.....EN),CN+1](6) 量级别的时序变化规律,现构建基于一维卷积神 其中,Loss(•)为人为指定的损失函数,用于衡量模 经网络的微震能级时序预测模型,具体步骤如下: 型预测的微震能量数量级与真实值之间的误差 (1)模型输入、输出 由于难以直接求得a,故通过求损失函数的最 模型输入时直接输入前若干次的微震能量值, 小值,间接使得给定标准的权值参数0最小.同时 本文中模型输出值代表微震能量级别,由于相邻 模型使用Softmax分类器作为输出层激活函数,模 的两个能量级别差异较大,若输出按十进制标量 型输出的是第i个样本点的预测类别的概率分布, 形式表示能量级别,模型训练结果会出现较大偏 因而选择分类交叉嫡函数(Categorical cross-entropy) 差.因此,采用一维有效编码方法(One-hot encode) 作为损失函数,分类交叉嫡函数能够度量预测 将标量转化为一维向量,即将预测的对应微震能 分布和真实分布之间的差距,其数学形式如式(7) 级表示为1,其他级别均为0 所示: (2)模型特征提取 Li=->(mlgyim) (7) 检测信号对某种特定模式的响应是卷积的本 质.卷积核通过遍历整段输人向量,对能量序列中 其中,L,为第i个样本的误差;n为样本数;m为类 某些发生突变的点或阶段等细微特征进行检测. 别数;m为第i个样本属于第m类的预测概率; 而池化层将卷积层输出的特征数据进行缩减以降 ym为第i个样本属于第m类的真实概率 低模型计算负担.由于微震能量序列是广义一维 2.2模型训练及测试结果 时间数据,相比于图像、视频等多维数据其包含信 考虑到采掘活动、地应力条件、地质条件等因 息量较少,为减少特征提取过程中数据信息的丢 素对微震事件的发生有一定影响,在选择输入数 失,模型使用卷积层进行特征提取而删去池化层 据维度时,经大量预试验,发现以前十次微震能级 模型先通过多个卷积层对微震数据提取特征,激 作为输入来预测下一次微震能级时正确率较高, 活函数采用Relu函数,最后由全连接层对最后一 相应的模型结构如图1所示,模型超参数经多次 层卷积层的输出加权平均.卷积层对上一层输出 试验迭代得,如表1所示. 利用砚北煤矿250202工作面2017年1月1日 在第j个卷积核处的值,按以下公式进行处理: 至2018年9月30日记录的10343次微震数据对 E;I(m)H j(i-m) (4) 一维卷积神经网络微震能级序列预测模型进行训 i=l 练和测试.选取9次10°级别微震中前6次微震, 其中,I为卷积层的一维输入向量;0为卷积层的 10级别微震中前66%的微震和其他级别前90% 一维输出向量:∫则为该层的激活函数;H为长度 的微震事件,混合、打乱组成训练集;其余的微震 为m的一维向量,又称为卷积核.同时,同一卷积 事件混合、打乱组成测试集,模型测试结果如表2 层内可有多个卷积核同时对输入值进行运算 所示 (3)模型分类与优化 由表2可知,模型对102、103、10低能级的微 为方便现场人员更好地了解预测类别的概率 震事件预测正确率和对10级别的高能级微震事 值,模型输出层选择Softmax分类器进行最终分类. 件的预测正确率均超过了98%,并且总体正确率也 为优化人工神经网络模型,寻找一组神经网络 达到了97.9%,说明基于一维卷积神经网络建立模 的权值参数O,并采用特定算法使损失函数Loss() 型对微震能级进行时序数据进行预测是可行的Ki = lgEi (3) 其中,Ki 表示第 i 次微震的能量级别. 基于以上内容构造模型,以前若干次的微震 事件能量级别为输入预测下一次微震事件能量 级别. 2    基于一维卷积神经网络的微震能级时序 预测模型 2.1    模型构建 为有效提取微震能量数据特征,预测微震能 量级别的时序变化规律,现构建基于一维卷积神 经网络的微震能级时序预测模型,具体步骤如下: (1)模型输入、输出. 模型输入时直接输入前若干次的微震能量值, 本文中模型输出值代表微震能量级别,由于相邻 的两个能量级别差异较大,若输出按十进制标量 形式表示能量级别,模型训练结果会出现较大偏 差. 因此,采用一维有效编码方法(One-hot encode) 将标量转化为一维向量,即将预测的对应微震能 级表示为 1,其他级别均为 0. (2)模型特征提取. 检测信号对某种特定模式的响应是卷积的本 质. 卷积核通过遍历整段输入向量,对能量序列中 某些发生突变的点或阶段等细微特征进行检测. 而池化层将卷积层输出的特征数据进行缩减以降 低模型计算负担. 由于微震能量序列是广义一维 时间数据,相比于图像、视频等多维数据其包含信 息量较少,为减少特征提取过程中数据信息的丢 失,模型使用卷积层进行特征提取而删去池化层[25] . 模型先通过多个卷积层对微震数据提取特征,激 活函数采用 Relu 函数,最后由全连接层对最后一 层卷积层的输出加权平均. 卷积层对上一层输出 在第 j 个卷积核处的值,按以下公式进行处理: O(i) = f   ∑m i=1 EiI(m)Hj(i−m)   (4) 其中,I 为卷积层的一维输入向量;O 为卷积层的 一维输出向量;f 则为该层的激活函数;Hj 为长度 为 m 的一维向量,又称为卷积核. 同时,同一卷积 层内可有多个卷积核同时对输入值进行运算. (3)模型分类与优化. 为方便现场人员更好地了解预测类别的概率 值,模型输出层选择 Softmax 分类器进行最终分类. 为优化人工神经网络模型,寻找一组神经网络 的权值参数 θ,并采用特定算法使损失函数 Loss(θ) 显著降低. 考虑到学习率对模型训练效果影响较 大,人工确定最佳参数具有较大难度,故选用一种 学习率自适应算法 Adam 作为模型优化算法[26] . 若设卷积神经网络模型为 f(θ;·),则 CN+1 与前 N 次微震能量关系如式(5)所示: CN+1 = f(θˆ;K1,K2,··· ,KN) (5) θˆ θˆ 其中, 为模型内部权值参数 θ 使得损失函数值最 小的最优估计,求解 的过程即为模型的训练过 程. 具体过程如式(6)所示: θˆ = argminθLoss[f(θ;E1,E2,··· ,EN),CN+1] (6) 其中,Loss(•) 为人为指定的损失函数,用于衡量模 型预测的微震能量数量级与真实值之间的误差. 由于难以直接求得 θˆ,故通过求损失函数的最 小值,间接使得给定标准的权值参数 θ 最小. 同时 模型使用 Softmax 分类器作为输出层激活函数,模 型输出的是第 i 个样本点的预测类别的概率分布, 因而选择分类交叉熵函数(Categorical cross-entropy) 作为损失函数,分类交叉熵函数能够度量预测 分布和真实分布之间的差距,其数学形式如式(7) 所示: Li = − ∑n 1 (ˆyim lgyim) (7) yˆim 其中,Li 为第 i 个样本的误差;n 为样本数;m 为类 别数; 为第 i 个样本属于第 m 类的预测概率; yim 为第 i 个样本属于第 m 类的真实概率. 2.2    模型训练及测试结果 考虑到采掘活动、地应力条件、地质条件等因 素对微震事件的发生有一定影响,在选择输入数 据维度时,经大量预试验,发现以前十次微震能级 作为输入来预测下一次微震能级时正确率较高, 相应的模型结构如图 1 所示,模型超参数经多次 试验迭代所得,如表 1 所示. 利用砚北煤矿 250202 工作面 2017 年 1 月 1 日 至 2018 年 9 月 30 日记录的 10343 次微震数据对 一维卷积神经网络微震能级序列预测模型进行训 练和测试. 选取 9 次 106 级别微震中前 6 次微震, 105 级别微震中前 66% 的微震和其他级别前 90% 的微震事件,混合、打乱组成训练集;其余的微震 事件混合、打乱组成测试集,模型测试结果如表 2 所示. 由表 2 可知,模型对 102、103、104 低能级的微 震事件预测正确率和对 105 级别的高能级微震事 件的预测正确率均超过了 98%,并且总体正确率也 达到了 97.9%,说明基于一维卷积神经网络建立模 型对微震能级进行时序数据进行预测是可行的. 裴艳宇等: 一维卷积神经网络特征提取下微震能级时序预测 · 1005 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有