陈恒志等:基于极限学习机(ELM)的连铸坯质量预测 ·819· 确率整体呈上升趋势:当隐含层神经元个数为120 时,训练模型的拟合度达到了最高(激活函数为 ‘sin'和‘sigmoid'时,训练准确率为100%;激活函 数为‘hardlim'时,模型训练准确率高达92%).图7 和图8分别为不同的激活函数和隐含层神经元个数 对连铸坯中心疏松模型和连铸坯中心偏析模型预测 准确率的影响. 90 hardlim -o-sigmoid 输人层 隐层 输出层 80外0 A-sin 图6典型的单隐层前馈神经网络模型 70 Fig.6 Typical feedforward neural network model of the single hidden layer Y.= B.G(0,4)G=1,2,…,m)(4) 50 式中:Y为网络的第m个输出层神经元的输出, 40 w,=[ua,w2,…,wn]T是隐含层第i个神经元与输 30 20 406080 100 120 入层的连接权值,B:为隐含层第i个神经元与输出 隐含层节点数 层的连接权值,G(w:,b:,x:)为第i个隐含层神经元 图7不同激活函数和隐层节点数对应的中心疏松预测准确率 的输出. Fig.7 Testing accuracy of the center porosity corresponding to differ- 该神经网络在对样本训练前随机的产生连接权 ent activation functions and the hidden layer node 值ω和隐含层神经元的偏置b,只需确定隐含层神 90 经元个数和隐含层神经元激活函数,即可计算出B. hardlim o-sigmoid 80 本文运用Matlab软件构建基于极限学习机的 ▲-stn 连铸坯质量预测模型.在建模过程中,发现不同的 70 隐藏层节点个数,对模型的预测精确度存在着很大 60 影响.因此模型需要在确定激活函数的情况下选择 隐藏层节点个数,且该模型分别选取不同的激励函 50 数进行实验,对比分析不同的激活函数和隐藏层节 40 点个数对模型测试精度的影响.本文选择的激活函 数为‘sin'、‘sigmoid'和‘hardlim';其中‘sigmoid'函 30 0 20 40 60 80 100 120 数是一种常见的S型函数.其函数表达式为 隐含层节点数 5() 图8不同激活函数和隐层节点数对应的中心偏析预测准确率 (5) Fig.8 Testing accuracy of the center segregation corresponding to ‘sin'函数为正弦函数.而hardlim'是一种传 different activation functions and the hidden laver node 递函数,传递函数是通过层的网络输入来计算输出: 由图7可知,在验证连铸坯中心疏松缺陷预测 hardlim(N)需要一组网络输入N,N是一个S×Q 模型的有效性时发现,模型隐含层神经元个数在 的矩阵,由网络输入矢量组成,当N符合条件时,函 (0,20]时模型的预测准确率逐渐增加,隐含层神经 数返回值为1,否则返回值为0 元个数在(20,120]时模型的预测准确率整体呈下 3.2模型验证 降趋势,由此可知当隐含层神经元个数超过20时, 本模型同样以方大特钢60Si2Mn的160组实际 模型的训练开始出现过度拟合:同样对于连铸坯中 生产数据为样本,选取其中的120组数据建立模型, 心偏析缺陷预测模型,在验证模型的有效性时发现 剩余的40组数据验证模型的准确性.在模型训练 模型的隐含层神经元个数在(0,20]时模型的预测 的过程中发现,随着隐含层神经元个数的逐渐增加 准确率基本不变,隐含层神经元个数超过20时模型 (隐含层神经元个数范围(0,120]),模型的训练准 的预测准确率整体呈下降趋势,具体如图8所示,由陈恒志等: 基于极限学习机(ELM)的连铸坯质量预测 图 6 典型的单隐层前馈神经网络模型 Fig. 6 Typical feedforward neural network model of the single hidden layer Ym = 移 L i = 1 茁iG(棕i,bi,xj) (j = 1,2,…,n) (4) 式中:Ym 为网络的第 m 个输出层神经元的输出, 棕i = [棕i1 ,棕i2 ,…,棕in ] T是隐含层第 i 个神经元与输 入层的连接权值,茁i 为隐含层第 i 个神经元与输出 层的连接权值,G(棕i,bi,xi)为第 i 个隐含层神经元 的输出. 该神经网络在对样本训练前随机的产生连接权 值 棕 和隐含层神经元的偏置 b,只需确定隐含层神 经元个数和隐含层神经元激活函数,即可计算出 茁. 本文运用 Matlab 软件构建基于极限学习机的 连铸坯质量预测模型. 在建模过程中,发现不同的 隐藏层节点个数,对模型的预测精确度存在着很大 影响. 因此模型需要在确定激活函数的情况下选择 隐藏层节点个数,且该模型分别选取不同的激励函 数进行实验,对比分析不同的激活函数和隐藏层节 点个数对模型测试精度的影响. 本文选择的激活函 数为‘sin爷、‘sigmoid爷和‘hardlim爷;其中‘sigmoid爷函 数是一种常见的 S 型函数. 其函数表达式为. S(x) = 1 1 + e - x (5) ‘sin爷函数为正弦函数. 而‘ hardlim爷是一种传 递函数,传递函数是通过层的网络输入来计算输出; hardlim(N) 需要一组网络输入 N,N 是一个 S 伊 Q 的矩阵,由网络输入矢量组成,当 N 符合条件时,函 数返回值为 1,否则返回值为 0. 3郾 2 模型验证 本模型同样以方大特钢 60Si2Mn 的 160 组实际 生产数据为样本,选取其中的 120 组数据建立模型, 剩余的 40 组数据验证模型的准确性. 在模型训练 的过程中发现,随着隐含层神经元个数的逐渐增加 (隐含层神经元个数范围(0,120]),模型的训练准 确率整体呈上升趋势;当隐含层神经元个数为 120 时,训练模型的拟合度达到了最高( 激活函数为 ‘sin爷和‘ sigmoid爷 时,训练准确率为 100% ;激活函 数为‘hardlim爷时,模型训练准确率高达 92% ). 图 7 和图 8 分别为不同的激活函数和隐含层神经元个数 对连铸坯中心疏松模型和连铸坯中心偏析模型预测 准确率的影响. 图 7 不同激活函数和隐层节点数对应的中心疏松预测准确率 Fig. 7 Testing accuracy of the center porosity corresponding to differ鄄 ent activation functions and the hidden layer node 图 8 不同激活函数和隐层节点数对应的中心偏析预测准确率 Fig. 8 Testing accuracy of the center segregation corresponding to different activation functions and the hidden layer node 由图 7 可知,在验证连铸坯中心疏松缺陷预测 模型的有效性时发现,模型隐含层神经元个数在 (0,20]时模型的预测准确率逐渐增加,隐含层神经 元个数在(20,120] 时模型的预测准确率整体呈下 降趋势,由此可知当隐含层神经元个数超过 20 时, 模型的训练开始出现过度拟合;同样对于连铸坯中 心偏析缺陷预测模型,在验证模型的有效性时发现 模型的隐含层神经元个数在(0,20] 时模型的预测 准确率基本不变,隐含层神经元个数超过 20 时模型 的预测准确率整体呈下降趋势,具体如图 8 所示,由 ·819·