D0I:10.13374/j.issn1001-053x.1999.03.017 第21卷第3期 北京科技大学学报 Vol.21 No.3 1999年6月 Journal of University of Science and Technology Beijing June 1999 基于人工神经网络的扁钢轧制力模型 赵伦” 王邦文) 韩素梅) 1)北京科技大学机械工程学院,北京1000832)北京市机械工业学校,北京100045 摘要根据BP人工神经网络算法原理,结合某厂型钢轧机轧制扁钢时的轧制力实测数据, 对扁钢轧制力进行建模.结果表明,神经网络用于轧制力建模是可行的,所建模型系统误差<1%, 模型计算值与实测值的偏差<4%,较好地反映了实际轧制过程的特征. 关键词系统建模:神经网络:轧制力模型 分类号TG335;TG335.5:Q954.52 目前的轧制力模型一般是在一定的假设条 样本模式对,上标k表示训练对的序号.对每一 件下,基于经典轧制理论而建立起来的数学模 个样本模式对进行如下的正向传播和反向传播 型,这种模型与复杂的真实轧制过程有时相差 处理 甚远,模型精度受到轧制条件的限制,而且建模 (1)正向前馈计算. 过程复杂,工作量大,而基于神经网络进行的系 当输入第k个数据x)时,隐含层结点h的 统建模可以弥补这一本质上的不足四.由于后者 总输入(加权和)为: 建模时无须对研究对象作任何假设,模型能够 S()=∑x()·W (1) 以其良好的映射逼近能力更逼近真实的轧制过 采用S型作用函数处理输入与输出的关系,隐 程.本文利用川威厂的实际轧制数据,根据BP 含层结点h的输出为: 算法原理,建立轧制扁钢时的轧制力模型. y(k)=1+e (2) 1BP神经网络的算法原理 相应地,输出层结点j的输出为: 1.1神经网络的BP算法 y)=1+e四W (3) BP网络模型的学习过程由正向传播和反 如果用k个输入的所有输出结点的误差平 向传播组成.在正向传播中,输入信息由输入层 方总和作为网络训练指标,则有: 经过隐含层并传向输出层,如果在输出层得不 网-=2d因-r (4) 到理想(期望)的输出值,则转向误差反向传播 由于转移函数(S型函数)是连续可微的,很显 过程,计算输出层和隐含层各单元的输出误差, 然,()也是每个权值的连续可微函数. 并据此反向依次修正各层神经元的连接权值, (2)误差反向传播修正各层权值, 最终实现输出误差最小 采用梯度规则,由J对各个W求导,可以求 假设网络结构有3层:在输入层有n个输 得使J最小的梯度,作为调整权值的反向, 入向量:1个隐含层:在输出层有m个输出向量. ①由隐含层到输出层的权值W的调整: 输入层结点、隐含层结点和输出层结点分别用 Aw,=-72-z6因y因 (5) 下标i,h,j表示;由输入结点x到隐含层的h结 6k)=[d()-yk)]f'(S(k) (6) 点的权值用W表示:由隐含层结点h到输出层 ②由输入层到隐含层的权值的调整: 结点j的权值用W表示, 对于输入数据x,设其目标输出为d,而实 naJ2=nΣ6.x因 △Wa=一W (7) 际输出为y.为了训练网络,由[,y]组成训练 (k)=ΣWw·δ()·f'(S(k) (8) 在实际应用时,常用当前误差对权值进行 1998-09-05收稿赵伦男,28岁,硕士生 调整,这样,式(5)和式(7)中对k的求和项就可
1 2 第 卷 第 期 3 l , 9 9 年 6 月 北 京 科 技 大 学 学 报 OJ u r n a l o f U n i v e sr iyt o f S e i e n e e a o d eT c h n o l o gy B e小 n g V 6 1 . 2 1 J U n e N 0 . 3 1 9 9 9 基 于 人 工神 经 网络 的扁 钢 轧 制 力模 型 赵 伦 ” 王 邦文 ” 韩素梅 ” l) 北京科 技大 学机械工 程学 院 , 北京 10 0 83 2) 北京市机 械 工业学校 , 北 京 10 0 0 45 摘 要 根据 B P 人 工神经 网络 算法 原理 , 结合 某厂 型钢轧 机轧 制扁钢 时 的轧制 力实 测数据 , 对扁钢 轧制 力进行建模 . 结果表 明 , 神经 网络用于轧制 力建模是可行 的 ,所建模型 系统误差 < 1% , 模 型计算 值与 实测值 的偏 差 < 4% , 较好地 反映 了实际 轧制 过程 的特征 . 关键 词 系 统建 模 : 神经 网络 ; 轧 制力模 型 分类 号 T G 3 3 5 ; T G 3 3 5 . 5: Q 95 4 . 5 2 目前 的轧制力模 型一般 是在一 定的假设条 件下 , 基于经 典轧制理论而 建立起 来 的数学模 型 . 这种模 型与复杂 的真 实轧制过程有时相差 甚远 , 模型精度受到轧制条件 的限制 , 而且建模 过程复杂 , 工作量大 , 而基于神经网 络进行 的系 统建模可 以弥补这一本质上的不足 `1] . 由于后者 建模 时无须对研究对象作任何 假设 , 模型 能够 以其 良好 的映射逼近 能力 更 逼近真 实的轧制过 程 . 本文 利用 川威厂的实际 轧制数据 , 根据 B P 算法 原理 , 建立轧制 扁钢 时 的轧制力模型 . 样 本模式对 , 上标 k 表示 训 练对 的序 号 . 对每一 个 样本模式对进行如下的正 向传播和反向传播 处理 . ( l) 正 向前馈计算 . 当输入第 k 个 数据 式k) 时 , 隐含层结 点 h 的 总输入 ( 加权和 ) 为 : hS (k) 二 艺姜(k) · 叽 ( l) 采用 S 型 作用 函 数处 理输入 与 输 出 的关系 , 隐 含层 结 点 h 的输 出 为 : 凡 (k) 1 + e 一 公 { k) 矶 ( 2 ) 1 B P 神 经 网 络 的算法原 理 1 . 1 神经 网络 的 B P 算法 B P 网络 模 型 的 学 习 过 程 由正 向传播和 反 向传播组 成 . 在正 向传播 中 , 输入信息 由输入层 经 过隐 含层 并传 向输 出 层 , 如 果 在输 出层 得 不 到 理想 ( 期望 ) 的输 出值 , 则 转 向误差 反 向传播 过程 , 计算输 出层和 隐含层 各单元的输 出误 差 , 并据此反 向依次修 正 各层 神经元 的连接权值 , 最 终实现输 出误差 最 小 `2] . 假设 网络 结构有 3 层 : 在输 入层有 n 个输 入 向量 ; 1个 隐含层 ; 在输 出层有 m 个输 出 向量 . 输入层结 点 、 隐含层 结点和 输 出层 结点分别用 下标 i , h , j 表示 ; 由输 入结点 x ` 到隐含层 的 h 结 点 的权值用 叽 表示 ; 由隐 含层 结 点 h 到 输 出层 结点 j 的权值用 hWj 表示 . 对于 输入 数据 x , 设其 目标 输 出为 d , 而 实 际输 出为 y . 为了 训练 网 络 , 由〔犷 ,犷]组 成训 练 相应地 , 输 出层 结点j 的输 出 为: 以k) = 一奥丽不 (3) z 了 、 一 / l + e 一 份少“ 叼 爪 、 一 产 如果 用 k 个输入 的所有输 出 结点的误差 平 方总 和 作 为网 络 训 练指标 , 则 有 : (J 。 一 告千于〔铸(劝 一 、 (k) 〕 ’ (4 , 由于 转移 函数 s( 型 函 数 ) 是 连续可 微 的 , 很 显 然 , (J 哟 也 是 每个权值 的连续可 微 函 数 . (2 ) 误 差 反 向传播修正 各层权 值 . 采用梯度规则 , 由 J 对 各 个 不求 导 , 可 以求 得 使 J 最 小的梯度 , 作 为调整权值 的反 向 . ① 由隐含层 到输 出层 的权 值 叽 的 调整 : △、 一樱 一 咧 劝 、 (5) 以k) =[ 以k) 一 以k)] .f ` (以k) (6) ② 由输入 层到 隐含层 的权 值 的调 整 : △。 一樱 一 琳.kx() ,k() (7) 民 (k) = 艺叽 · 氏 (k) · f ` (冬 (k) ) (8 ) 19 9 8 一 09 一 0 5 收稿 赵 伦 男 , 28 岁 , 硕 士生 在 实际 应用时 , 常用 当前误 差 对权值进行 调整 , 这 样 , 式 (5 ) 和 式 ( 7) 中对 k 的求和 项 就可 DOI: 10. 13374 /j . issn1001 -053x. 1999. 03. 017
·278· 北京科技大学学报 1999年第3期 省掉.同时,为了加速网络的训练速度,改善其 度、轧制速度和所轧材质特性的函数,所以,网 收敛性,在权值调整时附加一个冲量项.于是, 络模型的输出层神经元数为1,而输入层神经 权值调整公式为 元数为4. 对输出层:△W(k+1)=ndy(K)+a·△W(K)(9) (2)隐含层神经元数目的确定要进行优化设 对输入层:△W(k+1)=n·d4x()+a·△W()(10) 计,其方法是通过试验来确定的,既通过取不同 其中,a为冲量因数,或称为惯性因子,n为学 的隐含层神经元数,对一定的输入样本和输出 习因子.一般a=0.60.95,1=0.450.90. 样本考查网络的收敛速度及对已知样本的工作 12BP算法的软件实现 结果.本文通过大量试验比较(见表1),选取隐 BP算法实际上是求误差函数的极小值,它 含层神经元数为6. 通过多个学习样本的反复训练并采用最速下降 表1不同隐含层神经元数的计算结果 算法,使得权值沿误差函数的负梯度方向改变, 隐含层 迭代 计算结果 并收敛于最小点,根据BP算法原理,在计算机 神经元数/个数/次 最大误差/% 上基于C语言开发了相应的可实现程序,其程 20 8 15 序框图如图1所示. 10 4 14 8 163 0 开始 6 75 4 5 2 J 初始化 4 2 17 2 2 17 样本集输入 基于上面分析,构造出如图2所示的网络 计算各层输出 模型结构. 计算输出层误差 输出层 计算隐含层误差 隐含层 修正权值 模式学习结束 输出层 p<npattern 是 否 检验误差<e 是 材质特性轧制温度轧制速度压下率 图2基于BPNN的型钢轧制力网络模型 是 香 学习次数<上限? 否业 2.2数据预处理 结果输出← 采集了轧制同一材质、同一轧制道次的压 下率、轧制温度、轧制速度等数据,并考虑到对 结束 实际轧制过程进行建模训练时,所采集的现场 图1BP算法程序框图 数据通常会存在各种干扰因素,因此,为使所建 模型具有泛化能力,应把所采集的数据分为训 2基于人工神经网络的型钢轧制力 练集和测试集, 同时,对期望输出值进行归一化处理,对输 模型 入层参数进行量纲为一的归一化处理,使各特 2.1网络模型的优化设计 征变量在研究中所处的地位大致相同,避免网 (1)根据川威厂型钢轧机的轧制工艺特点, 络模型迭代计算时数值过于集中在某些神经元 某一道次的轧制力是该道次的压下率、轧制温 和权值上而降低模型的解算精度
一 2 7 8 . 北 京 科 技 大 学 学 报 1 9 9 9 年 第 3 期 省掉 . 同 时 , 为 了加速 网 络 的训 练速度 , 改善其 收敛性 , 在权 值调 整 时 附 加一 个 冲量项 . 于 是 , 权 值调 整 公式 为 对 输 出层 :△叽k( 十 1 ) 一 护 .6j 外 (k) + .a △叽( k) ( 9) 对输 入层 :△叽k( + 1卜 护咨 。 · x,( k) + .a △叽 (k) ( 10) 其 中 , a 为 冲 量 因数 , 或称为惯性 因 子 , 叮为学 习 因 子 一般 a 二 .0 6一 .0 95 , 粉= .0 45 ~0 .9 .0 L Z B P 算 法的软件 实现 B P 算法 实际 上 是求 误 差 函数 的极小值 , 它 通过多个学习 样本 的反 复训练并采用最速下 降 算法 , 使得权 值沿误差函 数的负梯度方 向改变 , 并 收敛 于 最小 点 . 根据 B P 算 法原理 , 在计 算机 上基于 C 语 言开 发 了相 应 的可 实现程序 , 其程 序框 图如 图 1 所示 . 度 、 轧 制速 度和 所轧材质特性的函 数 , 所 以 , 网 络模型 的 输 出层 神经 元 数为 1 , 而 输入 层 神经 元数为 4 . (2 )隐含 层 神经 元数 目的确 定 要进行优化 设 计 , 其 方法 是 通过试验来确 定 的 , 既通过 取不 同 的 隐 含层 神经元数 , 对 一 定 的 输入 样本和 输 出 样本考查 网络 的 收敛速度及 对 己 知 样本 的工作 结果 . 本文 通过 大量试验 比较 ( 见 表 1 ) , 选 取 隐 含层 神经元数 为 6 . 表 1 不同隐含层神经元数的计算结果 隐含层 神经元数 / 个 迭代 数 / 次 计算结果 最大误差 / % 开始 初始化 样本篓 计算输 出层误差 计算隐含层 误 差 修正 权值 模式学 习结束 P < n P a t et nr ? 检验误差 < 。 m ax 学 习次数 < 匕限 ? 结果输 出 结束 基于 上 面 分析 , 构造 出如 图 2 所示 的 网络 模型 结 构 . 输出层 隐含层 输 出层 材质特性 轧制温度 轧制速度 压下率 图 2 基干 B P N N 的型钢轧制力网 络模型 图 1 B P 算法程序框图 2 基 于 人 工 神 经 网 络 的型钢 轧 制 力 模型 2 . 1 网络 模型 的优 化 设计 ( l) 根据 川威 厂 型钢 轧机 的轧制工 艺特 点 , 某一 道次 的轧制力是 该 道次 的压 下 率 、 轧 制温 .2 2 数据 预 处理 采集 了轧制 同一 材 质 、 同一 轧 制道 次的 压 下 率 、 轧制 温度 、 轧制速度等数据 , 并考虑到 对 实 际轧制过程进行 建模 训练 时 , 所采集 的现场 数据通常会存在各种干扰 因素 , 因此 , 为使所 建 模型 具 有泛 化能力 , 应把所采集 的数据 分 为训 练集和 测 试 集 . 同 时 , 对 期 望输 出值进行 归 一 化处 理 , 对 输 入 层 参 数进 行量 纲 为一 的归 一 化 处 理 , 使各特 征 变量在研 究中所处 的 地位大致 相 同 , 避 免网 络模型 迭代计算 时数值过于 集 中在某些神经元 和 权值 上 而 降低模型 的解算精 度
VoL.21 No.3 赵伦等:基于人工神经网络的扁钢轧制力模型 279· 2.3BP算法的改进 和控制轧制的要求,而传统理论计算误差达到 传统的BP算法存在学习时间长、网络收敛 10%. 慢的缺点.为了使所建模型响应快、精度高,需 在利用BP原理建立轧制力的模型时,应该 要在传统的BP算法的基础上进行改进,其方法 注意以下几点: 是:采取批处理的方式来修正网络模型的连接 (1)神经网络的构造直接影响到模型学习的 权值,即在所有学习样本都输入后计算系统的 系统误差核算法的收敛速度,所以所构造的网 总误差,若系统误差不满足要求则修正权值,以 络模型一定要符合所研究的对象. 保证系统误差在学习过程中总是向减小的方向 (2)建模采用批处理方式来修正网络连接权 变化,并加快系统的收敛速度.此外,计算时选 值,可以保证误差函数向减小的方向变化,这种 取(-1,+1)内的权值作为权值初始化范围. 方式可以加快训练的收敛速度 2.4计算结果与分析 (3)建模用的学习速率n和动量因子a对收 对数据进行归一化预处理后,用自行编制 敛速度影响很大,应该不断地变化, 的BP算法程序进行了计算,结果如表2所示. (④)在设计神经网络结构时,除使网络的训 图2型钢轧制力模型计算结果 练误差最小外,还要充分考虑网络的复杂性、归 实测值kN模型输出值N误差% 纳能力和容错性, 598.25 591.50 1.13 600.57 591.59 1.05 3结论 588.32 591.75 0.60 590.82 591.69 0.15 (1)将神经网络算法原理引入轧制领域,用 578.65 592.07 2.30 于轧制压力的建模是可行的, 580.95 591.78 1.90 (2)根据BP神经网络原理编制的算法程序 589.36 591.83 0.40 具有一定的通用性,针对不同的轧机和不同的 585.34 591.75 1.10 产品规格,只需改动相关的数据文件即可实现 588.36 591.59 0.54 建模 604.10 591.45 2.10 590.30 591.83 0.25 参考文献 570.40 591.92 3.77 1王邦文,杨光,徐蜂,等,基于人工神经网络铝箔轧机 579.68 591.73 2.10 轧制力模型.北京科技大学学报,1997,19(2):173 从表2看出,所建的网络模型在计算轧制 2焦李成主编.神经网络计算.西安:西安电子科技大 学出版社,1993.10 力时,误差在4%以内,完全能够满足工程计算 Modeling of the Rolling Force Based on Artificial Neural Networks Zhao Lun,Wang Bangwen",Hai Sumer) 1)Mechanical Engineering School,UST Beijing,Beijing 100083,China 2)Beijing Mechanical School,Beijing 100045,China ABSTRACT Based on the principle of BP neural networks,the rolling force model is created after thor- oughly analyzing and processing the data of 400 mm mill.It states that the difference between the real value and the output of the model is in order of 4 percent.The model on basis of BPNN is practical and it reflects the real feature of the rolling process. KEY WORDS system modeling;neural networks;rolling force model
l b V . 2 1 0 N . 赵伦等 3 : 基于人工神经网络 的扁钢轧制力模型 . 2 7 9 . 2 . 算法的 改进 B 3 P 传统 的 算法存在学 习 时 间长 B P 、 网络收敛 慢 的缺点 . 为 了使所建模型 响应快 、 精度高 , 需 要在传统的 B P 算法的基 础 上 进行改进 . 其 方法 是 : 采 取批处 理的方 式来修正 网络模型 的连接 权值 , 即在所有学习 样本都输入后 计算 系统的 总 误差 , 若系统误差 不满足要 求则修正权值 , 以 保证系统误差在学习过程中总是向减小 的方 向 变 化 , 并加快系统 的收敛速度 . 此外 , 计算时 选 取 ( 一 1 , +l ) 内的权值作为权值初始化范 围 . .2 4 计算结果 与分析 对数据进行归一 化预处 理后 , 用 自行编制 的 B P 算法程序进行 了计算 , 结果 如表 2 所示 . 图 2 型钢轧制 力模型计算结果 实测值 瓜 N 模型输 出值 /kN 误差 从 和控 制轧制 的要 求 , 而传统理 论计 算误 差 达到 10 % . 在利用 B P 原理建立轧制力 的模 型 时 , 应 该 注 意 以下 几 点 : ( 1)神经 网络 的 构造直接影 响到 模型 学 习 的 系统误差 核算 法 的 收敛速度 , 所 以所构造 的 网 络模 型 一 定 要 符 合 所 研究 的对 象 . (2 )建模采用 批处 理 方式来修正 网络连接权 值 , 可 以保证 误 差 函数 向减小的 方 向变化 , 这 种 方式 可 以加快训 练 的收敛速 度 . (3 )建模用 的 学 习速 率 叮和 动 量 因子 a 对 收 敛速 度影 响 很大 , 应该 不 断 地变化 . (4 ) 在设计 神经 网络 结 构时 , 除使网 络 的 训 练误差 最小 外 , 还 要充 分考虑 网络的 复 杂性 、 归 纳能力和 容错 性 . 5 9 8 . 25 6 0 0 . 5 7 588 . 32 5 90 . 82 5 7 8 . 65 5 8 0 . 9 5 5 8 9 . 3 6 5 8 5 . 3 4 5 8 8 . 3 6 6 0 4 . 1 0 5 9 0 . 3 0 57 0 . 4 0 5 7 9 . 6 8 5 9 1 . 50 5 9 1 . 5 9 5 9 1 . 7 5 5 9 1 . 69 5 9 2 . 0 7 5 9 1 . 7 8 5 9 1 . 8 3 1 . 13 1 . 0 5 0 . 60 0 . 15 2 . 30 1 . 90 0 . 4 0 1 . 1 0 0 . 5 4 2 . 1 0 0 . 2 5 3 . 7 7 2 . 1 0 从表 2 看 出 , 所 建的 网络模 型在计算 轧制 力 时 , 误差在 4 % 以 内 , 完全能够满 足工 程计 算 3 结论 ( 1) 将神经 网络算 法原理 引入 轧制领域 , 用 于 轧制压力 的建模 是 可 行的 . ( 2 )根据 B P 神经 网络原 理编 制 的算法程 序 具 有一 定 的通用性 , 针对不 同 的轧机和 不 同 的 产 品规格 , 只 需改动 相 关 的数据 文件 即 可 实现 建模 . 参 考 文 献 l 王邦 文 , 杨光 , 徐 峰 , 等 . 基 于人工神 经 网络 铝 箔轧机 轧 制 力模型 . 北京科 技大 学学报 , 1 9 97 , 1 9 (2) : 1 73 2 焦 李成 主 编 . 神经 网络 计算 . 西 安 : 西安 电子科 技大 学 出版社 , 19 93 . 10 755948327 99g 八C, ù、一à、ù一 M o d e l i n g o f ht e R o l l i n g F o r e e B a s e d o n A rt i if e i a l N e ur a l N e wt o kr s hZ a o L u n , ), 肠叮 B a ” g w e n , ), aH i uS m e尸, l ) M e e h an i e al E n g in e e inr g S e h o o l , U S T B e ij in g , B e ij i n g 10 0 0 8 3 , C h in a Z ) B e ij in g M e c h an i e al s e h o o l , B e ij in g l 0 0 0 4 5 , C h i n a A B S T R A C T B a s e d on ht e P irn e iPl e o f B P n e ur a l n e tw o r ks , t h e r o ll ign fo r e e m o de l 1 5 c r e at e d a ft e r ht o r - 叨沙l y an a ly inz g a n d Pr o e e s s i n g ht e d at o f 4 0 0 nu m ill . It s at t e s ht at ht e d i fe r e n c e b e wt e e n het er a l v a l u e an d t h e o u 中u t o f ht e m o d e l 1 5 i n o dr e r o f 4 P e r e e nt . hT e m o d e l o n b a s i s o f B PN N 1 5 rP a e t i e a l an d it er fl e e st 比e er a l fe a tL 双 e o f ht e or llin g Pr o e e s s . K E Y W O R D S sy s t e m m o d e lin g : n e aur l n e wt o r k s : r o llin g fo r e e m o d e l