0I:10.13374/j.1ssn1001053x.1997.01.012 第19卷第1期 北京科技大学学报 VoL19 No.1 1997年2月 Journal of University of Science and Technology Beijing Feb.1997 人工神经网络方法在Osprey过程中的应用* 傅晓伟张济山 孙祖庆 北京科技大学新金属材料国家重点实验室,北京100083 摘要以BP反传理论为基础,建立了对Ospr©y过程的前向多层神经网络,并对其进行测试.利用 这一方法研究了Osprey过程中部分参数对孔隙度的影响.结果证明该网络较好地实现了学习和 预测. 关键词神经网络,Osprey,孔隙度 中图分类号TG394 Ospr©y是70年代起逐渐发展起来的一种新型的快速凝固技术,具有直接成形、低氧化、 低成本及优异的组织与性能等特点.近年来Ospr©y过程受到了广泛的关注,并因此获得了很 快的发展山.但是,由于其过程中参数多而交互作用复杂,因而很难选择合适的实验参数以及 实现质量控制.本文采用人工神经网络方法从工程的角度来探讨过程参数对质量的影响, 1 Osprey过程与人工神经网络方法 在Ospr©y过程中,熔融金属或合金在保护气氛中被高压气体雾化成弥散的微粒,喷射到 金属基板表面并沉积成致密的沉积坯,其组织细小、均匀,冷、热加工性能好.它克服了粉末冶 金技术工序复杂、氧化严重的问题,其优点是其他传统凝固技术所无法比拟的, 尽管如此,在该过程中存在大量的独立参数及非独立参数,如材料种类、熔体过热度、喷 嘴几何形貌、导管直径、金属流率、雾化气体压力及流量、雾化室状况、基板温度、位置及运动 情况等等.这些参数之间交互作用复杂,很难直接预测最终沉积坯质量.国外的多数学者采用 建立近似模型的方法来模拟这一过程,这需要对Ospr©y过程进行大量的实验观测及掌握较 深的流体力学、气体动力学及凝固理论.由于采取了一些假设以及近似处理,这些模型与实际 的观测结果都有很大的误差, 人工神经网络计算方法的优势在于它可以不考虑各组数据之间的严格数学关系.在 Osprey过程中,我们模拟了一个熟练技术人员的实际操作,他只需知道某组操作参数,就会预 知沉积材料的性能,操作时间越长,预测越准确.因此,从材料工程的角度,采用人工神经网络 的方法结合部分实际测试结果来模拟过程参数与沉积坯质量的关系是一种新的思路. 2前向多层神经网络的反传学习算法 结合具体的工艺情况,考虑采用多层神经网络的反传理论(Back-Propagation,缩写为BP) 1996-0919收稿 第一作者男24岁博士 ◆国家自然科学基金资助项目
第 卷 第 期 年 月 北 京 科 技 大 学 学 报 。 人工神经 网络方法在 过程 中的应用 ’ 傅晓伟 张济 山 孙祖庆 北京科技 大学新 金属 材料 国家重点实验室 , 北京 摘要 以 反传理论为基础 , 建立 了 对 过程 的前向多层神经 网络 , 并 对其进行测 试 利 用 这一方法 研究了 过 程 中部分参数对孔 隙度 的影 响 结果证 明该 网络较好地 实现 了学 习和 预测 关健词 神经 网络 , , 孔 隙度 中图分类号 是 年代起 逐 渐 发展起 来 的 一 种新 型 的快 速凝 固技 术 , 具 有 直 接 成形 、 低 氧化 、 低成本及 优异 的组织 与性 能等特点 近年来 过程 受到 了广泛 的关注 , 并 因此获得 了很 快 的发展 但是 , 由于其 过程 中参数多 而 交 互 作用 复杂 , 因而很难 选 择合 适 的实验参数 以 及 实现质量控制 本 文采用人 工 神经 网络方法 从工程 的角度来探讨过程参数对质量 的影 响 过程与人工神经网络方法 在 过程 中 , 熔 融金 属或合金 在 保护气氛 中被高压气体雾化成弥散的微粒 , 喷射到 金属基板表面并沉积成致 密的沉积坯 , 其组 织 细小 、 均匀 , 冷 、 热加 工性 能好 它 克服 了粉末 冶 金技术工序复杂 、 氧化严重 的 问题 , 其优点是 其他传 统凝 固技术所 无法 比拟 的 尽 管如 此 , 在 该过 程 中存 在 大 量 的独立 参数及 非独 立参数 , 如 材 料 种 类 、 熔体过 热度 、 喷 嘴几何 形 貌 、 导管直 径 、 金 属 流率 、 雾 化 气体压 力及 流量 、 雾 化 室 状况 、 基 板温 度 、 位 置 及 运 动 情况等等 这些 参数之 间交 互作用 复杂 , 很难直接 预测最终沉积坯质量 国外 的多数学 者采用 建 立 近似模 型 的方 法来 模 拟 这 一 过 程 , 这 需 要 对 过 程 进 行 大 量 的实验 观 测 及 掌握 较 深 的流体力学 、 气体动力学及凝 固理 论 由于 采 取 了一些假设 以及 近似处理 , 这些模 型 与实 际 的观测结果都有很大 的误差 人 工 神 经 网 络 计 算方 法 的 优 势在 于 它 可 以 不 考 虑 各 组 数 据 之 间 的 严 格 数学 关 系 在 过程 中 , 我们模拟 了一个熟 练技术 人 员 的实 际操作 , 他只需 知道某 组操作参数 , 就 会预 知沉积材料 的性 能 , 操作 时 间越 长 , 预测越 准确 因此 , 从材 料工程 的角度 , 采 用人 工神经 网络 的方法结合部分实 际测试结果来模拟过程 参数与沉积坯 质量 的关系是 一种新 的思 路 前 向多层神经网络 的反传学 习算法 结合具体的工 艺情 况 , 考虑采用多层 神经 网络的反传理 论 一 , 缩写 为 一 一 收稿 第一作者 男 岁 博士 国家 自然科 学基金 资助项 目 DOI :10.13374/j .issn1001-053x.1997.01.012
*60* 北京科技大学学报 1997年第1期 来处理Ospr©y过程中的参数优化问题.网络不仅有输入层节点、输出层节点,而且有隐层节 点.隐层可以是一层,也可以是多层,当信号输入时,首先传到隐节点,经过作用函数后,再把 隐节点的输出信号传播到输出层节点,经过处理后给出输出结果.节点的作用函数通常选用 S型函数,即: f(x)=1/(1+e-) 图1给出了反传学习过程原理图.在这种网络中,学习过程由正向传播和反向传播组成. 在正向传播过程中,输人信号从输入层经隐层单 权修正 元逐层处理,并传向输出层,每一层神经元的状态 误 只影响下一层神经元的状态,如果在输出层不能 得到期望的输出,则转人反向传播,将输出信号的 训 误差沿原来的连接通路返回.通过修改各层神经 练信 元的权值,使得误差信号最小, 设有n个节点的任意网络,各节点之特性为 输片 Sigmoid型.为简单起见,认为整个网络只有1个 输 隐 层 输出y,任意节点的输出为O,设有N个样本(x 层 层 k=1,2,“N,对某一输人x,网络的输出值为 图1反传学习原理 y,节点i的输出为O4,节点j的输入为: nett=∑W,Ok 式中W是i,j之间的连接权. 定义一个能量函数来表示期望输出与实际输出接近的程度,这里使用平方型误差函数 E.E可定义为: E=总 反传学习中,权系数修改公式为: △W(k+1)=òO+a△W(k) 其中,k-所加样本号,n-学习系数,“-动量因子,ò,-误差. 改进算法如下: (1)动量修改法 △W,(m+1)=n∑òO与+a△Wm) 此处m为送代步数. (2)学习系数的最优化 选择根据误差是否降低而定, 从理论上说,3层网络可完成任何复杂的函数,但更多层网络有可能会更经济,学习更 快增加隐层的数目将会提高网络的处理能力,同时,必须增加训练样本,训练时间也随之加 长,输入层代表网络的数据.输人节点的个数是根据数据源的特征而定,隐层的节点数则是通 过试验法来确定.神经网络输出的个数是由所使用的网络类型和期望输出的类型决定的
· · 北 京 科 技 大 学 学 报 年 第 期 来处理 过 程 中的参 数 优 化 问题 网 络不 仅 有输 人 层 节 点 、 输 出层 节点 , 而 且 有 隐层 节 点 隐层 可 以 是 一 层 , 也 可 以 是 多 层 当信 号输 人 时 , 首先 传 到 隐节 点 , 经过作 用 函数后 , 再把 隐节 点 的输 出信 号传播 到 输 出层 节点 , 经 过 处理 后 给 出输 出结果 节 点 的作用 函数通 常选 用 型 函数 , 即 一 工 图 给 出 了反传学 习 过程 原理 图 在 这 种 网络 中 , 学 习过 程 由正 向传播和 反 向传播组成 权修正 信号训练 隐层 层 输人层 在 正 向传 播 过 程 中 , 输 人 信 号 从 输 人 层 经 隐层 单 元逐 层处理 , 并传 向输 出层 , 每 一 层 神经元 的状态 只 影 响下 一层 神 经 元 的状 态 如 果 在 输 出层 不 能 得 到 期望 的输 出 , 则 转入 反 向传播 , 将 输 出信 号 的 误 差 沿 原 来 的连 接 通 路 返 回 通 过 修改 各层 神 经 元 的权值 , 使得 误差 信 号最小 设 有 个 节 点 的任意 网络 , 各 节 点 之 特性 为 型 为 简单起 见 , 认 为 整 个 网 络 只 有 个 输 出 , 任意 节 点 的输 出为 口,, 设有 个 样 本 , 劝 , , …, , 对某 一输人 , 网络 的输 出值 为 , 节 点 的输 出为 口 , 节点 的输人 为 图 反传学习原理 一 叉叽久 式 中 叽是 , 之 间 的连接 权 · 定 义 一 个 能 量 函数来 表 示 期望 输 出 与实 际输 出接 近 的程 度 这 里 使用 平 方 型 误 差 函 数 可 定义 为 一 菩 ,妙 一 凡 反 传 学 习 中 , 权 系 数修改公 式 为 △代 。氏 △峨 其 中 , 一 所加 样 本号 , 叮 一 学 习 系数 , 一 动量 因子 , , 一 误差 · 改进算法 如下 动量 修改法 △代 ‘ 一 “于 。 , 、 “ △砚 此处 为迭代步 数 学 习 系数 的最 优化 选 择根 据误差 是否 降低 而 定 从 理 论 上 说 , 层 网 络 可 完 成 任 何 复 杂 的 函 数 , 但 更 多 层 网络 有 可 能 会更 经 济 , 学 习更 快 增 加 隐层 的数 目将 会提 高 网络 的处理 能 力 , 同 时 , 必 须 增 加 训 练样 本 , 训练时间也 随之加 长 输人 层代 表 网络 的数据 输 入 节 点 的个 数 是 根 据 数据源 的特 征而定 隐层 的节点数则是通 过试验 法来 确定 神 经 网络输 出的个 数是 由所使 用 的 网络类型和期望输 出的类型决定 的
Vol.19 No.1 傅晓伟等:人工神经网络方法在Osprey过程中的应用 ·61· 3 实验过程及BP网络的建立 (1)运行4炉次的基本过程参数如表1所示. 表1部分运行参数 操作次数 (GIM)Ikg·kg 原料质量kg 沉积坯厚度/mm 运行时间s 1 0.65 16.1 19 64 2 0.24 16.0 19 24 3 0.33 16.3 25 30 4 0.49 15.7 19 48 (2)采用ASTM B311-58标准测试对应不同时间截面下的孔隙度值,结合过程参数,获 得学习样本.具体数值参见图2. 0.16 (3)为排除参数本身数量级对训练的 ·原始样本 0.14 。训练结果 影响,对学习样本实行了归一化处理 0.12 (4)根据试验法确定以下结构: 0.10 输人层含4个节点,2个隐层,各含6个节 蓝0.08 点,输出层含1个节点,学习规则为 20.06 “normal-cumulative delta”规则,作用函数 0.04 选择Sigmoid型函数.输人层有1个控制误 0.02 差的“bias”.学习系数n为0.9,动量因子a 0 10 2030 405060 样本序号 为0.7,送代2×105次. (5)用C语言编制程序在PC-AT兼 图2应用神经网络后的学习结果与实际数据的对比 容机上通过, 4结果与讨论 根据上述过程建立了一个BP神经网络,计算结果见图2,图3(共58组输入样本).从图2 可以看出,通过对训练样本的学习过程可见,该网络的学习结果与实际数据符合得相当好,这 也验证了神经网络计算方法在处理大量非线性数据时的优势.图3是采用了两组假想的理想 数据,用来预测当严格控制过程参量如气流液流速率比G/M值及过热度△T为恒定值时,沉 积质量随时间的变化.计算结果表明,当运行参数固定时,初始的一段时间内沉积坯的孔隙度 值较高,当达到某一时刻后,孔隙度将逐渐达到一个稳定值;G/M值的升高将增大沉积坯的 孔隙度,这些都与实际情况是符合的.深入理解这一点将对提高高质量沉积坯的收得率有很 大的意义. 除此以外,如果采用试验法进行更多的实验,分别设定不同的气流液流速率比G/M值 及过热度△T值,观察对比孔隙度结果即可找到最佳的参数;取时间参数一定,分别固定 G/M值及△T值,考察二者在一定范围内的变化对孔隙度的影响,则可以获得较好的匹配参
傅 晓伟等 人工 神经 网络方法 在 过程 中的应用 实验过程及 网络的建立 运行 炉次 的基 本过 程 参数如 表 所 示 表 部分运行参数 操作 次数 川 · 一 , 原料 质量瓜 沉积坯厚度阳口 运行 时间 , ︼气︸ ‘,,︸、 八 ‘,‘,且 采用 一 标 准测 试 对应不 同时 间截 面下 的孔 隙度值 , 结合过 程参数 , 获 卜 口︸ 侧魁裙 得学 习样本 具体数值参见 图 为 排 除参数 本 身 数 量 级 对训 练 的 影 响 , 对学 习样本 实行 了 归一 化处理 根 据 试 验 法 确 定 以 下 结 构 输 人 层 含 个 节 点 , 个 隐层 , 各 含 个 节 点 , 输 出 层 含 个 节 点 , 学 习 规 则 为 “ 一 ” 规 则 , 作 用 函 数 选择 型 函数 输人层有 个控 制误 差 的 “ ” 学 习 系数 刁 为 , 动量 因子 为 , 迭代 次 用 语 言编 制程 序 在 一 兼 容机上通 过 原始样 本 。 训练结果 脚、 气 、 曰‘ 一 一 曰‘ 一 样本序号 图 应用神经网络后的学习结果与实际数据的对 比 结果与讨论 根据上 述过程建 立 了一个 神经 网络 , 计算结果 见 图 , 图 共 组输人 样本 从 图 可 以 看 出 , 通过 对训 练样本 的学 习过程 可 见 , 该 网络 的学 习结果 与实 际数据符合得 相 当好 , 这 也验证 了神经 网络计算 方 法在处理 大量 非 线性 数据 时的优势 图 是 采 用 了两组假想 的理 想 数据 , 用来 预测 当严格 控制过 程参量 如气流液流 速率 比 值及 过 热度 △ 为恒定值 时 , 沉 积 质量 随时间 的变化 计算结果 表 明 , 当运行 参数 固定 时 , 初 始 的一段 时 间 内沉积坯 的孔 隙度 值较高 , 当达到某 一 时刻后 , 孔 隙度将逐 渐 达到 一个稳定 值 值 的升高将增 大沉积坯 的 孔 隙度 , 这 些 都 与实 际情 况 是 符合 的 深 人 理 解 这 一 点 将 对提 高高质量 沉积坯 的收得 率有很 大 的意义 除此 以 外 , 如果 采 用 试验法 进 行 更 多 的实验 , 分别设定不 同的气流液 流速 率 比 值 及 过 热 度 △ 值 , 观 察 对 比孔 隙度 结 果 即 可 找 到 最 佳 的 参 数 取 时 间 参 数 一 定 , 分 别 固 定 值及 △ 值 , 考 察二 者在 一定范 围 内的变化 对孔 隙度 的影 响 , 则可 以获得 较好的匹 配参
·62· 北京科技大学学报 1997年第1期 数.进一步地,考虑到更多的过程参数如沉积 0.10 距离、基板运动速度等等,如果能够得到以上 oG/M=0.4 0.08 0.3 参数之间的关系曲线,将对工艺的控制、优化 及成形理论非常有利.因此,在对Osprey过程 0.06 中的操作参数进行优化时,采用神经网络方 法可以替代大量的实验而节省资金,这一点 0.04 在参数众多的情况下表现得更为突出.同时, 神经计算也可以作为理论分析的参考手段, 0.02L 0 102030405060 通过实验还发现,当存在相互矛盾的数 t/s 据时,将会影响神经网络的学习速度及精度, 图3用神经网络预测时间对沉积坯孔隙度的影响 因此说,训练样本的数目及精度是决定神经网络处理能力的重要因素,大量的高精度的训练 样本的获得是运用神经网络计算的必要前提, 5结束语 实验及计算表明,实验所用的BP网络经训练后能够较好地实现对数据的学习及预测.如 果能够提供大量的高精度的训练样本(各种操作参数下的数据记录),该网络将能够更准确地 摹仿这一实际过程,而最终达到对过程参数的优化. 参考文献 1 Leatham A G,Brooks R G,Coombs J S,Ogilvy A J.The Past,Present and Future Developments of the Osprey Preform Process.In:Proc ICSF-90.Swansea,1990.17 2宿延吉,黄国建,于青松.神经网络理论及应用.哈尔滨:东北林业大学出版社,1993 3焦李成.神经网络系统理论.西安:西安电子科技大学出版社,1991 Application of Artificial Neural Networks in Osprey Process Fu Xiaowei Zhang Jishan Sun Zuging State Key Laboratory of Advanced Metals and Materials,UST Beijing,Beijing 100083,China ABSTACT Artificial neural networks for the Osprey process based on back-propagation are established and some tests are conducted.The relationship between the processing parameters and the outputs are simulated with the networks.It is shown that neural networks are successfully used to pridict porosity values of the process. KEY WORDS neural networks,Osprey,porosity values
北 京 科 技 大 学 学 报 年 第 期 数 进 一 步地 , 考 虑 到 更 多 的过 程 参 数 如沉 积 距离 、 基 板运 动 速 度 等 等 , 如 果 能 够 得 到 以 上 参数之 间 的关 系 曲线 , 将 对工 艺 的控 制 、 优化 及成形理论非 常有 利 因此 , 在 对 过 程 中 的操 作 参数 进 行 优 化 时 , 采 用 神 经 网 络 方 法 可 以 替 代 大 量 的 实 验 而 节 省 资金 , 这 一 点 在 参数 众多 的情 况 下 表 现得 更 为突 出 同时 , 神 经计算 也 可 以 作 为理论分 析 的参考手段 通 过 实 验 还 发 现 , 当存 在 相 互 矛 盾 的 数 据 时 , 将 会影 响神 经 网 络 的学 习速度 及 精 度 , 侧 · 置曰 八, 刃 一一 一一一一 一 占一一 司 图 用 神经网络预测时间对沉积坯孔隙度的影 响 因此说 , 训 练样 本 的数 目及 精度是 决 定神 经 网络处理 能力 的重要 因素 , 大量 的 高精 度 的训 练 样本 的获得是 运 用 神经 网络计算 的必要 前提 结束语 实验及 计算 表 明 , 实验 所 用 的 网络经 训 练后 能够 较好地 实现 对数据 的学 习及 预测 如 果 能够提供大量 的高精度 的训 练样 本 各 种操 作 参数下 的数据记 录 , 该 网络将能够更 准确地 摹仿这 一 实 际过程 , 而 最 终达 到 对过程 参数的优化 参 考 文 献 , , , , 一 , 宿延 吉 , 黄 国建 , 于 青松 神经 网络理论及 应用 哈尔滨 东北林业大学 出版社 , 焦李成 神经 网络 系统理论 西安 西 安 电子科技大学 出版社 , , , , 一