D0I:10.13374/j.issn1001-053x.1997.05.011 第19卷第5期 北京科技大学学报 Vol.19 No.5 1997年10月 Journal of University of Science and Technology Beijing 0ct.1997 用人工神经元方法预报F钢性能 江建华马衍伟王先进 北京科技大学材料科学与工程学院,北京100083 摘要用人工神经元方法分析F钢性能与成分、加工工艺之间关系,通过实验与现场数据训练1 个前向网络的考核结果表明,该方法是用于大生产中F钢成分与工艺设计的有效方法. 关键词人工神经元,前向网络,F钢,性能预报 中图分类法TP391 IF钢性能优异,近年来得到了很大的发展.但IF钢种类繁多,且用户对F钢性能的要 求也千变万化:如何在具备的条件下以最低成本生产出满足用户需求的产品是生产者必须考 虑的问题.多年的研究表明F最终产品性能对工艺条件与成分特别敏感,所以F钢生产的首 要工作是工艺与成分设计,而完成成分与工艺设计的第一项任务是预测不同工艺与工艺条件 下的IF钢性能.经多年的研究,人们已了解到IF钢性能与钢中C,N,P,S,Mn及添加元素Ti, b的含量以及冷轧、热轧等工艺因素有关四,但至今仍很难给出严格的数学模型.人们一直 在寻找其他方法来描述该模型,本文将人工神经元技术用于IF钢性能的预报,并探索了用于 工业化大生产的一些问题. 1神经网络设计 1.1前向网络 前向网络是神经元网络中常见的1种网络结构,图1是典型的前向网络.它由1个输人 层、若干个隐含层与1个输出层构成.在前向网络中,层间信息只向前传播,同层网络之间节 点没有联系.各网络层又由若干神经单元组成.单个神经元如图2所示,且其模型可表示为: 1=∑W%-6 (1) y=f() 式(1)中W,x,,y分别为对应i个输人量的权值、输入值和单元阈值,而f则为转换函数,本文 采用了Sigmoidal函数作为转换函数.前人工作表明,,前向网络是在映射与回归分析中使 用比较成功的神经网络,理论上已证明3层前向网络可以完成任意一非交集合的分类问 题.同时还有的研究表明,随隐含层的增加,网络的性能还可能变坏,所以本文采用3层前向 网络结构,使用C语言编写的Neural Works ProfessionalⅡPIus软件.该软件包括多种神经 1996-06-14收稿第一作者男32岁博士后 ◆国家“九五攻关项目
第 卷 第 期 年 月 北 京 科 技 大 学 学 报 《 用 人工神经元方法 预报 钢性能 ’ 江建华 马衍伟 王先进 北 京科技 大学材料科学 与工 程学院 , 北京 摘要 用 人 工 神经元 方 法 分 析 钢性 能 与成 分 、 加 工 工 艺之 间关 系 通 过 实验 与现场 数 据训 练 个前 向网络 的考核结果表 明 , 该方法是 用 于大生产 中 钢成分 与工 艺设计 的有效方法 关键词 人工神经元 , 前 向网络 , 钢 , 性 能预报 中图分类法 即 钢性 能优 异 , 近 年来得 到 了很大 的发展 但 钢种类 繁多 , 且 用 户 对 钢性 能 的要 求也 千 变万化 如何 在具 备 的条件下 以 最低成本生产 出满足 用户需 求 的产 品是 生 产者必须考 虑 的 问题 多 年 的研究 表 明 最终产 品性 能 对工 艺条件 与成分特别敏感 , 所 以 钢生产 的首 要 工作是 工 艺 与成分设计 , 而完成成 分 与工 艺设计 的第 一项 任务是 预测 不 同工 艺与工 艺条件 下 的 钢性 能 经多 年 的研究 , 人们 已 了解 到 钢性 能 与钢 中 , , , , 及 添加元 素 , 的含 量 以 及 冷轧 、 热轧等工 艺 因素有 关 , 但 至 今仍很 难 给 出严 格 的数 学模 型 人 们一 直 在 寻 找其他方法来 描 述 该模 型 本文将人 工 神经元技 术 用于 钢性 能 的预报 , 并 探 索 了用 于 工 业化大 生 产 的一些 问题 神经网络设计 前向网络 前 向 网络 是 神 经 元 网络 中常见 的 种 网络结 构 , 图 是 典 型 的前 向网 络 它 由 个 输入 层 、 若 干个 隐含 层 与 个 输 出层 构成 在 前 向网 络 中 , 层 间信 息 只 向前 传播 , 同层 网 络 之 间节 点 没有 联 系 各 网络层 又 由若干神经单元 组成 单个神经元 如 图 所 示 , 且其模 型 可 表示 为 艺” 李不一 少 乃 式 中 叫 , 再 , , 分别 为 对应 个输人 量 的权值 、 输人值 和 单元 阂值 , 而 则 为转换 函数 , 本文 采 用 了 函 数作 为转换 函 数 前 人 工 作 表 明 即 , 前 向网络是 在 映射 与 回 归分 析 中使 用 比较 成 功 的 神 经 网 络 理 论 上 已 证 明 层 前 向 网 络 可 以 完 成 任 意 一 非 交 集 合 的 分 类 问 题 同 时还 有 的研 究 表 明 , 随 隐含 层 的增 加 , 网络 的性 能 还 可 能 变 坏 , 所 以 本 文 采 用 层 前 向 网络结 构 , 使 用 语 言编 写 的 软件 该软件 包括 多 种 神经 一 一 收稿 第一作 者 男 岁 博 士 后 国家 “ 九五 ” 攻 关项 目 DOI :10.13374/j .issn1001-053x.1997.05.011
·468* 北京科技大学学报 1997年第5期 网络模型,如BP网、Hopfield网以及自适应共振模型等,特点是界面友好,训练速度比较快. 输入层 隐含层 输出层 X W 图1前向网络结构示意图 图2单个神经结构示意图 从图1可看出,3层网络的结构设计含输人层、输出层、隐含层与层间联系等4方面的内 容.由于网络的输人、输出单元数一般由问题本身的物理模型所确定,所以模型设计实际上是 隐含层结构设计与连接关系的确定, 假设各单元与前层网络各单元均连接,考虑到样本中主要变化的成分与工艺参量分别是 钢中C,N,P,S,Mn及添加元素Ti,Nb的含量、开轧温度、终轧温度、退火温度、退火时间、卷 取温度与冷轧压下量,研究中采用上述变量作输人量.超深冲“无间隙原子钢”主要性能衡量 指标是应变硬化指数n、塑性应变比r、屈服强度o,与总延伸率EI,故输出参量设为n,r,(o,与 EI.这样,网络的输人、输出单元数分别为14与4. 隐含节点数影响到网络收敛性与推广性,它取决于问题的复杂性与训练样本的数目, 推广性通常指训练后网络对未训练样本的反应能力.有关隐含单元的选取仍是神经网络研究 的热点,通常工程界希望采用最佳网络结构,即反映内在规律的最简单的网络(隐含单元最 少).研究中采用了试验方法确定隐含单元数, 用结构为14×3×4的前向网络描述IF钢性能与成分及工艺的关系.当使用5个样本时, 训练网络的计算速度与收敛性均满足要求,由于样本太少,无法描述物理模型的规律,训练后 网络没有充分描述F钢性能与成分、加工工艺之间的关系,不具备推广的价值.当训练样本 数量增加到25个时,再采用14×3×4的前向网络,不论采用何种训练手段,网络始终不收 敛据分析网络不收敛的原因是隐含单元过少,网络法不能描述训练样本所含的内在规律,为 确保网络收敛,计算中增加隐含节点,当增至12个隐含单元时,经2×104次训练后,网络收 敛.当再次增加隐含单元,网络仍能收敛.不过上述收敛的概念仅仅是对训练样本而言. 有理论表明,对含P个样本的问题,采用含P-1个隐含单元的三层网络可确保收敛, 但P一1个隐含单元的网络结构并非最好.当训练样本有限时,过多的隐含单元将使网络中 出现过拟合,从而影响网络的推广性;此外,随隐含节点的增加,网络训练时间也将增加.所以 隐含节点并不能无限地增多,工程中神经网络隐含节点的选取应确保网络的收敛性与网络推 广性,试验的方法寻找最佳网络是一种可取的方法 2训练样本的选取 训练样本的选取包含选取合适数量的优质样本,以确保训练在之中快速收敛并反映样本 所包含的内在规律,从而有较好的推广性
北 京 科 技 大 学 学 报 年 第 期 网络模 型 , 如 网 、 网 以及 自适 应共振模 型等 , 特 点是界 面 友 好 , 训 练速 度 比较快 输入层 隐含层 输 出层 凡 。 图 前向网络结构示 意图 图 单个神经结构示意图 从 图 可看 出 , 层 网络 的结 构设计含 输人层 、 输 出层 、 隐含层 与层 间联 系等 方 面 的 内 容 由于 网络 的输人 、 输 出单元数一般 由问题 本身的物理模 型所确定 , 所 以 模 型设计 实 际上是 隐含层 结构设计 与连接 关系 的确定 假设各单元 与前层 网络各单元均 连接 考虑 到样 本 中主要 变化 的成分 与工 艺参量分别是 钢 中 , , , , 及 添 加元 素 , 〕 的含 量 、 开 轧温 度 、 终 轧 温 度 、 退 火 温度 、 退 火 时 间 、 卷 取温 度 与冷 轧 压 下 量 , 研 究 中采 用 上 述 变 量 作 输人 量 超 深 冲 “ 无 间 隙原子 钢 ” 主要 性 能衡 量 指标是 应变 硬 化指 数 。 、 塑性 应 变 比 、 屈 服 强 度 与总 延 伸率 , 故 输 出参量 设 为 。 , , 与 这样 , 网络 的输 人 、 输 出单元 数分 别 为 与 隐含 节 点数影 响 到 网络 收敛性 与推 广性 它 取 决 于 问题 的复 杂性 与训 练样本 的数 目 推广性 通 常指训 练 后 网络对未 训 练样 本 的反 应 能 力 有 关 隐含 单元 的选取仍是 神经 网络研究 的热 点 , 通 常 工 程 界 希 望 采 用 最 佳 网络结 构 , 即反 映 内在 规 律 的最 简单 的 网络 隐含 单元 最 少 研究 中采 用 了试验方 法 确定 隐含单元 数 用结构 为 的前 向网络描 述 钢性 能 与成 分及 工 艺 的关系 当使用 个样本 时 , 训练 网络的计算速度 与收敛性 均 满足要 求 由于 样 本太 少 , 无 法描述 物理模 型 的规律 , 训练后 网络 没 有 充 分 描 述 钢性 能 与 成 分 、 加 工 工 艺 之 间 的 关 系 , 不 具 备 推 广 的价 值 当训 练样 本 数量 增 加 到 个 时 , 再 采 用 的前 向 网 络 , 不 论 采 用 何 种 训 练 手 段 , 网 络 始 终 不 收 敛 据分析 网络不 收敛 的原 因是 隐含 单元 过 少 , 网络法 不 能 描述 训 练样本所 含 的 内在规律 为 确保 网络 收敛 , 计 算 中增 加 隐含 节 点 , 当增 至 个 隐含 单元 时 , 经 次 训 练后 , 网络 收 敛 当再 次增 加 隐含单元 , 网络仍能 收敛 不 过 上 述 收敛 的概念 仅仅是 对训练样本而 言 有理 论表 明 , 对含 尸 个 样本 的 问题 , 采用 含 尸 一 个 隐含单元 的三层 网络可 确 保 收敛 , 但 尸 一 个 隐含 单元 的 网络结 构并 非 最 好 当训 练样 本 有 限 时 , 过 多 的 隐含 单 元 将 使 网络 中 出现过拟 合 , 从而影 响 网络 的推广性 此外 , 随 隐含 节点 的增 加 , 网络训 练时间也 将增 加 所 以 隐含节 点并 不 能无 限地 增 多 工 程 中神经 网络 隐含 节 点 的选取应 确保 网络 的 收敛性 与 网络 推 广性 , 试验 的方法 寻 找最 佳 网络是 一 种 可取 的方法 训练样本的选取 训练样 本 的选取 包含 选取 合适数量 的优质样本 , 以 确 保训 练在 之 中快 速 收敛并 反 映样本 所包含 的 内在规律 , 从而有较 好 的推广性
Vol.19 No.5 江建华等:用人工神经元方法预报F钢性能 *469· 2.1训练样本的要求 训练样本的选取主要考虑:(1)训练后的网络能反映物理模型的内在规律,保证网络具有 良好的推广性;(2)网络收敛速度. 对于试验数据分析,样本的选取应确保网络经训练后能足以反映内在规律.例如,研究 中,考虑到IF钢中(Ti+Nb)/(N+C原子比对IF钢性能的影响分2个区:当(Ti+Nb)(N+C) 原子比小于20时,IF钢性能随(Ti+Nb)(N+C原子比变化明显,所以训练样本同样应多选 取以反映该规律.(Ti+Nb)(N+©原子比大于2.0的情况下,IF钢性能变化不大,此时,样本则 可适当少选取.尽管神经元有较好的容错性,但包含质量不好的样本将要求增加样本的数 量,从而增加训练计算时间与收敛的难度, 2.2工业化大生产中训练样本的处理 将神经网络应用到工业化大生产中,首先要选取合适的训练样本,有关样本数量的选取 与前面分析完全相同.由于工业化大生产中数据多,且重复出现的输人条件较多,其中个别的 输出结果可能出现较大的误差,如前所述,无疑将增加计算时间.将神经网络应用到工业化大 生产,并确保快速、准确收敛,且反映问题的本质,首要工作是样本质量的提高,因而建议:首 先剔除有明显错误的样本;对于输人参数完全相同的样本取平均结果,使得样本均为非交样 本,且数量将减少,并确保样本质量大幅度提高, 3应用实例 采用人工神经元方法分析T,Nb复合添加F钢性能及成分与加工工艺之间的关系.从 已有的试验与现场数据中选选了27组数据作为训练样本.经试验后,建立10×17×4的3层 前向网络,计算中采用了反向传播算法,经4min,2.5×10次训练,网络收敛,全部训练样本 均为收敛中心. 图3,图4分别是F钢,值与屈服强度随原子比变化而变化的示意图,其中圆点代表预测 值,实线是由试验数据而得.图5与图6是F钢·值与屈服强度随卷取温度变化而变化的关 系,其中方框为实测值,实线是由分析结果连成.从图3~图6可以看出:未经训练的点与试验 数据的变化趋势是吻合的.无疑网络反映了问题的部分内在规律,可见网络的推广性较好. 2.2 250 2.0 200 1.8 150 6 1.6 100F 1.4L 50L 2 67 (Ti+Nb)(C+N)原子比 (Ti+Nb)(C+N原子比 图3IF钢Ti+Nb)/N+C)原子比变化对r影响 图4IF钢(Ti+Nb)N+C)原子比变化对屈服强度影响
江建华等 用人工神经元方法 预报 钢性 能 训 练样本的要 求 训 练样 本 的 选 取 主要 考 虑 训 练后 的 网络 能反 映物理模 型 的 内在 规律 , 保证 网络具 有 良好 的推广 性 网络 收敛速 度 对于 试 验数 据分 析 , 样 本 的 选取 应 确 保 网 络经 训 练后 能足 以 反 映 内在 规 律 例如 , 研 究 中 , 考 虑 到 钢 中 原 子 比对 钢性 能 的影 响分 个 区 当 原 子 比小 于 时 , 钢 性 能 随 确 十 原 子 比变 化 明 显 , 所 以 训 练 样 本 同样 应 多 选 取 以反 映该规律 协 原 子 比大 于 的情况 下 , 钢性 能变 化不 大 , 此 时 , 样 本则 可 适 当少 选 取 尽 管 神 经 元 有 较 好 的容 错 性 , 但 包 含 质 量 不 好 的 样 本 将 要 求 增 加 样 本 的数 量 , 从而 增 加训 练计算 时间与收敛 的难度 工 业化 大生产 中训练样本的处理 将 神经 网络应 用到 工 业化 大 生 产 中 , 首先要 选取 合适 的训 练样 本 有 关样 本数 量 的选 取 与前面分析完全相 同 由于 工 业化大 生产 中数据 多 , 且 重复 出现 的输人条件较多 , 其 中个别 的 输 出结果 可 能 出现较大 的误差 , 如前 所述 , 无 疑将 增 加计算 时 间 将 神 经 网络应 用 到 工 业化大 生 产 , 并 确保快 速 、 准确 收敛 , 且 反 映 问题 的本 质 , 首要 工 作是 样 本质量 的提 高 因 而 建 议 首 先剔 除有 明显 错误 的样 本 对于 输人 参 数完 全相 同的样 本 取 平 均 结果 , 使得 样 本均 为 非 交 样 本 , 且 数量将减 少 , 并 确保样本质量大 幅度提 高 应用 实例 采 用 人 工 神 经元 方 法 分 析 , 复 合 添 加 钢 性 能 及 成 分 与加 工 工 艺 之 间 的 关 系 从 已 有 的试验 与现场数据 中选选 了 组 数据作 为训 练样 本 经 试验后 , 建 立 的 层 前 向网络 , 计算 中采 用 了反 向传播 算 法 , 经 , 少 次训 练 , 网 络 收敛 , 全 部 训 练样 本 均 为 收敛 中心 图 , 图 分别是 钢 值与屈服 强 度 随原 子 比变 化 而 变化 的示 意 图 , 其 中圆点代 表预测 值 , 实线是 由试 验 数据而 得 图 与 图 是 钢 值 与 屈 服 强 度 随卷 取 温度 变 化 而 变 化 的关 系 , 其 中方框 为实测值 , 实线是 由分析结果 连成 从 图 一 图 可 以 看 出 未 经 训 练 的点 与试验 数据 的变化趋势是 吻合 的 无疑 网络反 映 了 问题 的部分 内在规律 , 可见 网络 的推广性 较好 厂 一月 , ‘,,一 芝门、才 原子比 防 原子 比 图 钢任 附 侧 原子 比变化对 影 响 图 钢任 附 阱 原子 比变化对屈服强度影响
·470· 北京科技大学学报 1997年第5期 2.5 16 124 1.5 4 0.5 800 820 840 860 SUU 02U 04U 卷曲温度/℃ 卷曲温度/℃ 围5F钢r值随卷取温度变化曲线 图6IF钢a.值随卷取温变化曲线 4结论 (1)有合适的样本的条件下,采用人工神经元的方法模拟F钢性能及成分与加工工艺之 间的关系是可行的, (2)训叫练样本的质量与数量决定网络的推广性,其选取要确保反映样本的内在规律,并保 证网络快速收敛. (3)根据样本的数量与问题的复杂性,用试验方法设计神经网络结构是可取的方法, 参考文献 1王先进,崔德理,唐荻.超深冲“无间隙原子钢的进展.钢铁,1990,25(6):61~65 2崔德理.冶金工艺对无间隙原子钢板织构及深冲性能影响的研究:[博士论文].北京:北京科技大 学,1992 3阁平凡.人工神经网络一模型分析与应用.合肥:安徽教育出版社,1993 4 Arai M.Mapping Abilities of Three-layer Neural Networks.In:Proceedings of 1EEE IJCNN,1989. 419~423 Prediction of Properties of IF Steel Using Neural Network Model Jiang Jianhua Ma Yanwei Wang Xianjin Material Science and Engineering School.UST Beijing,Beijing 100083,China ABSTRACT A method for design of artificial neural network to predict properties of IF steel was studied.Based on the experimental data,a neural network was established.It is concluded that artificial neural network is an effective method for the process and composition design for large scale production of IF steel. KEY WORDS artificial neural network,feed-forward neural network.IF steel,prediction of properties
北 京 科 技 大 学 学 报 年 第 期 月月‘ ,厂 勺 ‘ 月 芝泞 卷 曲温度 ℃ 钢 值随卷取温度变化 曲线 ﹃乱 ‘ 图 卷 曲温度 ℃ 钢 值随卷取温度变化 曲线 结论 有 合适 的样本 的条件下 , 采 用人工 神经元 的方 法模拟 钢性 能及 成分 与加 工 工 艺之 间 的关系是 可 行 的 训 练样 本的质量 与数量 决定 网络 的推广性 , 其 选取要 确保反 映样 本 的 内在规律 , 并保 证 网络快 速 收敛 根 据样本 的数量 与 问题 的复 杂性 , 用试验方 法设计神 经 网络结 构 是可 取 的方 法 参 考 文 献 王 先进 , 崔德理 , 唐荻 超深冲 “ 无 间隙原子钢 ” 的进展 钢铁 , , 一 崔德 理 冶 金 工 艺对无 间 隙原 子 钢 板 织 构 及 深 冲性 能 影 响 的 研 究 博 士 论 文 北 京 北 京 科 技 大 学 , 阎平凡 人工 神经 网络一模型分析 与应 用 合肥 安徽教育 出版社 , 一 眼 , 几 任 , 不 助 , , , , 一 ,