·106· 北京科技大学学报 算法对优化.点进行了成功的预报,以此为基础,初步建立了16M钢生产的炉前生产专家系 统 1模式识别一人工智能优化原理简介 1.1ANN-BP原理 (1)学习理解阶段、将变量作为输入神经元的“感知”,进入神经隐埋层的若干神经元进 行尝试“理解”(建立逼近对象的非线性函数),给出问题的判断(函数目标值).由这些判断 的准确度好坏来修改“理解”(调整函数)、直到“理解”令人满意(逼近函数准确到某个精 度).这样就可用得到的知识去预测某个给定变量的结果. 对工业优化,ANN一BP有如下若千缺点.(I)由于工业过程变量多,输入结点太多,函 数关系尤其复杂,难于建立贴切的网络结构;(2)往往出现过拟合现象(Over一fitting),即 虽可相当好地拟合训练样本集,却不能正确地预测非训练样本;(3)如果给定目标值,网络 很难预报相应的变量,因为目标量往往少于变量数目很多,给定目标值求相应的变量本身是 一个不定解问题,而后者恰恰是生产上最关心的事情. 在这种情况下,我们引入了PLS为基的模式识别方法,为ANN一BP提供改善了的输入 神经元(即令输入神经元是原变量的函数且数目减少),提供将被预测的类型定性已知的优化 点,使有可能用最简单的网络结构(尽可能少的输入神经元、隐埋层及其神经元)来建立理 解的知识所对应的非线性函数. 1.2PLS算法 令X、Y分别为预处理过的训练样本集的变量和目标矩阵,t、u为潜变量(latent variables),p、q为其对应的负荷(loading),E、F为回归残差.X和Y的外部关系为: X=Stp E;Y Suq+F; X和Y的内部关系表示为:b=ut. 经过推导,可得PLS基矢R,并有:T=XR和R=(PT)-'.这里有T是训练样本在PLS 空间的投影 我们取R和R2为基,通过R一(P)-1求出训练优化样本集的分布,用传统的模式识别 法求优化类聚集区重心附近的试探优化点,再用逆映照法求得后者所对应的原始工艺参数. 2计算过程 2.1原始数据的采集及分类 为保证样本的准确性及完整性,采用了1993年末和1994年16Mn加钒微合金化后的生 产数据的跟班记录做为处理样本集,数据全部采用初验结果,考虑的变量有C、Si、M、P、 S、V含量,板厚,终轧温度等8个因素.它们依次记为X、X2…、X,其目标变量为o、 、ò及冷弯,依次认为Y、Y:、Y、Y,分别单独作为目标和综合考虑做为目标进行处理.其 分类依据分别见表1~表5.. 1 0 6 . 北 京 科 技 大 学 学 报 算法 对优化 点进 行 了成 功 的预 报 , 以 此 为基 础 , 初 步建 立 了 16 M n 钢 生产 的炉 前生产 专 家系 统 . 1 模式识别 一 人工 智能优化原理 简介 1 . 1 A N N 一 B P 原理 ( 1) 学 习理 解 阶段 , 将 变 量 作为输 入 神经 元 的 “ 感 知 ” , 进 入 神经 隐埋层 的若干 神经 元进 行尝试 “ 理 解 ” ( 建 立逼 近对 象 的非 线性 函 数 ) , 给 出问题 的 判断 ( 函 数 目标 值 ) . 由这些 判断 的准确度 好 坏来 修改 “ 理 解 ” (调 整 函 数 ) , 直到 “ 理 解 ” 令 人满 意 ( 逼近 函数 准 确到 某 个精 度 ) . 这 样就 可 用得 到 的知识去预 测 某 个给 定变量 的 结果 . 对工 业优 化 , A N N 一 B P 有如 下若 干 缺点 . ( l) 由于 工业 过程 变量 多 , 输 入 结点 太 多 , 函 数关 系 尤其 复杂 , 难 于建 立 贴切 的 网络结 构 ; ( 2) 往往 出现过 拟 合现 象 (〔) ve r 一 ift it n g ) , 即 虽可相 当好地 拟 合训练 样 本集 , 却不 能 正 确地 预 测非 训练 样本 ; ( 3) 如 果给 定 目标值 , 网络 很难预报 相应 的变 量 , 因为 目标量 往 往少 于变 量 数 目很 多 , 给 定 目标 值求相 应 的变量 本 身是 一 个不定 解 问题 , 而 后者 恰恰 是 生产 上最 关心 的 事情 . 在这 种情况 下 , 我们 引入 了 IP 一 S 为基 的模 式识别方 法 , 为 A N N 一 B P 提供改 善 了的输入 神 经元 ( 即 令输 入神 经元 是 原变 量 的函 数 且 数 目减 少 ) , 提 供将 被 预测 的类 型定 性 已知 的优化 点 , 使有 可能 用最 简单 的 网络 结构 ( 尽可 能少 的输 入 神经 元 、 隐埋 层及 其神 经元 ) 来 建立 理 解 的知识所对 应 的非线 性 函数 . 1 . 2 P L S 算 法 令 X 、 Y 分 别 为 预 处 理 过 的 训 练 样 本 集 的 变 量 和 目标矩 阵 , , 、 u 为潜 变 量 l( at en t va iar lb se ) , P 、 q 为其 对应 的 负荷 l( oa id n g ) , E 、 F 为 回 归残差 . x 和 Y 的外 部关 系 为 : X 一 凡P + E ; Y 一 艺uq + F ; X 和 Y 的 内部 关 系表示 为 : b一 ut . 经 过推 导 , 可得 IP 一 基 矢 R , 并 有 : T 一 X R 和 R 一 ( 尸勺一 ’ . 这里 有 T 是训 练样 本在 P L S 空 间的投影 . 我 们取 R , 和 R Z 为 基 , 通 过 R 一 ( 尸r ) 一 `求 出训 练优 化样 本集的分 布 , 用传 统 的模式 识别 法求优 化类 聚集 区重 心 附近 的试 探 优化 点 , 再用 逆 映照法 求得 后者 所对 应 的原 始工 艺参 数 . 2 计算过程 .2 1 原始数据的采 集及 分类 为保证样本 的 准确性及 完整 性 , 采 用 了 1 9 9 3 年 末和 1 9 9 4 年 16 M n 加钒 微 合金 化 后 的生 产数据 的跟班 记录做 为处理 样 本集 . 数据 全部 采 用初 验结 果 , 考虑 的变 量有 c 、 iS 、 M n 、 P 、 S 、 V 含量 , 板 厚 , 终 轧温度 等 8 个因素 , 它 们依次 记 为 X I 、 X Z… … 、 x s , 其 目标 变 量 为 。 S 、 6 b 、 占 5 及冷 弯 , 依次认 为 y l 、 y : 、 Y 3 、 Y j 分别单独 作 为 目标和 综 合考 虑做 为 目标 进行 处理 . 其 分类 依据分别 见表 1一 表 5