D0I:10.13374/i.issn1001-053x.2005.01.025 第27卷第1期 北京科技大学学报 VoL27 No.1 2005年2月 Journal of University of Science and Technology Beijing Feb.2005 CBR及KDD技术在中厚板轧制 负荷分配建模中的应用 马当先》穆志纯)王绍波)王长松” )北京科技大学机械工程学院,北京,1000832)北京科技大学信息工程学院,北京100083 摘要针对中厚板生产产品规格变化大、轧制条件复杂等特点,提出一一种基于案例推理的 负荷分配模型,并应用数据库中的知识发现技术进行案例修正,使模型更符合实际轧制情况, 关键词负荷分配模型;基于案例的推理;数据库中的知识发现 分类号TP181;TG335.5*1 中厚钢板是工业生产中不可缺少的重要材曲线(称为PH图模型),使用时再根据待轧钢坯 料,被广泛用于国防、交通运输、能源和建筑等各 的成品尺寸进行插值计算获得其最后几道次的 种重要的国民经济生产部门.在中厚板轧制中, 应用PH曲线.这种方法思想简单,但建立包含 板形是一个非常重要的质量指标,它是保证生产 各种钢种、规格的二维表格的工作量巨大,且需 正常运行的重要条件,在国内的中厚板轧制实践 要有足够的现场条件,开发周期长:而利用插值 中,负荷分配是控制板形的主要手段之一,但中 计算对典型规格产品负荷分配的修正,很难保证 厚板生产产品规格变化很大,轧制条件非常复 对各种规格的产品均具有满意的控制效果.另一 杂,能适应各种实际生产工况的负荷分配模型的 方面,若利用操作工人的丰富操作经验,采用传 建立相当困难.因此,建立合理的负荷分配模型 统的基于规则推理的方法建立负荷分配模型也 一直是中厚板轧制技术的研究热点.本文将CBR 是一个较好的思路,但它存在着实现上的困难, (Case-Based Reasoning,基于案例的推理)与KDD 首先,将操作工人的丰富经验全面地转化为规则 (Knowledge Discovery in Database,数据库中的知 绝非易事:其次,基于规则推理的系统非常脆弱, 识发现)技术相结合,提出了一种新的建立负荷 必须完全满足规则条件才能解决问题,如果问题 分配模型的思路和方法,并对模型结构及具体处 处于系统已有规则的范围之外,系统对这样问题 理过程进行了介绍.利用现场数据进行的对比实 的求解将无能为力. 验计算结果表明,这种方法是有效的,较目前流 CBR技术和KDD技术的有机结合能够克服 行的负荷分配模型的计算结果有了改进, 传统的基于模型推理与基于规则推理的不足,如 知识获取出现瓶颈,对求解问题的历史缺乏记 1建模方案的选择 忆,需要靠专家事先经过大量的实验和推导才能 负荷分配模型对板形的影响主要体现在对 形成模型和规则,处理问题存在知识边界等.本 文工作的思路是,利用CBR的思想和技术建立轧 轧制的最后几个道次的负荷分配上,.因此,不同 负荷分配模型的主要差异在于对轧制最后几个 制规程案例库,利用KDD技术从轧制运行数据 道次的负荷分配所采用的原则和方法.对于这几 库中发现案例修改规则以适应不同轧制条件和 不同轧制规格,由此建立一种基于经验和知识模 个道次的负荷分配,一种方法是按成品典型宽度 和典型厚度组成的二维表格来存储其最后几道 型的中厚板轧制负荷分配方法.利用该方法建立 次的轧制力及出口厚度的设定值,得到一簇PH 模型,计算轧件最后几道次的负荷分配曲线作为 道次设定的依据,使负荷分配模型适应性更好, 收稿日期:2003-10-13修回日期:200403-10 更符合应用现场情况. 作者简介:马当先(1959-,男,教授 基于案例推理是一种类比推理方法.其一般
第 卷 第 期 ” 年 月 北 京 科 技 大 学 学 报 邝 血。 啊牙卫喇恤 叭 及 技术在 中厚板轧制 负荷分配建模 中的应用 马 当 先 ‘ , 穆志 纯 ” 王 绍 波 ” 王 长松 ” 北 京科技大 学机械工 程 学 院 ,北京 , 北京 科技大 学信息 工 程 学 院 , 北 京 摘 要 针 对 中厚 板生产 产 品规格 变化大 、 轧制 条件复 杂等特 点 , 提 出 一 种基 于 案例 推 理 的 负荷分 配模 型 , 并应 用数据 库 中的知 识发现技术进行案例修 正 , 使模型 更符合 实际轧制情况 关键词 负荷 分 配模型 基于 案例 的推理 数据 库 中 的知 识 发现 分 类号 、 中 厚 钢 板 是 工 业 生 产 中 不 可 缺 少 的 重 要 材 料 , 被广 泛 用 于 国防 、 交通运输 、 能源 和 建筑等 各 种 重要 的 国 民经 济生产 部 门‘月 在 中厚 板 轧 制 中 , 板 形 是 一 个 非 常重要 的质 量 指标 , 它是保 证 生产 正 常运 行 的重 要 条件 在 国 内的 中厚板 轧制 实践 中 , 负荷 分 配 是 控 制 板 形 的主 要 手 段 之 一 但 中 厚 板 生 产 产 品 规 格 变 化 很 大 , 轧 制 条 件 非 常 复 杂 , 能适 应 各种 实 际 生产 工 况 的 负荷 分 配模型 的 建 立 相 当 困难 因 此 , 建 立 合 理 的 负荷 分 配模 型 一 直 是 中厚板 轧 制技 术 的研究热 点 本文 将 一 助 , 基 于 案 例 的推 理 与 加 以 。 , 数据 库 中 的知 识 发现 技 术 相 结合 , 提 出 了一 种 新 的建立 负荷 分配 模 型 的思 路和 方 法 , 并对模型 结构及 具 体处 理过 程 进 行 了介 绍 利 用 现 场 数据进 行 的对 比实 验 计 算 结 果表 明 , 这 种 方 法 是 有 效 的 , 较 目前 流 行 的 负荷 分 配 模型 的计 算 结果 有 了 改进 建 模 方 案 的选 择 负荷 分 配 模 型 对 板 形 的 影 响 主 要 体 现 在 对 轧制 的最后 几 个 道 次 的 负荷 分 配 上 因此 , 不 同 负荷 分 配 模 型 的主 要 差 异 在 于 对 轧制 最 后 几 个 道 次 的负荷分 配所采 用 的原则和 方法 对 于 这几 个道 次的负荷 分配 , 一种 方法 是按 成 品典 型 宽度 和 典 型 厚度 组 成 的 二 维 表格 来 存储 其 最 后 几 道 次 的轧制 力及 出 口 厚 度 的设 定值 , 得 到 一 簇 收稿 日期 一 于 修 回 日期 刁 一 作者简介 马 当先 一 , 男 , 教授 曲线 称 为 图模 型 , 使用 时 再 根 据 待 轧钢 坯 的成 品尺 寸 进 行 插值 计 算 获 得 其 最 后 几 道 次 的 应 用 曲线 。 , 这种 方 法 思想 简单 , 但 建 立 包 含 各 种 钢 种 、 规 格 的二 维 表 格 的工 作量 巨大 , 且 需 要 有足 够 的现 场 条 件 , 开 发 周 期 长 而 利 用 插 值 计 算对 典 型 规格产 品 负荷 分 配 的修 正 , 很 难保证 对 各种 规格 的产 品均 具 有满 意 的控制 效 果 另 一 方 面 , 若 利 用 操 作 工 人 的丰 富操 作 经 验 , 采 用 传 统 的基 于 规 则 推 理 的方 法 建 立 负荷 分 配 模 型 也 是 一 个 较好 的 思 路 , 但 它 存 在 着 实 现 上 的 困难 首先 , 将操 作 工 人 的丰 富经 验 全面 地转 化 为规 则 绝 非 易事 其 次 , 基 于 规则推理 的系统 非 常脆 弱 , 必 须完全满足 规 则 条件才 能解 决 问题 , 如 果 问题 处 于 系统 己 有规 则 的范 围之 外 , 系统对 这 样 问题 的求解 将 无 能 为力 技 术 和 技 术 的有机 结合 能够 克服 传 统 的基 于模型 推 理 与 基 于 规 则推 理 的不足 , 如 知 识 获 取 出现 瓶 颈 , 对 求 解 问题 的 历 史缺 乏 记 忆 , 需要 靠 专 家事 先 经过 大量 的实验 和 推 导 才 能 形 成模 型 和 规 则 , 处 理 问题 存 在 知 识 边 界 等 本 文工作 的思路是 , 利用 的思想和 技 术建立 轧 制 规程 案 例库 , 利 用 技 术 从 轧制 运 行 数 据 库 中发 现 案 例 修 改 规 则 以适 应 不 同 轧 制 条件 和 不 同轧 制 规格 , 由此 建 立 一种 基 于 经 验 和 知 识模 型 的中厚板 轧制 负荷分 配 方 法 利用 该 方 法 建 立 模 型 , 计 算 轧 件最 后几 道 次 的 负荷分 配 曲线 作 为 道 次设 定 的依据 , 使 负荷 分 配 模 型 适 应 性 更 好 , 更 符合 应 用 现 场 情况 基 于 案例 推 理 是 一 种类 比推理方 法 其 一 般 DOI :10.13374/j .issn1001-053x.2005.01.025
Vol.27 No.1 马当先等:CBR及KDD技术在中厚板轧制负荷分配建模中的应用 99 推理过程为:问题描述→案例检索→案例修改→ 验,选择钢种、平均辊径、坯料长/宽/厚、成品宽/ 案例保存,首先从用户那里得到对问题(案例)的 厚、开轧温度、终轧温度9个属性作为案例的条 描述,根据案例描述,在案例库中进行检索,找到 件属性.CBR模型的输入是案例的条件属性,输 最佳匹配的案例,再根据此案例和问题描述的差 出是案例的决策属性, 异,对此案例进行修正,使之适应当前问题的描 (2)案例检索.案例检索的实质就是从案例库 述,最后,将问题的解提供给用户,并将此新案例 中寻找与当前案例最为相似的案例,常用的案例 存入案例库).其中,案例保存既是学习的过程, 检索方法主要有三种:最近邻法,归纳索引法和 也是知识获取的过程,在CBR系统中,最困难 知识导引法.本文采用最近邻法的思想计算案 的一步是案例修改,它同具体问题的领域知识有 例的相似程度,即: 关.然而,不少CBR应用系统没有进行案例修改 SC,C)=2w,4 (1) 的有效机制,将修改的任务完全推给了用户,在 其中,①为案例第k个条件属性的权值,其值根据 解决本文研究的特定问题中,笔者利用KDD技 经验按对负荷分配影响的大小设定;a,a分别为 术从现场采集的大量轧制数据(轧制运行数据 案例C,与案例C的第k个条件属性值.特别地,钢 库)中挖掘潜在的领域知识,发现案例修改加权 种属性是一种类别属性,若两个案例的钢种属于 关联规则,在CBR原始案例的基础上,根据这些 修改规则进行修正,以适应不同的轧制情况 同一类,则该属性的相似度取1,否则取0. 最近邻法简单实用,但对于每个输入的当前 2模型结构与实现方法 案例需要和案例库中的每个案例求相似度,对于 大型案例库检索效率低.因此在实际应用中,利 本文提出的基于CBR和KDD的负荷分配模 用知识对最近邻法进行了简化.由于成品厚度对 型结构如图1所示. 最后几个道次负荷分配的影响最大(成品厚度越 (1)新案例的输入与表示.案例的表示是指用 薄越易出现板形问题),因此在案例检索的时候, 一种适当的形式描述案例的特征,将案例在计算 让当前案例只与案例库中成品厚度属性值相等 机中表示出来,它是基于案例推理的前提和基 的案例进行相似度的比较,这样大大减少了需要 础.本文采用面向对象技术进行案例的表示,将 计算相似度的案例的数量,提高了案例检索的速 案例的属性数据以及案例检索、修改、保存等方 度,满足了应用背景的实时性要求, 法封装在案例类中,系统在运行中动态地构造案 (3)案例修改.CBR系统检索到的案例往往只 例对象, 是与当前问题类似,但还有一定差距,需进行修 根据本文研究问题的目的和特点,选取轧制 改.案例修改是CBR应用中的一个难点,对领域 过程最后几道次(例如最后6个道次)的轧制力以 知识依赖性很强. 及出口厚度作为案例的决策属性.实际轧制中影 本研究的重点在于求解轧件最后几道次合 响负荷分配的因素很多,综合考虑各种因素影响 理的负荷分配曲线.根据经验和实际轧制数据分 的大小及检索模型的规模并结合工人的轧制经 析,最后几个道次的轧制压力下降曲线近似于一 条直线,因此可将案例修改规则简化为由钢坯 新案例的输入与表示 的几个重要属性参数值推出合理的终轧压力 案例库 案例检索 及最后几个道次中每道次轧制压力的下降量, 即简化为(SteelKind=a)∧(Shplt=b)∧(Swplt=c)∧ 否 需要修改?> (EndT=d)→(EndP=e)∧(EndPSlope=-).其中,Steel-- 是 Kind,Shplt,Swplt,EndT分别表示钢种、成品厚 保存有意义 基于规则的案例修改 的新案例 度、成品宽度、终轧温度,是规则的条件属性: 仍需修改? 是 人工修改 EndP,EndPSlope分别表示终轧压力及压力下降 否 量,是规则的结果属性,这种规则与KDD中关联 规则的情形比较类似,因此可以通过挖掘轧制运 结果输出 行数据库中的关联规则获取案例修改的规则, 图1基于CRB的负荷分配模型结构 设I=i,2,…,in是m个不同交易项目的集合, Fig.1 Structure of CBR-based schedule model 给定一个交易数据库D,其中每个交易TSI都与
马 当先 等 及 技 术在 中厚 板 轧制 负荷分 配 建模 中的应 用 推 理 过程 为 问题 描述 案 例 检索 案 例 修 改 案例 保 存 首 先 从用 户 那 里 得 到对 问题 案 例 的 描述 , 根 据 案例 描述 , 在案例 库 中进 行检索 , 找到 最 佳 匹 配 的案例 再根据 此 案 例 和 问题 描述 的差 异 , 对 此 案 例 进 行 修 正 , 使 之 适 应 当前 问题 的描 述 最 后 , 将 问题 的解 提 供 给 用 户 , 并将 此 新 案例 存 入 案例 库 〔 其 中 , 案 例 保存 既 是 学 习 的过 程 , 也 是 知 识 获 取 的过 程 ‘ 在 系 统 中 , 最 困难 的一 步 是案例 修 改 , 它 同具 体 问题 的领 域 知 识 有 关 然 而 , 不 少 应 用 系统 没 有 进 行 案 例 修 改 的有 效机 制 , 将 修 改 的任 务 完 全 推 给 了用 户 在 解 决本 文 研 究 的特 定 问题 中 , 笔 者 利 用 技 术 从 现 场 采 集 的大 量 轧 制 数 据 轧 制 运 行 数 据 库 中挖 掘潜 在 的领 域 知 识 , 发 现 案 例 修 改 加 权 关 联 规 则 , 在 原 始 案 例 的基 础 上 , 根 据 这 些 修 改规 则 进 行 修 正 , 以适 应 不 同 的轧 制 情 况 验 , 选 择 钢 种 、 平 均 辊 径 、 坯 料 长 宽 厚 、 成 品 宽 厚 、 开 轧温 度 、 终 轧温度 个 属 性 作 为案 例 的条 件属 性 模 型 的输入 是 案 例 的条 件 属 性 , 输 出是 案 例 的决策 属 性 案例 检 索 案例 检 索 的实质 就 是 从案例 库 中寻 找 与 当前 案例 最 为相似 的案 例 常用 的案例 检 索 方 法主 要 有 三 种 最 近 邻 法 , 归纳 索 引法 和 知 识 导 引法 〔 本 文 采 用 最 近邻 法 的思 想 计 算 案 例 的相 似 程 度 , 即 , , ,一 薯 田合 模 型 结 构 与 实现 方 法 本 文 提 出 的基 于 和 的 负荷 分 配 模 型 结 构如 图 所 示 新 案例 的输 入 与表 示 案 例 的表 示 是指 用 一 种 适 当 的形 式描 述 案例 的特 征 , 将 案 例 在 计 算 机 中表 示 出来 , 它 是 基 于 案 例 推 理 的前 提 和 基 础 本 文 采 用 面 向对 象 技 术 进 行 案 例 的表 示 , 将 案例 的属 性 数 据 以及 案例 检 索 、 修 改 、 保 存 等 方 法封 装在 案 例类 中 , 系统 在运 行 中动 态 地 构 造 案 例 对 象 根 据 本 文研 究 问题 的 目的和 特 点 , 选 取 轧 制 过程 最 后 几 道 次 例 如 最 后 个 道 次 的轧 制 力 以 及 出 口 厚度 作 为案 例 的决 策属 性 实 际轧 制 中影 响 负荷分 配 的 因素很 多 , 综 合考虑 各种 因素 影 响 的大 小及 检 索 模 型 的规 模 并 结 合 工 人 的轧 制 经 新案例的输入与表示 保存有意义 基于规则的案例修改 的新案例 结果输出 图 基 于 的 负荷 分 配模型 结 构 啥 其 中 , 。 为案 例 第 个 条 件 属 性 的权值 , 其 值 根 据 经 验 按对 负荷 分配 影 响 的大 小 设定 几 , 今分 别 为 案例 与 案 例 的第 个 条 件 属 性 值 特 别 地 , 钢 种 属性 是 一 种类 别属 性 , 若 两个 案例 的钢 种属 于 同一 类 , 则 该 属 性 的相 似度瓮取 , , 否 则 取 “ · 最 近 邻 法 简单 实用 , 但 对 于 每个 输入 的 当前 案 例 需要 和 案 例 库 中 的每 个 案例 求 相似度 , 对 于 大 型案 例 库 检 索 效 率低 因此 在 实 际应 用 中 , 利 用 知 识 对 最 近 邻 法 进 行 了简化 由于 成 品厚度对 最 后 几 个 道 次 负荷 分 配 的影 响最 大 成 品厚度 越 薄越 易 出现 板 形 问题 , 因此 在 案例 检 索 的 时候 , 让 当前 案 例 只 与 案例 库 中成 品厚 度 属 性 值 相 等 的案例 进行 相 似 度 的 比较 , 这样 大 大 减 少 了需 要 计 算相 似度 的案例 的数 量 , 提 高 了案 例检 索 的速 度 , 满 足 了应 用 背 景 的实 时性 要 求 案 例 修 改 系 统检 索 到 的案 例 往 往 只 是 与 当前 问题 类 似 , 但 还 有 一 定 差 距 , 需进 行 修 改 案 例 修 改 是 应 用 中 的一 个难 点 , 对 领 域 知 识 依 赖 性 很 强 本 研 究 的重 点 在 于 求 解 轧 件 最 后 几 道 次 合 理 的负荷 分配 曲线 , 根 据经 验 和 实 际轧制 数据 分 析 , 最 后 几 个道 次 的轧 制压 力 下 降 曲线近 似 于 一 条 直 线 因此 可 将 案 例 修 改 规 则 简 化 为 由钢 坯 的几 个 重 要 属 性 参 数 值 推 出 合 理 的 终 轧 压 力 及 最 后 几 个 道 次 中 每 道 次 轧 制 压 力 的 下 降 量 , 即 简化 为 二 八 八 帅 八 司冷 八 功 其 中 , , , , 分 别 表 示 钢 种 、 成 品 厚 度 、 成 品 宽度 、 终 轧温 度 , 是 规 则 的条件 属 性 , 分别 表 示 终 轧压 力及 压 力 下 降 量 , 是 规 则 的结 果 属 性 这 种 规 则 与 中关联 规 则 的情 形 比较类 似 , 因此 可 以通过 挖 掘 轧 制运 行 数 据 库 中 的关联 规 则 获 取 案例 修 改 的规 则 设 二 ,, 儿 , … , 瑞是 个 不 同交 易项 目的集 合 , 给 定 一 个交 易数据 库 , 其 中每 个 交 易 几 都 与
100. 北京科技大学学报 2005年第1期 一个惟一的标识符TD相关联.如果对于I中的 以看作数据包中的一个点,通过数据包,重新定 一个子集X,有X仁T,称交易T支持X.一条关联规 义支持度和置信度,更便于关联规则的挖掘, 则就是一个形如X→Y的蕴含式,其中X∈I,YI, 上述算法中,布尔化转变是非常关键的一 且Xn=☑.其意义在于一个交易中某些项目的 步,区间划分太窄可能使一些规则因其支持度达 出现,可推导出另一些项目在同一交易中也出 不到最小支持度而丢失,产生“最小支持度”问 现.若D中有s%的交易同时支持项目集X和Y, 题:区间划分太宽可能使一些规则因其置信度达 D中支持项目集X的交易中有c%的交易同时也 不到最小置信度而丢失,产生“最小置信度”问 支持项目集Y,称规则X→Y在D中具有s%的支持 题.根据工人实际轧制经验,终轧厚度对终轧压 度,%的置信度,关联规则的挖掘问题就是在给 力的取值影响较大,因此对于终轧厚度的属性划 定的交易数据库D中发现满足用户给定的最小 分区间不能过大.特别是成品厚度很薄时,对板 支持度和最小置信度的关联规则的过程, 形要求更高,划分应更细.为体现薄板数据的重 按处理对象的不同,关联规则可分为布尔型 要性,同时避免布尔化过程中的“最小支持度”问 关联规则和多值关联规则阿.布尔型关联规则挖 题,采用加权方法,按成品厚度赋予权值,对包含 掘问题的主要应用对象是由布尔型属性组成的 较小成品厚度的记录赋予较大的权值,增加其 交易数据库,是在给定的交易数据库中发现满足 加权支持度.以规则(SteelKind-0)∧(Shpt=I)∧ 用户给定的最小支持和最小置信度的布尔型关 (Swplt-=O)∧(EndT=4)→(EndP=5)∧(EndPSlope=3) 联规则的过程.多值关联规则挖掘问题的主要应 为例,设Shplt-1对应权值0.9,通过数据包,其加 用对象是由多值属性组成的记录集,是在给定的 权支持度与加权置信度分别定义如下, 记录集中产生满足用户给定的最小支持度和最 ①加权支持度:数据包(0,1,0,4)中EndP=5同 小置信度的多值关联规则的过程.多值属性主要 时EndPSlope=3的记录数同0.9的乘积与加权记 有数量属性(如年龄、工资等)和类别属性(如性 录总数的比值. 别、学历等) ②加权置信度:数据包(0,1,0,4)中EndP=5同 本文所要挖掘的案例修改规则中的属性值 时EndPSlope-=3的记录数与该数据包中包含的记 既有数量属性(成品尺寸、终轧温度、终轧压力 录总数的比值. 等),又有类别属性(钢种),因此可以按照QARP 其中,加权记录总数定义为成品厚度落在其 的处理方法进行规则挖掘.目前已有的关联规则 各布尔化单位区间上的记录数与该区间对应权 挖掘的许多算法都是针对BARP提出的,主要研 值的乘积的总和, 究对象是项目集类型的数据集(如超市中每个顾 对每个数据包进行加权计算,可以很方便地 客购买的商品形成一个项目集),通过对数据库 从中发现案例修改规则.由于挖掘的修改规则只 的多次扫描挖掘出所隐含的项目及其数量预先 是一种简化形式,忽略了一些其他因素,因此在 未知的关联规则.QARP比较复杂,一般先将它转 完成了基于规则的案例修改之后,得到的轧件负 化为BARP,再使用BARP的挖掘算法.由于笔者 荷分配曲线有可能仍需要进一步修改.这时,可 在应用中利用领域知识事先确定了与挖掘任务 提供人机接口界面,由操作工直接进行调整, 有关的因素,明确了要挖掘的规则的形式,因而 (4)案例保存.完成案例修改后,得到当前案 可以避免挖掘的盲目性,采用一种更为有效的特 例的所有属性值,即一个完整的新案例.若用户 殊挖掘算法,这种算法首先进行布尔化转换,将 觉得该案例有保存价值,则将其存入案例库,以 数据的各个属性按一定标准划分为一个个单位 备后用:如果用户觉得以后不需要或者该案例可 区间,将每个区间按顺序映射为一个非负整数, 由现在库中己有的案例很方便地再生出来,则可 并将每一条记录的属性值映射为非负整数,属性 不进行存储.通过保存有意义的新案例,使案例 区间可以按数据的分布特征划分,也可以按n等 库得到不断的补充完善,体现了基于案例推理优 分的标准划分,或按等频的标准进行划分,从空 于其他传统推理方式的学习能力. 间的角度来看,全部条件属性构成了一个多维数 据空间.在属性区间划分后,各维度的单位区间 3对比实验结果 在多维空间中交叉构成了一个个被称为数据包 应用本文提出的基于CBR和KDD的负荷分 (data cube)m的小单位空间,而每一条数据记录可 配模型进行了在线对比实验计算,得到了比较合
的 北 京 科 技 大 学 学 报 年 第 期 一 个惟 一 的标 识 符 相 关 联 如 果对 于 中 的 一 个 子集, 有叉生 , 称 交 易 支 持 一 条 关 联规 则 就 是 一 个 形 如尤添 的蕴 含 式 , 其 中刃立 , 几, 且尤门 卜 其 意 义 在 于 一个 交 易 中某些 项 目的 出现 , 可 推 导 出 另 一 些 项 目在 同一 交 易 中 也 出 现 若 中有 的交 易 同 时支 持项 目集 和 , 中支 持 项 目集 的交 易 中有 的交 易 同 时 也 支 持项 目集 , 称 规 则火冷 了在 中具 有 的支 持 度 沁 的置 信 度 关 联 规 则 的挖 掘 问题 就 是 在 给 定 的交 易数 据 库 中发现满足 用 户 给 定 的最 小 支 持度 和 最 小 置 信度 的关联 规 则 的过 程 按 处 理对 象 的不 同 , 关 联 规 则 可 分 为布 尔 型 关 联 规 则和 多值 关 联规 则 布 尔 型 关 联 规 则 挖 掘 问题 的主 要 应 用 对 象 是 由布 尔 型 属 性 组 成 的 交易数据 库 , 是在 给 定 的交 易数据 库 中发现满足 用 户 给 定 的最 小 支 持 和 最 小 置 信 度 的布 尔 型 关 联 规 则 的过 程 多值 关 联 规 则挖 掘 问题 的主 要 应 用对 象 是 由多值属 性 组成 的记 录集 , 是在给 定 的 记 录 集 中产 生 满 足 用 户 给 定 的最 小 支 持度 和 最 小置 信度 的 多值 关联 规 则 的过 程 多值属 性 主 要 有数 量 属 性 如 年龄 、 工 资 等 和 类 别属 性 如 性 别 、 学 历 等 本 文 所 要 挖 掘 的 案 例 修 改 规 则 中 的 属 性 值 既有数 量 属 性 成 品尺 寸 、 终 轧温 度 、 终 轧压 力 等 , 又 有类 别 属 性 钢 种 , 因此 可 以按照 卫 的处 理方 法进 行规 则挖掘 目前 己 有 的关联规 则 挖 掘 的许 多算法 都 是 针对 提 出 的 , 主 要 研 究对 象 是 项 目集类 型 的数 据 集 如超 市 中每 个顾 客 购 买 的商 品 形 成 一 个 项 目集 , 通过 对 数据 库 的 多 次 扫 描 挖 掘 出所 隐 含 的项 目及 其 数 量 预 先 未知 的关联规 则 比较复杂 , 一般先 将 它 转 化 为 , 再 使 用 的挖 掘 算 法 由于 笔 者 在 应 用 中利 用 领 域 知 识 事 先 确 定 了 与 挖 掘 任 务 有 关 的 因 素 , 明确 了要 挖 掘 的规 则 的形 式 , 因 而 可 以避 免挖 掘 的盲 目性 , 采用 一种 更 为有 效 的特 殊 挖 掘 算 法 这 种 算 法 首 先 进 行 布 尔 化 转 换 , 将 数 据 的各 个 属 性 按 一 定标 准 划 分 为一 个 个 单位 区 间 , 将每 个 区 间按 顺 序 映射 为 一 个 非 负整数 , 并将 每一 条记 录 的属 性值 映射 为非 负整 数 属 性 区 间 可 以按 数据 的分 布特征划 分 , 也 可 以按 等 分 的标 准划 分 , 或 按 等频 的标准 进 行 划 分 从 空 间 的角度 来看 , 全 部条件 属 性 构 成 了一 个 多维数 据 空 间 在 属 性 区 间划 分 后 , 各 维度 的单位 区 间 在 多维 空 间 中交 叉 构 成 了一 个 个 被 称 为 数 据 包 刀 的 小单 位 空 间 , 而 每 一 条数 据 记 录 可 以看 作数据 包 中 的一 个 点 通过 数 据 包 , 重 新 定 义 支 持度 和 置信度 , 更 便 于 关 联 规 则 的挖 掘 上 述 算 法 中 , 布 尔 化 转变 是 非 常 关 键 的 一 步 区 间划 分 太 窄可 能使 一 些 规 则 因其支 持度 达 不 到 最 小 支 持度 而 丢 失 , 产 生 “ 最 小支 持度 ” 问 题 区 间划 分太 宽可 能使 一些 规 则 因其 置 信度 达 不 到 最 小 置信 度而 丢 失 , 产 生 “ 最 小置 信 度 ” 问 题 根据 工 人 实 际 轧 制 经 验 , 终 轧厚 度 对 终 轧 压 力 的取 值 影 响较 大 , 因此对 于 终 轧厚度 的属 性划 分 区 间不 能过 大 特 别 是 成 品厚 度 很 薄 时 , 对 板 形 要 求 更 高 , 划 分 应 更 细 为体现 薄板 数 据 的重 要 性 , 同时避 免布 尔 化 过程 中 的 “ 最 小支持度 ” 问 题 , 采用 加 权 方法 , 按 成 品厚度 赋 予 权 值 , 对 包 含 较 小 成 品 厚 度 的记 录 赋 予 较大 的权 值 , 增 加 其 加权支 持 度 以规 则 】 习 八 饰卜 八 八 ” 为例 , 设 卜 对 应 权值 , 通 过 数 据 包 , 其 加 权 支 持 度 与 加 权 置 信 度分 别 定 义 如 下 ① 加 权 支 持度 数据 包 , ,, 中 二 同 时 , 的记 录 数 同 的乘积 与加 权 记 录 总 数 的 比值 ② 加 权 置 信 度 数据 包 , ,, 中 同 时 叩 的记 录 数 与 该数据 包 中包 含 的记 录 总数 的 比值 其 中 , 加 权 记 录 总 数定义 为成 品 厚度 落在其 各 布 尔 化 单 位 区 间 上 的记 录数 与 该 区 间对 应 权 值 的乘 积 的 总和 对 每个 数据 包 进 行 加 权 计 算 , 可 以很 方 便 地 从 中发 现 案例 修 改规 则 由于挖掘 的修 改规 则 只 是 一 种 简 化 形 式 , 忽 略 了一 些其 他 因 素 , 因 此 在 完成 了基 于 规则 的案例 修 改之 后 , 得 到 的轧件 负 荷 分 配 曲线 有 可 能 仍 需 要 进 一 步 修 改 这 时 , 可 提 供 人 机 接 口 界 面 , 由操 作 工 直 接进 行 调 整 案 例 保 存 完成 案 例 修 改后 , 得 到 当前案 例 的所 有 属 性 值 , 即 一 个完 整 的新 案 例 若 用 户 觉 得 该案 例 有 保 存价值 , 则将 其 存 入 案 例 库 , 以 备 后 用 如 果用 户 觉 得 以后 不 需要 或 者 该案 、 例 可 由现 在库 中 己 有 的案 例很 方便 地 再 生 出来 , 则 可 不 进 行 存 储 通 过 保 存 有意 义 的新 案例 , 使案 例 库得 到 不 断 的补充 完 善 , 体现 了基 于 案例推理 优 于其 他 传 统推 理方 式 的学 习 能力 对 比实验 结果 应 用 本 文提 出 的基 于 和 的负荷 分 配 模 型进行 了在 线对 比实验 计 算 , 得 到 了 比较合
Vol.27 No.1 马当先等:CBR及KDD技术在中厚板轧制负荷分配建模中的应用 ·101· 理的规程.以Q235A钢为例,平均辊径950mm, 条件复杂的实际情况,探索研究将CBR与KDD 坯料厚×宽×长=150mm×1200mm×3300mm,成 技术相结合来进行负荷分配的方法,提出了一种 品厚×宽=10mm×2300mm,开轧温度1035℃,终 基于CBR和KDD的负荷分配模型,合理地解决 轧温度为850℃,分别用基于CBR和KDD的负荷 了这一特定问题中知识获取的问题,充分利用了 分配模型和PH图模型进行计算,将得到的规程 工人的操作经验,提高了求解效率和求解质量, 与在某厂现场实际采集统计得到的规程相比较, 使负荷分配更符合实际轧制情况.当然,这种模 最后6道次的辊缝值如表1所示 型的应用效果在很大程度上要取决于案例数据 表1规程比较(辊缝值) 的好坏,将该模型用于实际生产要涉及案例数据 Table 1 Comparison of the schedules (Roll gap)mm 的处理工作,但这种数据处理的工作已较传统的 方法(如H图法)大为简化了. 道次 利用PH图模基于CBR,KDD实际采集得 型生成的规程生成的规程 到的规程 参考文献 1 6.31 6.61 6.54 2 7.93 7.39 7.25 []孙本荣,王有铭,陈瑛.中厚钢板生产,北京:治金工业出 版社,1993 3 9.88 8.79 8.79 2]鞍钢新轧钢股份有限公司厚板厂过程控制计算机系统改 4 11.93 11.78 11.59 造初步设计书.北京:高效轧制国家工程研究中心,1999 15.15 14.26 14.03 [3]田盛丰.人工智能与知识工程,北京:中国铁道出版社, 6 19.63 19.54 19.18 1999 [4]Leake D.CBR in Context:the Present and Future.Case-based 从表1中的辊缝数据中可以看出:利用PH图 Reasoning:Experiences,Lessons Future Directions.AAAI 模型生成的规程中,最后几个道次,尤其是最终 Pres5,1996 道次,压下量太大,无法得到符合要求的板形:由 [5]Agrawal R,Imielinski T,Swami A.Mining association rules be- tween sets of items in large database.Proc ACM SIGMOD Int 基于CBR和KDD的轧制规程计算模型生成的规 Conf Manage Data,1993(2):207 程则与实际采集得到的规程的压下量比较接近, [6]Agrawal R,Srikant R.Mining quantitative association rules in 负荷分配较为合理,有利于保证最终的板形. large relational tables.Proc ACM SIGMOD Int Conf Manage Data,1996(2):12 4结论 [7]Agrawal R,Gupta A,Sarawagi S.Modeling multidimensional databases.In:Proc.the 13th Int Conf on Data Engineering.Bir- 本文根据中厚板生产产品规格变化大、轧制 minham.1997 Application of CBR and KDD techniques to modeling plate rolling schedules Ma Dangxian,MU Zhichun,WANG Shaobo2,WANG Changsong" 1)Mechanical Engineering School,University of Science and Technology Beijing,Beijing 100083,China 2)Information Engineering School,University of Science and Technology Beijing,Beijing 100083,China ABSTRACT In order to develop an adaptive model for automatically generating rolling schedules that comply with practical operations in heavy plate rolling,the techniques of Case-Based Reasoning(CBR)and Knowledge Dis- covery in Database(KDD)are introduced in the modeling process.In the model CBR not only is used for storing and retrieving the cases,i.e.schedules by which high-guality products have been rolled,but also generates an initial schedule for the material to be rolled according to the similarity in attributes between the material and the stored cas- es.KDD is introduced to find the rules from the operational data records to modify the initial schedule if there is dif- ference between the ongoing rolling practice and the case applied.The experimental results of comparing the sche- dules against the practical rolling data show that the schedule generated by the new model is more reasonable and conformable to the actual rolling practice than that generated by traditional methods,which indicates that the method proposed in this paper is a promising method for rolling schedule generation modeling. KEY WORDS rolling schedule model;case-based reasoning;knowledge discovery in database
七】 马 当先等 及 技 术 在 中厚板 轧 制 负荷 分 配 建 模 中 的 应 用 理 的规 程 以 钢 为例 , 平 均 辊 径 刀 , 坯 料 厚 宽 长 , 成 品厚 宽 刃 。 , 开 轧温度 , 终 轧 温 度 为 ℃ , 分 别 用 基 于 和 的负 荷 分 配 模 型 和 图模 型 进 行 计 算 , 将 得 到 的规 程 与在某厂现场 实 际采集 统 计 得 到 的规 程 相 比较 , 最 后 道 次 的辊 缝 值 如表 所 示 , 表 规程 比较 辊缝 值 道 次 利用 图模 基 于 民 实 际 采 集得 型 生 成 的规 程 生 成 的规 程 到 的规 程 , 从表 中 的辊 缝数据 中可 以看 出 利 用 图 模 型 生 成 的规 程 中 , 最 后 几 个 道 次 , 尤 其 是 最 终 道 次 , 压 下量太 大 , 无 法得 到符合要 求 的板 形 由 基 于 和 的轧 制 规 程 计 算 模 型 生 成 的规 程 则 与 实 际采集 得 到 的规 程 的压 下 量 比较接近 , 负荷 分 配 较 为合 理 , 有 利 于 保 证 最 终 的板 形 结 论 本 文根 据 中厚板 生产 产 品规 格变 化 大 、 轧制 条件 复杂 的实 际情 况 , 探 索 研 究将 与 技术 相 结合 来 进 行 负荷 分 配 的方法 , 提 出了一种 基 于 和 的 负荷 分 配 模 型 , 合 理地解 决 了这 一特 定 问题 中知 识 获取 的问题 , 充 分利用 了 工 人 的操 作经 验 , 提 高 了求解 效 率和 求解 质 量 , 使 负 荷 分 配 更 符 合 实 际 轧 制 情 况 , 当然 , 这 种 模 型 的应 用 效 果 在 很 大 程 度 上 要 取 决 于 案 例 数 据 的好坏 , 将 该模 型用 于 实 际 生产 要涉及 案 例 数 据 的处 理 工 作 , 但 这种 数 据 处 理 的工 作 己较传统 的 方 法 如 图法 大 为 简化 了 参 考 文 献 〔 孙 本 荣 , 王 有 铭 , 陈瑛 中厚钢板 生 产 北 京 冶金 工 业 出 版社 , 鞍钢 新 轧钢 股份 有 限 公 司 厚 板厂 过 程控制计 算机系统 改 造 初 步设计 书 北京 高 效轧 制 国家工 程 研 究 中心 , 』 田 盛 丰 人 工 智能与知 识 工 程 北京 中国铁道 出版社 , 奴业 一 , 汀 , 】民 , 沙 , 凡 名 功 , 【 , , 吧 汕 玩 恤 , 九勿 ,气材 ,, 恻刃 ,,环乞 岁 , 助 , 川 , , , , , , 一 , · , 加 公 。 找 记血 小 加 如 访 脉 幽 丘代 执吧 妙 力 扭 , · 一 电