正在加载图片...
王玲等:基于定量关联规则树的分类及回归预测算法 891 对应的项,每个叶节点除了记录输出类别外还记录对 条路径的叶节点是与输出相关变量的而且记录每条关 应规则的置信度,以及关联规则后件线性表达式系数 联规则的输出类别、关联规则后件线性表达式系数和 通过构建中厚板关联规则树,实现中厚板质量影响因 置信度.在规则匹配时,为了解决待预测新样本与多 素之间的关联分析. 条规则相互匹配,难以确定输出类别的问题,将置信度 图4显示生成的关联规则树结构.从图中可以看 最高的叶节点所表示的输出类别作为新样本的预测输 出,中厚板关联规则树共有八层节点,树中节点与中厚 出,同时可以利用模糊推理实现对新样本输出值的精 板关联规则树项头表中的序号所代表的项相对应,每 确预测. )根节点 …(16 3 (9) (13 282828 图4中厚板关联规则树 Fig.4 Association rule tree of plates 选用1000个中厚板数据样本作为训练数据,用 保证了较高的预测精度. 500个中厚板数据样本作为测试数据.为了对比本文 从图5可以看出,在训练阶段,基于QART算法构 提出的QART算法与其他预测方法,我们在中厚板数 建的中厚板质量模型的对实际屈服度的拟合度较高, 据集上分别用本文的方法、BP神经网络回、RBF圆、支 在模型测试阶段虽然模型对测试样本的拟合度较训练 持向量机回归模型切、CART模型图以及ANFIS模 阶段稍稍降低,但仍有较好的拟合精度,由此可得出基 型回进行预测,采用相同训练数据和测试数据得到模 于QART算法构建的中厚板质量模型对轧钢产品质量 型的训练和测试误差对比结果如表3所示 预测以及对钢铁企业生产提供决策支持有着重要的 表3模型误差对比 作用. Table 3 Comparison of model erors 3结论 算法 训练误差 测试误差 BP神经网络 0.2064 0.4439 根据现有关联规则挖掘方法应用于数值数据进行 RBF神经网络 0.2205 0.5753 分类及回归预测时存在的问题,提出基于定量关联规 支持向量机回归模型 0.9760 0.8263 则树的分类及回归预测算法.为了验证算法性能及有 CART模型 1.1040 1.0745 效性,采用UCI基准数据库中ris、Wine、Seed以及 ANFIS模型 1.0423 1.0037 Breast Cancer数据集作为实验数据进行仿真,同时将 QART算法(本文) 0.1858 0.1989 该算法应用于实际轧钢生产过程的产品质量预测.结 果表明,由于采用改进的定量关联规则算法挖掘数值 从表3中可以看出,在训练阶段和测试阶段基于 型数据生成关联规则库,减少了数据库扫描次数,提高 QART算法构建的中厚板质量模型时均方根误差仅为 了算法效率;利用关联规则树结构,不仅加快了分类及 0.1858和0.1989,其预测模型性能均优于其他模型, 回归预测的速度,而且提高了预测准确性.王 玲等: 基于定量关联规则树的分类及回归预测算法 对应的项,每个叶节点除了记录输出类别外还记录对 应规则的置信度,以及关联规则后件线性表达式系数. 通过构建中厚板关联规则树,实现中厚板质量影响因 素之间的关联分析. 图 4 显示生成的关联规则树结构. 从图中可以看 出,中厚板关联规则树共有八层节点,树中节点与中厚 板关联规则树项头表中的序号所代表的项相对应,每 条路径的叶节点是与输出相关变量的而且记录每条关 联规则的输出类别、关联规则后件线性表达式系数和 置信度. 在规则匹配时,为了解决待预测新样本与多 条规则相互匹配,难以确定输出类别的问题,将置信度 最高的叶节点所表示的输出类别作为新样本的预测输 出,同时可以利用模糊推理实现对新样本输出值的精 确预测. 图 4 中厚板关联规则树 Fig. 4 Association rule tree of plates 选用 1000 个中厚板数据样本作为训练数据,用 500 个中厚板数据样本作为测试数据. 为了对比本文 提出的 QART 算法与其他预测方法,我们在中厚板数 据集上分别用本文的方法、BP 神经网络[5]、RBF[6]、支 持向 量 机 回 归 模 型[7]、CART 模型[8] 以及 ANFIS 模 型[9]进行预测,采用相同训练数据和测试数据得到模 型的训练和测试误差对比结果如表 3 所示. 表 3 模型误差对比 Table 3 Comparison of model errors 算法 训练误差 测试误差 BP 神经网络 0. 2064 0. 4439 RBF 神经网络 0. 2205 0. 5753 支持向量机回归模型 0. 9760 0. 8263 CART 模型 1. 1040 1. 0745 ANFIS 模型 1. 0423 1. 0037 QART 算法( 本文) 0. 1858 0. 1989 从表 3 中可以看出,在训练阶段和测试阶段基于 QART 算法构建的中厚板质量模型时均方根误差仅为 0. 1858 和 0. 1989,其预测模型性能均优于其他模型, 保证了较高的预测精度. 从图 5 可以看出,在训练阶段,基于 QART 算法构 建的中厚板质量模型的对实际屈服度的拟合度较高, 在模型测试阶段虽然模型对测试样本的拟合度较训练 阶段稍稍降低,但仍有较好的拟合精度,由此可得出基 于 QART 算法构建的中厚板质量模型对轧钢产品质量 预测以及对钢铁企业生产提供决策支持有着重要的 作用. 3 结论 根据现有关联规则挖掘方法应用于数值数据进行 分类及回归预测时存在的问题,提出基于定量关联规 则树的分类及回归预测算法. 为了验证算法性能及有 效性,采 用 UCI 基 准 数 据 库 中 Iris、Wine、Seed 以 及 Breast Cancer 数据集作为实验数据进行仿真,同时将 该算法应用于实际轧钢生产过程的产品质量预测. 结 果表明,由于采用改进的定量关联规则算法挖掘数值 型数据生成关联规则库,减少了数据库扫描次数,提高 了算法效率; 利用关联规则树结构,不仅加快了分类及 回归预测的速度,而且提高了预测准确性. · 198 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有