正在加载图片...
何飞等:基于多模态和加权支持向量机的热轧轧制力智能预报 519· 持向量机算法进行建模和预测,最后将所有的结果进 f(x)= Cak(xx)+b. (9) 行汇总.当产生新的样本时,则计算该样本到各类中 心的距离,将该样本划归到距离最近的类,然后采用该 其中,a,和b为模型系数,模型中正则化参数y和带宽 类建立的加权支持向量机模型进行预测 σ2是加权支持向量机训练需要调整的两个参数,它们 的选取将直接影响模型的训练精度和预报精度,在建 3加权最小二乘支持向量机 模时采用交叉验证法进行寻优 支持向量机是在统计学习理论的基础上发展起来 4热轧轧制力智能预报应用 的新型分类和回归工具,它可以在很大程度上克服维 数灾难、过学习等现象.支持向量机学习算法可以归 4.1数据预处理 结为求解一个受约束的凸二次型规划(quadratic pro- 首先选择对轧制力产生影响的工艺参数作为模型 gramming,QP)问题,它的核心思想是利用核函数将输 的输入,然后应用加权支持向量机算法来计算轧制力 入空间中线性不可分的样本映射到一个高维的特征空 的修正系数.根据实际生产经验和领域专家知识,模 间,使样本线性可分或者近似线性可分四 型所需要的输入变量见表1. 加权最小二乘支持向量机是支持向量机的一种改 建模数据的质量会影响模型的精度,首先对数据 进.对于同样的训练集(x,y:),i=1,2,…,l,x∈R“,y 进行预处理.预处理包括空缺值和奇异值样本的删 ∈R,加权支持向量机算法中加入权重因子,其回归 除,其中奇异值的处理是借助正态分布的3倍标准差 问题如下☒: 原则来筛选:其次,为消除数据量纲对建模的影响,对 (min w,8》=(w,w)+之y 样本数据标准化,即将原始数据减去均值后再除以标 (4) 准差。 s.t.y:=wb(x)+b+5i=1,2,…,l. 表1模型的输入变量 式中:w为支持向量面的法向量;专为松弛变量;y为 Table 1 Input variables of the model 正则化参数,用于平衡拟合误差和模型的复杂程度. 变量名称 单位 加权支持向量机中选取径向基核函数k(x,x)= 各元素质量分数 会 中(x)中(x)=exp[-(x-x,)2/o2],然后引入La- 入口厚度 mm grange函数进行求解. 入口温度 通过误差向量e,来确定加权系数·具体方法 压下率 1 如下: 工作辊半径 m le/sl≤C,: (C2-le,/5I)/(C2-C,),C,≤le,≤C2: 4.2建模和预测 10-4, otherwise. 从热轧的生产线提取相关生产数据.训练数据有 (5) 4998组,对原始数据进行预处理后进行聚类,聚类之 式中,C,和C2一般取值为2.5和3.0,因为在高斯分 后对每一类分别进行建模和预测.聚类分析中采用 布N(0,1)中,绝对值小于2.5的样本出现概率为 Silhouette指标确定聚类数为2,每类样本中分别有数 99.38%,而绝对值小于3.0的样本出现概率为 据2869组和2129组.然后选取三个测试数据集,每个 99.87%.误差e:的计算公式为 500组数据.聚类前和聚类后的模型预测结果的复测 定系数R值如表2所示.复测定系数越大说明拟合程 di ei=y (6) 度越好.从表2可以看到,与BP神经网络相比,支持 5用于衡量误差向量e:的分布与高斯分布的差异 向量机因基于结构风险具有更优的预测结果,而加权 程度,它的计算公式为 支持向量机考虑了样本的差异对结果的贡献,具有最 IOR 好的预测结果.为了形象展示聚类后的预测结果,两 $=2×0.6745 (7) 类的预测结果分别如图4和图5所示.从图中可以看 式中,QR为四分位数间距,也就是将误差值排序之 到预测值和实际值的相对误差基本在10%以内 后,分别位于75%和25%位置的两个数据中间的 4.3轧制力预报 差值. 采用表3中的接触面积、变形抗力、应力系数、张 s=1.483MAD(x,). (8) 力系数等代入式(1)表达的机理模型计算出轧制力近 式中,MAD(x)是绝对离差的中位数. 似值,然后利用表1中的过程变量并采集实际生产数 最终得到加权支持向量机的预测模型: 据,利用加权支持向量机计算出轧制力修正系数后,即何 飞等: 基于多模态和加权支持向量机的热轧轧制力智能预报 持向量机算法进行建模和预测,最后将所有的结果进 行汇总. 当产生新的样本时,则计算该样本到各类中 心的距离,将该样本划归到距离最近的类,然后采用该 类建立的加权支持向量机模型进行预测. 3 加权最小二乘支持向量机 支持向量机是在统计学习理论的基础上发展起来 的新型分类和回归工具,它可以在很大程度上克服维 数灾难、过学习等现象. 支持向量机学习算法可以归 结为求解一个受约束的凸二次型规划( quadratic pro￾gramming,QP) 问题,它的核心思想是利用核函数将输 入空间中线性不可分的样本映射到一个高维的特征空 间,使样本线性可分或者近似线性可分[9 - 10]. 加权最小二乘支持向量机是支持向量机的一种改 进. 对于同样的训练集( xi,yi ) ,i = 1,2,…,l,x∈Rn ,y ∈R,加权支持向量机算法中加入权重因子 vi,其回归 问题如下[11 - 12]: min J( w,ξ) = 1 2 ( w,w) + 1 2 γ∑ l i = 1 viξi ; s. t. yi = w( xi ) + b + ξi,i = 1,2,…, { l. ( 4) 式中: w 为支持向量面的法向量; ξi 为松弛变量; γ 为 正则化参数,用于平衡拟合误差和模型的复杂程度. 加权支持向量机中选取径向基核函数 k( x,xi ) = '( xi ) ( xi ) = exp [- ( x - xi ) 2 /σ2 ],然后引入 La￾grange 函数进行求解. 通过误差向量 ei 来确定加权系数 vi . 具体方法 如下: vi = 1, |ei / ^ s| ≤C1 ; ( C2 - |ei / ^ s| ) /( C2 - C1 ) , C1≤|ei / ^ s| ≤C2 ; 10 - 4, otherwise { . ( 5) 式中,C1 和 C2 一般取值为 2. 5 和 3. 0,因为在高斯分 布 N( 0,1) 中,绝 对 值 小 于 2. 5 的 样 本 出 现 概 率 为 99. 38% ,而 绝 对 值 小 于 3. 0 的 样 本 出 现 概 率 为 99. 87% . 误差 ei 的计算公式为 ei = ai γ . ( 6) ^ s 用于衡量误差向量 ei 的分布与高斯分布的差异 程度,它的计算公式为 ^ s = IQR 2 × 0. 6745. ( 7) 式中,IQR 为四分位数间距,也就是将误差值排序之 后,分 别 位 于 75% 和 25% 位置的两个数据中间的 差值. ^ s = 1. 483MAD( xi ) . ( 8) 式中,MAD( xi ) 是绝对离差的中位数. 最终得到加权支持向量机的预测模型: f( x) = ∑ l i = 1 aik( x,xi ) + b. ( 9) 其中,ai 和 b 为模型系数,模型中正则化参数 γ 和带宽 σ2 是加权支持向量机训练需要调整的两个参数,它们 的选取将直接影响模型的训练精度和预报精度,在建 模时采用交叉验证法进行寻优. 4 热轧轧制力智能预报应用 4. 1 数据预处理 首先选择对轧制力产生影响的工艺参数作为模型 的输入,然后应用加权支持向量机算法来计算轧制力 的修正系数. 根据实际生产经验和领域专家知识,模 型所需要的输入变量见表 1. 建模数据的质量会影响模型的精度,首先对数据 进行预处理. 预处理包括空缺值和奇异值样本的删 除,其中奇异值的处理是借助正态分布的 3 倍标准差 原则来筛选; 其次,为消除数据量纲对建模的影响,对 样本数据标准化,即将原始数据减去均值后再除以标 准差. 表 1 模型的输入变量 Table 1 Input variables of the model 变量名称 单位 各元素质量分数 % 入口厚度 mm 入口温度 ℃ 压下率 1 工作辊半径 m 4. 2 建模和预测 从热轧的生产线提取相关生产数据. 训练数据有 4998 组,对原始数据进行预处理后进行聚类,聚类之 后对每一类分别进行建模和预测. 聚类分析中采用 Silhouette 指标确定聚类数为 2,每类样本中分别有数 据2869 组和2129 组. 然后选取三个测试数据集,每个 500 组数据. 聚类前和聚类后的模型预测结果的复测 定系数 R2 值如表 2 所示. 复测定系数越大说明拟合程 度越好. 从表 2 可以看到,与 BP 神经网络相比,支持 向量机因基于结构风险具有更优的预测结果,而加权 支持向量机考虑了样本的差异对结果的贡献,具有最 好的预测结果. 为了形象展示聚类后的预测结果,两 类的预测结果分别如图 4 和图 5 所示. 从图中可以看 到预测值和实际值的相对误差基本在 10% 以内. 4. 3 轧制力预报 采用表 3 中的接触面积、变形抗力、应力系数、张 力系数等代入式( 1) 表达的机理模型计算出轧制力近 似值,然后利用表 1 中的过程变量并采集实际生产数 据,利用加权支持向量机计算出轧制力修正系数后,即 · 915 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有