正在加载图片...
其中,1表示简支集向量个数,1<nsw。式(10)优化解 (B,Y)=argmin (11) 式(ll)中,参数B,Y*优化解可以采用迭代贪婪算法(Iterative Greedy Algorithm)求得。如果采 用径向基核函数,式(11)可进一步简化为下面优化解 y-arg maxexp(-0.y /' (12) 其中,σ为核函数参数,n表示参与学习的部分支持向量个数。由于简支集分布在类边界曲线(或 曲面)上,因此可以实现正确、快捷的类判别。上面所讨论的利用简支集确定类边界的方法可简化质 量自动判别的过程,并为不同钢种的工艺规范的制定提供依据,具体应用在下面掌节中讨论。 为了验证方法的有效性,下面讨论应用实例。数据取自两个不同类的数据由于类间数据交叉 重叠,因此类边界较复杂,且支持向量较多。为了合理划分类边界,首先采用软间隔支持向量机, 求出76个支持向量,如图1所示。然后,取简支集的个数为10,从支芽向量集中随机抽取部分支持 向量组成10个子集,通过式(11)和式(12),求出各子集的简支集优化解。最后,通过函数拟合 方法求得类边界曲线,如图1所示。 1.2 reduced set 0.8 R N 0.6 support vecto 品 0.4 0.2 oo class 1 x class 2 class margin 025 -0.5 0 0.5 Variable 1 图1利用简支集确定类边界的例子 e of determined class boundaries using reduced sets 1.3质量在线评级与质指标预测 实现产品质量在线智能判级,首先需将待判样本通过同等缩放后投影到经过训练的工艺参数聚 类图上,并根锯映射点的位置选取距该点最近的K个训练集中的样本点作为参考样本集。然后,从 质量指标分类图找出这些参考样本集的类属性,采用K邻近分类法(KNN)确定待判样本的类 别。KNN算法的核心是,一个样本在特征空间中的K个邻近样本(参考样本)中的大多数属于某一 个类别,则认为该样本也属于这一类别。由于KNN方法对类域存在交叉、重叠的待分样本集来说具 有快捷、准确分类的特点,因此这种方法可以实现产品质量的在线快速判级。 此外,还可以通过非线性回归模型,如核偏最小二乘法、神经元网络、深度学习等方法预测待测 样本的产品质量指标值,并根据2.2节中讨论的产品质量指标的类边界,利用综合判定的方法来判 定待测样本的产品质量类别。 基于机器学习的产品质量自动判级过程,包括以下4个步骤: 1)数据采集与预处理:从实际生产线上采集主要工序的工艺参数和质量指标数据,并对样本 集中的数据进行清洗,剔除数据集中缺失数据、异常点等不规范数据:其中,l1 表示简支集向量个数,l1<nsv。式(10)优化解 2 1 * 1 1 ( ) arg min ( ) ( ) l nsv i i i i i i y y         * * β,Y β,Y β  α (11) 式(11)中,参数 β,Y*优化解可以采用迭代贪婪算法(Iterative Greedy Algorithm)求得。如果采 用径向基核函数,式(11)可进一步简化为下面优化解 2 * 2 * 1 arg max exp(-0.5 / ) nn i i y i y y      α y (12) 其中,σ 为核函数参数,nn 表示参与学习的部分支持向量个数。由于简支集分布在类边界曲线(或 曲面)上,因此可以实现正确、快捷的类判别。上面所讨论的利用简支集确定类边界的方法可简化质 量自动判别的过程,并为不同钢种的工艺规范的制定提供依据,具体应用在下面章节中讨论。 为了验证方法的有效性,下面讨论应用实例。数据取自两个不同类的数据,由于类间数据交叉 重叠,因此类边界较复杂,且支持向量较多。为了合理划分类边界,首先采用软间隔支持向量机, 求出 76 个支持向量,如图 1 所示。然后,取简支集的个数为 10,从支持向量集中随机抽取部分支持 向量组成 10 个子集,通过式(11)和式(12),求出各子集的简支集优化解。最后,通过函数拟合 方法求得类边界曲线,如图 1 所示。 -1.5 -1 -0.5 0 0.5 1 -0.2 0 0.2 0.4 0.6 0.8 1 1.2 Variable 1 V ariable 2 class margin o class 1 x class 2 reduced set support vectors 图 1 利用简支集确定类边界的例子 Fig.1 Example of determined class boundaries using reduced sets 1.3 质量在线评级与质量指标预测 实现产品质量在线智能判级,首先需将待判样本通过同等缩放后投影到经过训练的工艺参数聚 类图上,并根据映射点的位置选取距该点最近的 K 个训练集中的样本点作为参考样本集。然后,从 质量指标分类图中找出这些参考样本集的类属性,采用 K-邻近分类法(KNN)确定待判样本的类 别。KNN 算法的核心是,一个样本在特征空间中的 K 个邻近样本(参考样本)中的大多数属于某一 个类别,则认为该样本也属于这一类别。由于 KNN 方法对类域存在交叉、重叠的待分样本集来说具 有快捷、准确分类的特点,因此这种方法可以实现产品质量的在线快速判级。 此外,还可以通过非线性回归模型,如核偏最小二乘法、神经元网络、深度学习等方法预测待测 样本的产品质量指标值,并根据 2.2 节中讨论的产品质量指标的类边界,利用综合判定的方法来判 定待测样本的产品质量类别。 基于机器学习的产品质量自动判级过程,包括以下 4 个步骤: 1) 数据采集与预处理:从实际生产线上采集主要工序的工艺参数和质量指标数据,并对样本 集中的数据进行清洗,剔除数据集中缺失数据、异常点等不规范数据; 录用稿件,非最终出版稿
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有