正在加载图片...
354 工程科学学报,第42卷,第3期 法中涉及的核心样本定义为:在样本p的邻域半 Normal training samples 径内包含的样本数量不少于邻域内最少样本数设 O Breakout training samples ◇ 定值,即: 2 WEps(pl≥MinPts (7) 9 式中:NEps(p)={gEDDTW(p,q)≤Eps,D为数据 集,P,q∈D,DTW(p,q)表示样本p、q的动态时间弯 6 曲距离. 密度聚类首先根据参数邻域半径、邻域内最 u6r 少样本数确定样本库Q中所有的核心样本,然后 0 0 10 15 20 以任一核心对象为出发点,找出与其密度相连的 Distance from the cluster center 样本生成类簇,直到所有的核心对象均被访问为 图8训练样本密度聚类可视化结果 止.令邻域半径为3.0、邻域内最少样本数为7, Fig.8 Training samples visual result after DBSCAN clustering 对样本库Q实施密度聚类,聚类结果如表2所示, 其中0和-1分别指代两个类簇标号 3.5漏钢预报方法开发 聚类结束后,共计捕获了30个漏钢样本(标号 依据上述聚类结果及构建的聚类模型,鉴于 为0),其余未被捕获的样本标记记为噪声(标号为 漏钢样本从属于同一类簇,且同一类簇样本属于 -1),包括20个正常模式样本和30个误报模式样 同一类别,可根据新样本在模型中的聚类结果,即 本.将标号为0的类簇称之为漏钢类簇,记为CB, 新样本与样本库Q重新聚类后所属的类簇,对其 将标号为-1的样本归为噪声类簇,即包括正常和 是否属于漏钢进行识别和判定.判定流程如图9 误报在内的正常工况类簇记为CN.训练样本的聚 所示.漏钢识别与判定时首先需要对实时温度数 类可视化结果如图8所示.图中横坐标表示每个 据进行温度预处理,然后将新样本与样本库Q一 样本与其所在类簇的中心的距离,纵坐标表示每 Begin 个样本与其所在类簇中最近的7(邻域内最少样本 数设定值)个样本距离的平均值 Real-time temperature acquisition 表2训练样本密度聚类结果 Table 2 DBSCAN clustering result of training samples Temperature pre-processing Working condition DBSCAN clustering result (label) Temperature change rate Difference of change rate -1-1-1-1-1-1-1-1-1-1 Normal -core normalization -1-1-1-1-1-1-1-1-1-1 -1-1-1-1-1-1-1-1-1-1 Sample similarity measurement False alarm -1-1-1-1-1-1-1-1-1-1 Dynamic Time Warping -1-1-1-1-1-1-1-1-1-1 0000000000 Breakout 0000000000 --- Xnew 0000000000 DBSCAN clustering 从图8中可以看出,正常工况样本彼此较为分 散,因此不能被规则捕获.然而,聚类得到的漏钢 The label ofx is 0? No 类簇样本彼此距离较近且集中,表明其易于被规 则捕获形成类簇.聚类结果与漏钢温度模式相似 Yes 而正常工况下的温度异常样本模式多样化的特点 Breakout alarm 高度吻合,说明采用动态时间弯曲距离度量方式 图9漏钢预报流程 和密度聚类方法是合理的 Fig.9 Flowchart of breakout prediction法中涉及的核心样本定义为:在样本 p 的邻域半 径内包含的样本数量不少于邻域内最少样本数设 定值,即: NEps (p) ⩾ MinPts (7) NEps (p) = { q ∈ D DTW(p,q) ⩽ Eps} D p,q ∈ D DTW(p,q) 式中 : , 为数据 集, , 表示样本 p、q 的动态时间弯 曲距离. 密度聚类首先根据参数邻域半径、邻域内最 少样本数确定样本库 Q 中所有的核心样本,然后 以任一核心对象为出发点,找出与其密度相连的 样本生成类簇,直到所有的核心对象均被访问为 止[18] . 令邻域半径为 3.0、邻域内最少样本数为 7, 对样本库 Q 实施密度聚类,聚类结果如表 2 所示, 其中 0 和−1 分别指代两个类簇标号. 聚类结束后,共计捕获了 30 个漏钢样本(标号 为 0),其余未被捕获的样本标记记为噪声(标号为 −1),包括 20 个正常模式样本和 30 个误报模式样 本. 将标号为 0 的类簇称之为漏钢类簇,记为 CB, 将标号为−1 的样本归为噪声类簇,即包括正常和 误报在内的正常工况类簇记为 CN. 训练样本的聚 类可视化结果如图 8 所示. 图中横坐标表示每个 样本与其所在类簇的中心的距离,纵坐标表示每 个样本与其所在类簇中最近的 7(邻域内最少样本 数设定值)个样本距离的平均值. 从图 8 中可以看出,正常工况样本彼此较为分 散,因此不能被规则捕获. 然而,聚类得到的漏钢 类簇样本彼此距离较近且集中,表明其易于被规 则捕获形成类簇. 聚类结果与漏钢温度模式相似 而正常工况下的温度异常样本模式多样化的特点 高度吻合,说明采用动态时间弯曲距离度量方式 和密度聚类方法是合理的. 3.5    漏钢预报方法开发 依据上述聚类结果及构建的聚类模型,鉴于 漏钢样本从属于同一类簇,且同一类簇样本属于 同一类别,可根据新样本在模型中的聚类结果,即 新样本与样本库 Q 重新聚类后所属的类簇,对其 是否属于漏钢进行识别和判定. 判定流程如图 9 所示. 漏钢识别与判定时首先需要对实时温度数 据进行温度预处理,然后将新样本与样本库 Q 一 表 2    训练样本密度聚类结果 Table 2    DBSCAN clustering result of training samples Working condition DBSCAN clustering result (label) Normal −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 False alarm −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 −1 Breakout 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 15 3 6 9 12 0 0 5 20 10 15 Distance from the cluster center Normal training samples Breakout training samples Average distance from the nearest neighbor 图 8    训练样本密度聚类可视化结果 Fig.8    Training samples visual result after DBSCAN clustering Begin Real-time temperature acquisition Temperature pre-processing Temperature change rate Difference of change rate Z-score normalization Sample similarity measurement Dynamic Time Warping DBSCAN clustering The label of xnew is 0? No xnew Q Breakout alarm Yes 图 9    漏钢预报流程 Fig.9    Flowchart of breakout prediction · 354 · 工程科学学报,第 42 卷,第 3 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有