正在加载图片...
866 工程科学学报,第43卷,第6期 (2)实验环境 测试点1作为整流桥输出点,采集了其信号稳定 依托实验室现有的激励、测试仪器,通过实物 后电压最大值max和最小值mim,测试点 测量的方式,获取电路正常和故障状态下的测试 2~8均采集了信号稳定后的电压有效值,即 数据.测试环境如图3 2~'),不平衡比为1:4.17.根据不平衡数据集 分类问题的相关研究,92,该不平衡比例具有 一定的代表性.数据集记为Regulator,,部分数据如 表3. 3.4参数分析 将RBNR算法与SMOTE过采样方法、随机欠 采样与SMOTE相结合的算法(RU-SMOTE)2]和 基于“变异系数”的边界混合采样方法BMSM进行 对比实验,分类器均采用KELM.在传统的面向分 类问题的机器学习方法中,普遍采用最小化交叉 验证分类误差的方式选取模型参数.KELM涉及 到核函数、正则化参数与核参数的设置,借鉴文 图3测试环境图 献26]~[27I,核函数选用RBF核,正则化参数 Fig.3 Testing environment C取值范围设定为10,10,,10,10),在训练样 (3)测试数据集 本间的最大欧式距离和最小欧式距离间等间隔取 通过重复测试,共采集到188组正常状态下的 20个离散值作为核参数σ的范围(调用dd tools工 样本,此后电路发生故障,电容1击穿,后采集了 具箱的scale_range函数实现).采用网格搜索法, 45组故障状态下的样本,特征维数为9(其中图中 以最小化交叉验证分类误差为目标,确定各参数 表3电路实测数据(部分) Table 3 Some circuit measured data ID VimaV VimiNV VN VN VNV VN VeN VNV VsIV Attribute -7.730 -6.360 -6.923 -6.928 -6.281 -2.811 -2.981 -5.579 -0.140 2 -7.794 -6.337 -6.953 6.955 -6.297 -2.781 -2.969 -5.603 -0.134 normal 188 -7.706 -6.344 -6.943 -6.945 -6.271 -2.812 -3.020 -5.613 -0.148 189 -7.760 -6.622 -7.106 -7.089 -6.533 -2.656 -2.456 -4.548 -0.133 faulty 233 -7.792 -6.597 -7.078 -7.049 -6.503 -2.670 -2.544 -4.726 -0.113 由前文可知,RBNR算法为了使数据集分布均 文献[7]并未给出BMS算法中有关KBMs距离 衡,根据两类样本的数量差,令升、降采样量相等 值和变异系数阈值如何设置的相关说明,文献[28] 为公平起见,将RU-SMOTE算法和BMS算法中的 将KBMs值设置为20并结合实验指出变异系数阈 升、降采样量也设为相等Wup=Ndown,.SMOTE算 值设置在0.2~0.3之间能够得到较好的边界检测 法只包含升采样,令其升采样量与其他三种算法 结果.但是对于那些样本总量较大(例如多于 中少数类样本的升采样量设置为相同值,进而确 1000)的数据集而言,将KBMs值设置为20并不科 定采样倍率Vsample=[Wup/Wmin]文献[2O]将SMOTE 学,且在实验中发现,一些数据集的变异系数值都 算法中的最近邻阈值KSMOTE设置为采样倍率的2.5 远大于0.3.因此将变异系数阈值根据变异系数排 倍,因此在实验中将其设置为KSMOTE=[Vsample×2.5]. 序后的数值取突变点处的值更为合理,突变点可 RBNR算法涉及少数类样本近邻值k1和多数类样 以通过寻找相邻样本变异系数差值最大处来确 本近邻值k2两个参数,采用网格搜索法,最终确定 定.固定变异系数阈值,将正则化参数C设置为 k1=Nmin和k2=Nmai/3时算法性能总体最优 1,核参数σ取训练样本最大欧式距离和最小欧式(2)实验环境. 依托实验室现有的激励、测试仪器,通过实物 测量的方式,获取电路正常和故障状态下的测试 数据. 测试环境如图 3. 图 3 测试环境图 Fig.3 Testing environment (3)测试数据集. 通过重复测试,共采集到 188 组正常状态下的 样本,此后电路发生故障,电容 1 击穿,后采集了 45 组故障状态下的样本,特征维数为 9(其中图中 测试点 1 作为整流桥输出点,采集了其信号稳定 后 电 压 最 大 值 V1_max 和 最 小 值 V1_min, 测 试 点 2~ 8 均采集了信号稳定后的电压有效值 , 即 V2~V8),不平衡比为 1∶4.17. 根据不平衡数据集 分类问题的相关研究[7, 9, 12, 22] ,该不平衡比例具有 一定的代表性. 数据集记为 Regulator,部分数据如 表 3. 3.4    参数分析 ,··· 将 RBNR 算法与 SMOTE 过采样方法、随机欠 采样与 SMOTE 相结合的算法(RU-SMOTE) [23] 和 基于“变异系数”的边界混合采样方法 BMS[7] 进行 对比实验,分类器均采用 KELM. 在传统的面向分 类问题的机器学习方法中,普遍采用最小化交叉 验证分类误差的方式选取模型参数. KELM 涉及 到核函数、正则化参数与核参数的设置,借鉴文 献 [26]~ [27],核函数选 用 RBF 核 ,正则化参 数 C 取值范围设定为{10−5,10−4 ,104 ,105 },在训练样 本间的最大欧式距离和最小欧式距离间等间隔取 20 个离散值作为核参数 σ 的范围(调用 dd_tools 工 具箱的 scale_range 函数实现). 采用网格搜索法, 以最小化交叉验证分类误差为目标,确定各参数. 表 3 电路实测数据(部分) Table 3 Some circuit measured data ID V1_max/V V1_min/V V2 /V V3 /V V4 /V V5 /V V6 /V V7 /V V8 /V Attribute 1 −7.730 −6.360 −6.923 −6.928 −6.281 −2.811 −2.981 −5.579 −0.140 normal 2 −7.794 −6.337 −6.953 −6.955 −6.297 −2.781 −2.969 −5.603 −0.134 …… 188 −7.706 −6.344 −6.943 −6.945 −6.271 −2.812 −3.020 −5.613 −0.148 189 −7.760 −6.622 −7.106 −7.089 −6.533 −2.656 −2.456 −4.548 −0.133 …… faulty 233 −7.792 −6.597 −7.078 −7.049 −6.503 −2.670 −2.544 −4.726 −0.113 Nup = Ndown Nsample = [Nup/Nmin] KSMOTEKSMOTE = [Nsample ×2.5] k1 k2 k1 = Nmin k2 = Nmaj/3 由前文可知,RBNR 算法为了使数据集分布均 衡,根据两类样本的数量差,令升、降采样量相等. 为公平起见,将 RU-SMOTE 算法和 BMS 算法中的 升、降采样量也设为相等 . SMOTE 算 法只包含升采样,令其升采样量与其他三种算法 中少数类样本的升采样量设置为相同值,进而确 定采样倍率 . 文献 [20] 将 SMOTE 算法中的最近邻阈值 设置为采样倍率的 2.5 倍,因此在实验中将其设置为 . RBNR 算法涉及少数类样本近邻值 和多数类样 本近邻值 两个参数,采用网格搜索法,最终确定 和 时算法性能总体最优. KBMS KBMS KBMS 文献 [7] 并未给出 BMS 算法中有关 距离 值和变异系数阈值如何设置的相关说明,文献 [28] 将 值设置为 20 并结合实验指出变异系数阈 值设置在 0.2~0.3 之间能够得到较好的边界检测 结果. 但是对于那些样本总量较大(例如多于 1000)的数据集而言,将 值设置为 20 并不科 学,且在实验中发现,一些数据集的变异系数值都 远大于 0.3. 因此将变异系数阈值根据变异系数排 序后的数值取突变点处的值更为合理,突变点可 以通过寻找相邻样本变异系数差值最大处来确 定. 固定变异系数阈值,将正则化参数 C 设置为 1,核参数 σ 取训练样本最大欧式距离和最小欧式 · 866 · 工程科学学报,第 43 卷,第 6 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有