Fig.1 The flowchart of MEIVS algorith_中国高校课件下载中心

点击下载：《工程科学学报》：综合智能模型的碳钢大气腐蚀重要变量提取和依赖关系挖掘（北京科技大学）

正在加载图片...

Fig.1 The flowchart of MEIVS algorithm:(a)main process steps of MEIVS algorithm;(b)process steps of Permutation algorithm 2.2局部依赖曲线设f八)表示输入变量与输出变量的映射关系，在样本xw上对于第Sm)个输入变量的 Ceteris--paribus函数(e)为： h()=f) (2) (是描述输出变量的预测值与第j个输入变量x,的依赖关系的函数，其中，x:代表其他输入变量取样本x"的实际值、第j个输入变量任取z值时构造的样本，：可在变量的整个数值范围内取值。考虑更广泛的情况，本文随机挑选l00个样本，计算l00梯本的Ceteris-paribus函数，取其均值得到局部依赖函数g（),通过该函数所绘制的曲线为PDP2 g=之 n (3) 本文以PDP描述环境变量的变化对腐蚀电偶电流的碎均影响，PDP由三个模型的预测均值产生。PDP的变化越剧烈，表示环境变量对腐蚀电偶兜流产生的影响越大。 3仿真结果与分析 3.1大气离做重要变量分析本文以Z-Score标准化后的相对湿度、温度、降雨、O3浓度、SO2浓度、NO2浓度、PM2.5浓度、 PM10浓度数据作为输入变量，对数腐蚀电偶电流为输出变量，分别对五个地区的大气腐蚀数据建立RF、GBRT、BPNN模型。本文以8O%的数据作为训练集，20%的数据作为测试集，为每个地区的模型进行了调参。对于RF,用MO0棵CART树作为基学习器，超参数为用于CART树的变量个数：对于GBT,超参数为提迭代次数、最大树深度、学习速率、最小终端节点大小：对于 BPNN,采用双隐层结构微函数为ah函数，学习速率设置为0.0ool,最大迭代次数为 10000, 超参数为隐层神经元个数。采用网格搜索法和十折交叉验证法对3个模型进行调优，其他未调参数采用默认值，模型预测结果如表2所示。评价指标采用可决系数(Coefficient of Determination,R)和RMSE。之-y R2=1- (4) 2- 其中，)为所有样本实际值的均值。表2三州横型在不同地区的州合表现 Table 2 Fitting performance of the three models in different regions Training set Testing set Region Model RMSE R RMSE Beijing 0.956 0.408 0.8150.743Fig.1 The flowchart of MEIVS algorithm: (a) main process steps of MEIVS algorithm; (b) process steps of Permutation algorithm 2.2 局部依赖曲线设 f   表示输入变量与输出变量的映射关系，在样本 new x 上对于第 j(j≤m)个输入变量的 Ceteris-paribus 函数 ( ) j h z 为：    |  j new j z h z f x   (2)   j h z 是描述输出变量的预测值与第 j 个输入变量 j x 的依赖关系的函数，其中， | new j z x  代表其他输入变量取样本 new x 的实际值、第 j 个输入变量任取 z 值时构造的样本，z 可在变量 j x 的整个数值范围内取值。考虑更广泛的情况，本文随机挑选 100 个样本，计算 100 个样本的 Ceteris-paribus 函数，取其均值得到局部依赖函数   j g z ，通过该函数所绘制的曲线为 PDP[24,25]。    |  1 1 n j i j z i g z f x n     (3) 本文以 PDP 描述环境变量的变化对腐蚀电偶电流的平均影响，PDP 由三个模型的预测均值产生。PDP 的变化越剧烈，表示环境变量对腐蚀电偶电流产生的影响越大。 3 仿真结果与分析 3.1 大气腐蚀重要变量分析本文以 Z-Score 标准化后的相对湿度、温度、降雨、O3浓度、SO2浓度、NO2浓度、PM2.5 浓度、 PM10 浓度数据作为输入变量，对数腐蚀电偶电流为输出变量，分别对五个地区的大气腐蚀数据建立 RF、GBRT、BPNN 模型。本文以 80%的数据作为训练集，20%的数据作为测试集，为每个地区的模型进行了调参。对于 RF，采用 100 棵 CART 树作为基学习器，超参数为用于 CART 树的变量个数；对于 GBRT，超参数为提升迭代次数、最大树深度、学习速率、最小终端节点大小；对于 BPNN，采用双隐层结构，激活函数为 tanh 函数，学习速率设置为 0.0001，最大迭代次数为 10000，超参数为隐层神经元个数。采用网格搜索法和十折交叉验证法对 3 个模型进行调优，其他未调参数采用默认值。模型预测结果如表 2 所示。评价指标采用可决系数 (Coefficient of Determination, R2 )和 RMSE。     2 2 1 2 1 ˆ 1 N i i i N i i y y R y y         (4) 其中， y 为所有样本实际值的均值。表 2 三种模型在不同地区的拟合表现 Table 2 Fitting performance of the three models in different regions Region Model Training set Testing set R 2 RMSE R 2 RMSE Beijing RF 0.956 0.408 0.815 0.743 录用稿件，非最终出版稿

<<向上翻页向下翻页>>

点击下载：《工程科学学报》：综合智能模型的碳钢大气腐蚀重要变量提取和依赖关系挖掘（北京科技大学）