正在加载图片...
Fig.1 The flowchart of MEIVS algorithm:(a)main process steps of MEIVS algorithm;(b)process steps of Permutation algorithm 2.2局部依赖曲线 设f八)表示输入变量与输出变量的映射关系,在样本xw上对于第Sm)个输入变量的 Ceteris--paribus函数(e)为: h()=f) (2) (是描述输出变量的预测值与第j个输入变量x,的依赖关系的函数,其中,x:代表其他 输入变量取样本x"的实际值、第j个输入变量任取z值时构造的样本,:可在变量的整个数值范 围内取值。考虑更广泛的情况,本文随机挑选l00个样本,计算l00梯本的Ceteris-paribus函数, 取其均值得到局部依赖函数g(),通过该函数所绘制的曲线为PDP2 g=之 n (3) 本文以PDP描述环境变量的变化对腐蚀电偶电流的碎均影响,PDP由三个模型的预测均值产 生。PDP的变化越剧烈,表示环境变量对腐蚀电偶兜流产生的影响越大。 3仿真结果与分析 3.1大气离做重要变量分析 本文以Z-Score标准化后的相对湿度、温度、降雨、O3浓度、SO2浓度、NO2浓度、PM2.5浓度、 PM10浓度数据作为输入变量,对数腐蚀电偶电流为输出变量,分别对五个地区的大气腐蚀数据建 立RF、GBRT、BPNN模型。本文以8O%的数据作为训练集,20%的数据作为测试集,为每个地区 的模型进行了调参。对于RF,用MO0棵CART树作为基学习器,超参数为用于CART树的变量 个数:对于GBT,超参数为提迭代次数、最大树深度、学习速率、最小终端节点大小:对于 BPNN,采用双隐层结构微函数为ah函数,学习速率设置为0.0ool,最大迭代次数为 10000, 超参数为隐层神经元个数。采用网格搜索法和十折交叉验证法对3个模型进行调优,其他 未调参数采用默认值,模型预测结果如表2所示。评价指标采用可决系数(Coefficient of Determination,R)和RMSE。 之-y R2=1- (4) 2- 其中,)为所有样本实际值的均值。 表2三州横型在不同地区的州合表现 Table 2 Fitting performance of the three models in different regions Training set Testing set Region Model RMSE R RMSE Beijing 0.956 0.408 0.8150.743Fig.1 The flowchart of MEIVS algorithm: (a) main process steps of MEIVS algorithm; (b) process steps of Permutation algorithm 2.2 局部依赖曲线 设 f   表示输入变量与输出变量的映射关系,在样本 new x 上对于第 j(j≤m)个输入变量的 Ceteris-paribus 函数 ( ) j h z 为:    |  j new j z h z f x   (2)   j h z 是描述输出变量的预测值与第 j 个输入变量 j x 的依赖关系的函数,其中, | new j z x  代表其他 输入变量取样本 new x 的实际值、第 j 个输入变量任取 z 值时构造的样本,z 可在变量 j x 的整个数值范 围内取值。考虑更广泛的情况,本文随机挑选 100 个样本,计算 100 个样本的 Ceteris-paribus 函数, 取其均值得到局部依赖函数   j g z ,通过该函数所绘制的曲线为 PDP[24,25]。    |  1 1 n j i j z i g z f x n     (3) 本文以 PDP 描述环境变量的变化对腐蚀电偶电流的平均影响,PDP 由三个模型的预测均值产 生。PDP 的变化越剧烈,表示环境变量对腐蚀电偶电流产生的影响越大。 3 仿真结果与分析 3.1 大气腐蚀重要变量分析 本文以 Z-Score 标准化后的相对湿度、温度、降雨、O3浓度、SO2浓度、NO2浓度、PM2.5 浓度、 PM10 浓度数据作为输入变量,对数腐蚀电偶电流为输出变量,分别对五个地区的大气腐蚀数据建 立 RF、GBRT、BPNN 模型。本文以 80%的数据作为训练集,20%的数据作为测试集,为每个地区 的模型进行了调参。对于 RF,采用 100 棵 CART 树作为基学习器,超参数为用于 CART 树的变量 个数;对于 GBRT,超参数为提升迭代次数、最大树深度、学习速率、最小终端节点大小;对于 BPNN,采用双隐层结构,激活函数为 tanh 函数,学习速率设置为 0.0001,最大迭代次数为 10000,超参数为隐层神经元个数。采用网格搜索法和十折交叉验证法对 3 个模型进行调优,其他 未调参数采用默认值。模型预测结果如表 2 所示。评价指标采用可决系数 (Coefficient of Determination, R2 )和 RMSE。     2 2 1 2 1 ˆ 1 N i i i N i i y y R y y         (4) 其中, y 为所有样本实际值的均值。 表 2 三种模型在不同地区的拟合表现 Table 2 Fitting performance of the three models in different regions Region Model Training set Testing set R 2 RMSE R 2 RMSE Beijing RF 0.956 0.408 0.815 0.743 录用稿件,非最终出版稿
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有