正在加载图片...
·1698 北京科技大学学报 第36卷 度变化趋势和范围,并验证预测结果的准确性.其 得出正确结果.采用交叉验证方法选取的参数比随 中,分别取得该监测点四个季节有效数据1761个 机选取参数所得到的模型的回归预测结果更有效, (春季)、2036个(夏季)、2068个(秋季)和2059个 此处采用k重交叉验证法,即将原始数据均分为k (冬季),相应的变化范围分别为y1∈(3,479)μg· 组,将每个子集数据分别做一次验证集,剩余的k- m-3、y2∈(3,560)μgm-3、y3∈(3,381)ugm-3和 1组子集数据作为训练机,用这k个模型最终的验 y4∈(3,589)μg"m-3. 证集的平均准确率作为此交叉验证的性能指标.大 采用式(5)所示的三角型函数对PM2s原始监 量的实验和研究表明s-,采用径向基函数(radial 测数据进行模糊粒化,通过MATLAB平台下的函数 basis function,RBF)为核函数具有较高的拟合和预 接口实现,分别筛选出用于训练和预测的自变量和 测精度,故选用其作为核函数进行研究,如式(7)所 因变量样本集.将原始数据划分为多个窗口,每个 示,其构造的支持向量机回归估计函数如式(8) 窗口生成一个模糊粒子,此处以24h作为一个窗 所示: 宽,窗口数即为原始数据长度除以24后取整.以春 K(x,x)=exp {-Gx;x2),(7) 季的数据样本为例,其原始质量浓度随时间的变化 f(x)= (a;-a;)exp (-Gx;+b. 和数据模糊粒化结果分别如图4和图5所示,其中 图5中的L、R和U为模糊粒子参数,分别表示 (8) PM2,质量浓度值变化的最小值、平均值和最大值. 式中,‖x:-x‖是二范数距离,G是径向基函数的 500 核函数参数.式(7)所示的径向基函数对应的特征 450 空间是无穷维的,使得有限的样本在该特征空间中 400 350 线性可分.对于惩罚参数C和核函数参数G的选 取,采取以下步骤实现:①设定C和G的初始变化 20 范围及步进大小,通过网格划分使其在一定范围内 搜索最佳参数:②选取能达到最高验证回归准确率 150 00 中最小的C及其对应的G作为最佳参数;③若出现 50 多组最小的C及对应的G,则选取搜索到的第一组 20040060080010001200140016001800 C和G作为最佳参数. 时间序列h 3.3基于LIBSVM的回归预测实现 图4质量浓度随时间变化 支持向量机算法的实现采用台湾大学林智仁 Fig.4 Variation of mass concentration with time (Lin Chih-Jen)教授开发的LIBSVM工具箱. 450 LIBSVM具有参数调节较少、便于改进及系统兼容 400 性强的优点,可在MATLAB上实现操作.利用 LIBSVM分别对模糊粒子参数L、R和U进行回归预 测,首先对数据样本进行归一化到0,1]区间的预 处理方式,再应用k重交叉验证的方法搜索并选择 15 使均方差误差δRE最小的最佳回归参数,此处将C 00 和G的初步搜索范围确定为2-“,2],搜索过程 如图6所示,在初步搜索后,根据搜索到的第一组C 和G,缩小搜索范围并进行精细的参数优选,通过再 20 30 40 50 粒化时间序列h 次搜索最终得出最优C和G参数值.利用最优参数 值对原始值进行回归预测,拟合结果如图7所示 图5数据模糊粒化结果 通过图7所示的模糊粒子拟合结果图可以看出L、R Fig.5 Fuzzy granulation of original data 和U的变化趋势及范围.从图中的拟合效果来看, 3.2£一支持向量机参数优化 三者的拟合结果基本与原始数据保持一致的变化趋 支持向量机的性能主要受核函数类型、核函数 势,表明该模型具有较好的预测能力.同理,用夏 参数及惩罚参数的影响网,目前对于核函数及相关 季、秋季和冬季的监测数据样本建立模糊粒化时序 参数的选择仍无统一的模式,需进行有效优化方可 模型,分别对下一个模糊粒子进行回归预测,可得出北 京 科 技 大 学 学 报 第 36 卷 度变化趋势和范围,并验证预测结果的准确性. 其 中,分别取得该监测点四个季节有效数据 1761 个 ( 春季) 、2036 个( 夏季) 、2068 个( 秋季) 和 2059 个 ( 冬季) ,相应的变化范围分别为 y1∈( 3,479) μg· m - 3、y2∈( 3,560) μg·m - 3、y3∈( 3,381) μg·m - 3和 y4∈( 3,589) μg·m - 3 . 采用式( 5) 所示的三角型函数对 PM2. 5 原始监 测数据进行模糊粒化,通过 MATLAB 平台下的函数 接口实现,分别筛选出用于训练和预测的自变量和 因变量样本集. 将原始数据划分为多个窗口,每个 窗口生成一个模糊粒子,此处以 24 h 作为一个窗 宽,窗口数即为原始数据长度除以 24 后取整. 以春 季的数据样本为例,其原始质量浓度随时间的变化 和数据模糊粒化结果分别如图 4 和图 5 所示,其中 图 5 中 的 L、R 和 U 为模糊粒子参数,分 别 表 示 PM2. 5质量浓度值变化的最小值、平均值和最大值. 图 4 质量浓度随时间变化 Fig. 4 Variation of mass concentration with time 图 5 数据模糊粒化结果 Fig. 5 Fuzzy granulation of original data 3. 2 ε--支持向量机参数优化 支持向量机的性能主要受核函数类型、核函数 参数及惩罚参数的影响[26],目前对于核函数及相关 参数的选择仍无统一的模式,需进行有效优化方可 得出正确结果. 采用交叉验证方法选取的参数比随 机选取参数所得到的模型的回归预测结果更有效, 此处采用 k 重交叉验证法,即将原始数据均分为 k 组,将每个子集数据分别做一次验证集,剩余的 k - 1 组子集数据作为训练机,用这 k 个模型最终的验 证集的平均准确率作为此交叉验证的性能指标. 大 量的实验和研究表明[26--28],采用径向基函数( radial basis function,RBF) 为核函数具有较高的拟合和预 测精度,故选用其作为核函数进行研究,如式( 7) 所 示,其构造的支持向量机回归估计函数如式( 8) 所示: K( xi,xj ) = exp { - G ‖xi - xj‖2 } , ( 7) f( x) = ∑ n i = 1 ( αi - α* i ) exp { - G ‖xi - xj‖2 } + b. ( 8) 式中,‖xi - xj‖是二范数距离,G 是径向基函数的 核函数参数. 式( 7) 所示的径向基函数对应的特征 空间是无穷维的,使得有限的样本在该特征空间中 线性可分. 对于惩罚参数 C 和核函数参数 G 的选 取,采取以下步骤实现: ①设定 C 和 G 的初始变化 范围及步进大小,通过网格划分使其在一定范围内 搜索最佳参数; ②选取能达到最高验证回归准确率 中最小的 C 及其对应的 G 作为最佳参数; ③若出现 多组最小的 C 及对应的 G,则选取搜索到的第一组 C 和 G 作为最佳参数. 3. 3 基于 LIBSVM 的回归预测实现 支持向量机算法的实现采用台湾大学林智仁 ( Lin Chih-Jen ) 教 授 开 发 的 LIBSVM 工 具 箱. LIBSVM 具有参数调节较少、便于改进及系统兼容 性强 的 优 点,可 在 MATLAB 上 实 现 操 作. 利 用 LIBSVM 分别对模糊粒子参数 L、R 和 U 进行回归预 测,首先对数据样本进行归一化到[0,1]区间的预 处理方式,再应用 k 重交叉验证的方法搜索并选择 使均方差误差 δMRE最小的最佳回归参数,此处将 C 和 G 的初步搜索范围确定为[2 - 10,210],搜索过程 如图 6 所示,在初步搜索后,根据搜索到的第一组 C 和 G,缩小搜索范围并进行精细的参数优选,通过再 次搜索最终得出最优 C 和 G 参数值. 利用最优参数 值对原始值进行回归预测,拟合结果如图 7 所示. 通过图 7 所示的模糊粒子拟合结果图可以看出 L、R 和 U 的变化趋势及范围. 从图中的拟合效果来看, 三者的拟合结果基本与原始数据保持一致的变化趋 势,表明该模型具有较好的预测能力. 同理,用夏 季、秋季和冬季的监测数据样本建立模糊粒化时序 模型,分别对下一个模糊粒子进行回归预测,可得出 · 8961 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有