正在加载图片...
926 工程科学学报,第42卷,第7期 值与PM2s浓度之间的关系方程,并利用列生成算 核矩阵利用列生成算法求解模型参数.实验中, 法求解方程参数 L,PR表示单核预测模型,L+P+R表示本文提出的 3.1特征选择 混合核模型,核函数中的标准差σ用x-x的均 从图像中提取Fh,Fis,Fi,Fg,Fia共5个特征, 值代替(,遍历所有的训练样本).基于图像混合 对各特征和1h后的PM2s值进行相关性分析,结 核的列生成预测步骤如下 果如表1所示,5个特征与PM25浓度均呈负相 步骤1:采集图像数据和PM2s浓度数据,经数 关,可知PM25浓度升高,会导致图像对比度、暗 据预处理后,配成样本对: 通道强度下降,HSI颜色差异变小.其中Fg,Fia与 步骤2:提取图像特征,与1h后的PMs浓度 PM25值的相关性强,Fh,Fs,F与PM25的相关性 数据做相关性分析,别除弱相关特征; 较强.因此,本文选择Fih,Fis,Fi,Fig,Fa共5个特 步骤3:选取多个核函数,计算核函数基于图 征进行模型训练 像特征值的Gram矩阵; 步骤4:将多个Gram矩阵合并为混合核矩阵; 表1特征与PM25相关性值 步骤5:抽取混合核矩阵的部分列构成列子 Table 1 Correlation between characteristics and PM,s 集,利用列生成算法基于列子集求取模型当 Fa Fid Fih Fis Fa 前解; -0.55 -0.46 -0.36 -0.4 -0.29 步骤6:验证当前解是否为最优解.若是,输出 3.2预测步骤 最优解,模型构建完成;若否,抽取未选列中的最 为方便预测,首先构造混合核矩阵,将给定的 佳列添加到列子集中,返回步骤5; 多个核函数组成核函数集S=(K1,K2,…,K,计算 步骤7:利用验证集验证预测模型的精度与稳 每个核基于训练样本K,(,x)的Gram矩阵KP 定性 (Kp(,x)对应第j个训练样本).然后,将所有Gram 3.3性能指标 矩阵并列构成一个混合核矩阵K=[K,K2,…,KP], 为了衡量单核预测模型和本文混合核模型的 则K为I×d的矩阵,其中d=l×p,K表示混合核矩 性能优劣,采用均方根误差(em∝),平均绝对百分 比误差(empe)和相关系数(R2)3个指标对模型进 阵的第行,K表示混合核矩阵的第列 行评估: 在没有任何先验知识的前提下,优先选择简 单的、计算成本低的核函数.本实验中,当简单核 emse (yii),emape= 1- WnZi=1 n1 yi 函数对应的列没有可添加的列用于求解时,则需 要从更加复杂的核函数列中选取列用于求解.因 R2=1- 》10-)2 此实验从简单到复杂采用三种核函数:线性核函 丁”6-2 EI 数(L)、多项式核函数(P)、RBF核函数(R)构建混 式中:y表示第个样本对应的PM25浓度的真实 合核,将给定的3个核函数组成核函数集 值,,表示第个样本对应的PM25浓度的预测值, S={KL,KP,…,KR,分别计算每个核基于训练样本 表示模型预测输出平均值.emse反映模型预测输 的Gram矩阵KL,KP,KR.将所有Gram矩阵并列构 出值稳定性,emape反映模型预测输出值偏离实际 成一个混合核矩阵K=[K,KP,K],然后基于混合 值的程度,两者均是越小说明模型性能越好;反 (a) 图1数据采集设备(a)及数据样本(b) Fig.1 Data acquisition equipment(a)and data samples (b)值与 PM2.5 浓度之间的关系方程,并利用列生成算 法求解方程参数. 3.1    特征选择 Fih Fis Fii Fig Fid Fig Fid Fih Fis Fii Fih Fis Fii Fig Fid 从图像中提取 , , , , 共 5 个特征, 对各特征和 1 h 后的 PM2.5 值进行相关性分析,结 果如表 1 所示. 5 个特征与 PM2.5 浓度均呈负相 关,可知 PM2.5 浓度升高,会导致图像对比度、暗 通道强度下降,HSI 颜色差异变小. 其中 , 与 PM2.5 值的相关性强, , , 与 PM2.5 的相关性 较强. 因此,本文选择 , , , , 共 5 个特 征进行模型训练. 3.2    预测步骤 S = {K1,K2,··· ,Kp} Kp(·, x j) K p Kp(·, x j) j K = [K 1 ,K 2 ,··· ,K p ] K l×d d = l× p Ki· i K· j j 为方便预测,首先构造混合核矩阵. 将给定的 多个核函数组成核函数集 ,计算 每 个 核 基 于 训 练 样 本 的 Gram 矩 阵 ( 对应第 个训练样本). 然后,将所有 Gram 矩阵并列构成一个混合核矩阵 , 则 为 的矩阵,其中 , 表示混合核矩 阵的第 行, 表示混合核矩阵的第 列. L P R S = {KL,KP,··· ,KR} K L ,K P ,K R K = [K L ,K P ,K R ] 在没有任何先验知识的前提下,优先选择简 单的、计算成本低的核函数. 本实验中,当简单核 函数对应的列没有可添加的列用于求解时,则需 要从更加复杂的核函数列中选取列用于求解. 因 此实验从简单到复杂采用三种核函数:线性核函 数 ( )、多项式核函数 ( )、RBF 核函数 ( ) 构建混 合 核 . 将 给 定 的 3 个 核 函 数 组 成 核 函 数 集 ,分别计算每个核基于训练样本 的 Gram 矩阵 . 将所有 Gram 矩阵并列构 成一个混合核矩阵 ,然后基于混合 L,P,R L+ P+R σ xi − xj 2 i j 核矩阵利用列生成算法求解模型参数. 实验中, 表示单核预测模型, 表示本文提出的 混合核模型,核函数中的标准差 用 的均 值代替( , 遍历所有的训练样本). 基于图像混合 核的列生成预测步骤如下. 步骤 1:采集图像数据和 PM2.5 浓度数据,经数 据预处理后,配成样本对; 步骤 2:提取图像特征,与 1 h 后的 PM2.5 浓度 数据做相关性分析,剔除弱相关特征; 步骤 3:选取多个核函数,计算核函数基于图 像特征值的 Gram 矩阵; 步骤 4:将多个 Gram 矩阵合并为混合核矩阵; 步骤 5:抽取混合核矩阵的部分列构成列子 集 ,利用列生成算法基于列子集求取模型当 前解; 步骤 6:验证当前解是否为最优解. 若是,输出 最优解,模型构建完成;若否,抽取未选列中的最 佳列添加到列子集中,返回步骤 5; 步骤 7:利用验证集验证预测模型的精度与稳 定性. 3.3    性能指标 emse emape R 2 为了衡量单核预测模型和本文混合核模型的 性能优劣,采用均方根误差( ),平均绝对百分 比误差( )和相关系数( )3 个指标对模型进 行评估: emse = √ 1 n ∑n i=1 (yi −yˆi), emape = 1 n ∑n 1 yi −yˆi yi , R 2 = 1− ∑n i=1 (yi −yˆi) 2 ∑n i=1 (¯y−yˆi) 2 yi i yˆi i y¯ emse emape R 2 式中: 表示第 个样本对应的 PM2.5 浓度的真实 值 , 表示第 个样本对应的 PM2.5 浓度的预测值, 表示模型预测输出平均值. 反映模型预测输 出值稳定性, 反映模型预测输出值偏离实际 值的程度,两者均是越小说明模型性能越好; 反 表 1    特征与 PM2.5 相关性值 Table 1    Correlation between characteristics and PM2.5 Fig Fid Fih Fis Fii – 0.55 – 0.46 – 0.36 – 0.4 – 0.29 (a) (b) 图 1    数据采集设备(a)及数据样本(b) Fig.1    Data acquisition equipment (a) and data samples (b) · 926 · 工程科学学报,第 42 卷,第 7 期
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有