正在加载图片...
陈亮等:低合金钢海水腐蚀监测中的双率数据处理与建模 99· 从而将双率数据转换为单率数据{XkT1),Y化kT), 采样周期为T2的单率采样数据{CIVave(kT2),Y(kT2)小, 其样本数量显著减少 保留了原始数据更多的信息,获得了更多的建模 第二步定义综合指标值CIV表征海水输入环 样本. 境因子对腐蚀电位的综合影响,其定义式如下: 上述流程提出了输入变量采样周期大于输出 变量采样周期(T>T)情况下的双率数据处理方 CIV(kTI)= wixi(kT1) (5) 法.对于输入变量采样周期小于输出变量采样周 期(T1<T2)的情况,只需对上述流程中的第一步和 式中,m表示海水环境因子的个数,x(kT)表示海 第五步稍作修改即可.第一步中,将小采样周期的 水环境因子数据,w是每个海水环境因子的权重, 输入变量数据采用均值法进行处理转换为单率数 是待优化参数 据.第五步中,通过原始输入变量数据计算CIV序 第三步采用2.1节的BAS算法对上一步中的 列,并将其代入第四步建立的对应最小二乘模型 参数进行寻优.寻优目标设置为: 可以计算得到对应的输出变量数据.经上述处理 W=argmin (6) 后也能得到具有更多建模样本的单率数据集 coeff(CIV(kT1),y'kT)川 2.3IRVR方法 2.3.1RVR原理 ∑8-4- 相关向量回归(Relevance vector regression,.RVR) 是由Tipping2于2001年提出的一种与SVM类似 coeff(G,H)= (7) 的监督学习方法.RVR与SVR最大的区别在于: ∑8-2h-2 RVR基于贝叶斯理论框架,能够得到具有概率特 性的预测结果.同时,RVR的核函数不受MERCER 式中,对任意一个参数向量W进行寻优判断,最终 定理(核矩阵必须是连续对称的正定矩阵)限制, 可以得到最优的参数向量W.其中coeff()用于 可以任意构建核函数 计算任意两个长度相同且均为s的序列G=[g1, 给定输入输出样本{x,o%,RVR模型的输出 g2,…,gi…,gJ和H=[h1,h2,…,h,…,h,]T的Pearson 可表示为: 相关系数,其计算公式由式(7)给出,其中和分 别表示序列G和H的均值.lcoeff)越大,两变量 0i= wik(x,xi)+Si (10) 的线性相关程度越高.寻优目标意义在于使序列 l CIV(kT)与输出中每个分量y'kT)的lcoeff(0均值 式中,N是输入输出样本数量;w=[w1,w2,,ww 最大 是权值向量;K(x,x)是核函数;e是独立均匀分布 第四步得到最优参数向量旷后,通过式(5) 的零均值高斯噪声,对于各自独立的输出目标0, 可以计算得到最优的CIV序列,将其表示为 输入输出样本数据集{x,%的似然估计函数 CIV(kT).此时CIV(kT)与输出中每个分量序列 P(ow,c2)可以表示为: ykT)的线性相关程度最大,可以分别建立最小二 Poma=(2ra)¥e (11) 乘线性回归模型: 式中,0=[o1,o2.…,0是样本数据集的输出目标 CIV'(kT1)=aiy'(kT1)+bi.i=1,2,....p (8) 向量;w是权值向量;G是样本输入的方差;中= 式中,针对p个分量共建立p个最小二乘线性回归 [p(x),p(x,…,p(xw】是基于核函数的NxN+1的 模型,a,和b,分别表示第i个模型的斜率和截距. 矩阵,其中p(x)=l,Kxx),Kxx2),…,K(,w小 第五步将原始输出序列Y(kT2)=y(kT2, 为了避免求解式(11)中w和G2时产生过于拟合的 y2(kT2),…yP(kT2)份别代入式(8)中对应的最小二 现象,对w赋予先验的条件概率P(wla),即 乘模型可以计算得到对应的CIV序列CIV:(kT2) (i=1,2,…p),取其均值为 P(wla)- Nw0,- (12) CIVave(kT2)=- CIVi(kT2) (9) 上式中,a=[o,a1,…,a'是N+1维的超参数向 l 量.根据贝叶斯公式,所有未知参数的后验概率分 可以将原始的双率采样数据{X(kT),YkT2)转换为 布P(wlo,a,σ2)可以表示为:从而将双率数据转换为单率数据 {X(kT1),Y(kT1)}, 其样本数量显著减少. 第二步 定义综合指标值 CIV 表征海水输入环 境因子对腐蚀电位的综合影响,其定义式如下: CIV(kT1) = ∑m i=1 wixi(kT1) (5) xi(kT1) wi 式中,m 表示海水环境因子的个数, 表示海 水环境因子数据, 是每个海水环境因子的权重, 是待优化参数. 第三步 采用 2.1 节的 BAS 算法对上一步中的 参数进行寻优. 寻优目标设置为: W∗ = argmin W 1 1 p ∑ p i=1 coeff(CIV(kT1), y i (kT1)) (6) coeff(G, H) = ∑s i (gi −g¯)(hi −h¯) vt∑s i (gi −g¯) 2 (hi −h¯) 2 (7) G = [ g1, g2,··· ,gi ,··· ,gs ]T H=[h1,h2,··· ,hi ,··· ,hs] T g¯ h¯ CIV(kT1) y i (kT1) 式中,对任意一个参数向量 W 进行寻优判断,最终 可以得到最优的参数向量 W* . 其中 coeff() 用于 计算任意两个长度相同且均为 s 的序列 和 的 Pearson 相关系数,其计算公式由式(7)给出,其中 和 分 别表示序列 G 和 H 的均值. |coeff()|越大,两变量 的线性相关程度越高. 寻优目标意义在于使序列 与输出中每个分量 的|coeff()|均值 最大. CIV∗ (kT1) CIV∗ (kT1) y i (kT1) 第四步 得到最优参数向量 W*后,通过式(5) 可 以 计 算 得 到 最 优 的 CIV 序 列 , 将 其 表 示 为 . 此时 与输出中每个分量序列 的线性相关程度最大,可以分别建立最小二 乘线性回归模型: CIV∗ (kT1) = aiy i (kT1)+bi ,i = 1,2,··· , p (8) 式中,针对 p 个分量共建立 p 个最小二乘线性回归 模型,ai 和 bi 分别表示第 i 个模型的斜率和截距. Y(kT2) = [ y 1 (kT2), y 2 (kT2),··· , y p (kT2) ] CIVi(kT2) (i = 1,2,··· , p) 第 五 步 将 原 始 输 出 序 列 分别代入式(8)中对应的最小二 乘模型可以计算得到对应的 CIV 序列 ,取其均值为 CIVavg(kT2) = 1 p ∑ p i=1 CIVi(kT2) (9) 可以将原始的双率采样数据 {X(kT1),Y(kT2)} 转换为 {CIVavg 采样周期为 T (kT2),Y(kT2)} 2 的单率采样数据 , 保留了原始数据更多的信息,获得了更多的建模 样本. 上述流程提出了输入变量采样周期大于输出 变量采样周期 (T1 > T2 ) 情况下的双率数据处理方 法. 对于输入变量采样周期小于输出变量采样周 期 (T1 < T2 ) 的情况,只需对上述流程中的第一步和 第五步稍作修改即可. 第一步中,将小采样周期的 输入变量数据采用均值法进行处理转换为单率数 据. 第五步中,通过原始输入变量数据计算 CIV 序 列,并将其代入第四步建立的对应最小二乘模型 可以计算得到对应的输出变量数据. 经上述处理 后也能得到具有更多建模样本的单率数据集. 2.3    IRVR 方法 2.3.1    RVR 原理 相关向量回归 (Relevance vector regression, RVR) 是由 Tipping[23] 于 2001 年提出的一种与 SVM 类似 的监督学习方法. RVR 与 SVR 最大的区别在于: RVR 基于贝叶斯理论框架,能够得到具有概率特 性的预测结果. 同时,RVR 的核函数不受 MERCER 定理(核矩阵必须是连续对称的正定矩阵)限制, 可以任意构建核函数[24] . {xi ,oi} N 给定输入输出样本 i=1 ,RVR 模型的输出 可表示为: oi = ∑ N i=1 wiK(x, xi)+εi (10) {xi ,oi} N i=1 P(oi |w,σ2 ) 式中,N 是输入输出样本数量;w = [w1 , w2 , …, wN] T 是权值向量;K(x, xi ) 是核函数;εi 是独立均匀分布 的零均值高斯噪声. 对于各自独立的输出目标 oi, 输入输出样本数据集 的似然估计函数 可以表示为: P(oi |w,σ2 ) = (2πσ 2 ) − N 2 e − ∥o−ϕw∥ 2 2σ2 (11) o2. ··· , (x1), ··· , ··· , K P(w|α) 式中,o = [o1 , oN] T 是样本数据集的输出目标 向量;w 是权值向量; σ 2 是样本输入的方差;Φ = [φ(x1 ), φ φ(xN)] 是基于核函数的 N×N+1 的 矩阵,其中 φ(xi ) = [1, K(xi , x1 ), K(xi , x2 ) , (xi , xN)]. 为了避免求解式(11)中 w 和 σ 2 时产生过于拟合的 现象,对 w 赋予先验的条件概率 ,即 P(w|α) = ∏ N i=0 N(wi |0,αi −1 ) (12) α1, ··· , P(w|o,α,σ2 ) 上式中,α = [α0 , αN] T 是 N + 1 维的超参数向 量. 根据贝叶斯公式,所有未知参数的后验概率分 布 可以表示为: 陈    亮等: 低合金钢海水腐蚀监测中的双率数据处理与建模 · 99 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有