第9卷第2期 智能系统学报 Vol.9 No.2 2014年4月 CAAI Transactions on Intelligent Systems Apr.2014 D0I:10.3969/j.issn.1673-4785.201309009 网络出版地址:http:/www.cnki.net/kcms/detail/23.1538.TP.20140329.0955.001.html 基宽灵敏度分析的径向基神经网络代理模型 张艳霞,陈丹琪,韩莹,刘道华2 (1.防灾科技学院灾害信息工程系,北京101601;2.信阳师范学院计算机与信息技术学院,河南信阳464000) 摘要:为提高径向基代理模型的近似精度,突破传统固定径向基基宽的方法,采用基宽灵敏度分析方法构建径向 基代理模型,给出了基宽灵敏度分析的径向基代理模型具体参数的构建方法.采用Benchmark测试函数验证该代理 模型的精度,并与采用固定径向基基宽的代理模型作测试对比,结果表明,采用该方法获得的代理模型在训练时间 上多于其他方法,因模型参数获得时需要进行基宽灵敏度分析,但获得的模型精度比其他方法高,且该方法不需要 更多的训练样本即能获得稳定的代理模型参数 关键词:灵敏度分析:径向基函数神经网络:代理模型:基宽 中图分类号:TP202+.3文献标志码:A文章编号:1673-4785(2014)02-0259-06 中文引用格式:张艳覆,陈丹琪,韩莹,等.基宽灵敏度分析的径向基神经网络代理模型[J].智能系统学报,2014,9(2):259-264. 英文引用格式:ZHANG Yanxia,CHEN Danqi,HAN Ying,etal.Surrogate model of radial basis function networks based on width factor sensitivity analysis[J].CAAI Transactions on Intelligent Systems,2014,9(2):259-264. Surrogate model of radial basis function networks based on width factor sensitivity analysis ZHANG Yanxia',CHEN Danqi',HAN Ying',LIU Daohua2 (1.Disaster Information Engineering Department,Institute of Disaster Prevention,Beijing 101601,China;2.School of Computer and Information Technology,Xinyang Normal University,Xinyang 464000,China) Abstract:In order to improve the approximation accuracy for the surrogate model of radial basis function networks and break through the traditional way that fixed the radial basis width factor,this paper adopts sensitivity analysis method on width factor to build the surrogate model of radial basis function networks,and gives the construction method of specific parameters for the surrogate model of radial basis function networks based on sensitivity analysis. The Benchmark test function is used to verify the accuracy of the surrogate model and the tested results are com- pared with the fixed radial basis width factor.The comparison results indicate that training time of the surrogate model obtained by this method is longer than that of other methods,because it needs sensitivity analysis when obtai- ning the width factor,while the obtained model accuracy is higher than other methods,besides,this method can obtainstable the surrogate model parameters without more training samples. Keywords:sensitivity analysis;radial basis function(RBF)networks;surrogate model;width factor 在多学科设计优化过程中,近似模型(代理模之一。而在径向基神经网络代理模型构建过程中, 型)的构建相当重要,它为复杂多学科问题的设计 径向基函数的中心、基宽是代理模型的2个最重要 提供了重要的保证,是复杂多学科设计中关键技术 的参数,这2个参数设计的好坏直接影响代理模型 收稿日期:2013-09-03.网络出版日期:2014-03-29. 精度)。在中心参数的设计上,许多学者均做过 基金项目:河北省教育厅高校科学技术研究计划资助项目 (Z2013108):河北省科技计划资助项目(12270325):河 研究,如张健4采用k-均值聚类算法确定基函数的 南省教育厅科学技术研究重点资助项目(14A520001): 中心:赵磊)在基于k-均值和量子遗传算法的RBF 河南省教师教育改革研究重点资助项目(2013-JSJYZD- 025);廊坊市科学技术研究与发展计划资助项目 网络优化一文中,通过k-均值和量子遗传算法结合 (2013011021). 通信作者:刘道华.E-mail:bjbjzyx(@126.com. 起来确定RBF网络的径向基中心参数:李乐庆等[6)
第 9 卷第 2 期 智 能 系 统 学 报 Vol.9 №.2 2014 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2014 DOI:10.3969 / j.issn.1673⁃4785.201309009 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20140329.0955.001.html 基宽灵敏度分析的径向基神经网络代理模型 张艳霞1 ,陈丹琪1 ,韩莹1 ,刘道华2 (1.防灾科技学院 灾害信息工程系,北京 101601; 2. 信阳师范学院 计算机与信息技术学院,河南 信阳 464000) 摘 要:为提高径向基代理模型的近似精度,突破传统固定径向基基宽的方法,采用基宽灵敏度分析方法构建径向 基代理模型,给出了基宽灵敏度分析的径向基代理模型具体参数的构建方法.采用 Benchmark 测试函数验证该代理 模型的精度,并与采用固定径向基基宽的代理模型作测试对比,结果表明,采用该方法获得的代理模型在训练时间 上多于其他方法,因模型参数获得时需要进行基宽灵敏度分析,但获得的模型精度比其他方法高,且该方法不需要 更多的训练样本即能获得稳定的代理模型参数. 关键词:灵敏度分析;径向基函数神经网络;代理模型;基宽 中图分类号: TP202+.3 文献标志码:A 文章编号:1673⁃4785(2014)02⁃0259⁃06 中文引用格式:张艳霞,陈丹琪,韩莹,等. 基宽灵敏度分析的径向基神经网络代理模型[J]. 智能系统学报, 2014, 9(2): 259⁃264. 英文引用格式:ZHANG Yanxia, CHEN Danqi, HAN Ying, et al. Surrogate model of radial basis function networks based on width factor sensitivity analysis[J]. CAAI Transactions on Intelligent Systems, 2014, 9(2): 259⁃264. Surrogate model of radial basis function networks based on width factor sensitivity analysis ZHANG Yanxia 1 , CHEN Danqi 1 , HAN Ying 1 ,LIU Daohua 2 (1. Disaster Information Engineering Department, Institute of Disaster Prevention, Beijing 101601, China; 2. School of Computer and Information Technology, Xinyang Normal University, Xinyang 464000,China) Abstract:In order to improve the approximation accuracy for the surrogate model of radial basis function networks and break through the traditional way that fixed the radial basis width factor, this paper adopts sensitivity analysis method on width factor to build the surrogate model of radial basis function networks, and gives the construction method of specific parameters for the surrogate model of radial basis function networks based on sensitivity analysis. The Benchmark test function is used to verify the accuracy of the surrogate model and the tested results are com⁃ pared with the fixed radial basis width factor. The comparison results indicate that training time of the surrogate model obtained by this method is longer than that of other methods, because it needs sensitivity analysis when obtai⁃ ning the width factor, while the obtained model accuracy is higher than other methods, besides, this method can obtainstable the surrogate model parameters without more training samples. Keywords:sensitivity analysis; radial basis function(RBF) networks; surrogate model; width factor 收稿日期:2013⁃09⁃03. 网络出版日期:2014⁃03⁃29. 基金项 目: 河 北 省 教 育 厅 高 校 科 学 技 术 研 究 计 划 资 助 项 目 (Z2013108);河北省科技计划资助项目( 12270325);河 南省教育厅科学技术研究重点资助项目( 14A520001); 河南省教师教育改革研究重点资助项目( 2013⁃JSJYZD- 025); 廊 坊 市 科 学 技 术 研 究 与 发 展 计 划 资 助 项 目 (2013011021). 通信作者:刘道华. E⁃mail:bjbjzyx@ 126.com. 在多学科设计优化过程中,近似模型(代理模 型)的构建相当重要,它为复杂多学科问题的设计 提供了重要的保证,是复杂多学科设计中关键技术 之一。 而在径向基神经网络代理模型构建过程中, 径向基函数的中心、基宽是代理模型的 2 个最重要 的参数,这 2 个参数设计的好坏直接影响代理模型 精度[1⁃3] 。 在中心参数的设计上,许多学者均做过 研究,如张健[4]采用 k⁃均值聚类算法确定基函数的 中心;赵磊[5]在基于 k⁃均值和量子遗传算法的 RBF 网络优化一文中,通过 k⁃均值和量子遗传算法结合 起来确定 RBF 网络的径向基中心参数;李乐庆等[6]
·260 智能系统学报 第9卷 在基于RBF的散乱点曲面重构一文中,采用相关系 及宽度的一个微小扰动,故由c和G:产生的差值为 数的方法自动确定网络隐含层核函数中心的大小: △y=wh-wh= 也有学者采用随机选取中心法、自组织选取中心法、 有监督选取中心法和正交最小二乘法等)。而在 三,xp(-x29∥) 2 宽度的设计上,绝大多数学者都是将基宽取为一定 ,ep(- lx-e112 范围内的某一常值,或是采用线性变化值,如张占 (3) 台 2σ 南[8劉将宽度值定义为σ=d/√2m,d为两两中心的 式中:G:=0:+△0:,其是初始基宽在基宽扰动后产 最大值,m为中心个数。除此之外,很少学者对径 生的基宽值,在扰动下的连接权值为,=州,+ 向基基宽进行深入研究,因基宽同中心参数一样,均 4W。由于该径向基高斯函数的中心、基宽以及连 存在某种分布,故将基宽定义为某一常值或是其在 接权在微小扰动下对整个网络的输出均产生影响, 某一线性变化值,均不利于获得设计问题的高精度 由于文献[13]已分析过基中心以及连接权的扰动 的径向基网络代理模型。基于此,笔者采用基宽灵 对整个网络性能的影响,在此仅分析基宽以及连接 敏度分析的方法构建径向基神经网络代理模型,并 权的扰动对整个网络性能的影响。第i个隐层神经 采用经典的benchmark测试函数进行验证,从模型 元与第j个输出层神经元宽度以及连接权的扰动 获得时间、模型获得值同真实值的偏差等方面作比 Ao:和Aw,能被具有零均值和偏差σ。和σ的高 较,从比较结果中体现出该设计的代理模型具有更 斯分布所定义。 高的模型近似精度。 1 1径向基神经网络结构 ()wexp( (4) 标准的径向基神经网络模型有3层结构组成, wAw p(△w:)= 分别为输入层、隐层和输出层,输入层神经元的个数 (V2moep(- 22 同输入样本点维数相同,即输入层对应着N维输入 式中:N是输入样本x的维数,K是隐层神经元基宽 矢量x=[x1x2…xw],隐层由K个神经元组 数,也是隐层神经元个数。 成,其与输入层神经元全相连,其是通过隐层的激活 基于文献[14]提出的计算灵敏度方法,对于第 函数将线性输入空间映射到非线性隐层空间,每一 i个神经元在扰动△x下产生的偏差S:被定义为 个隐层神经元的激活函数有高斯型函数、多二次型 S;=E(If(x +Ax)w;)-f(xw;))(5) 函数、逆多二次型函数、薄板样条函数组成,常取高 故采用这种扰动递归计算方法,在第K次递归 斯型基函数[91]。 过程中,假设径向基隐层神经元的第K-1个基宽已 h exp(-c -),i=1,2,…,K(1) 经被确定,即σ,将被确定,因此对于第j个输出神经 3 元的灵敏度被定义为E[(△y)2],即 式中:c:和σ:分别代表第i个隐单元的高斯基中心 和基宽。输出层同隐层节点通过连接权心:全相联, S=E[(4y)2]=p(Aw)p(4c)· 第j个输出神经元的输出表示为 Σ,ep(-L与-c4c.L f(x)=wh=,ep(-二 gEDm,R=1 20 (2) 2o1 1x-c.-4c.I2、 )dAcdaw -2p(Aw)p(Ac). 式中:h=[h,h2…hx]为隐层的输出矢量, 201 w,为隐层的第j个神经元与输出层的第i个神经元 ∑2,m--c-4c. 的连接权。 20 2变基宽灵敏度分析的RBF代理模型 I-。-Ac.)dcw+p(awp(ae)· 20 2.1变基宽的灵敏度分析 采用c,和G:表示第i个隐层神经元的中心以 2m15-e4c 20
在基于 RBF 的散乱点曲面重构一文中,采用相关系 数的方法自动确定网络隐含层核函数中心的大小; 也有学者采用随机选取中心法、自组织选取中心法、 有监督选取中心法和正交最小二乘法等[7] 。 而在 宽度的设计上,绝大多数学者都是将基宽取为一定 范围内的某一常值,或是采用线性变化值,如张占 南[8]将宽度值定义为 σ = d / 2m , d 为两两中心的 最大值, m 为中心个数。 除此之外,很少学者对径 向基基宽进行深入研究,因基宽同中心参数一样,均 存在某种分布,故将基宽定义为某一常值或是其在 某一线性变化值,均不利于获得设计问题的高精度 的径向基网络代理模型。 基于此,笔者采用基宽灵 敏度分析的方法构建径向基神经网络代理模型,并 采用经典的 benchmark 测试函数进行验证,从模型 获得时间、模型获得值同真实值的偏差等方面作比 较,从比较结果中体现出该设计的代理模型具有更 高的模型近似精度。 1 径向基神经网络结构 标准的径向基神经网络模型有 3 层结构组成, 分别为输入层、隐层和输出层,输入层神经元的个数 同输入样本点维数相同,即输入层对应着 N 维输入 矢量 x = [x1 x2 … xN] ,隐层由 K 个神经元组 成,其与输入层神经元全相连,其是通过隐层的激活 函数将线性输入空间映射到非线性隐层空间,每一 个隐层神经元的激活函数有高斯型函数、多二次型 函数、逆多二次型函数、薄板样条函数组成,常取高 斯型基函数[9⁃12] 。 hi = exp( - ‖x - ci‖2 2σ 2 i ),i = 1,2,…,K (1) 式中: ci 和 σi 分别代表第 i 个隐单元的高斯基中心 和基宽。 输出层同隐层节点通过连接权 wi 全相联, 第 j 个输出神经元的输出表示为 f j(x) = wjh = ∑ K i = 1 wij exp( - ‖x - ci‖2 2σ 2 i ) (2) 式中: h = [h1 h2 … hK ] 为隐层的输出矢量, wij 为隐层的第 j 个神经元与输出层的第 i 个神经元 的连接权。 2 变基宽灵敏度分析的 RBF 代理模型 2.1 变基宽的灵敏度分析 采用 c ^ i 和 σ ^ i 表示第 i 个隐层神经元的中心以 及宽度的一个微小扰动,故由 c ^ i 和 σ ^ i 产生的差值为 Δyj = w ^ jh ^ - wjh = ∑ K i = 1 w ^ ij exp( - ‖x - c ^ i‖2 2σ ^ 2 i ) - ∑ K i = 1 wij exp( - ‖x - ci‖2 2σ 2 i ) (3) 式中: σ ^ i = σi + Δσi ,其是初始基宽在基宽扰动后产 生的基宽值, 在扰动下的连接权值为 w ^ j = wj + Δ wj。 由于该径向基高斯函数的中心、基宽以及连 接权在微小扰动下对整个网络的输出均产生影响, 由于文献[13]已分析过基中心以及连接权的扰动 对整个网络性能的影响,在此仅分析基宽以及连接 权的扰动对整个网络性能的影响。 第 i 个隐层神经 元与第 j 个输出层神经元宽度以及连接权的扰动 Δσi 和 Δ wj 能被具有零均值和偏差 σσi 和 σwj 的高 斯分布所定义。 p(Δσi) = 1 ( 2πσσi ) N exp( - c T i ci 2Δσ 2 σi ) p(Δ wj) = 1 ( 2πσwj ) K exp( - Δ w T j Δ wj 2σ 2 wj ) ì î í ï ï ï ï ï ï (4) 式中:N 是输入样本 x 的维数, K 是隐层神经元基宽 数,也是隐层神经元个数。 基于文献[14]提出的计算灵敏度方法,对于第 i 个神经元在扰动 Δx 下产生的偏差 Si 被定义为 Si = E( f(x + Δx)wi) - f(xwi) ) (5) 故采用这种扰动递归计算方法,在第 K 次递归 过程中,假设径向基隐层神经元的第 K-1 个基宽已 经被确定,即 σi 将被确定,因此对于第 j 个输出神经 元的灵敏度被定义为 E[(Δyj) 2 ] ,即 S (K) j = E[(Δ yj) 2 ] = ∬p(Δw)p(Δc)· ∑xl∈D∑ K m,n = 1 w ^ mjw ^ nj exp( - ‖ xl - cm - Δ cm‖2 2σ 2 m - ‖ xl - cn - Δ cn‖2 2σ 2 n )dΔcdΔw - 2∬p(Δw)p(Δc)· ∑xl∈D∑ K m,n = 1 w ^ mjwnj exp( - ‖ xl - cm - Δ cm‖2 2σ 2 m - ‖ xl - cn - Δ cn‖2 2σ 2 n )dΔcdΔw + ∬p(Δw)p(Δc)· ∑xl∈D∑ K m,n = 1 wmjwnj exp( - ‖ xl - cm - Δ cm‖2 2σ 2 m - ·260· 智 能 系 统 学 报 第 9 卷
第2期 张艳霞,等:基宽灵敏度分析的径向基神经网络代理模型 ·261 ‖-cm-cn 在H阵分解过程中,只有一个列能被正交化, -)d△cdAw (6) 2w2 且在第K次分解时,一个正交列能够被先前第K-1 式中:D=《x}1,为该网络的所有训练样本集。 次正交列得到,具体的相关分解式为 式(6)经展开得 9 =hi S=E[(4y)2]= q;hK (2c) Ig∥1sisK (9) ,0m0g 到eDm,n=1,m≠n (c+( c+ 9k=hx-∑ah exp(- 2(6-02(%-0)+ 通过式(9)计算矩阵H的各次迭代的正交列, (E)' 并能通过RBF灵敏度分析对各正交列进行排序。 假设S(σ,)表示为在第K次迭代过程中前K-1 (c+2c.) 个RBF宽度与该σ:相关的q:值,且I≤i≤L。并将 exp( 2-户)-2. 式(3)以及式(7)中的相关连接权用式(10)代替。 (E)' e (10) N ·exp(- (√(ca+ca.)) 2(x1-0n)2 然后计算径向基神经网络K个隐层各个径向 基基宽的灵敏度值,并设Q为第K次迭代的正交 0)+三“,· 矩阵的值,而Q被排序为 xeDm,n=1 c IS(c,)‖≥IS(c2)I≥…I‖S(c)I c exp(- 2(,-g.)22(x,-g,)月 (7) (11) 2.2 基宽灵敏度分析的RBF模型关键参数的获取 对采用RBF灵敏度分析获得各个基宽的排序 由于灵敏度分析能确定径向基关键参数的微小 值,最终获得RBF的关键基宽,从而获得RBF整个 变化对整个径向基构成的影响,但这种分析不能确 结构的参数值。 2.3基宽灵敏度分析的RBF代理模型构建算法 定RBF模型的具体参数值,故采用灵敏度分析过程 中的矩阵信息并应用正交分解方法确定RBF的各 通过灵敏度分析及正交变换阵即可获得径向基基 具体参数。假设Y=[y1y2…y]”,L为训练 宽,即具体代理模型的结构参数,具体算法描述为: 样本数,y:(i=1,2,…,L)表示第i个输出神经元, 1)通过L个训练样本数据点信息构建3层RBF 依据式(2)有 网络初始结构,并对该网络结构的所有参数进行初 Y=HW=(OA)W (8) 始化,包括构建矩阵H、K个隐层节点、每个隐层径 式中:Y、H、W分别为L×M、L×L、L×M维矩阵, 向基函数中心、基宽以及隐层与输出层的所有连接 径向基各个隐层神经元基宽的确定可通过矩阵H的关 权心,的初始化。 键列分解得到,而H能被分解为QA,其中矩阵Q为 2)依据灵敏度分析式(7)计算H中的每一列 L×L维阵并具有正交列[9,92…q],A是一 值,并将该列最大灵敏度值赋给Q),然后计算该 个L×L维上三角阵,具体的H、A阵表示为 训练样本的输出值与样本的期望值的差值E,此 Thu hu 时设置K=2。 H= 3)依据式(9)计算正交阵H中的剩余Q-)列。 hu 4)对于每一个训练样本,侯选值σ是隐层第i [1 av L 个神经元的函数基宽值,其与正交阵H的q:列相 0 1 a23 关,计算前K-1个RBF宽度以便求出SO(σ:),在 A= 0 求解过程中,连接权将被式(10)所更新,而正 0 1 a(L-1)L 交矩阵Q的值将被式(11)所排序。从产生最大 0 0 值的灵敏度分析的迭代步中获得正交阵Q的第
‖ xl - cn - Δ cn‖2 2σ 2 n )dΔcdΔw (6) 式中: D = xl { } L l = 1 ,为该网络的所有训练样本集。 式(6)经展开得 S (K) j = E[(Δ yj) 2 ] = ∑xl∈D ∑ K m,n = 1,m≠n wmjwnj ( c 2 m c 2 n ) N ( (c 2 m + c 2 σm )(c 2 n + c 2 σn ) ) N· exp( - c 2 m + c 2 σm 2 (xl - σm ) 2 - c 2 n + c 2 σn 2 (xl - σn ) 2 ) + ∑xl∈D∑ K m = 1 (wmj + wnj) ( c 2 m ) N ( (c 2 m + 2c 2 σm ) ) N × exp( - c 2 m + 2c 2 σm 2 (xl - σm ) 2 ) - 2∑xl∈D ∑ K m,n = 1 wmjwnj· ( c 2 m ) N ( (c 2 m + c 2 σm ) ) N·exp( - c 2 m + c 2 σm 2 (xl - σm ) 2 - c 2 n + c 2 σn 2 (xl - σn ) 2 ) + ∑xl∈D ∑ K m,n = 1 wmjwnj· exp( - c 2 m 2 (xl - σm ) 2 - c 2 n 2 (xl - σn ) 2 ) (7) 2.2 基宽灵敏度分析的 RBF 模型关键参数的获取 由于灵敏度分析能确定径向基关键参数的微小 变化对整个径向基构成的影响,但这种分析不能确 定 RBF 模型的具体参数值,故采用灵敏度分析过程 中的矩阵信息并应用正交分解方法确定 RBF 的各 具体参数。 假设 Y = [y1 y2 … yL ] T ,L 为训练 样本数, yi ( i = 1,2,…,L )表示第 i 个输出神经元, 依据式(2)有 Y = HW = (QA)W (8) 式中: Y 、 H 、 W 分别为 L × M 、 L × L 、 L × M 维矩阵, 径向基各个隐层神经元基宽的确定可通过矩阵 H 的关 键列分解得到,而 H 能被分解为 QA ,其中矩阵 Q 为 L × L 维阵并具有正交列 [q1 q2 … qL ] , A 是一 个 L × L 维上三角阵,具体的 H 、 A 阵表示为 H = h11 … h1L ︙ ︙ h1L … hLL é ë ê ê ê ê ù û ú ú ú ú A = 1 a12 … … a1L 0 1 a23 ︙ ︙ 0 ⋱ ︙ ︙ 0 1 a(L-1) L 0 … … 0 1 é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú 在 H 阵分解过程中,只有一个列能被正交化, 且在第 K 次分解时,一个正交列能够被先前第 K-1 次正交列得到,具体的相关分解式为 q1 = h1 aiK = q T i hK ‖ qi‖ ,1 ≤ i ≤ K qK = hK - ∑ K-1 i = 1 aiK hi ì î í ï ï ïï ï ï ï (9) 通过式(9)计算矩阵 H 的各次迭代的正交列, 并能通过 RBF 灵敏度分析对各正交列进行排序。 假设 S (K) (σi) 表示为在第 K 次迭代过程中前K-1 个 RBF 宽度与该 σi 相关的 qi 值,且 1 ≤ i ≤ L。 并将 式(3)以及式(7)中的相关连接权用式(10)代替。 w (K) ij = ∑ L l = 1 aliwij (10) 然后计算径向基神经网络 K 个隐层各个径向 基基宽的灵敏度值,并设 Q (K) 为第 K 次迭代的正交 矩阵的值,而 Q (K) 被排序为 ‖ S (K) (c1 )‖ ≥ ‖ S (K) (c2 )‖ ≥ …‖ S (K) (cL )‖ (11) 对采用 RBF 灵敏度分析获得各个基宽的排序 值,最终获得 RBF 的关键基宽,从而获得 RBF 整个 结构的参数值。 2.3 基宽灵敏度分析的 RBF 代理模型构建算法 通过灵敏度分析及正交变换阵即可获得径向基基 宽,即具体代理模型的结构参数,具体算法描述为: 1)通过 L 个训练样本数据点信息构建 3 层 RBF 网络初始结构,并对该网络结构的所有参数进行初 始化,包括构建矩阵 H、 K 个隐层节点、每个隐层径 向基函数中心、基宽以及隐层与输出层的所有连接 权 wij 的初始化。 2)依据灵敏度分析式(7) 计算 H 中的每一列 值,并将该列最大灵敏度值赋给 Q (1) , 然后计算该 训练样本的输出值与样本的期望值的差值 E (1) , 此 时设置 K = 2。 3)依据式(9)计算正交阵 H 中的剩余 Q (K-1) 列。 4)对于每一个训练样本,侯选值 σi 是隐层第 i 个神经元的函数基宽值,其与正交阵 H 的 qi 列相 关,计算前 K-1 个 RBF 宽度以便求出 S (K) (σi) ,在 求解过程中,连接权 w (K) ij 将被式(10)所更新,而正 交矩阵 Q (K) 的值将被式(11)所排序。 从产生最大 值的灵敏度分析的迭代步中获得正交阵 Q (K) 的第 第 2 期 张艳霞,等:基宽灵敏度分析的径向基神经网络代理模型 ·261·
.262. 智能系统学报 第9卷 K列,计算该训练样本的输出值与样本的期望值的 表2标准差对比 差值E。 Table 2 Comparison of the standard deviation s 5)判断E-E(-)≤8,8为事先设定的常 本文方法 固定基宽的RBF 样本点数 数值,如果该式成立,则转7):否则转6)。 F F2 F F2 6)计数器K=K+1,并转3)。 80 0.005710.00743 0.0935 0.0824 7)输出矩阵Q中的第K列值,即为该径向 200 0.002190.00473 0.0655 0.0447 基函数神经网络的所有隐层神经元的高斯基基宽。 500 0.004280.00863 0.0841 0.0652 3实例测试 由表1、表2中可知,在相同的训练样本点数 时,采用本文方法所需要的训练时间都比采用固定 为验证该方法构建代理模型的精度,采用2个 基宽方法需要的时间长,这主要是由于采用该方法 benchmark测试函数具体验证该方法的有效性,并 时,各个隐层径向基基宽在每一次训练过程中均需 采用传统RBF固定宽度的方法作测试对比,其中固 要进行灵敏度分析,且需要正交矩阵相关列的计算 定径向基基宽σ=d/√2m,d为两两中心的最大 以及连接权值的调整,但从获得的代理模型精度上 值,m为径向基中心个数。在每种实例中采用3种 来看,不管采用样本数多少,本文所提方法获得模型 的标准差均远小于采用固定基宽方法,前者精度比 不同数量的样本点作对比,从模型训练时间、代理模 后者精度高一个数量级。从样本点数多少来对比模 型获得值同真实值的偏差N。等方面作对比,其中 型的精度,样本点数足够大并不能提高模型精度,也 N.定义如式(12)所示,而3种数据样本点分别取 就是训练样本点取合适足够数即可,无需采集大样 80、200、500个。具体的测试函数为F,和F2。 本数据进行径向基网络的训练,该结果也可从2种 模型的对比图(如图1~6所示)反映出,其中图1、2 (f(x()-f(x())2 和3分别为函数F,在样本点R为80、200、500情况 N.= (12) 含r 下获得的模型图,图4、5和6分别为函数F,在样本 点R为80、200、500情况下获得的模型图。 式中:f(x))、f八x@)分别为模型的真实值、代理 模型获得的输出值。 F1:f(x,y)= 0.5+ sin2(√x2+y-0.5 [1.0+0.001(x2+y2)] 100≤x,y≤100 F2:f(x,y)= -2 0 (4-2.1x2+ 3)+y+(-4+4)y2 4-4-2 图1测试函数F,在数据样本点为80时获得的模型 -3≤x≤3,-2≤y≤2 Fig.I The obtained model for the testing function F (R 80) 在实验过程中,采用Intel(R)Core(TM)i3- 2120,3.30 GHz CPU,并在MATLAB7.0编程环境下 实验,且参数8=0.45。表1、2为试验对比结果。 表1训练时间对比 Table 1 Comparison of the training time s -5 本文方法 固定基宽的RBF 样本点数 0 F F2 F F2 80 23.4517.09 12.62 10.51 0 4-4-2x 200 67.0255.45 44.00 31.09 图2测试函数F,在数据样本点为200时获得的模型 50091.8979.73 68.30 45.36 Fig.2 The obtained model for the testing function F(R 200)
K 列,计算该训练样本的输出值与样本的期望值的 差值 E (K) 。 5)判断 E (K) - E (K-1) ≤ δ , δ 为事先设定的常 数值,如果该式成立,则转 7);否则转 6)。 6)计数器 K = K + 1,并转 3)。 7) 输出矩阵 Q (K) 中的第 K 列值,即为该径向 基函数神经网络的所有隐层神经元的高斯基基宽。 3 实例测试 为验证该方法构建代理模型的精度,采用 2 个 benchmark 测试函数具体验证该方法的有效性,并 采用传统 RBF 固定宽度的方法作测试对比,其中固 定径向基基宽 σ = d / 2m , d 为两两中心的最大 值, m 为径向基中心个数。 在每种实例中采用 3 种 不同数量的样本点作对比,从模型训练时间、代理模 型获得值同真实值的偏差 Ne 等方面作对比,其中 Ne 定义如式(12) 所示,而 3 种数据样本点分别取 80、200、500 个。 具体的测试函数为 F1和 F2 。 Ne = ∑ q i = 1 (f e(x (i) ) - f(x (i) )) 2 ∑ q i = 1 f e (x (i) ) 2 (12) 式中: f e(x (i) ) 、 f(x (i) ) 分别为模型的真实值、代理 模型获得的输出值。 F1 : f(x,y) = 0.5 + sin 2 ( x 2 + y 2 - 0.5 [1.0 + 0.001(x 2 + y 2 )] 2 - 100 ≤ x,y ≤ 100 F2 : f(x,y) = (4 - 2.1x 2 + x 4 3 )x 2 + xy + ( - 4 + 4y 2 )y 2 - 3 ≤ x ≤ 3, - 2 ≤ y ≤ 2 在实验过程中,采用 Intel(R) Core( TM) i3 - 2120, 3.30GHz CPU,并在 MATLAB7.0 编程环境下 实验,且参数 δ = 0.45。 表 1、2 为试验对比结果。 表 1 训练时间对比 Table 1 Comparison of the training time s 样本点数 本文方法 F 1 F 2 固定基宽的 RBF F1 F2 80 23.45 17.09 12.62 10.51 200 67.02 55.45 44.00 31.09 500 91.89 79.73 68.30 45.36 表 2 标准差对比 Table 2 Comparison of the standard deviation s 样本点数 本文方法 F 1 F 2 固定基宽的 RBF F1 F2 80 0.005 71 0.007 43 0.093 5 0.082 4 200 0.002 19 0.004 73 0.065 5 0.044 7 500 0.004 28 0.008 63 0.084 1 0.065 2 由表 1、表 2 中可知,在相同的训练样本点数 时,采用本文方法所需要的训练时间都比采用固定 基宽方法需要的时间长,这主要是由于采用该方法 时,各个隐层径向基基宽在每一次训练过程中均需 要进行灵敏度分析,且需要正交矩阵相关列的计算 以及连接权值的调整,但从获得的代理模型精度上 来看,不管采用样本数多少,本文所提方法获得模型 的标准差均远小于采用固定基宽方法,前者精度比 后者精度高一个数量级。 从样本点数多少来对比模 型的精度,样本点数足够大并不能提高模型精度,也 就是训练样本点取合适足够数即可,无需采集大样 本数据进行径向基网络的训练,该结果也可从 2 种 模型的对比图(如图 1~ 6 所示)反映出,其中图 1、2 和 3 分别为函数 F1在样本点 R 为 80、200、500 情况 下获得的模型图,图 4、5 和 6 分别为函数 F2在样本 点 R 为 80、200、500 情况下获得的模型图。 图 1 测试函数 F1在数据样本点为 80 时获得的模型 Fig.1 The obtained model for the testing function F1(R = 80) 图 2 测试函数 F1在数据样本点为 200 时获得的模型 Fig.2 The obtained model for the testing function F1(R = 200) ·262· 智 能 系 统 学 报 第 9 卷
第2期 张艳霞,等:基宽灵敏度分析的径向基神经网络代理模型 .263. ×10 10下 10 5 10 -0 -15 2 1 y-1 44-2 -2-3-2-10 图3测试函数F,在数据样本点为500时获得的模型 图4测试函数F,在数据样本点为80时获得的模型 Fig.3 The obtained model for the testing function F(R=500)Fig.4 The obtained model for the testing function F2(R =80) ×10 0 -2 21 0 - -2-3-2-1012 0 23 -2-19123 图5测试函数F,在数据样本点为200时获得的模型 图6测试函数F,在数据样本点为500时获得的模型 Fig.5 The obtained model for the testing function F,(R=200)Fig.6 The obtained model for the testing function F,(R 500) Networks,2005(18):117-122. 4结束语 [2]WEI Z,KATIE S,NAN S.Genomic signatures characterize 合适的径向基基宽能提高代理模型的近似精 leukocyte infiltration in myositis muscles[].BMC Medical 度,本文通过对径向基基宽的灵敏度分析,并对正交 Genomics,2012(5):1-53. 矩阵的最大列求解,从而获得隐层各神经元的高斯 [3]FRANCESCO P,MASSIMILIANO R.SIMONE R.Numeri- 径向基基宽,最终获得径向基神经网络代理模型结 cal and experimental characterization of a novel modular passive micromixer[J].Biomedical Microdevices,2012,14 构。采用具体的两测试函数进行验证,证实了这种 (5):849-862. 基宽灵敏度分析的径向基代理模型比采用传统的固 [4]张健,李为吉.飞机多学科设计优化中的近似方法分析 定基宽的代理模型具有更高的模型近似精度。同时 [J].航空计算技术,2005,35(3):5-8. 在实验过程中,也获得采用该方法在构建稳定的代 ZHANG Jian,LI Weiji.Approximation methods analysis in 理模型时并不需要太多的训练样本点。为提高代理 multidisciplinary design optimization[.Aeronautical Com- 模型的近似精度,该文只是采用对基宽的灵敏度分 puter Technique,2005,35(3):5-8. 析,在以后的工作中有待进一步验证,在基宽灵敏度 [5]赵磊,贾振红,罩锡忠,等.基于k均值和量子遗传算法 分析的基础上,同时进行中心灵敏度分析,这样也许 的RBF网络优化[J].计算机工程,2011,37(10):152 153 能更进一步提高代理模型的精度。 ZHAO Lei,JIA Zhenhong,QIN Xizhong,et al.RBF net- 参考文献: work optimization based on k-means and quantum genetic al- gorithm[J].Computer Engineering,2011,37(10):152- [1]MANOLIS W,NICOLAS T,STEFANOS K.Intelligent ini- 153. tialization of resource allocating RBF networks J].Neural [6]李乐庆,康宝生.基于RBF的散乱点曲面重构[J].西北
图 3 测试函数 F1在数据样本点为 500 时获得的模型 图 4 测试函数 F2在数据样本点为 80 时获得的模型 Fig.3 The obtained model for the testing function F1(R = 500) Fig.4 The obtained model for the testing function F2(R = 80) 图 5 测试函数 F2在数据样本点为 200 时获得的模型 图 6 测试函数 F2在数据样本点为 500 时获得的模型 Fig.5 The obtained model for the testing function F2(R = 200) Fig.6 The obtained model for the testing function F2(R = 500) 4 结束语 合适的径向基基宽能提高代理模型的近似精 度,本文通过对径向基基宽的灵敏度分析,并对正交 矩阵的最大列求解,从而获得隐层各神经元的高斯 径向基基宽,最终获得径向基神经网络代理模型结 构。 采用具体的两测试函数进行验证,证实了这种 基宽灵敏度分析的径向基代理模型比采用传统的固 定基宽的代理模型具有更高的模型近似精度。 同时 在实验过程中,也获得采用该方法在构建稳定的代 理模型时并不需要太多的训练样本点。 为提高代理 模型的近似精度,该文只是采用对基宽的灵敏度分 析,在以后的工作中有待进一步验证,在基宽灵敏度 分析的基础上,同时进行中心灵敏度分析,这样也许 能更进一步提高代理模型的精度。 参考文献: [1]MANOLIS W, NICOLAS T, STEFANOS K. Intelligent ini⁃ tialization of resource allocating RBF networks[ J]. Neural Networks, 2005(18): 117⁃122. [2]WEI Z, KATIE S, NAN S. Genomic signatures characterize leukocyte infiltration in myositis muscles[ J]. BMC Medical Genomics, 2012(5): 1⁃53. [3]FRANCESCO P, MASSIMILIANO R, SIMONE R. Numeri⁃ cal and experimental characterization of a novel modular passive micromixer[J]. Biomedical Microdevices, 2012, 14 (5): 849⁃862. [4]张健,李为吉.飞机多学科设计优化中的近似方法分析 [J]. 航空计算技术, 2005, 35(3): 5⁃8. ZHANG Jian, LI Weiji. Approximation methods analysis in multidisciplinary design optimization[J]. Aeronautical Com⁃ puter Technique, 2005, 35(3): 5⁃8. [5]赵磊,贾振红,覃锡忠,等. 基于 k 均值和量子遗传算法 的 RBF 网络优化[J]. 计算机工程, 2011, 37(10): 152⁃ 153 ZHAO Lei, JIA Zhenhong, QIN Xizhong, et al. RBF net⁃ work optimization based on k⁃means and quantum genetic al⁃ gorithm[J]. Computer Engineering, 2011, 37( 10): 152⁃ 153. [6]李乐庆,康宝生. 基于 RBF 的散乱点曲面重构[ J].西北 第 2 期 张艳霞,等:基宽灵敏度分析的径向基神经网络代理模型 ·263·
·264· 智能系统学报 第9卷 大学学报,2011,41(2):221-225. [13]SHI D,YEUNG D S,GAO J.Sensitivity analysis applied LI Leqing,KANG Baosheng.RBF-based surface reconstruc- to the construction of radial basis function networks[J]. tion from scattered data[J].Journal of Northwest Universi- Neural Networks,2005(18):951-957. ty,2011,41(2):221-225. [14]ZENG X,YEUNG D S.A quantified sensitivity measure [7]MARINARO M,SCARPETTA S.On-line learning in RBF for multilayer perceptron to input perturbation[.Neural neural networks:a stochastic approach[J].Neural Net- Computation,2003(15):183-212. works,2000(13):719-729. 作者简介: [8]张占南.基于RBF神经网络的y能谱分析[D].大连: 张艳霞,女,1979年生,讲师,主要 辽宁师范大学,2011:43-58. 研究方向为数据库新技术、数据挖掘、 ZHANG Zhannan.The analysis of y spectrum by RBF network 智能算法等,发表学术论文10篇,出版 [D].Dalian:Liaoning Normal University,2011:43-58. 著作1部。 [9]DAVID C,CHEN X W.Radial basis function neural net- works for nonlinear fisher discrimination and neyman-pearson 陈丹琪,女,1972年生,副教授,主要研究方向为传感器 classification[J].Neural Networks,2003(16):529-535. 网络、软件工程、神经网络等,发表学术 [10]NAM M D,THANH T C.Numerical solution of differential 论文20余篇,出版著作1部。 equations using multiquadric radial basis function networks [J].Neural Networks,2001(14):185-199. [11]刘道华,张礼涛.基于正交最小二乘法的径向基神经网 络模型[J].信阳师范学院学报,2013,26(3):428-431. LIU Daohua,ZHANG Litao.Radial basis function neural net- 韩莹,女,1979年生,讲师,主要研 work model based on orthogonal least squares[].Journal of 究方向为数据挖掘、人工智能等,发表 Xinyang Normal University,2013,26(3):428-431. 学术论文5篇,出版著作1部。 [12]KON M A,PLASKOTA L.Information complexity of neu- ral networks[J].Neural Networks,2000(13):365-375
大学学报, 2011, 41(2): 221⁃225. LI Leqing, KANG Baosheng. RBF⁃based surface reconstruc⁃ tion from scattered data[ J]. Journal of Northwest Universi⁃ ty, 2011, 41(2): 221⁃225. [7]MARINARO M, SCARPETTA S. On⁃line learning in RBF neural networks: a stochastic approach [ J ]. Neural Net⁃ works, 2000(13): 719⁃729. [8]张占南. 基于 RBF 神经网络的 γ 能谱分析[D]. 大连: 辽宁师范大学, 2011: 43⁃58. ZHANG Zhannan. The analysis of γ spectrum by RBF network [D]. Dalian:Liaoning Normal University, 2011: 43⁃58. [9] DAVID C, CHEN X W. Radial basis function neural net⁃ works for nonlinear fisher discrimination and neyman⁃pearson classification[J]. Neural Networks, 2003(16): 529⁃535. [10]NAM M D, THANH T C. Numerical solution of differential equations using multiquadric radial basis function networks [J]. Neural Networks, 2001(14): 185⁃199. [11]刘道华,张礼涛.基于正交最小二乘法的径向基神经网 络模型[J].信阳师范学院学报, 2013, 26(3): 428⁃431. LIU Daohua,ZHANG Litao. Radial basis function neural net⁃ work model based on orthogonal least squares[J]. Journal of Xinyang Normal University, 2013, 26(3): 428⁃431. [12]KON M A, PLASKOTA L. Information complexity of neu⁃ ral networks[J]. Neural Networks, 2000(13): 365⁃375. [13]SHI D, YEUNG D S, GAO J. Sensitivity analysis applied to the construction of radial basis function networks [ J]. Neural Networks, 2005(18): 951⁃957. [14]ZENG X, YEUNG D S. A quantified sensitivity measure for multilayer perceptron to input perturbation[ J]. Neural Computation, 2003(15):183⁃212. 作者简介: 张艳霞,女,1979 年生,讲师,主要 研究方向为数据库新技术、数据挖掘、 智能算法等,发表学术论文 10 篇,出版 著作 1 部。 陈丹琪,女,1972 年生,副教授,主要研究方向为传感器 网络、软件工程、神经网络等,发表学术 论文 20 余篇,出版著作 1 部。 韩莹,女,1979 年生,讲师,主要研 究方向为数据挖掘、人工智能等,发表 学术论文 5 篇,出版著作 1 部。 ·264· 智 能 系 统 学 报 第 9 卷