【机器学习】基于自组织递归模糊神经网络的PM2.5浓度预测

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：1.49MB

第13卷第4期智能系统学报 Vol.13 No.4 2018年8月 CAAI Transactions on Intelligent Systems Aug.2018 D0:10.11992/tis.201710007 网络出版地址：http:/kns.cnki.net/kcms/detail/23.1538.TP.20180328.1649.012.html 基于自组织递归模糊神经网络的PM2.5浓度预测周杉杉2，李文静2，乔俊飞2 （1.北京工业大学信息学部，北京100124；2.计算智能与智能系统北京市重点实验室，北京100124) 摘要：针对PM2.5浓度非线性动态变化的特点，提出了一种自组织递归模糊神经网络(self-organizing recurrent fuzzy neural network,SORFNN)方法预测PM2.5小时浓度。首先，通过分析影响PM2.5浓度的多种因素，利用主成分分析法(principal component analysis.PCA)筛选出与PM2.5浓度相关性较强的特征变量作为神经网络的输入变量。然后，根据e准则和偏最小二乘算法(partial least squares,.PLS)进行规则化层神经元的增删，实现递归模糊神经网络结构的自动调整，并采用学习率自适应的梯度下降算法调整模型中心、宽度和权值等参数，建立 PM25预测模型。最后，利用典型非线性系统辨识和实际PM2.5浓度预测实验进行验证。实验结果表明，所设计的自组织递归模糊神经网络结构精简且预测精度高，较好地满足了PM2.5实时预测的要求。关键词：PM2.5;预测；PCA:递归模糊神经网络；自组织；自适应梯度下降中图分类号：TP18文献标志码：A文章编号：1673-4785(2018)04-0509-08 中文引用格式：周杉杉，李文静，乔俊飞.基于自组织递归模糊神经网络的PM2.5浓度预测几.智能系统学报，2018,13(4)： 509-516. 英文引用格式：ZHOU Shanshan,I Wenjing,QIAO Junfei..Prediction of PM2.5 concentration based on self--organizing recurrent fuzzy neural network J].CAAI transactions on intelligent systems,2018,13(4):509-516. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network ZHOU Shanshan,LI Wenjing,QIAO Junfei' (1.Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China;2.Beijing Key Laboratory of Com- putational Intelligent System,Beijing 100124,China) Abstract:To address the nonlinear dynamic variation in the concentration of fine particulate matter(PM2.5),in this pa- per,we propose a novel self-organizing recurrent fuzzy neural network(SORFNN)for predicting the hourly PM2.5 con- centration.First,we analyzed the factors affecting PM2.5 concentration by principal component analysis to identify the characteristic variables and used them as input variables in the neural network.Next,we added or deleted a nerve cell to the regularized layer,based on the e criterion and partial least squares algorithm,to automatically adjust the recurrent fuzzy neural network.In addition,we applied the adaptive gradient descent algorithm to adjust parameters such as the centers,widths and weights to establish a PM2.5 model.Lastly,to verify the results,we conducted experiments in typic- al nonlinear system identification and actual PM2.5 concentration prediction.The experimental results show that the proposed SORFNN is compact in structure,has high prediction accuracy,and can satisfy the real-time prediction re- quirements of PM2.5 concentration. Keywords:PM2.5;prediction;PCA;recurrent fuzzy neural network;self-organizing;adaptive gradient descent al- gorithm 收稿日期：2017-10-17.网络出版日期：2018-03-28. 近年来伴随我国多个城市空气重污染事件的基金项目：国家自然科学基金项目(61533002,61603009)：北京工业大学“日新人才”计划项目(2017-RX(1)-04):北发生，以细颗粒物(PM2.5)为特征污染物的区域京市自然科学基金项目(4182007). 通信作者：周杉杉.E-mail:18810337855@163.com. 性大气环境问题逐渐引起了人们的广泛关注山

DOI: 10.11992/tis.201710007 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180328.1649.012.html 基于自组织递归模糊神经网络的 PM2.5 浓度预测周杉杉1,2，李文静1,2，乔俊飞1,2 （1. 北京工业大学信息学部，北京 100124; 2. 计算智能与智能系统北京市重点实验室，北京 100124）摘要：针对 PM2.5 浓度非线性动态变化的特点，提出了一种自组织递归模糊神经网络 (self-organizing recurrent fuzzy neural network，SORFNN) 方法预测 PM2.5 小时浓度。首先，通过分析影响 PM2.5 浓度的多种因素，利用主成分分析法 (principal component analysis，PCA) 筛选出与 PM2.5 浓度相关性较强的特征变量作为神经网络的输入变量。然后，根据 ε 准则和偏最小二乘算法 (partial least squares，PLS) 进行规则化层神经元的增删，实现递归模糊神经网络结构的自动调整，并采用学习率自适应的梯度下降算法调整模型中心、宽度和权值等参数，建立 PM2.5 预测模型。最后，利用典型非线性系统辨识和实际 PM2.5 浓度预测实验进行验证。实验结果表明，所设计的自组织递归模糊神经网络结构精简且预测精度高，较好地满足了 PM2.5 实时预测的要求。关键词：PM2.5；预测；PCA；递归模糊神经网络；自组织；自适应梯度下降中图分类号：TP18 文献标志码：A 文章编号：1673−4785(2018)04−0509−08 中文引用格式：周杉杉, 李文静, 乔俊飞. 基于自组织递归模糊神经网络的 PM2.5 浓度预测 [J]. 智能系统学报, 2018, 13(4): 509–516. 英文引用格式：ZHOU Shanshan, LI Wenjing, QIAO Junfei. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network[J]. CAAI transactions on intelligent systems, 2018, 13(4): 509–516. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network ZHOU Shanshan1,2 ，LI Wenjing1,2 ，QIAO Junfei1,2 (1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China; 2. Beijing Key Laboratory of Computational Intelligent System, Beijing 100124, China) Abstract: To address the nonlinear dynamic variation in the concentration of fine particulate matter (PM2.5), in this paper, we propose a novel self-organizing recurrent fuzzy neural network (SORFNN) for predicting the hourly PM2.5 concentration. First, we analyzed the factors affecting PM2.5 concentration by principal component analysis to identify the characteristic variables and used them as input variables in the neural network. Next, we added or deleted a nerve cell to the regularized layer, based on the ε criterion and partial least squares algorithm, to automatically adjust the recurrent fuzzy neural network. In addition, we applied the adaptive gradient descent algorithm to adjust parameters such as the centers, widths and weights to establish a PM2.5 model. Lastly, to verify the results, we conducted experiments in typical nonlinear system identification and actual PM2.5 concentration prediction. The experimental results show that the proposed SORFNN is compact in structure, has high prediction accuracy, and can satisfy the real-time prediction requirements of PM2.5 concentration. Keywords: PM2.5; prediction; PCA; recurrent fuzzy neural network; self-organizing; adaptive gradient descent algorithm 近年来伴随我国多个城市空气重污染事件的发生，以细颗粒物 (PM2.5) 为特征污染物的区域性大气环境问题逐渐引起了人们的广泛关注[1]。收稿日期：2017−10−17. 网络出版日期：2018−03−28. 基金项目：国家自然科学基金项目 (61533002，61603009)；北京工业大学“日新人才”计划项目 (2017-RX(1)-04)；北京市自然科学基金项目 (4182007). 通信作者：周杉杉. E-mail：18810337855@163.com.. 第 13 卷第 4 期智能系统学报 Vol.13 No.4 2018 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2018

·510 智能系统学报第13卷 2012年环保部发布了新修订的《环境空气质量网络预测上海市区PM2.5日均浓度，以更少的输标准》(GB3095一2012)，将PM2.5纳入空气质量入取得了比RBF更好的预测效果，但是预测精度监测范围。2013年国务院发布了《大气污染防仍需进一步提高。由于神经网络是“黑箱模型”，治行动计划》，制定了明确的大气污染防治目可解释性差，模糊系统则可以利用模糊语言处理标。但截至2016年中国环境状况公报发布的数信息，表达能力较强，因此结合两种方法的优势据，全国338个地级及以上城市只有84个城市空对PM2.5浓度进行预测成为提高预测精度的有效气质量达标，以PM2.5为首要污染物的天数达到方法；Mishra等o以CO、NO2、O、SO2、上一时刻 80.3%。我国城市空气污染是长期形成的复合型的PM2.5浓度、温度、风速、相对湿度和露点温度大气污染，治理工作还需要我们长期不懈的努力。作为输入，利用Takagi Sugeno型模糊神经网络预据研究PM2.5可以渗透到人的肺部和支气测当前时刻的PM2.5浓度，取得了比MLR和管，因此长期暴露于PM2.5环境中会增加呼吸系 ANN更好的效果；Qiao等利用模糊神经网络建统和心血管疾病的发病率和死亡率。通过对太立PM2.5小时预测模型，并采用二阶梯度下降算阳辐射的吸收和散射，PM2.5也会对全球气候变法训练网络，预测效果比ESN和化学传输模型都化产生影响，同时会影响能见度，进而影响我们要好。另外，PM2.5的浓度扩散是一个非线性动的日常生活。因此，对PM2.5进行有效的预测，态变化的过程，受到时滞的影响。相对于前馈神及时采取防控措施有重要意义。但是PM2.5的浓经网络，递归神经网络具有动态元素，内部的反度既和污染源有关，又受气象条件的影响，使得馈连接可用于记忆历史信息，更适合处理非线性预测难度较大。动态过程。因此，本文提出采用递归模糊神经网目前空气质量预测方法主要有机理分析和统络(recurrent fuzzy neural network,RFNN)预测PM2.5 计模型两种。机理分析法通过研究PM2.5的形成浓度。机理，复杂的物理、化学变化来模拟其扩散过程，对于神经网络而言，网络结构的大小是影响进而预测PM2.5的浓度。比如，Saide等利用化其性能的重要因素，结构优化方法主要有增长型学传输模型，根据示踪物CO浓度与PM10/PM2.5 修剪型和增长修剪相结合等方法。而很多方法在的线性关系得到PM10/PM2.5的预测浓度，其中判断是否增删神经元时需要预先设定阈值，这些模型所需的排放源清单的准确性对预测结果有显阈值的设定通常凭借经验多次试凑，不能保证找著影响：Riccio等利用欧拉模型和拉格朗日模到最优值2。针对以上问题，本文提出一种神型对意大利南部某站点的PM2.5浓度变化情况进经网络结构自组织方法，采用ε准则和偏最小二行了模拟，得出了当地PM2.5的浓度不但受本地乘法(partial least squares,PLS)定义增长和删减指排放源的影响，同时与周边区域的输送有关的结标，使用尽量少的阈值，实现规则化层神经元的论。但是，大气环境是动态变化的非线性过程，理自动增删，同时采用学习率自适应的梯度下降算论分析复杂，机理分析建模所需的气象边界条件、法对网络参数进行优化，并将该自组织递归模糊排放源清单等参数难以取得，模型的适用性较难神经网络用于PM2.5浓度预测实验。满足，不适合日常PM2.5浓度的预测。相比于机理分析方法，统计模型更容易通过 1 递归模糊神经网络数据拟合方法建立预测模型。Chen等6使用小波分解和逐步回归结合的方法来预测PM10的浓 RFNN结合了神经网络与模糊系统的优点，度，取得了不错的预测效果；Elbayoumi等m以室引入的递归环节可以增加网络的动态记忆性能。外PM10、PM2.5、C0、CO2浓度、风速、气压和相文中RFNN的结构如图1所示。输入层隶属函数层规则层去模糊输出层对湿度作为输入，建立多元线性回归模型(mu- 化层 tiple linear regression,MLR)预测室内PMI0和 PM2.5的浓度。而PM2.5浓度变化是非线性过程，对其建立线性模型效果并不理想。人工神经网络(artificial neural network,.ANN) 因其强大的非线性映射能力、自组织自学习能力，被广泛用于非线性系统的建模。Ordieres等图利用多层感知器和径向基函数(radial basis func-. tion,RBF)神经网络预测PM2.5浓度，发现RBF 图1递归模糊神经网络结构神经网络预测结果更精确；Xu等例利用回声状态 Fig.1 Structure of recurrent fuzzy neural network

2012 年环保部发布了新修订的《环境空气质量标准》(GB3095—2012)，将 PM2.5 纳入空气质量监测范围。2013 年国务院发布了《大气污染防治行动计划》，制定了明确的大气污染防治目标。但截至 2016 年中国环境状况公报发布的数据，全国 338 个地级及以上城市只有 84 个城市空气质量达标，以 PM2.5 为首要污染物的天数达到 80.3%。我国城市空气污染是长期形成的复合型大气污染，治理工作还需要我们长期不懈的努力。据研究 PM2.5 可以渗透到人的肺部和支气管，因此长期暴露于 PM2.5 环境中会增加呼吸系统和心血管疾病的发病率和死亡率[2]。通过对太阳辐射的吸收和散射，PM2.5 也会对全球气候变化产生影响，同时会影响能见度，进而影响我们的日常生活[3]。因此，对 PM2.5 进行有效的预测，及时采取防控措施有重要意义。但是 PM2.5 的浓度既和污染源有关，又受气象条件的影响，使得预测难度较大。目前空气质量预测方法主要有机理分析和统计模型两种。机理分析法通过研究 PM2.5 的形成机理，复杂的物理、化学变化来模拟其扩散过程，进而预测 PM2.5 的浓度。比如，Saide 等 [4] 利用化学传输模型，根据示踪物 CO 浓度与 PM10/PM2.5 的线性关系得到 PM10/PM2.5 的预测浓度，其中模型所需的排放源清单的准确性对预测结果有显著影响；Riccio 等 [5] 利用欧拉模型和拉格朗日模型对意大利南部某站点的 PM2.5 浓度变化情况进行了模拟，得出了当地 PM2.5 的浓度不但受本地排放源的影响，同时与周边区域的输送有关的结论。但是，大气环境是动态变化的非线性过程，理论分析复杂，机理分析建模所需的气象边界条件、排放源清单等参数难以取得，模型的适用性较难满足，不适合日常 PM2.5 浓度的预测。相比于机理分析方法，统计模型更容易通过数据拟合方法建立预测模型。Chen 等 [6] 使用小波分解和逐步回归结合的方法来预测 PM10 的浓度，取得了不错的预测效果；Elbayoumi 等 [7] 以室外 PM10、PM2.5、CO、CO2 浓度、风速、气压和相对湿度作为输入，建立多元线性回归模型 (multiple linear regression，MLR) 预测室内 PM10 和 PM2.5 的浓度。而 PM2.5 浓度变化是非线性过程，对其建立线性模型效果并不理想。人工神经网络 (artificial neural network，ANN) 因其强大的非线性映射能力、自组织自学习能力，被广泛用于非线性系统的建模。Ordieres 等 [8] 利用多层感知器和径向基函数 (radial basis function，RBF) 神经网络预测 PM2.5 浓度，发现 RBF 神经网络预测结果更精确；Xu 等 [9] 利用回声状态网络预测上海市区 PM2.5 日均浓度，以更少的输入取得了比 RBF 更好的预测效果，但是预测精度仍需进一步提高。由于神经网络是“黑箱模型”，可解释性差，模糊系统则可以利用模糊语言处理信息，表达能力较强，因此结合两种方法的优势对 PM2.5 浓度进行预测成为提高预测精度的有效方法；Mishra 等 [10] 以 CO、NO2、O3、SO2、上一时刻的 PM2.5 浓度、温度、风速、相对湿度和露点温度作为输入，利用 Takagi Sugeno 型模糊神经网络预测当前时刻的 PM2.5浓度，取得了比 MLR 和 ANN 更好的效果；Qiao 等 [11]利用模糊神经网络建立 PM2.5 小时预测模型，并采用二阶梯度下降算法训练网络，预测效果比 ESN 和化学传输模型都要好。另外，PM2.5 的浓度扩散是一个非线性动态变化的过程，受到时滞的影响。相对于前馈神经网络，递归神经网络具有动态元素，内部的反馈连接可用于记忆历史信息，更适合处理非线性动态过程。因此，本文提出采用递归模糊神经网络 (recurrent fuzzy neural network，RFNN) 预测 PM2.5 浓度。对于神经网络而言，网络结构的大小是影响其性能的重要因素，结构优化方法主要有增长型、修剪型和增长修剪相结合等方法。而很多方法在判断是否增删神经元时需要预先设定阈值，这些阈值的设定通常凭借经验多次试凑，不能保证找到最优值[12-14]。针对以上问题，本文提出一种神经网络结构自组织方法，采用 ε 准则和偏最小二乘法 (partial least squares，PLS) 定义增长和删减指标，使用尽量少的阈值，实现规则化层神经元的自动增删，同时采用学习率自适应的梯度下降算法对网络参数进行优化，并将该自组织递归模糊神经网络用于 PM2.5 浓度预测实验。 1 递归模糊神经网络 RFNN 结合了神经网络与模糊系统的优点，引入的递归环节可以增加网络的动态记忆性能。文中 RFNN 的结构如图 1 所示。 yout 输入层隶属函数层规则层去模糊化层输出层 f f f . . . x1 x2 xn Π Π Π Σ 图 1 递归模糊神经网络结构 Fig. 1 Structure of recurrent fuzzy neural network ·510· 智能系统学报第 13 卷

第4期周杉杉，等：基于自组织递归模糊神经网络的PM2.5浓度预测 ·511· 网络隶属函数层采用高斯函数对输入变量进 2.1 结构增长行模糊化处理，如式(1)所示。在规则层引入反规则层神经元的增长有两个判断标准：误差馈环节，通过sigmoid函数将上一时刻规则层的和ε准则。输出作为当前规则层的一个输入，计算过程如式（②）~ 1)定义判断误差e。为了减小异常数据的影 (4)所示。去模糊化层和输出层如式（⑤）~(6)所示。响，文中采用滑窗方法： 4(0=exp- a(0）-c0)2 20 ]，j=1,2.…,m(1) ei ier-M+】式中：u()为t时刻第i个输入对应的第j个隶属 e= M 函数的输出，c()和σ()分别为对应隶属函数的 e;=(i)-y(i) 中心和宽度。式中：M是滑窗宽度。若误差e变大，则说明网络 0=f4,0.j=1,2…,m (2) 泛化性能变差，需要增加模糊规则或者修正参数。 1 2)根据ε完整性准则啊，对于一个正常的数据 f=1+exp(-h (3) 分布，当输入位于[c2o,c+2o]范围内时， h:=中(t-1)l(t) (4) 95%的数据属于该成员函数。因此通过式(1)计式中：(1)是1时刻第j个规则层神经元的输出，算可以得到隶属函数的输出阈值为0.1354。这个 (-1)表示前一时刻规则层的输出，是对应的条件保证了每个输入的模糊隶属度不小于0.1354， sigmoid函数，h是内部变量，()是t时刻递归环满足了模糊规则的ε完整性准则。节的反馈权值。因此，如果满足条件：，0=01∑，0 (5) le(t+1)>le(t) (m)=arg max(u.）<0.1354 0=立4030 则说明当前网络误差变大，现有规则不能有 (6) 效覆盖输入数据，需要增加规则层神经元（将规式中：)是1时刻神经网络的输出，w)是1时刻则层第n个神经元分裂为两个)。新增神经元的输出层与前一层的连接权值，，（①）是去模糊化层初始参数设置为的输出。 Cnew(t)= 为了提高网络的收敛性，本文采用学习率自适 2c.0+x0ω 应的梯度下降算法调整递归模糊神经网络的参数。 Onew(t)=(t) 刀=刀mas-d7max-amn)/D (7) Whew(t)=e(t) 中aew(t) 式中：nma和nm分别是最大和最小学习率，d是当前式中：Cew()、oeu()和we()分别是新增神经元的迭代步数，D是总的迭代步数。在初始阶段参数调中心、宽度和连接权值，c.()和c.(1)是第n个神整幅度较大，利于快速寻优节省时间，随着迭代步经元的中心和宽度，x(t)是当前输入样本，paew(t) 数的增加，学习率逐渐减小，以保证网络的稳定性。是新增神经元的输出。 2自组织递归模糊神经网络 2.2结构修剪神经网络的结构是影响其性能的关键因素之模糊神经网络规则层的删减一般根据规则层一，本文根据模糊规则的ε完整性准则和偏最小神经元对于输出层神经元的影响大小来判断。这二乘法实现网络规则层的自组织，结构如图2所示。种删减也可以理解为一种数据的降维。因此，基于数据降维的思想，本文采用偏最小二乘算法实输入层隶属函数层规则层去模糊输出层化层现规则层神经元的修剪。偏最小二乘算法的一个显著特点就是允许在样本点个数少于变量个数的情况下进行回归分析。由于滑窗宽度有限，可能出现滑窗内样本个数少于规则层神经元个数（即变量个数)的情况，所以采用PLS算法正好解决这一问题。以下是删减过程的主要步骤：首先判断误差e,如果le(t+l)<e(t)儿，说明当前网络性能较好。接下来通过PLS计算规则层神图2自组织递归模糊网络结构经元的回归系数，删除对输出影响较小的神经元 Fig.2 Structure of self-organizing RFNN 以避免网络结构冗余。PLS主要计算步骤如下：

网络隶属函数层采用高斯函数对输入变量进行模糊化处理，如式 (1) 所示。在规则层引入反馈环节，通过 sigmoid 函数将上一时刻规则层的输出作为当前规则层的一个输入，计算过程如式 (2)～ (4) 所示。去模糊化层和输出层如式 (5)～(6) 所示。 ui j(t) = exp[− (ai(t)−ci j(t))2 2σ 2 i j(t) ], j = 1,2,··· ,m (1) 式中：uij(t) 为 t 时刻第 i 个输入对应的第 j 个隶属函数的输出，cij(t) 和 σij(t) 分别为对应隶属函数的中心和宽度。 ϕj(t) = fj ∏n i=1 ui j(t), j = 1,2,··· ,m (2) fj = 1 1+exp(−hj) (3) hj = ϕj(t−1)λj(t) (4) 式中：ϕj (t) 是 t 时刻第 j 个规则层神经元的输出， ϕj (t-1) 表示前一时刻规则层的输出，fj 是对应的 sigmoid 函数，hj 是内部变量，λj (t) 是 t 时刻递归环节的反馈权值。 ϕ¯ j(t) = ϕj(t)/ ∑m j=1 ϕj(t) (5) y(t) = ∑m j=1 wj(t)ϕ¯ j(t) (6) ϕ¯ j(t) 式中：y(t) 是 t 时刻神经网络的输出，wj (t) 是 t 时刻输出层与前一层的连接权值，是去模糊化层的输出。为了提高网络的收敛性，本文采用学习率自适应的梯度下降算法调整递归模糊神经网络的参数。 η = ηmax −d(ηmax −ηmin)/D (7) 式中： ηmax和 ηmin分别是最大和最小学习率，d 是当前迭代步数，D 是总的迭代步数。在初始阶段参数调整幅度较大，利于快速寻优节省时间，随着迭代步数的增加，学习率逐渐减小，以保证网络的稳定性。 2 自组织递归模糊神经网络神经网络的结构是影响其性能的关键因素之一，本文根据模糊规则的 ε 完整性准则和偏最小二乘法实现网络规则层的自组织，结构如图 2 所示。 yout 输入层隶属函数层规则层去模糊化层输出层 f f f . . . x1 x2 xn Π Π Π Σ 图 2 自组织递归模糊网络结构 Fig. 2 Structure of self-organizing RFNN 2.1 结构增长 ε 规则层神经元的增长有两个判断标准：误差和准则。 1) 定义判断误差 e。为了减小异常数据的影响，文中采用滑窗方法： e = ∑r i=r−M+1 ei M ei = y d (i)−y(i) 式中：M 是滑窗宽度。若误差 e 变大，则说明网络泛化性能变差，需要增加模糊规则或者修正参数。 ε ε 2) 根据完整性准则[15] ，对于一个正常的数据分布，当输入位于 [ci j-2σi j， ci j+2σi j] 范围内时， 95% 的数据属于该成员函数。因此通过式 (1) 计算可以得到隶属函数的输出阈值为 0.135 4。这个条件保证了每个输入的模糊隶属度不小于 0.135 4，满足了模糊规则的完整性准则。因此，如果满足条件： { |e(t+1)| > |e(t)| u(n) = argmax(u• j) < 0.135 4 则说明当前网络误差变大，现有规则不能有效覆盖输入数据，需要增加规则层神经元 (将规则层第 n 个神经元分裂为两个)。新增神经元的初始参数设置为 cnew(t) = 1 2 (cn(t)+ x(t)) σnew(t) = σn(t) wnew(t) = e(t) ϕnew(t) 式中：cnew(t)、σnew(t) 和 wnew(t) 分别是新增神经元的中心、宽度和连接权值，cn (t) 和 σn (t) 是第 n 个神经元的中心和宽度，x(t) 是当前输入样本，ϕnew(t) 是新增神经元的输出。 2.2 结构修剪模糊神经网络规则层的删减一般根据规则层神经元对于输出层神经元的影响大小来判断。这种删减也可以理解为一种数据的降维。因此，基于数据降维的思想，本文采用偏最小二乘算法实现规则层神经元的修剪。偏最小二乘算法的一个显著特点就是允许在样本点个数少于变量个数的情况下进行回归分析。由于滑窗宽度有限，可能出现滑窗内样本个数少于规则层神经元个数 (即变量个数) 的情况，所以采用 PLS 算法正好解决这一问题。以下是删减过程的主要步骤：首先判断误差 e，如果|e(t+1)|<|e(t)|，说明当前网络性能较好。接下来通过 PLS 计算规则层神经元的回归系数，删除对输出影响较小的神经元以避免网络结构冗余。PLS 主要计算步骤如下：第 4 期周杉杉，等：基于自组织递归模糊神经网络的 PM2.5 浓度预测 ·511·

·512· 智能系统学报第13卷 1)以滑窗内规则层神经元输出作为自变量 3实验研究 X,网络输出层神经元作为单因变量y。X和y经标准化后的矩阵分别记为E。和Fo。 3.1非线性系统辨识 2)从E和F。分别提取第1个成分4和41。提为验证SORFNN模型的有效性，采用典型的取成分时，1与山要尽可能多地携带原数据的信非线性系统：息且相关性最大，从而保证自变量成分1对因变量 1+1)=0-100+2.5 +u(t) 成分“的解释性最强。如果第1个成分不能满足 1+y2(t)+y2(t-1) 精度要求，则用残差矩阵E和F继续提取第2个进行实验验证。其中，y(0)=0,y(1)=0,(t)= 成分，直至提取的成分个数满足算法的停止要求。 sin(2πl25)。非线性系统的模型为 X-TP+E->+E t+1)=f0y(t0),y(t-1),(t) (8) 因此SORFNN模型为3输入1输出，根据式 (8)产生500个样本，训练数据采用前400组，后 y=UOT+F= 4，g+F 100组用于测试，为了验证神经网络的自组织结 =1 式中：T、P、E分别是自变量X的得分矩阵、负荷构变化，初始规则数选取较小值2。矩阵与残差矩阵；U、Q、F分别是因变量y的得分图3给出了训练过程中规则层神经元个数的矩阵、负荷矩阵与残差矩阵；α是提取的成分个数。变化情况，最终神经元稳定在6个左右，表明网络 3)通过检验交叉有效性确定最终提取的成分结构能够动态优化，提高网络性能。图4和图5分个数。首先从所有n个样本点中除去第i个样本别给出了网络训练效果和测试效果。从图中可以看点(=1,2，…，n),用h个成分拟合一个回归方程。出，网络在训练和测试阶段与期望输出都拟合较好。将被除去的样本点i代入该回归方程，得到y在 6.0 样本点i上的拟合值M-n。对=1,2，，n重复上述 5.5 熟5.0 计算，则因变量y的拟合误差平方和为 R4.5 PRESS 4.0 3.5 其次，将所有n个样本点用于拟合含h个成 0 2.5 分的回归方程，记第i个样本点的拟合值为，得 2.0 到y的误差平方和为 50100150200250300350400 样本个数 SS= - 图3规则层神经元变化 Fig.3 Number variation of neurons in rule layer 定义交叉有效性用目验中 =1-PRESS, SSh- 当Q<0.0975时，增加新的成分对减少回归方程的拟合误差无明显改善，停止提取成分。通过计算回归系数R,当规则层神经元的最小系数R小于阈值R时，则删除该神经元。 0 50100150200250300350400 训练样本 le(t+1)<le(t) R=arg min(R)<Ri 图4训练效果若第个神经元被删除，则与第j个规则层神 Fig.4 Training results 经元欧氏距离最近的神经元参数调整为期望输出·SORFNN输出 c'()=cr(①) 0(t)=0r() 3210 w.(t)=wr(1)+wi)(t)/r(t) 式中：了是与神经元j欧氏距离最近的神经元，c、 0102030405060708090100 G、和w',分别是结构调整后神经元'的中心、宽测试样本度和权值；C、G、和w分别是结构调整前神经元图5测试效果的中心、宽度和权值；是神经元广的输出。 Fig.5 Test results

1) 以滑窗内规则层神经元输出作为自变量 X，网络输出层神经元作为单因变量 y。X 和 y 经标准化后的矩阵分别记为 E0 和 F0。 2) 从 E0 和 F0 分别提取第 1 个成分 t1 和 u1。提取成分时，t1 与 u1 要尽可能多地携带原数据的信息且相关性最大，从而保证自变量成分 t1 对因变量成分 u1 的解释性最强。如果第 1 个成分不能满足精度要求，则用残差矩阵 E1 和 F1 继续提取第 2 个成分，直至提取的成分个数满足算法的停止要求。 X = TPT + E = ∑α i=1 ti p T i + E y = UQT + F = ∑α i=1 uiq T i + F 式中：T、P、E 分别是自变量 X 的得分矩阵、负荷矩阵与残差矩阵；U、Q、F 分别是因变量 y 的得分矩阵、负荷矩阵与残差矩阵；α 是提取的成分个数。 ··· yˆh(−i) ··· 3) 通过检验交叉有效性确定最终提取的成分个数。首先从所有 n 个样本点中除去第 i 个样本点 (i=1,2, ,n)，用 h 个成分拟合一个回归方程。将被除去的样本点 i 代入该回归方程，得到 y 在样本点 i 上的拟合值。对 i=1,2, ,n 重复上述计算，则因变量 y 的拟合误差平方和为 PRESSh = ∑n i=1 (yi −yˆh(−i)) 2 yˆhi 其次，将所有 n 个样本点用于拟合含 h 个成分的回归方程，记第 i 个样本点的拟合值为，得到 y 的误差平方和为 SSh = ∑n i=1 (yi −yˆhi) 2 定义交叉有效性 Q 2 h = 1− PRESSh SSh−1 Q 2 当 h < 0.097 5 时，增加新的成分对减少回归方程的拟合误差无明显改善，停止提取成分。通过计算回归系数 Rj，当规则层神经元的最小系数 R 小于阈值 Rth 时，则删除该神经元。 { |e(t+1)| < |e(t)| R = argmin(Rj) < Rth 若第 j 个神经元被删除，则与第 j 个规则层神经元欧氏距离最近的神经元参数调整为 c ′ j ′ (t) = cj ′ (t) σ ′ j ′ (t) = σj ′ (t) w ′ j ′ (t) = wj ′ (t)+wj(t)ϕj(t)/ϕj ′ (t) 式中：j′是与神经元 j 欧氏距离最近的神经元，c′ j′、 σ′ j′、和 w′ j′分别是结构调整后神经元 j′的中心、宽度和权值；cj′、σj′、和 wj′分别是结构调整前神经元 j′的中心、宽度和权值；ϕj′是神经元 j′的输出。 3 实验研究 3.1 非线性系统辨识为验证 SORFNN 模型的有效性，采用典型的非线性系统： y(t+1) = y(t)y(t−1)[y(t)+2.5] 1+y 2 (t)+y 2 (t−1) +u(t) 进行实验验证。其中，y(0)=0，y(1)=0，u(t)= sin(2πt/25)。非线性系统的模型为 yˆ(t+1) = ˆf(y(t), y(t−1),u(t)) (8) 因此 SORFNN 模型为 3 输入 1 输出，根据式 (8) 产生 500 个样本，训练数据采用前 400 组，后 100 组用于测试，为了验证神经网络的自组织结构变化，初始规则数选取较小值 2。图 3 给出了训练过程中规则层神经元个数的变化情况，最终神经元稳定在 6 个左右，表明网络结构能够动态优化，提高网络性能。图 4 和图 5 分别给出了网络训练效果和测试效果。从图中可以看出，网络在训练和测试阶段与期望输出都拟合较好。 0 50 100 150 200 250 300 350 400 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 样本个数规则层神经元个数图 3 规则层神经元变化 Fig. 3 Number variation of neurons in rule layer 0 50 100 150 200 250 300 350 400 −2 −1 0 1 2 3 4 训练样本输出值期望输出 SORFNN 输出图 4 训练效果 Fig. 4 Training results 0 10 20 30 40 50 60 70 80 90 100 −2 −1 0 1 2 3 4 ⍻䈅ṧᵜ 䗃ࠪ٬ ᵏᵋ䗃ࠪ SORFNN 䗃ࠪ 图 5 测试效果 Fig. 5 Test results ·512· 智能系统学报第 13 卷

第4期周杉杉，等：基于自组织递归模糊神经网络的PM2.5浓度预测 ·513· 图6是样本的测试误差图，图7是测试输出其中，均方根误差RMSE和平均百分比误差与期望输出拟合的散点图。从图中可以看出网络 APE计算公式如下：测试误差较小，测试输出与期望输出基本拟合在一条直线上。表I给出了SORFNN与动态模糊神 ya(0-y(0)2 经网络(dynamic fuzzy neural network,DFNN) RMSE =1 2N 广义动态模糊神经网络(generalized dynamic fuzzy neural network,GDFNN)I和基于本文自组织方 APE= 1 六bz0-y0创×100% N bya()l 法的自组织模糊神经网络(self-organizing fuzzy 3.2 PM2.5浓度预测 neural network,SOFNN)的性能比较。通过非线性系统辨识实验，验证了所设计的 10-2 2.5 SORFNN模型的有效性，接下来将该模型用于同 2.0 样是非线性过程的实际PM2.5浓度的小时预测。 3.2.1数据来源 0.5 PM2.5浓度预测和分析使用的数据一般有 -0.5 3种：地面监测站观测数据、同期同地区的气象观 1.0 测数据、高空遥感图像。目前北京市已经建立了 20 完善的空气污染监测站，因此本次实验选用易获 102030405060708090100 得的地面监测站数据和同期气象数据，以北京市测试样本朝阳区某国控空气质量监测站为研究对象，采集图6测试误差该站点的小时监测数据。具体数据集来源于微软 Fig.6 Error of test 的城市计算项目3，该数据集采样时间为2014年 5月1日一2015年4月30日，包含了4个季节的监测数据，样本内容丰富具有代表性，采样变量包括《环境空气质量标准》(GB3095一2012)中规定的6项常规监测项目CO、NO2、SO2、O3、PM2.5、 0 PM10和气象变量温度(T)、湿度(RH)、风向 (WD)、风速(WS)、气压(P)、天气(W),删除异常数据和缺失数据后获得4000组完整数据。实验中先将样本数据随机化归一化处理，然后选择前期望输出 3000组用于网络训练并进行十折交叉验证，轮流图7测试散点图将其中9份用作训练，1份作为测试，求其误差均 Fig.7 Scatter plot of test 值。后1000组用于网络测试，并进行多次独立实从表1可以看出，SORFNN的测试RMSE为验。这样训练样本和测试样本都包含了空气质量 0.0091,明显小于其他算法。规则层神经元个数较好和较差时的观测数据，保证了样本的多样性。为6，结构较为紧凑。同时，该自组织算法计算时 3.2.2特征提取间明显小于其他算法。对比结果表明SORFNN PM2.5的小时浓度与其他污染物和气象条件不仅能够获得较为精简的网络结构，而且性能同密切相关，陈冠益等1图的研究表明PM2.5浓度受样可以满足要求。温度、相对湿度、风速风向、降雨的影响显著。表1不同算法网络性能对比 Zheng等1的研究表明不同时刻的天气条件和 Table 1 Performance comparison of different algorithms SO2、NO2等污染物对PM2.5浓度影响较大。本文测试算法 Num APE 时间/s 中选择当前时刻的污染物变量(CO、NO2、SO2、 RMSE O3、PM2.5和PM10)、当前时刻的气象因子（温度、 SORFNN 6 0.0091 0.0161 1.28 湿度、风向、风速、气压和天气)、下一时刻的预报 DFNN 6 0.0283 0.0104 17.23 气象因子（温度、湿度、风向、风速、气压和天 GDFNN 0.0108 0.0040 18.12 气)作为特征变量。考虑到特征变量比较多，且 SOFNN 6 0.0227 0.0189 1.03 各个变量之间有一定相关性，若直接引入神经网络预测模型会有信息冗余，造成模型复杂度变 SORBF > 0.0266 0.0407 0.83 高，影响模型预测性能。所以，采用主成分分析

图 6 是样本的测试误差图，图 7 是测试输出与期望输出拟合的散点图。从图中可以看出网络测试误差较小，测试输出与期望输出基本拟合在一条直线上。表 1 给出了 SORFNN 与动态模糊神经网络 (dynamic fuzzy neural network，DFNN)[16] 、广义动态模糊神经网络 (generalized dynamic fuzzy neural network，GDFNN)[17] 和基于本文自组织方法的自组织模糊神经网络 (self-organizing fuzzy neural network，SOFNN) 的性能比较。 0 10 20 30 40 50 60 70 80 90 100 −2.5 −2.0 −1.5 −1.0 −0.5 0 0.5 1.0 1.5 2.0 2.5 ≷䄁ᵣ᱘ ≷䄁䄛ጚ ×10−2 图 6 测试误差 Fig. 6 Error of test −2 −1 0 1 2 3 4 −2 −1 0 1 2 3 4 期望输出测试输出图 7 测试散点图 Fig. 7 Scatter plot of test 从表 1 可以看出，SORFNN 的测试 RMSE 为 0.009 1，明显小于其他算法。规则层神经元个数为 6，结构较为紧凑。同时，该自组织算法计算时间明显小于其他算法。对比结果表明 SORFNN 不仅能够获得较为精简的网络结构，而且性能同样可以满足要求。表 1 不同算法网络性能对比 Table 1 Performance comparison of different algorithms 算法 Num 测试 RMSE APE 时间/s SORFNN 6 0.009 1 0.016 1 1.28 DFNN 6 0.028 3 0.010 4 17.23 GDFNN 8 0.010 8 0.004 0 18.12 SOFNN 6 0.022 7 0.018 9 1.03 SORBF 7 0.026 6 0.040 7 0.83 其中，均方根误差 RMSE 和平均百分比误差 APE 计算公式如下： RMSE = vuuuuut∑N t=1 (yd(t)−y(t))2 2N APE = 1 N ∑N t=1 |yd(t)−y(t)| |yd(t)| ×100% 3.2 PM2.5 浓度预测通过非线性系统辨识实验，验证了所设计的 SORFNN 模型的有效性，接下来将该模型用于同样是非线性过程的实际 PM2.5 浓度的小时预测。 3.2.1 数据来源 PM2.5 浓度预测和分析使用的数据一般有 3 种：地面监测站观测数据、同期同地区的气象观测数据、高空遥感图像。目前北京市已经建立了完善的空气污染监测站，因此本次实验选用易获得的地面监测站数据和同期气象数据，以北京市朝阳区某国控空气质量监测站为研究对象，采集该站点的小时监测数据。具体数据集来源于微软的城市计算项目[34] ，该数据集采样时间为 2014 年 5 月 1 日—2015 年 4 月 30 日，包含了 4 个季节的监测数据，样本内容丰富具有代表性，采样变量包括《环境空气质量标准》(GB3095—2012) 中规定的 6 项常规监测项目 CO、NO2、SO2、O3、PM2.5、 PM10 和气象变量温度 (T)、湿度 (RH)、风向 (WD)、风速 (WS)、气压 (P)、天气 (W)，删除异常数据和缺失数据后获得 4 000 组完整数据。实验中先将样本数据随机化归一化处理，然后选择前 3 000 组用于网络训练并进行十折交叉验证，轮流将其中 9 份用作训练，1 份作为测试，求其误差均值。后 1 000 组用于网络测试，并进行多次独立实验。这样训练样本和测试样本都包含了空气质量较好和较差时的观测数据，保证了样本的多样性。 3.2.2 特征提取 PM2.5 的小时浓度与其他污染物和气象条件密切相关，陈冠益等[18] 的研究表明 PM2.5 浓度受温度、相对湿度、风速风向、降雨的影响显著。 Zheng 等 [19] 的研究表明不同时刻的天气条件和 SO2、NO2 等污染物对 PM2.5 浓度影响较大。本文中选择当前时刻的污染物变量 (CO、NO2、SO2、 O3、PM2.5 和 PM10)、当前时刻的气象因子 (温度、湿度、风向、风速、气压和天气)、下一时刻的预报气象因子 (温度、湿度、风向、风速、气压和天气) 作为特征变量。考虑到特征变量比较多，且各个变量之间有一定相关性，若直接引入神经网络预测模型会有信息冗余，造成模型复杂度变高，影响模型预测性能。所以，采用主成分分析第 4 期周杉杉，等：基于自组织递归模糊神经网络的 PM2.5 浓度预测 ·513·

·514· 智能系统学报第13卷方法进行特征变量提取，达到数据降维的目的。 a 一期望输出◆SORFNN输出本文中取累计贡献率大于0.85的变量，最终提取出8个主成分作为神经网络预测模型的输入。 3.2.3实验结果实验中神经网络为8输入1输出，规则层初始神经元个数为4。预测模型的评价指标采用常用的均方根误差RMSE、平均绝对误差MAE、决定系数R、一致性指数IA82刘。 23 4567891010 测试样本 MAE= 1 图9测试效果 (∑p-o,- Fig.9 Test results =1 R2= 250 m-a- 200 150 100 50 IA=1 -50 -100 -150 式中：0和ō分别是期望值和期望值的均值，p:和 -200 -250 是预测值和预测值的均值。 4 56 78910×10 测试样本图8给出了网络训练过程中规则层神经元个数的变化情况，从图中可以看出在训练过程中神图10测试误差经网络的结构是动态变化的，根据一段时间内样 Fig.10 Test error 本的分布情况，神经元实现了增删调整，最终神表2不同网络性能对比经元个数为7个。图9给出了网络的测试效果， Table 2 Performance comparison of different networks 测试输出与期望输出拟合较好。图10是SOR- 参数 SORENN DENN GDFNN SOFNN SORBF FNN与DFNN、GDFNN、SOFNN、SORBF方法的训练预测误差对比图，DFNN的误差在(-250,250)范 0.0357 0.04620.04650.02940.0352 RMSE 围内，GDFNN和SORBF的误差都在(-150，测试 250)之间，S0FNN的误差范围是(-100,250)， 0.03500.05360.05510.03770.0435 RMSE SORFNN的误差则在(-150,150)范围。相比其 MAE 16.785916.237518.063817.558719.3941 他方法，SORFNN的预测误差范围较小，分布也 R 0.87670.84700.85200.85800.8439 比较均匀集中。具体性能指标对比如表2所示。 0.96550.95810.95900.95950.9548 从表中可以看出，文中自组织方法有效地减小了 IA 预测模型的误差，在拟合度等方面也有所提高， Num 7 6 g 9 10 是一种有效的自组织方法。 8.0 4结束语 7.5 7.0 通过分析PM2.5浓度变化的特点，本文提出采用自组织递归模糊神经网络来预测PM2.5浓 6.0 度。经过PCA提取特征变量，实现数据降维和信 55 5.0 息去冗余，有利于提高模型预测性能。为了解决 4.5 神经网络结构优化问题，提出基于ε准则和偏最 4. 0 1015202530×10 小二乘法的自组织方法，构建了自组织递归模糊训练样本神经网络模型，同时采用学习率自适应的梯度下图8规则层神经元变化降算法对神经网络的中心、宽度等参数进行训 Fig.8 Number variation of neurons in rule layer 练，建立了PM2.5浓度预测模型。通过非线性系

方法进行特征变量提取，达到数据降维的目的。本文中取累计贡献率大于 0.85 的变量，最终提取出 8 个主成分作为神经网络预测模型的输入。 3.2.3 实验结果实验中神经网络为 8 输入 1 输出，规则层初始神经元个数为 4。预测模型的评价指标采用常用的均方根误差 RMSE、平均绝对误差 MAE、决定系数 R 2 、一致性指数 IA[7-8,28-29]。 MAE = 1 N ∑N i=1 |oi− pi | R 2 = ( ∑N i=1 (pi − p¯)(oi −o¯))2 ∑N i=1 (pi − p¯) 2∑N i=1 (oi −o¯) 2 IA = 1− ∑N i=1 (pi −oi) 2 ∑N i=1 (|pi −o¯|+|oi −o¯|) 2 o¯ p¯ 式中：oi 和分别是期望值和期望值的均值，pi 和是预测值和预测值的均值。图 8 给出了网络训练过程中规则层神经元个数的变化情况，从图中可以看出在训练过程中神经网络的结构是动态变化的，根据一段时间内样本的分布情况，神经元实现了增删调整，最终神经元个数为 7 个。图 9 给出了网络的测试效果，测试输出与期望输出拟合较好。图 10 是 SORFNN 与 DFNN、GDFNN、SOFNN、SORBF 方法的预测误差对比图，DFNN 的误差在 (–250,250) 范围内， GDFNN 和 SORBF 的误差都在 (–150, 250) 之间，SOFNN 的误差范围是 (–100,250)， SORFNN 的误差则在 (–150,150) 范围。相比其他方法，SORFNN 的预测误差范围较小，分布也比较均匀集中。具体性能指标对比如表 2 所示。从表中可以看出，文中自组织方法有效地减小了预测模型的误差，在拟合度等方面也有所提高，是一种有效的自组织方法。 0 5 10 15 20 25 30 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 䃙㏯ᵣ᱘ 㻰݅ᅮ⺊㏻ٯ᪜͖ ×102 图 8 规则层神经元变化 Fig. 8 Number variation of neurons in rule layer 0 1 2 3 4 5 6 7 8 9 10 −1 0 1 2 3 4 5 测试样本期望输出 SORFNN 输出 PM2.5 浓度(μg/m3 ) ×102 ×102 图 9 测试效果 Fig. 9 Test results 0 1 2 3 4 5 6 7 8 9 10 −250 −200 −150 −100 −50 0 50 100 150 200 250 测试样本 GDFNN DFNN SOFNN SORBF SORFNN 测试误差(μg/m3 ) ×102 图 10 测试误差 Fig. 10 Test error 表 2 不同网络性能对比 Table 2 Performance comparison of different networks 参数 SORFNN DFNN GDFNN SOFNN SORBF 训练 RMSE 0.035 7 0.046 2 0.046 5 0.029 4 0.035 2 测试 RMSE 0.035 0 0.053 6 0.055 1 0.037 7 0.043 5 MAE 16.785 9 16.237 5 18.063 8 17.558 7 19.394 1 R 2 0.876 7 0.847 0 0.852 0 0.858 0 0.843 9 IA 0.965 5 0.958 1 0.959 0 0.959 5 0.954 8 Num 7 6 9 9 10 4 结束语通过分析 PM2.5 浓度变化的特点，本文提出采用自组织递归模糊神经网络来预测 PM2.5 浓度。经过 PCA 提取特征变量，实现数据降维和信息去冗余，有利于提高模型预测性能。为了解决神经网络结构优化问题，提出基于 ε 准则和偏最小二乘法的自组织方法，构建了自组织递归模糊神经网络模型，同时采用学习率自适应的梯度下降算法对神经网络的中心、宽度等参数进行训练，建立了 PM2.5浓度预测模型。通过非线性系 ·514· 智能系统学报第 13 卷

第4期周杉杉，等：基于自组织递归模糊神经网络的PM2.5浓度预测 ·515· 统辨识实验证明了该预测模型的有效性，最后将 vironment,2015,102:239-248 该模型用于实际问题PM2.5浓度的预测。实验结 [11]QIAO Junfei,CAI Jie,HAN Honggui,et al.Predicting 果表明该模型不仅能够获得较为精简的网络结 PM2s concentrations at a regional background station us- 构，而且预测精度有所提高，为PM2.5浓度预测 ing second order self-organizing fuzzy neural network[J]. 提供了一种有效的方法。 Atmosphere,2017,8(1):10. [12]HAN Honggui,LI Ying,GUO Yanan,et al.A soft com- 参考文献： puting method to predict sludge volume index based on a recurrent self-organizing neural network[J].Applied soft [1]TAO Minghui,CHEN Liangfu,WANG Zifeng,et al.A computing,2016.38:477-486. study of urban pollution and haze clouds over northern [13]HAN Honggui,WANG Lidan,QIAO Junfei,et al.A China during the dusty season based on satellite and sur- face observations[J].Atmospheric environment,2014,82: spiking-based mechanism for self-organizing RBF neural networks[C]//2014 International Joint Conference on 183-192 [2]QIAO Liping.CAI Jing,WANG Hongqi,et al.PM2.5 con- Neural Networks (IJCNN).Beijing,China,2014: 3775-3782 stituents and hospital emergency-room visits in Shanghai, [14]HAN Honggui,WU Xiaolong,QIAO Junfei.Nonlinear China[J].Environmental science and technology,2014, 48(17):10406-10414. systems modeling based on self-organizing fuzzy-neural- [3]XIAO S,WANG Q Y,CAO JJ,et al.Long-term trends in network with adaptive computation algorithm[J].IEEE visibility and impacts of aerosol composition on visibility transactions on cybernetics,2014,44(4):554-564. impairment in Baoji,China[J].Atmospheric research, [15]LENG Gang,MCGINNITY T M,PRASAD G.An ap- 2014,149:88-95. proach for on-line extraction of fuzzy rules using a self- [4]SAIDE P E.CARMICHAEL G R,SPAK S N,et al.Fore- organising fuzzy neural network[J].Fuzzy sets and sys- casting urban PM10 and PM2.5 pollution episodes in very tems,2005,150(2):211-243 stable nocturnal conditions and complex terrain using [16]WU Shiqian,ER M J.Dynamic fuzzy neural networks-a WRF-Chem CO tracer model[J].Atmospheric environ- novel approach to function approximation[J].IEEE trans- ment.2011.45(16):2769-2780 actions on systems,man,and cybernetics,part B(cyber- [5]RICCIO A,CHIANESE E,AGRILLO G,et al.Source ap- netics).2000.30(2):358-364. portion of atmospheric particulate matter:a joint [17]WU Shiqian,ER M J,GAO Yang.A fast approach for Eulerian/Lagrangian approach[J].Environmental science automatic generation of fuzzy rules by generalized dy- and pollution research,2014,21(23):13160-13168. namic fuzzy neural networks[J].IEEE transactions on [6]CHEN Yuanyuan,SHI Runhe,SHU Shijie,et al.En- fuzzy systems,.2001,94):578-594. semble and enhanced PM10 concentration forecast model [18]陈冠益，张雯，侯立安，等.天津蓟县夏季PM2.5污染特 based on stepwise regression and wavelet analysis[J].At- 征及影响因素).天津大学学报：自然科学与工程技术 mospheric environment,2013,74:346-359. 版，2015,48(2)：95-102 [7]ELBAYOUMI M,RAMLI N A,MD YUSOF N FF,et al. CHEN Guanyi,ZHANG Wen,HOU Lian,et al.Pollution Multivariate methods for indoor PM10 and PM2.5 model- characteristics and influence factors of PM2.5 in summer ling in naturally ventilated schools buildings[J].Atmo- in Jixian county of Tianjin[J].Journal of Tianjin uni- spheric environment,2014,94:11-21. versity:science and technology,2015,48(2):95-102. [8]ORDIERES J B.VERGARA E P,CAPUZ R S,et al. [19]ZHENG Yu,YI Xiuwen,LI Ming,et al.Forecasting fine- Neural network prediction model for fine particulate mat- grained air quality based on big data[C]//Proceedings of ter (PM2.5)on the US-Mexico border in El Paso (Texas) the 21th ACM SIGKDD International Conference on and Ciudad Juarez(Chihuahua)[J].Environmental model- Knowledge Discovery and Data Mining.New York,NY, ling and software,2005,20(5):547-559. USA.2015:2267-2276 [9]XU Zhao,XIA Xiaopeng,LIU Xiangnan,et al.Combin- [20]AZID A,JUAHIR H,TORIMAN M E,et al.Prediction ing DMSP/OLS nighttime light with echo state network for of the level of air pollution using principal component prediction of daily PM2.5 average concentrations in analysis and artificial neural network techniques:A case Shanghai,China[J].Atmosphere,2015,6(10):1507-1520. study in Malaysia[J].Water,air,and soil pollution,2014, [10]MISHRA D.GOYAL P.UPADHYAY A.Artificial intel- 225:2063. ligence based approach to forecast PM2.5 during haze [21]VOUKANTSIS D,KARATZAS K,KUKKONEN J,et al. episodes:a case study of Delhi,India[J].Atmospheric en- Intercomparison of air quality data using principal com-

统辨识实验证明了该预测模型的有效性，最后将该模型用于实际问题 PM2.5 浓度的预测。实验结果表明该模型不仅能够获得较为精简的网络结构，而且预测精度有所提高，为 PM2.5 浓度预测提供了一种有效的方法。参考文献： TAO Minghui, CHEN Liangfu, WANG Zifeng, et al. A study of urban pollution and haze clouds over northern China during the dusty season based on satellite and surface observations[J]. Atmospheric environment, 2014, 82: 183–192. [1] QIAO Liping, CAI Jing, WANG Hongqi, et al. PM2.5 constituents and hospital emergency-room visits in Shanghai, China[J]. Environmental science and technology, 2014, 48(17): 10406–10414. [2] XIAO S, WANG Q Y, CAO J J, et al. Long-term trends in visibility and impacts of aerosol composition on visibility impairment in Baoji, China[J]. Atmospheric research, 2014, 149: 88–95. [3] SAIDE P E, CARMICHAEL G R, SPAK S N, et al. Forecasting urban PM10 and PM2.5 pollution episodes in very stable nocturnal conditions and complex terrain using WRF–Chem CO tracer model[J]. Atmospheric environment, 2011, 45(16): 2769–2780. [4] RICCIO A, CHIANESE E, AGRILLO G, et al. Source apportion of atmospheric particulate matter: a joint Eulerian/Lagrangian approach[J]. Environmental science and pollution research, 2014, 21(23): 13160–13168. [5] CHEN Yuanyuan, SHI Runhe, SHU Shijie, et al. Ensemble and enhanced PM10 concentration forecast model based on stepwise regression and wavelet analysis[J]. Atmospheric environment, 2013, 74: 346–359. [6] ELBAYOUMI M, RAMLI N A, MD YUSOF N F F, et al. Multivariate methods for indoor PM10 and PM2.5 modelling in naturally ventilated schools buildings[J]. Atmospheric environment, 2014, 94: 11–21. [7] ORDIERES J B, VERGARA E P, CAPUZ R S, et al. Neural network prediction model for fine particulate matter (PM2.5) on the US–Mexico border in El Paso (Texas) and Ciudad Juárez (Chihuahua)[J]. Environmental modelling and software, 2005, 20(5): 547–559. [8] XU Zhao, XIA Xiaopeng, LIU Xiangnan, et al. Combining DMSP/OLS nighttime light with echo state network for prediction of daily PM2.5 average concentrations in Shanghai, China[J]. Atmosphere, 2015, 6(10): 1507–1520. [9] MISHRA D, GOYAL P, UPADHYAY A. Artificial intelligence based approach to forecast PM2.5 during haze episodes: a case study of Delhi, India[J]. Atmospheric en- [10] vironment, 2015, 102: 239–248. QIAO Junfei, CAI Jie, HAN Honggui, et al. Predicting PM2.5 concentrations at a regional background station using second order self-organizing fuzzy neural network[J]. Atmosphere, 2017, 8(1): 10. [11] HAN Honggui, LI Ying, GUO Yanan, et al. A soft computing method to predict sludge volume index based on a recurrent self-organizing neural network[J]. Applied soft computing, 2016, 38: 477–486. [12] HAN Honggui, WANG Lidan, QIAO Junfei, et al. A spiking-based mechanism for self-organizing RBF neural networks[C]//2014 International Joint Conference on Neural Networks (IJCNN). Beijing, China, 2014: 3775–3782. [13] HAN Honggui, WU Xiaolong, QIAO Junfei. Nonlinear systems modeling based on self-organizing fuzzy-neuralnetwork with adaptive computation algorithm[J]. IEEE transactions on cybernetics, 2014, 44(4): 554–564. [14] LENG Gang, MCGINNITY T M, PRASAD G. An approach for on-line extraction of fuzzy rules using a selforganising fuzzy neural network[J]. Fuzzy sets and systems, 2005, 150(2): 211–243. [15] WU Shiqian, ER M J. Dynamic fuzzy neural networks-a novel approach to function approximation[J]. IEEE transactions on systems, man, and cybernetics, part B (cybernetics), 2000, 30(2): 358–364. [16] WU Shiqian, ER M J, GAO Yang. A fast approach for automatic generation of fuzzy rules by generalized dynamic fuzzy neural networks[J]. IEEE transactions on fuzzy systems, 2001, 9(4): 578–594. [17] 陈冠益, 张雯, 侯立安, 等. 天津蓟县夏季 PM2.5 污染特征及影响因素 [J]. 天津大学学报: 自然科学与工程技术版, 2015, 48(2): 95–102. CHEN Guanyi, ZHANG Wen, HOU Lian, et al. Pollution characteristics and influence factors of PM2.5 in summer in Jixian county of Tianjin[J]. Journal of Tianjin university: science and technology, 2015, 48(2): 95–102. [18] ZHENG Yu, YI Xiuwen, LI Ming, et al. Forecasting finegrained air quality based on big data[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, NY, USA, 2015: 2267–2276. [19] AZID A, JUAHIR H, TORIMAN M E, et al. Prediction of the level of air pollution using principal component analysis and artificial neural network techniques: A case study in Malaysia[J]. Water, air, and soil pollution, 2014, 225: 2063. [20] VOUKANTSIS D, KARATZAS K, KUKKONEN J, et al. Intercomparison of air quality data using principal com- [21] 第 4 期周杉杉，等：基于自组织递归模糊神经网络的 PM2.5 浓度预测 ·515·

·516· 智能系统学报第13卷 ponent analysis,and forecasting of PMo and PM2.5 con- Santiago de Chile with emphasis on night episodes[J].At- centrations using artificial neural networks,in Thes- mospheric environment,2016,124:22-27 saloniki and Helsinki[J].Science of the total environment, [31]WU G D,HUANG P H.A maximizing-discriminability- 2011,4097):1266-1276. based self-organizing fuzzy network for classification [22]HAN Honggui.GUO Yanan,QIAO Junfei.Self-organiza- problems[J].IEEE transactions on fuzzy systems,2010. tion of a recurrent RBF neural network using an informa- 18(2)362-373. tion-oriented algorithm[J].Neurocomputing,2017,225: [32]许少鹏，韩红桂，乔俊飞.基于模糊递归神经网络的污 80-91. 泥容积指数预测模型).化工学报，2013,64(12)：4550- [23]QIAO Junfei.ZHANG Wei,HAN Honggui.Self-organiz- 4556. ing fuzzy control for dissolved oxygen concentration us- XU Shaopeng,HAN Honggui,QIAO Junfei.Prediction ing fuzzy neural networkI [J].Journal of intelligent and of activated sludge bulking based on recurrent fuzzy neur- fuzzy systems,.2016,30(6):3411-3422 al network[J].CIESC journal,2013,64(12):4550-4556. [24]WANG Ning,ER M J,MENG Xianyao.A fast and accur- [33]MADRIGANO J.KLOOG I,GOLDBERG R.et al. ate online self-organizing scheme for parsimonious fuzzy Long-term exposure to PM2.5 and incidence of acute neural networks[J].Neurocomputing,2009,72(16/17/18): myocardial infarction[.Environmental health perspect- 3818-3829. ives,2013,121(2):192-196. [25]余辉，袁晶，于旭耀，等.基于ARMAX的PM2.5小时 [34]城市计算EB/OL].(2008-03-18).htps:www.microsoft. 浓度跟踪预测模型仞.天津大学学报：自然科学与工程技术版，2017,50(1)：105-111. com/en-us/research/.project/城市计算 YU Hui,YUAN Jing,YU Xuyao,et al.Tracking predic- 作者简介： tion model for PM2.5 hourly concentration based on 周杉杉，女，1992年生，硕士研究 ARMAX[J].Journal of Tianjin university:science and 生，主要研究方向为智能信息处理与 technology,2017,50(1)105-111. 神经网络非线性系统建模。获得软件 [26]ZOU Bin,WANG Min,WAN Neng,et al.Spatial model- 著作权1项。发表学术论文1篇。 ing of PM2.5 concentrations with a multifactoral radial basis function neural network[J].Environmental science and pollution research,2015,22(14):10395-10404 [27]MISHRA D,GOYAL P.Neuro-fuzzy approach to fore- 李文静，女，1985年生，副教授， cast NO,pollutants addressed to air quality dispersion 博士，主要研究方向为神经计算、人工神经网络、模式识别。主持国家自然 model over Delhi,India[J].Aerosol and air quality re- 科学基金青年项目、中国博土后第 search,2016,16(1):166-174. 57批面上资助项目、北京市博土后科 [28]FU Minglei,WANG Weiwen,LE Zichun,et al.Predic- 研活动经费资助项目各1项。申请美 tion of particular matter concentrations by developed 国发明专利1项。近5年来发表学术 feed-forward neural network with rolling mechanism and 论文10余篇，其中SCI收录8篇。 gray model[J].Neural computing and applications,2015, 乔俊飞.男.1968年生教授博士生 26(8):1789-1797. [29]ELANGASINGHE M A.SINGHAL N,DIRKS K N,et 导师。中国人工智能学会科普工作委员会主任，中国自动化学会理事，主要 al.Complex time series analysis of PM10 and PM2.5 for 研究方向为智能信息处理、智能控制 a coastal site using artificial neural network modelling 理论与应用。获教育部科技进步奖一 and k-means clustering[J].Atmospheric environment, 等奖和北京市科学技术奖三等奖各 2014.94:106-116. 1项。获得发明专利20余项。发表学 [30]PEREZ P,GRAMSCH E.Forecasting hourly PM2.5 in 术论文100余篇，其中被SCI收录20余篇，EI收录60余篇

ponent analysis, and forecasting of PM10 and PM2.5 concentrations using artificial neural networks, in Thessaloniki and Helsinki[J]. Science of the total environment, 2011, 409(7): 1266–1276. HAN Honggui, GUO Yanan, QIAO Junfei. Self-organization of a recurrent RBF neural network using an information-oriented algorithm[J]. Neurocomputing, 2017, 225: 80–91. [22] QIAO Junfei, ZHANG Wei, HAN Honggui. Self-organizing fuzzy control for dissolved oxygen concentration using fuzzy neural network1[J]. Journal of intelligent and fuzzy systems, 2016, 30(6): 3411–3422. [23] WANG Ning, ER M J, MENG Xianyao. A fast and accurate online self-organizing scheme for parsimonious fuzzy neural networks[J]. Neurocomputing, 2009, 72(16/17/18): 3818–3829. [24] 余辉, 袁晶, 于旭耀, 等. 基于 ARMAX 的 PM2.5 小时浓度跟踪预测模型 [J]. 天津大学学报: 自然科学与工程技术版, 2017, 50(1): 105–111. YU Hui, YUAN Jing, YU Xuyao, et al. Tracking prediction model for PM2.5 hourly concentration based on ARMAX[J]. Journal of Tianjin university: science and technology, 2017, 50(1): 105–111. [25] ZOU Bin, WANG Min, WAN Neng, et al. Spatial modeling of PM2.5 concentrations with a multifactoral radial basis function neural network[J]. Environmental science and pollution research, 2015, 22(14): 10395–10404. [26] MISHRA D, GOYAL P. Neuro-fuzzy approach to forecast NO2 pollutants addressed to air quality dispersion model over Delhi, India[J]. Aerosol and air quality research, 2016, 16(1): 166–174. [27] FU Minglei, WANG Weiwen, LE Zichun, et al. Prediction of particular matter concentrations by developed feed-forward neural network with rolling mechanism and gray model[J]. Neural computing and applications, 2015, 26(8): 1789–1797. [28] ELANGASINGHE M A, SINGHAL N, DIRKS K N, et al. Complex time series analysis of PM10 and PM2.5 for a coastal site using artificial neural network modelling and k-means clustering[J]. Atmospheric environment, 2014, 94: 106–116. [29] [30] PEREZ P, GRAMSCH E. Forecasting hourly PM2.5 in Santiago de Chile with emphasis on night episodes[J]. Atmospheric environment, 2016, 124: 22–27. WU G D, HUANG P H. A maximizing-discriminabilitybased self-organizing fuzzy network for classification problems[J]. IEEE transactions on fuzzy systems, 2010, 18(2): 362–373. [31] 许少鹏, 韩红桂, 乔俊飞. 基于模糊递归神经网络的污泥容积指数预测模型 [J]. 化工学报, 2013, 64(12): 4550– 4556. XU Shaopeng, HAN Honggui, QIAO Junfei. Prediction of activated sludge bulking based on recurrent fuzzy neural network[J]. CIESC journal, 2013, 64(12): 4550–4556. [32] MADRIGANO J, KLOOG I, GOLDBERG R, et al. Long-term exposure to PM2.5 and incidence of acute myocardial infarction[J]. Environmental health perspectives, 2013, 121(2): 192–196. [33] 城市计算 [EB/OL]. (2008–03–18). https://www.microsoft. com/en-us/research/project/城市计算. [34] 作者简介：周杉杉，女，1992 年生，硕士研究生，主要研究方向为智能信息处理与神经网络非线性系统建模。获得软件著作权 1 项。发表学术论文 1 篇。李文静，女，1985 年生，副教授，博士，主要研究方向为神经计算、人工神经网络、模式识别。主持国家自然科学基金青年项目、中国博士后第 57 批面上资助项目、北京市博士后科研活动经费资助项目各 1 项。申请美国发明专利 1 项。近 5 年来发表学术论文 10 余篇，其中 SCI 收录 8 篇。乔俊飞,男,1968 年生,教授,博士生导师。中国人工智能学会科普工作委员会主任,中国自动化学会理事,主要研究方向为智能信息处理、智能控制理论与应用。获教育部科技进步奖一等奖和北京市科学技术奖三等奖各 1 项。获得发明专利 20 余项。发表学术论文 100 余篇,其中被 SCI 收录 20 余篇,EI 收录 60 余篇。 ·516· 智能系统学报第 13 卷

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录