第13卷第4期 智能系统学报 Vol.13 No.4 2018年8月 CAAI Transactions on Intelligent Systems Aug.2018 D0:10.11992/tis.201710007 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20180328.1649.012.html 基于自组织递归模糊神经网络的PM2.5浓度预测 周杉杉2,李文静2,乔俊飞2 (1.北京工业大学信息学部,北京100124;2.计算智能与智能系统北京市重点实验室,北京100124) 摘要:针对PM2.5浓度非线性动态变化的特点,提出了一种自组织递归模糊神经网络(self-organizing recurrent fuzzy neural network,SORFNN)方法预测PM2.5小时浓度。首先,通过分析影响PM2.5浓度的多种因素,利用主 成分分析法(principal component analysis.PCA)筛选出与PM2.5浓度相关性较强的特征变量作为神经网络的输 入变量。然后,根据e准则和偏最小二乘算法(partial least squares,.PLS)进行规则化层神经元的增删,实现递归 模糊神经网络结构的自动调整,并采用学习率自适应的梯度下降算法调整模型中心、宽度和权值等参数,建立 PM25预测模型。最后,利用典型非线性系统辨识和实际PM2.5浓度预测实验进行验证。实验结果表明,所设 计的自组织递归模糊神经网络结构精简且预测精度高,较好地满足了PM2.5实时预测的要求。 关键词:PM2.5;预测;PCA:递归模糊神经网络;自组织;自适应梯度下降 中图分类号:TP18文献标志码:A文章编号:1673-4785(2018)04-0509-08 中文引用格式:周杉杉,李文静,乔俊飞.基于自组织递归模糊神经网络的PM2.5浓度预测几.智能系统学报,2018,13(4): 509-516. 英文引用格式:ZHOU Shanshan,I Wenjing,QIAO Junfei..Prediction of PM2.5 concentration based on self--organizing recurrent fuzzy neural network J].CAAI transactions on intelligent systems,2018,13(4):509-516. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network ZHOU Shanshan,LI Wenjing,QIAO Junfei' (1.Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China;2.Beijing Key Laboratory of Com- putational Intelligent System,Beijing 100124,China) Abstract:To address the nonlinear dynamic variation in the concentration of fine particulate matter(PM2.5),in this pa- per,we propose a novel self-organizing recurrent fuzzy neural network(SORFNN)for predicting the hourly PM2.5 con- centration.First,we analyzed the factors affecting PM2.5 concentration by principal component analysis to identify the characteristic variables and used them as input variables in the neural network.Next,we added or deleted a nerve cell to the regularized layer,based on the e criterion and partial least squares algorithm,to automatically adjust the recurrent fuzzy neural network.In addition,we applied the adaptive gradient descent algorithm to adjust parameters such as the centers,widths and weights to establish a PM2.5 model.Lastly,to verify the results,we conducted experiments in typic- al nonlinear system identification and actual PM2.5 concentration prediction.The experimental results show that the proposed SORFNN is compact in structure,has high prediction accuracy,and can satisfy the real-time prediction re- quirements of PM2.5 concentration. Keywords:PM2.5;prediction;PCA;recurrent fuzzy neural network;self-organizing;adaptive gradient descent al- gorithm 收稿日期:2017-10-17.网络出版日期:2018-03-28. 近年来伴随我国多个城市空气重污染事件的 基金项目:国家自然科学基金项目(61533002,61603009):北京 工业大学“日新人才”计划项目(2017-RX(1)-04):北 发生,以细颗粒物(PM2.5)为特征污染物的区域 京市自然科学基金项目(4182007). 通信作者:周杉杉.E-mail:18810337855@163.com. 性大气环境问题逐渐引起了人们的广泛关注山
DOI: 10.11992/tis.201710007 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20180328.1649.012.html 基于自组织递归模糊神经网络的 PM2.5 浓度预测 周杉杉1,2,李文静1,2,乔俊飞1,2 (1. 北京工业大学 信息学部,北京 100124; 2. 计算智能与智能系统北京市重点实验室,北京 100124) 摘 要:针对 PM2.5 浓度非线性动态变化的特点,提出了一种自组织递归模糊神经网络 (self-organizing recurrent fuzzy neural network,SORFNN) 方法预测 PM2.5 小时浓度。首先,通过分析影响 PM2.5 浓度的多种因素,利用主 成分分析法 (principal component analysis,PCA) 筛选出与 PM2.5 浓度相关性较强的特征变量作为神经网络的输 入变量。然后,根据 ε 准则和偏最小二乘算法 (partial least squares,PLS) 进行规则化层神经元的增删,实现递归 模糊神经网络结构的自动调整,并采用学习率自适应的梯度下降算法调整模型中心、宽度和权值等参数,建立 PM2.5 预测模型。最后,利用典型非线性系统辨识和实际 PM2.5 浓度预测实验进行验证。实验结果表明,所设 计的自组织递归模糊神经网络结构精简且预测精度高,较好地满足了 PM2.5 实时预测的要求。 关键词:PM2.5;预测;PCA;递归模糊神经网络;自组织;自适应梯度下降 中图分类号:TP18 文献标志码:A 文章编号:1673−4785(2018)04−0509−08 中文引用格式:周杉杉, 李文静, 乔俊飞. 基于自组织递归模糊神经网络的 PM2.5 浓度预测 [J]. 智能系统学报, 2018, 13(4): 509–516. 英文引用格式:ZHOU Shanshan, LI Wenjing, QIAO Junfei. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network[J]. CAAI transactions on intelligent systems, 2018, 13(4): 509–516. Prediction of PM2.5 concentration based on self-organizing recurrent fuzzy neural network ZHOU Shanshan1,2 ,LI Wenjing1,2 ,QIAO Junfei1,2 (1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China; 2. Beijing Key Laboratory of Computational Intelligent System, Beijing 100124, China) Abstract: To address the nonlinear dynamic variation in the concentration of fine particulate matter (PM2.5), in this paper, we propose a novel self-organizing recurrent fuzzy neural network (SORFNN) for predicting the hourly PM2.5 concentration. First, we analyzed the factors affecting PM2.5 concentration by principal component analysis to identify the characteristic variables and used them as input variables in the neural network. Next, we added or deleted a nerve cell to the regularized layer, based on the ε criterion and partial least squares algorithm, to automatically adjust the recurrent fuzzy neural network. In addition, we applied the adaptive gradient descent algorithm to adjust parameters such as the centers, widths and weights to establish a PM2.5 model. Lastly, to verify the results, we conducted experiments in typical nonlinear system identification and actual PM2.5 concentration prediction. The experimental results show that the proposed SORFNN is compact in structure, has high prediction accuracy, and can satisfy the real-time prediction requirements of PM2.5 concentration. Keywords: PM2.5; prediction; PCA; recurrent fuzzy neural network; self-organizing; adaptive gradient descent algorithm 近年来伴随我国多个城市空气重污染事件的 发生,以细颗粒物 (PM2.5) 为特征污染物的区域 性大气环境问题逐渐引起了人们的广泛关注[1]。 收稿日期:2017−10−17. 网络出版日期:2018−03−28. 基金项目:国家自然科学基金项目 (61533002,61603009);北京 工业大学“日新人才”计划项目 (2017-RX(1)-04);北 京市自然科学基金项目 (4182007). 通信作者:周杉杉. E-mail:18810337855@163.com.. 第 13 卷第 4 期 智 能 系 统 学 报 Vol.13 No.4 2018 年 8 月 CAAI Transactions on Intelligent Systems Aug. 2018
·510 智能系统学报 第13卷 2012年环保部发布了新修订的《环境空气质量 网络预测上海市区PM2.5日均浓度,以更少的输 标准》(GB3095一2012),将PM2.5纳入空气质量 入取得了比RBF更好的预测效果,但是预测精度 监测范围。2013年国务院发布了《大气污染防 仍需进一步提高。由于神经网络是“黑箱模型”, 治行动计划》,制定了明确的大气污染防治目 可解释性差,模糊系统则可以利用模糊语言处理 标。但截至2016年中国环境状况公报发布的数 信息,表达能力较强,因此结合两种方法的优势 据,全国338个地级及以上城市只有84个城市空 对PM2.5浓度进行预测成为提高预测精度的有效 气质量达标,以PM2.5为首要污染物的天数达到 方法;Mishra等o以CO、NO2、O、SO2、上一时刻 80.3%。我国城市空气污染是长期形成的复合型 的PM2.5浓度、温度、风速、相对湿度和露点温度 大气污染,治理工作还需要我们长期不懈的努力。 作为输入,利用Takagi Sugeno型模糊神经网络预 据研究PM2.5可以渗透到人的肺部和支气 测当前时刻的PM2.5浓度,取得了比MLR和 管,因此长期暴露于PM2.5环境中会增加呼吸系 ANN更好的效果;Qiao等利用模糊神经网络建 统和心血管疾病的发病率和死亡率。通过对太 立PM2.5小时预测模型,并采用二阶梯度下降算 阳辐射的吸收和散射,PM2.5也会对全球气候变 法训练网络,预测效果比ESN和化学传输模型都 化产生影响,同时会影响能见度,进而影响我们 要好。另外,PM2.5的浓度扩散是一个非线性动 的日常生活。因此,对PM2.5进行有效的预测, 态变化的过程,受到时滞的影响。相对于前馈神 及时采取防控措施有重要意义。但是PM2.5的浓 经网络,递归神经网络具有动态元素,内部的反 度既和污染源有关,又受气象条件的影响,使得 馈连接可用于记忆历史信息,更适合处理非线性 预测难度较大。 动态过程。因此,本文提出采用递归模糊神经网 目前空气质量预测方法主要有机理分析和统 络(recurrent fuzzy neural network,RFNN)预测PM2.5 计模型两种。机理分析法通过研究PM2.5的形成 浓度。 机理,复杂的物理、化学变化来模拟其扩散过程, 对于神经网络而言,网络结构的大小是影响 进而预测PM2.5的浓度。比如,Saide等利用化 其性能的重要因素,结构优化方法主要有增长型 学传输模型,根据示踪物CO浓度与PM10/PM2.5 修剪型和增长修剪相结合等方法。而很多方法在 的线性关系得到PM10/PM2.5的预测浓度,其中 判断是否增删神经元时需要预先设定阈值,这些 模型所需的排放源清单的准确性对预测结果有显 阈值的设定通常凭借经验多次试凑,不能保证找 著影响:Riccio等利用欧拉模型和拉格朗日模 到最优值2。针对以上问题,本文提出一种神 型对意大利南部某站点的PM2.5浓度变化情况进 经网络结构自组织方法,采用ε准则和偏最小二 行了模拟,得出了当地PM2.5的浓度不但受本地 乘法(partial least squares,PLS)定义增长和删减指 排放源的影响,同时与周边区域的输送有关的结 标,使用尽量少的阈值,实现规则化层神经元的 论。但是,大气环境是动态变化的非线性过程,理 自动增删,同时采用学习率自适应的梯度下降算 论分析复杂,机理分析建模所需的气象边界条件、 法对网络参数进行优化,并将该自组织递归模糊 排放源清单等参数难以取得,模型的适用性较难 神经网络用于PM2.5浓度预测实验。 满足,不适合日常PM2.5浓度的预测。 相比于机理分析方法,统计模型更容易通过 1 递归模糊神经网络 数据拟合方法建立预测模型。Chen等6使用小 波分解和逐步回归结合的方法来预测PM10的浓 RFNN结合了神经网络与模糊系统的优点, 度,取得了不错的预测效果;Elbayoumi等m以室 引入的递归环节可以增加网络的动态记忆性能。 外PM10、PM2.5、C0、CO2浓度、风速、气压和相 文中RFNN的结构如图1所示。 输入层隶属函数层 规则层去模糊 输出层 对湿度作为输入,建立多元线性回归模型(mu- 化层 tiple linear regression,MLR)预测室内PMI0和 PM2.5的浓度。而PM2.5浓度变化是非线性过 程,对其建立线性模型效果并不理想。 人工神经网络(artificial neural network,.ANN) 因其强大的非线性映射能力、自组织自学习能 力,被广泛用于非线性系统的建模。Ordieres等图 利用多层感知器和径向基函数(radial basis func-. tion,RBF)神经网络预测PM2.5浓度,发现RBF 图1递归模糊神经网络结构 神经网络预测结果更精确;Xu等例利用回声状态 Fig.1 Structure of recurrent fuzzy neural network
2012 年环保部发布了新修订的《环境空气质量 标准》(GB3095—2012),将 PM2.5 纳入空气质量 监测范围。2013 年国务院发布了《大气污染防 治行动计划》,制定了明确的大气污染防治目 标。但截至 2016 年中国环境状况公报发布的数 据,全国 338 个地级及以上城市只有 84 个城市空 气质量达标,以 PM2.5 为首要污染物的天数达到 80.3%。我国城市空气污染是长期形成的复合型 大气污染,治理工作还需要我们长期不懈的努力。 据研究 PM2.5 可以渗透到人的肺部和支气 管,因此长期暴露于 PM2.5 环境中会增加呼吸系 统和心血管疾病的发病率和死亡率[2]。通过对太 阳辐射的吸收和散射,PM2.5 也会对全球气候变 化产生影响,同时会影响能见度,进而影响我们 的日常生活[3]。因此,对 PM2.5 进行有效的预测, 及时采取防控措施有重要意义。但是 PM2.5 的浓 度既和污染源有关,又受气象条件的影响,使得 预测难度较大。 目前空气质量预测方法主要有机理分析和统 计模型两种。机理分析法通过研究 PM2.5 的形成 机理,复杂的物理、化学变化来模拟其扩散过程, 进而预测 PM2.5 的浓度。比如,Saide 等 [4] 利用化 学传输模型,根据示踪物 CO 浓度与 PM10/PM2.5 的线性关系得到 PM10/PM2.5 的预测浓度,其中 模型所需的排放源清单的准确性对预测结果有显 著影响;Riccio 等 [5] 利用欧拉模型和拉格朗日模 型对意大利南部某站点的 PM2.5 浓度变化情况进 行了模拟,得出了当地 PM2.5 的浓度不但受本地 排放源的影响,同时与周边区域的输送有关的结 论。但是,大气环境是动态变化的非线性过程,理 论分析复杂,机理分析建模所需的气象边界条件、 排放源清单等参数难以取得,模型的适用性较难 满足,不适合日常 PM2.5 浓度的预测。 相比于机理分析方法,统计模型更容易通过 数据拟合方法建立预测模型。Chen 等 [6] 使用小 波分解和逐步回归结合的方法来预测 PM10 的浓 度,取得了不错的预测效果;Elbayoumi 等 [7] 以室 外 PM10、PM2.5、CO、CO2 浓度、风速、气压和相 对湿度作为输入,建立多元线性回归模型 (multiple linear regression,MLR) 预测室内 PM10 和 PM2.5 的浓度。而 PM2.5 浓度变化是非线性过 程,对其建立线性模型效果并不理想。 人工神经网络 (artificial neural network,ANN) 因其强大的非线性映射能力、自组织自学习能 力,被广泛用于非线性系统的建模。Ordieres 等 [8] 利用多层感知器和径向基函数 (radial basis function,RBF) 神经网络预测 PM2.5 浓度,发现 RBF 神经网络预测结果更精确;Xu 等 [9] 利用回声状态 网络预测上海市区 PM2.5 日均浓度,以更少的输 入取得了比 RBF 更好的预测效果,但是预测精度 仍需进一步提高。由于神经网络是“黑箱模型”, 可解释性差,模糊系统则可以利用模糊语言处理 信息,表达能力较强,因此结合两种方法的优势 对 PM2.5 浓度进行预测成为提高预测精度的有效 方法;Mishra 等 [10] 以 CO、NO2、O3、SO2、上一时刻 的 PM2.5 浓度、温度、风速、相对湿度和露点温度 作为输入,利用 Takagi Sugeno 型模糊神经网络预 测当前时刻的 PM2.5浓度,取得了比 MLR 和 ANN 更好的效果;Qiao 等 [11]利用模糊神经网络建 立 PM2.5 小时预测模型,并采用二阶梯度下降算 法训练网络,预测效果比 ESN 和化学传输模型都 要好。另外,PM2.5 的浓度扩散是一个非线性动 态变化的过程,受到时滞的影响。相对于前馈神 经网络,递归神经网络具有动态元素,内部的反 馈连接可用于记忆历史信息,更适合处理非线性 动态过程。因此,本文提出采用递归模糊神经网 络 (recurrent fuzzy neural network,RFNN) 预测 PM2.5 浓度。 对于神经网络而言,网络结构的大小是影响 其性能的重要因素,结构优化方法主要有增长型、 修剪型和增长修剪相结合等方法。而很多方法在 判断是否增删神经元时需要预先设定阈值,这些 阈值的设定通常凭借经验多次试凑,不能保证找 到最优值[12-14]。针对以上问题,本文提出一种神 经网络结构自组织方法,采用 ε 准则和偏最小二 乘法 (partial least squares,PLS) 定义增长和删减指 标,使用尽量少的阈值,实现规则化层神经元的 自动增删,同时采用学习率自适应的梯度下降算 法对网络参数进行优化,并将该自组织递归模糊 神经网络用于 PM2.5 浓度预测实验。 1 递归模糊神经网络 RFNN 结合了神经网络与模糊系统的优点, 引入的递归环节可以增加网络的动态记忆性能。 文中 RFNN 的结构如图 1 所示。 yout 输入层 隶属函数层 规则层 去模糊 化层 输出层 f f f . . . x1 x2 xn Π Π Π Σ 图 1 递归模糊神经网络结构 Fig. 1 Structure of recurrent fuzzy neural network ·510· 智 能 系 统 学 报 第 13 卷
第4期 周杉杉,等:基于自组织递归模糊神经网络的PM2.5浓度预测 ·511· 网络隶属函数层采用高斯函数对输入变量进 2.1 结构增长 行模糊化处理,如式(1)所示。在规则层引入反 规则层神经元的增长有两个判断标准:误差 馈环节,通过sigmoid函数将上一时刻规则层的 和ε准则。 输出作为当前规则层的一个输入,计算过程如式(②)~ 1)定义判断误差e。为了减小异常数据的影 (4)所示。去模糊化层和输出层如式(⑤)~(6)所示。 响,文中采用滑窗方法: 4(0=exp- a(0)-c0)2 20 ],j=1,2.…,m(1) ei ier-M+】 式中:u()为t时刻第i个输入对应的第j个隶属 e= M 函数的输出,c()和σ()分别为对应隶属函数的 e;=(i)-y(i) 中心和宽度。 式中:M是滑窗宽度。若误差e变大,则说明网络 0=f4,0.j=1,2…,m (2) 泛化性能变差,需要增加模糊规则或者修正参数。 1 2)根据ε完整性准则啊,对于一个正常的数据 f=1+exp(-h (3) 分布,当输入位于[c2o,c+2o]范围内时, h:=中(t-1)l(t) (4) 95%的数据属于该成员函数。因此通过式(1)计 式中:(1)是1时刻第j个规则层神经元的输出, 算可以得到隶属函数的输出阈值为0.1354。这个 (-1)表示前一时刻规则层的输出,是对应的 条件保证了每个输入的模糊隶属度不小于0.1354, sigmoid函数,h是内部变量,()是t时刻递归环 满足了模糊规则的ε完整性准则。 节的反馈权值。 因此,如果满足条件: ,0=01∑,0 (5) le(t+1)>le(t) (m)=arg max(u.)<0.1354 0=立4030 则说明当前网络误差变大,现有规则不能有 (6) 效覆盖输入数据,需要增加规则层神经元(将规 式中:)是1时刻神经网络的输出,w)是1时刻 则层第n个神经元分裂为两个)。新增神经元的 输出层与前一层的连接权值,,(①)是去模糊化层 初始参数设置为 的输出。 Cnew(t)= 为了提高网络的收敛性,本文采用学习率自适 2c.0+x0ω 应的梯度下降算法调整递归模糊神经网络的参数。 Onew(t)=(t) 刀=刀mas-d7max-amn)/D (7) Whew(t)=e(t) 中aew(t) 式中:nma和nm分别是最大和最小学习率,d是当前 式中:Cew()、oeu()和we()分别是新增神经元的 迭代步数,D是总的迭代步数。在初始阶段参数调 中心、宽度和连接权值,c.()和c.(1)是第n个神 整幅度较大,利于快速寻优节省时间,随着迭代步 经元的中心和宽度,x(t)是当前输入样本,paew(t) 数的增加,学习率逐渐减小,以保证网络的稳定性。 是新增神经元的输出。 2自组织递归模糊神经网络 2.2结构修剪 神经网络的结构是影响其性能的关键因素之 模糊神经网络规则层的删减一般根据规则层 一,本文根据模糊规则的ε完整性准则和偏最小 神经元对于输出层神经元的影响大小来判断。这 二乘法实现网络规则层的自组织,结构如图2所示。 种删减也可以理解为一种数据的降维。因此,基 于数据降维的思想,本文采用偏最小二乘算法实 输入层隶属函数层规则层去模糊 输出层 化层 现规则层神经元的修剪。偏最小二乘算法的一个 显著特点就是允许在样本点个数少于变量个数的 情况下进行回归分析。由于滑窗宽度有限,可能 出现滑窗内样本个数少于规则层神经元个数(即 变量个数)的情况,所以采用PLS算法正好解决 这一问题。以下是删减过程的主要步骤: 首先判断误差e,如果le(t+l)<e(t)儿,说明当前 网络性能较好。接下来通过PLS计算规则层神 图2自组织递归模糊网络结构 经元的回归系数,删除对输出影响较小的神经元 Fig.2 Structure of self-organizing RFNN 以避免网络结构冗余。PLS主要计算步骤如下:
网络隶属函数层采用高斯函数对输入变量进 行模糊化处理,如式 (1) 所示。在规则层引入反 馈环节,通过 sigmoid 函数将上一时刻规则层的 输出作为当前规则层的一个输入,计算过程如式 (2)~ (4) 所示。去模糊化层和输出层如式 (5)~(6) 所示。 ui j(t) = exp[− (ai(t)−ci j(t))2 2σ 2 i j(t) ], j = 1,2,··· ,m (1) 式中:uij(t) 为 t 时刻第 i 个输入对应的第 j 个隶属 函数的输出,cij(t) 和 σij(t) 分别为对应隶属函数的 中心和宽度。 ϕj(t) = fj ∏n i=1 ui j(t), j = 1,2,··· ,m (2) fj = 1 1+exp(−hj) (3) hj = ϕj(t−1)λj(t) (4) 式中:ϕj (t) 是 t 时刻第 j 个规则层神经元的输出, ϕj (t-1) 表示前一时刻规则层的输出,fj 是对应的 sigmoid 函数,hj 是内部变量,λj (t) 是 t 时刻递归环 节的反馈权值。 ϕ¯ j(t) = ϕj(t)/ ∑m j=1 ϕj(t) (5) y(t) = ∑m j=1 wj(t)ϕ¯ j(t) (6) ϕ¯ j(t) 式中:y(t) 是 t 时刻神经网络的输出,wj (t) 是 t 时刻 输出层与前一层的连接权值, 是去模糊化层 的输出。 为了提高网络的收敛性,本文采用学习率自适 应的梯度下降算法调整递归模糊神经网络的参数。 η = ηmax −d(ηmax −ηmin)/D (7) 式中: ηmax和 ηmin分别是最大和最小学习率,d 是当前 迭代步数,D 是总的迭代步数。在初始阶段参数调 整幅度较大,利于快速寻优节省时间,随着迭代步 数的增加,学习率逐渐减小,以保证网络的稳定性。 2 自组织递归模糊神经网络 神经网络的结构是影响其性能的关键因素之 一,本文根据模糊规则的 ε 完整性准则和偏最小 二乘法实现网络规则层的自组织,结构如图 2 所示。 yout 输入层 隶属函数层 规则层 去模糊 化层 输出层 f f f . . . x1 x2 xn Π Π Π Σ 图 2 自组织递归模糊网络结构 Fig. 2 Structure of self-organizing RFNN 2.1 结构增长 ε 规则层神经元的增长有两个判断标准:误差 和 准则。 1) 定义判断误差 e。为了减小异常数据的影 响,文中采用滑窗方法: e = ∑r i=r−M+1 ei M ei = y d (i)−y(i) 式中:M 是滑窗宽度。若误差 e 变大,则说明网络 泛化性能变差,需要增加模糊规则或者修正参数。 ε ε 2) 根据 完整性准则[15] ,对于一个正常的数据 分布,当输入位于 [ci j-2σi j, ci j+2σi j] 范围内时, 95% 的数据属于该成员函数。因此通过式 (1) 计 算可以得到隶属函数的输出阈值为 0.135 4。这个 条件保证了每个输入的模糊隶属度不小于 0.135 4, 满足了模糊规则的 完整性准则。 因此,如果满足条件: { |e(t+1)| > |e(t)| u(n) = argmax(u• j) < 0.135 4 则说明当前网络误差变大,现有规则不能有 效覆盖输入数据,需要增加规则层神经元 (将规 则层第 n 个神经元分裂为两个)。新增神经元的 初始参数设置为 cnew(t) = 1 2 (cn(t)+ x(t)) σnew(t) = σn(t) wnew(t) = e(t) ϕnew(t) 式中:cnew(t)、σnew(t) 和 wnew(t) 分别是新增神经元的 中心、宽度和连接权值,cn (t) 和 σn (t) 是第 n 个神 经元的中心和宽度,x(t) 是当前输入样本,ϕnew(t) 是新增神经元的输出。 2.2 结构修剪 模糊神经网络规则层的删减一般根据规则层 神经元对于输出层神经元的影响大小来判断。这 种删减也可以理解为一种数据的降维。因此,基 于数据降维的思想,本文采用偏最小二乘算法实 现规则层神经元的修剪。偏最小二乘算法的一个 显著特点就是允许在样本点个数少于变量个数的 情况下进行回归分析。由于滑窗宽度有限,可能 出现滑窗内样本个数少于规则层神经元个数 (即 变量个数) 的情况,所以采用 PLS 算法正好解决 这一问题。以下是删减过程的主要步骤: 首先判断误差 e,如果|e(t+1)|<|e(t)|,说明当前 网络性能较好。接下来通过 PLS 计算规则层神 经元的回归系数,删除对输出影响较小的神经元 以避免网络结构冗余。PLS 主要计算步骤如下: 第 4 期 周杉杉,等:基于自组织递归模糊神经网络的 PM2.5 浓度预测 ·511·
·512· 智能系统学报 第13卷 1)以滑窗内规则层神经元输出作为自变量 3实验研究 X,网络输出层神经元作为单因变量y。X和y经 标准化后的矩阵分别记为E。和Fo。 3.1非线性系统辨识 2)从E和F。分别提取第1个成分4和41。提 为验证SORFNN模型的有效性,采用典型的 取成分时,1与山要尽可能多地携带原数据的信 非线性系统: 息且相关性最大,从而保证自变量成分1对因变量 1+1)=0-100+2.5 +u(t) 成分“的解释性最强。如果第1个成分不能满足 1+y2(t)+y2(t-1) 精度要求,则用残差矩阵E和F继续提取第2个 进行实验验证。其中,y(0)=0,y(1)=0,(t)= 成分,直至提取的成分个数满足算法的停止要求。 sin(2πl25)。非线性系统的模型为 X-TP+E->+E t+1)=f0y(t0),y(t-1),(t) (8) 因此SORFNN模型为3输入1输出,根据式 (8)产生500个样本,训练数据采用前400组,后 y=UOT+F= 4,g+F 100组用于测试,为了验证神经网络的自组织结 =1 式中:T、P、E分别是自变量X的得分矩阵、负荷 构变化,初始规则数选取较小值2。 矩阵与残差矩阵;U、Q、F分别是因变量y的得分 图3给出了训练过程中规则层神经元个数的 矩阵、负荷矩阵与残差矩阵;α是提取的成分个数。 变化情况,最终神经元稳定在6个左右,表明网络 3)通过检验交叉有效性确定最终提取的成分 结构能够动态优化,提高网络性能。图4和图5分 个数。首先从所有n个样本点中除去第i个样本 别给出了网络训练效果和测试效果。从图中可以看 点(=1,2,…,n),用h个成分拟合一个回归方程。 出,网络在训练和测试阶段与期望输出都拟合较好。 将被除去的样本点i代入该回归方程,得到y在 6.0 样本点i上的拟合值M-n。对=1,2,,n重复上述 5.5 熟5.0 计算,则因变量y的拟合误差平方和为 R4.5 PRESS 4.0 3.5 其次,将所有n个样本点用于拟合含h个成 0 2.5 分的回归方程,记第i个样本点的拟合值为,得 2.0 到y的误差平方和为 50100150200250300350400 样本个数 SS= - 图3规则层神经元变化 Fig.3 Number variation of neurons in rule layer 定义交叉有效性 用目验中 =1-PRESS, SSh- 当Q<0.0975时,增加新的成分对减少回归 方程的拟合误差无明显改善,停止提取成分。 通过计算回归系数R,当规则层神经元的最 小系数R小于阈值R时,则删除该神经元。 0 50100150200250300350400 训练样本 le(t+1)<le(t) R=arg min(R)<Ri 图4训练效果 若第个神经元被删除,则与第j个规则层神 Fig.4 Training results 经元欧氏距离最近的神经元参数调整为 期望输出·SORFNN输出 c'()=cr(①) 0(t)=0r() 3210 w.(t)=wr(1)+wi)(t)/r(t) 式中:了是与神经元j欧氏距离最近的神经元,c、 0102030405060708090100 G、和w',分别是结构调整后神经元'的中心、宽 测试样本 度和权值;C、G、和w分别是结构调整前神经元 图5测试效果 的中心、宽度和权值;是神经元广的输出。 Fig.5 Test results
1) 以滑窗内规则层神经元输出作为自变量 X,网络输出层神经元作为单因变量 y。X 和 y 经 标准化后的矩阵分别记为 E0 和 F0。 2) 从 E0 和 F0 分别提取第 1 个成分 t1 和 u1。提 取成分时,t1 与 u1 要尽可能多地携带原数据的信 息且相关性最大,从而保证自变量成分 t1 对因变量 成分 u1 的解释性最强。如果第 1 个成分不能满足 精度要求,则用残差矩阵 E1 和 F1 继续提取第 2 个 成分,直至提取的成分个数满足算法的停止要求。 X = TPT + E = ∑α i=1 ti p T i + E y = UQT + F = ∑α i=1 uiq T i + F 式中:T、P、E 分别是自变量 X 的得分矩阵、负荷 矩阵与残差矩阵;U、Q、F 分别是因变量 y 的得分 矩阵、负荷矩阵与残差矩阵;α 是提取的成分个数。 ··· yˆh(−i) ··· 3) 通过检验交叉有效性确定最终提取的成分 个数。首先从所有 n 个样本点中除去第 i 个样本 点 (i=1,2, ,n),用 h 个成分拟合一个回归方程。 将被除去的样本点 i 代入该回归方程,得到 y 在 样本点 i 上的拟合值 。对 i=1,2, ,n 重复上述 计算,则因变量 y 的拟合误差平方和为 PRESSh = ∑n i=1 (yi −yˆh(−i)) 2 yˆhi 其次,将所有 n 个样本点用于拟合含 h 个成 分的回归方程,记第 i 个样本点的拟合值为 ,得 到 y 的误差平方和为 SSh = ∑n i=1 (yi −yˆhi) 2 定义交叉有效性 Q 2 h = 1− PRESSh SSh−1 Q 2 当 h < 0.097 5 时,增加新的成分对减少回归 方程的拟合误差无明显改善,停止提取成分。 通过计算回归系数 Rj,当规则层神经元的最 小系数 R 小于阈值 Rth 时,则删除该神经元。 { |e(t+1)| < |e(t)| R = argmin(Rj) < Rth 若第 j 个神经元被删除,则与第 j 个规则层神 经元欧氏距离最近的神经元参数调整为 c ′ j ′ (t) = cj ′ (t) σ ′ j ′ (t) = σj ′ (t) w ′ j ′ (t) = wj ′ (t)+wj(t)ϕj(t)/ϕj ′ (t) 式中:j′是与神经元 j 欧氏距离最近的神经元,c′ j′、 σ′ j′、和 w′ j′分别是结构调整后神经元 j′的中心、宽 度和权值;cj′、σj′、和 wj′分别是结构调整前神经元 j′的中心、宽度和权值;ϕj′是神经元 j′的输出。 3 实验研究 3.1 非线性系统辨识 为验证 SORFNN 模型的有效性,采用典型的 非线性系统: y(t+1) = y(t)y(t−1)[y(t)+2.5] 1+y 2 (t)+y 2 (t−1) +u(t) 进行实验验证。其中,y(0)=0,y(1)=0,u(t)= sin(2πt/25)。非线性系统的模型为 yˆ(t+1) = ˆf(y(t), y(t−1),u(t)) (8) 因此 SORFNN 模型为 3 输入 1 输出,根据式 (8) 产生 500 个样本,训练数据采用前 400 组,后 100 组用于测试,为了验证神经网络的自组织结 构变化,初始规则数选取较小值 2。 图 3 给出了训练过程中规则层神经元个数的 变化情况,最终神经元稳定在 6 个左右,表明网络 结构能够动态优化,提高网络性能。图 4 和图 5 分 别给出了网络训练效果和测试效果。从图中可以看 出,网络在训练和测试阶段与期望输出都拟合较好。 0 50 100 150 200 250 300 350 400 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 样本个数 规则层神经元个数 图 3 规则层神经元变化 Fig. 3 Number variation of neurons in rule layer 0 50 100 150 200 250 300 350 400 −2 −1 0 1 2 3 4 训练样本 输出值 期望输出 SORFNN 输出 图 4 训练效果 Fig. 4 Training results 0 10 20 30 40 50 60 70 80 90 100 −2 −1 0 1 2 3 4 ⍻䈅ṧᵜ 䗃ࠪ٬ ᵏᵋ䗃ࠪ SORFNN 䗃ࠪ 图 5 测试效果 Fig. 5 Test results ·512· 智 能 系 统 学 报 第 13 卷
第4期 周杉杉,等:基于自组织递归模糊神经网络的PM2.5浓度预测 ·513· 图6是样本的测试误差图,图7是测试输出 其中,均方根误差RMSE和平均百分比误差 与期望输出拟合的散点图。从图中可以看出网络 APE计算公式如下: 测试误差较小,测试输出与期望输出基本拟合在 一条直线上。表I给出了SORFNN与动态模糊神 ya(0-y(0)2 经网络(dynamic fuzzy neural network,DFNN) RMSE =1 2N 广义动态模糊神经网络(generalized dynamic fuzzy neural network,GDFNN)I和基于本文自组织方 APE= 1 六bz0-y0创×100% N bya()l 法的自组织模糊神经网络(self-organizing fuzzy 3.2 PM2.5浓度预测 neural network,SOFNN)的性能比较。 通过非线性系统辨识实验,验证了所设计的 10-2 2.5 SORFNN模型的有效性,接下来将该模型用于同 2.0 样是非线性过程的实际PM2.5浓度的小时预测。 3.2.1数据来源 0.5 PM2.5浓度预测和分析使用的数据一般有 -0.5 3种:地面监测站观测数据、同期同地区的气象观 1.0 测数据、高空遥感图像。目前北京市已经建立了 20 完善的空气污染监测站,因此本次实验选用易获 102030405060708090100 得的地面监测站数据和同期气象数据,以北京市 测试样本 朝阳区某国控空气质量监测站为研究对象,采集 图6测试误差 该站点的小时监测数据。具体数据集来源于微软 Fig.6 Error of test 的城市计算项目3,该数据集采样时间为2014年 5月1日一2015年4月30日,包含了4个季节的 监测数据,样本内容丰富具有代表性,采样变量 包括《环境空气质量标准》(GB3095一2012)中 规定的6项常规监测项目CO、NO2、SO2、O3、PM2.5、 0 PM10和气象变量温度(T)、湿度(RH)、风向 (WD)、风速(WS)、气压(P)、天气(W),删除异常 数据和缺失数据后获得4000组完整数据。实验 中先将样本数据随机化归一化处理,然后选择前 期望输出 3000组用于网络训练并进行十折交叉验证,轮流 图7测试散点图 将其中9份用作训练,1份作为测试,求其误差均 Fig.7 Scatter plot of test 值。后1000组用于网络测试,并进行多次独立实 从表1可以看出,SORFNN的测试RMSE为 验。这样训练样本和测试样本都包含了空气质量 0.0091,明显小于其他算法。规则层神经元个数 较好和较差时的观测数据,保证了样本的多样性。 为6,结构较为紧凑。同时,该自组织算法计算时 3.2.2特征提取 间明显小于其他算法。对比结果表明SORFNN PM2.5的小时浓度与其他污染物和气象条件 不仅能够获得较为精简的网络结构,而且性能同 密切相关,陈冠益等1图的研究表明PM2.5浓度受 样可以满足要求。 温度、相对湿度、风速风向、降雨的影响显著。 表1不同算法网络性能对比 Zheng等1的研究表明不同时刻的天气条件和 Table 1 Performance comparison of different algorithms SO2、NO2等污染物对PM2.5浓度影响较大。本文 测试 算法 Num APE 时间/s 中选择当前时刻的污染物变量(CO、NO2、SO2、 RMSE O3、PM2.5和PM10)、当前时刻的气象因子(温度、 SORFNN 6 0.0091 0.0161 1.28 湿度、风向、风速、气压和天气)、下一时刻的预报 DFNN 6 0.0283 0.0104 17.23 气象因子(温度、湿度、风向、风速、气压和天 GDFNN 0.0108 0.0040 18.12 气)作为特征变量。考虑到特征变量比较多,且 SOFNN 6 0.0227 0.0189 1.03 各个变量之间有一定相关性,若直接引入神经网 络预测模型会有信息冗余,造成模型复杂度变 SORBF > 0.0266 0.0407 0.83 高,影响模型预测性能。所以,采用主成分分析
图 6 是样本的测试误差图,图 7 是测试输出 与期望输出拟合的散点图。从图中可以看出网络 测试误差较小,测试输出与期望输出基本拟合在 一条直线上。表 1 给出了 SORFNN 与动态模糊神 经网络 (dynamic fuzzy neural network,DFNN)[16] 、 广义动态模糊神经网络 (generalized dynamic fuzzy neural network,GDFNN)[17] 和基于本文自组织方 法的自组织模糊神经网络 (self-organizing fuzzy neural network,SOFNN) 的性能比较。 0 10 20 30 40 50 60 70 80 90 100 −2.5 −2.0 −1.5 −1.0 −0.5 0 0.5 1.0 1.5 2.0 2.5 ≷䄁ᵣ᱘ ≷䄁䄛ጚ ×10−2 图 6 测试误差 Fig. 6 Error of test −2 −1 0 1 2 3 4 −2 −1 0 1 2 3 4 期望输出 测试输出 图 7 测试散点图 Fig. 7 Scatter plot of test 从表 1 可以看出,SORFNN 的测试 RMSE 为 0.009 1,明显小于其他算法。规则层神经元个数 为 6,结构较为紧凑。同时,该自组织算法计算时 间明显小于其他算法。对比结果表明 SORFNN 不仅能够获得较为精简的网络结构,而且性能同 样可以满足要求。 表 1 不同算法网络性能对比 Table 1 Performance comparison of different algorithms 算法 Num 测试 RMSE APE 时间/s SORFNN 6 0.009 1 0.016 1 1.28 DFNN 6 0.028 3 0.010 4 17.23 GDFNN 8 0.010 8 0.004 0 18.12 SOFNN 6 0.022 7 0.018 9 1.03 SORBF 7 0.026 6 0.040 7 0.83 其中,均方根误差 RMSE 和平均百分比误差 APE 计算公式如下: RMSE = vuuuuut∑N t=1 (yd(t)−y(t))2 2N APE = 1 N ∑N t=1 |yd(t)−y(t)| |yd(t)| ×100% 3.2 PM2.5 浓度预测 通过非线性系统辨识实验,验证了所设计的 SORFNN 模型的有效性,接下来将该模型用于同 样是非线性过程的实际 PM2.5 浓度的小时预测。 3.2.1 数据来源 PM2.5 浓度预测和分析使用的数据一般有 3 种:地面监测站观测数据、同期同地区的气象观 测数据、高空遥感图像。目前北京市已经建立了 完善的空气污染监测站,因此本次实验选用易获 得的地面监测站数据和同期气象数据,以北京市 朝阳区某国控空气质量监测站为研究对象,采集 该站点的小时监测数据。具体数据集来源于微软 的城市计算项目[34] ,该数据集采样时间为 2014 年 5 月 1 日—2015 年 4 月 30 日,包含了 4 个季节的 监测数据,样本内容丰富具有代表性,采样变量 包括《环境空气质量标准》(GB3095—2012) 中 规定的 6 项常规监测项目 CO、NO2、SO2、O3、PM2.5、 PM10 和气象变量温度 (T)、湿度 (RH)、风向 (WD)、风速 (WS)、气压 (P)、天气 (W),删除异常 数据和缺失数据后获得 4 000 组完整数据。实验 中先将样本数据随机化归一化处理,然后选择前 3 000 组用于网络训练并进行十折交叉验证,轮流 将其中 9 份用作训练,1 份作为测试,求其误差均 值。后 1 000 组用于网络测试,并进行多次独立实 验。这样训练样本和测试样本都包含了空气质量 较好和较差时的观测数据,保证了样本的多样性。 3.2.2 特征提取 PM2.5 的小时浓度与其他污染物和气象条件 密切相关,陈冠益等[18] 的研究表明 PM2.5 浓度受 温度、相对湿度、风速风向、降雨的影响显著。 Zheng 等 [19] 的研究表明不同时刻的天气条件和 SO2、NO2 等污染物对 PM2.5 浓度影响较大。本文 中选择当前时刻的污染物变量 (CO、NO2、SO2、 O3、PM2.5 和 PM10)、当前时刻的气象因子 (温度、 湿度、风向、风速、气压和天气)、下一时刻的预报 气象因子 (温度、湿度、风向、风速、气压和天 气) 作为特征变量。考虑到特征变量比较多,且 各个变量之间有一定相关性,若直接引入神经网 络预测模型会有信息冗余,造成模型复杂度变 高,影响模型预测性能。所以,采用主成分分析 第 4 期 周杉杉,等:基于自组织递归模糊神经网络的 PM2.5 浓度预测 ·513·
·514· 智能系统学报 第13卷 方法进行特征变量提取,达到数据降维的目的。 a 一期望输出◆SORFNN输出 本文中取累计贡献率大于0.85的变量,最终提取 出8个主成分作为神经网络预测模型的输入。 3.2.3实验结果 实验中神经网络为8输入1输出,规则层初 始神经元个数为4。预测模型的评价指标采用常 用的均方根误差RMSE、平均绝对误差MAE、决 定系数R、一致性指数IA82刘。 23 4567891010 测试样本 MAE= 1 图9测试效果 (∑p-o,- Fig.9 Test results =1 R2= 250 m-a- 200 150 100 50 IA=1 -50 -100 -150 式中:0和ō分别是期望值和期望值的均值,p:和 -200 -250 是预测值和预测值的均值。 4 56 78910×10 测试样本 图8给出了网络训练过程中规则层神经元个 数的变化情况,从图中可以看出在训练过程中神 图10测试误差 经网络的结构是动态变化的,根据一段时间内样 Fig.10 Test error 本的分布情况,神经元实现了增删调整,最终神 表2不同网络性能对比 经元个数为7个。图9给出了网络的测试效果, Table 2 Performance comparison of different networks 测试输出与期望输出拟合较好。图10是SOR- 参数 SORENN DENN GDFNN SOFNN SORBF FNN与DFNN、GDFNN、SOFNN、SORBF方法的 训练 预测误差对比图,DFNN的误差在(-250,250)范 0.0357 0.04620.04650.02940.0352 RMSE 围内,GDFNN和SORBF的误差都在(-150, 测试 250)之间,S0FNN的误差范围是(-100,250), 0.03500.05360.05510.03770.0435 RMSE SORFNN的误差则在(-150,150)范围。相比其 MAE 16.785916.237518.063817.558719.3941 他方法,SORFNN的预测误差范围较小,分布也 R 0.87670.84700.85200.85800.8439 比较均匀集中。具体性能指标对比如表2所示。 0.96550.95810.95900.95950.9548 从表中可以看出,文中自组织方法有效地减小了 IA 预测模型的误差,在拟合度等方面也有所提高, Num 7 6 g 9 10 是一种有效的自组织方法。 8.0 4结束语 7.5 7.0 通过分析PM2.5浓度变化的特点,本文提出 采用自组织递归模糊神经网络来预测PM2.5浓 6.0 度。经过PCA提取特征变量,实现数据降维和信 55 5.0 息去冗余,有利于提高模型预测性能。为了解决 4.5 神经网络结构优化问题,提出基于ε准则和偏最 4. 0 1015202530×10 小二乘法的自组织方法,构建了自组织递归模糊 训练样本 神经网络模型,同时采用学习率自适应的梯度下 图8规则层神经元变化 降算法对神经网络的中心、宽度等参数进行训 Fig.8 Number variation of neurons in rule layer 练,建立了PM2.5浓度预测模型。通过非线性系
方法进行特征变量提取,达到数据降维的目的。 本文中取累计贡献率大于 0.85 的变量,最终提取 出 8 个主成分作为神经网络预测模型的输入。 3.2.3 实验结果 实验中神经网络为 8 输入 1 输出,规则层初 始神经元个数为 4。预测模型的评价指标采用常 用的均方根误差 RMSE、平均绝对误差 MAE、决 定系数 R 2 、一致性指数 IA[7-8,28-29]。 MAE = 1 N ∑N i=1 |oi− pi | R 2 = ( ∑N i=1 (pi − p¯)(oi −o¯))2 ∑N i=1 (pi − p¯) 2∑N i=1 (oi −o¯) 2 IA = 1− ∑N i=1 (pi −oi) 2 ∑N i=1 (|pi −o¯|+|oi −o¯|) 2 o¯ p¯ 式中:oi 和 分别是期望值和期望值的均值,pi 和 是预测值和预测值的均值。 图 8 给出了网络训练过程中规则层神经元个 数的变化情况,从图中可以看出在训练过程中神 经网络的结构是动态变化的,根据一段时间内样 本的分布情况,神经元实现了增删调整,最终神 经元个数为 7 个。图 9 给出了网络的测试效果, 测试输出与期望输出拟合较好。图 10 是 SORFNN 与 DFNN、GDFNN、SOFNN、SORBF 方法的 预测误差对比图,DFNN 的误差在 (–250,250) 范 围内, GDFNN 和 SORBF 的误差都在 (–150, 250) 之间,SOFNN 的误差范围是 (–100,250), SORFNN 的误差则在 (–150,150) 范围。相比其 他方法,SORFNN 的预测误差范围较小,分布也 比较均匀集中。具体性能指标对比如表 2 所示。 从表中可以看出,文中自组织方法有效地减小了 预测模型的误差,在拟合度等方面也有所提高, 是一种有效的自组织方法。 0 5 10 15 20 25 30 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 䃙㏯ᵣ᱘ 㻰݅ᅮ⺊㏻ٯ͖ ×102 图 8 规则层神经元变化 Fig. 8 Number variation of neurons in rule layer 0 1 2 3 4 5 6 7 8 9 10 −1 0 1 2 3 4 5 测试样本 期望输出 SORFNN 输出 PM2.5 浓度(μg/m3 ) ×102 ×102 图 9 测试效果 Fig. 9 Test results 0 1 2 3 4 5 6 7 8 9 10 −250 −200 −150 −100 −50 0 50 100 150 200 250 测试样本 GDFNN DFNN SOFNN SORBF SORFNN 测试误差(μg/m3 ) ×102 图 10 测试误差 Fig. 10 Test error 表 2 不同网络性能对比 Table 2 Performance comparison of different networks 参数 SORFNN DFNN GDFNN SOFNN SORBF 训练 RMSE 0.035 7 0.046 2 0.046 5 0.029 4 0.035 2 测试 RMSE 0.035 0 0.053 6 0.055 1 0.037 7 0.043 5 MAE 16.785 9 16.237 5 18.063 8 17.558 7 19.394 1 R 2 0.876 7 0.847 0 0.852 0 0.858 0 0.843 9 IA 0.965 5 0.958 1 0.959 0 0.959 5 0.954 8 Num 7 6 9 9 10 4 结束语 通过分析 PM2.5 浓度变化的特点,本文提出 采用自组织递归模糊神经网络来预测 PM2.5 浓 度。经过 PCA 提取特征变量,实现数据降维和信 息去冗余,有利于提高模型预测性能。为了解决 神经网络结构优化问题,提出基于 ε 准则和偏最 小二乘法的自组织方法,构建了自组织递归模糊 神经网络模型,同时采用学习率自适应的梯度下 降算法对神经网络的中心、宽度等参数进行训 练,建立了 PM2.5浓度预测模型。通过非线性系 ·514· 智 能 系 统 学 报 第 13 卷
第4期 周杉杉,等:基于自组织递归模糊神经网络的PM2.5浓度预测 ·515· 统辨识实验证明了该预测模型的有效性,最后将 vironment,2015,102:239-248 该模型用于实际问题PM2.5浓度的预测。实验结 [11]QIAO Junfei,CAI Jie,HAN Honggui,et al.Predicting 果表明该模型不仅能够获得较为精简的网络结 PM2s concentrations at a regional background station us- 构,而且预测精度有所提高,为PM2.5浓度预测 ing second order self-organizing fuzzy neural network[J]. 提供了一种有效的方法。 Atmosphere,2017,8(1):10. [12]HAN Honggui,LI Ying,GUO Yanan,et al.A soft com- 参考文献: puting method to predict sludge volume index based on a recurrent self-organizing neural network[J].Applied soft [1]TAO Minghui,CHEN Liangfu,WANG Zifeng,et al.A computing,2016.38:477-486. study of urban pollution and haze clouds over northern [13]HAN Honggui,WANG Lidan,QIAO Junfei,et al.A China during the dusty season based on satellite and sur- face observations[J].Atmospheric environment,2014,82: spiking-based mechanism for self-organizing RBF neural networks[C]//2014 International Joint Conference on 183-192 [2]QIAO Liping.CAI Jing,WANG Hongqi,et al.PM2.5 con- Neural Networks (IJCNN).Beijing,China,2014: 3775-3782 stituents and hospital emergency-room visits in Shanghai, [14]HAN Honggui,WU Xiaolong,QIAO Junfei.Nonlinear China[J].Environmental science and technology,2014, 48(17):10406-10414. systems modeling based on self-organizing fuzzy-neural- [3]XIAO S,WANG Q Y,CAO JJ,et al.Long-term trends in network with adaptive computation algorithm[J].IEEE visibility and impacts of aerosol composition on visibility transactions on cybernetics,2014,44(4):554-564. impairment in Baoji,China[J].Atmospheric research, [15]LENG Gang,MCGINNITY T M,PRASAD G.An ap- 2014,149:88-95. proach for on-line extraction of fuzzy rules using a self- [4]SAIDE P E.CARMICHAEL G R,SPAK S N,et al.Fore- organising fuzzy neural network[J].Fuzzy sets and sys- casting urban PM10 and PM2.5 pollution episodes in very tems,2005,150(2):211-243 stable nocturnal conditions and complex terrain using [16]WU Shiqian,ER M J.Dynamic fuzzy neural networks-a WRF-Chem CO tracer model[J].Atmospheric environ- novel approach to function approximation[J].IEEE trans- ment.2011.45(16):2769-2780 actions on systems,man,and cybernetics,part B(cyber- [5]RICCIO A,CHIANESE E,AGRILLO G,et al.Source ap- netics).2000.30(2):358-364. portion of atmospheric particulate matter:a joint [17]WU Shiqian,ER M J,GAO Yang.A fast approach for Eulerian/Lagrangian approach[J].Environmental science automatic generation of fuzzy rules by generalized dy- and pollution research,2014,21(23):13160-13168. namic fuzzy neural networks[J].IEEE transactions on [6]CHEN Yuanyuan,SHI Runhe,SHU Shijie,et al.En- fuzzy systems,.2001,94):578-594. semble and enhanced PM10 concentration forecast model [18]陈冠益,张雯,侯立安,等.天津蓟县夏季PM2.5污染特 based on stepwise regression and wavelet analysis[J].At- 征及影响因素).天津大学学报:自然科学与工程技术 mospheric environment,2013,74:346-359. 版,2015,48(2):95-102 [7]ELBAYOUMI M,RAMLI N A,MD YUSOF N FF,et al. CHEN Guanyi,ZHANG Wen,HOU Lian,et al.Pollution Multivariate methods for indoor PM10 and PM2.5 model- characteristics and influence factors of PM2.5 in summer ling in naturally ventilated schools buildings[J].Atmo- in Jixian county of Tianjin[J].Journal of Tianjin uni- spheric environment,2014,94:11-21. versity:science and technology,2015,48(2):95-102. [8]ORDIERES J B.VERGARA E P,CAPUZ R S,et al. [19]ZHENG Yu,YI Xiuwen,LI Ming,et al.Forecasting fine- Neural network prediction model for fine particulate mat- grained air quality based on big data[C]//Proceedings of ter (PM2.5)on the US-Mexico border in El Paso (Texas) the 21th ACM SIGKDD International Conference on and Ciudad Juarez(Chihuahua)[J].Environmental model- Knowledge Discovery and Data Mining.New York,NY, ling and software,2005,20(5):547-559. USA.2015:2267-2276 [9]XU Zhao,XIA Xiaopeng,LIU Xiangnan,et al.Combin- [20]AZID A,JUAHIR H,TORIMAN M E,et al.Prediction ing DMSP/OLS nighttime light with echo state network for of the level of air pollution using principal component prediction of daily PM2.5 average concentrations in analysis and artificial neural network techniques:A case Shanghai,China[J].Atmosphere,2015,6(10):1507-1520. study in Malaysia[J].Water,air,and soil pollution,2014, [10]MISHRA D.GOYAL P.UPADHYAY A.Artificial intel- 225:2063. ligence based approach to forecast PM2.5 during haze [21]VOUKANTSIS D,KARATZAS K,KUKKONEN J,et al. episodes:a case study of Delhi,India[J].Atmospheric en- Intercomparison of air quality data using principal com-
统辨识实验证明了该预测模型的有效性,最后将 该模型用于实际问题 PM2.5 浓度的预测。实验结 果表明该模型不仅能够获得较为精简的网络结 构,而且预测精度有所提高,为 PM2.5 浓度预测 提供了一种有效的方法。 参考文献: TAO Minghui, CHEN Liangfu, WANG Zifeng, et al. A study of urban pollution and haze clouds over northern China during the dusty season based on satellite and surface observations[J]. Atmospheric environment, 2014, 82: 183–192. [1] QIAO Liping, CAI Jing, WANG Hongqi, et al. PM2.5 constituents and hospital emergency-room visits in Shanghai, China[J]. Environmental science and technology, 2014, 48(17): 10406–10414. [2] XIAO S, WANG Q Y, CAO J J, et al. Long-term trends in visibility and impacts of aerosol composition on visibility impairment in Baoji, China[J]. Atmospheric research, 2014, 149: 88–95. [3] SAIDE P E, CARMICHAEL G R, SPAK S N, et al. Forecasting urban PM10 and PM2.5 pollution episodes in very stable nocturnal conditions and complex terrain using WRF–Chem CO tracer model[J]. Atmospheric environment, 2011, 45(16): 2769–2780. [4] RICCIO A, CHIANESE E, AGRILLO G, et al. Source apportion of atmospheric particulate matter: a joint Eulerian/Lagrangian approach[J]. Environmental science and pollution research, 2014, 21(23): 13160–13168. [5] CHEN Yuanyuan, SHI Runhe, SHU Shijie, et al. Ensemble and enhanced PM10 concentration forecast model based on stepwise regression and wavelet analysis[J]. Atmospheric environment, 2013, 74: 346–359. [6] ELBAYOUMI M, RAMLI N A, MD YUSOF N F F, et al. Multivariate methods for indoor PM10 and PM2.5 modelling in naturally ventilated schools buildings[J]. Atmospheric environment, 2014, 94: 11–21. [7] ORDIERES J B, VERGARA E P, CAPUZ R S, et al. Neural network prediction model for fine particulate matter (PM2.5) on the US–Mexico border in El Paso (Texas) and Ciudad Juárez (Chihuahua)[J]. Environmental modelling and software, 2005, 20(5): 547–559. [8] XU Zhao, XIA Xiaopeng, LIU Xiangnan, et al. Combining DMSP/OLS nighttime light with echo state network for prediction of daily PM2.5 average concentrations in Shanghai, China[J]. Atmosphere, 2015, 6(10): 1507–1520. [9] MISHRA D, GOYAL P, UPADHYAY A. Artificial intelligence based approach to forecast PM2.5 during haze episodes: a case study of Delhi, India[J]. Atmospheric en- [10] vironment, 2015, 102: 239–248. QIAO Junfei, CAI Jie, HAN Honggui, et al. Predicting PM2.5 concentrations at a regional background station using second order self-organizing fuzzy neural network[J]. Atmosphere, 2017, 8(1): 10. [11] HAN Honggui, LI Ying, GUO Yanan, et al. A soft computing method to predict sludge volume index based on a recurrent self-organizing neural network[J]. Applied soft computing, 2016, 38: 477–486. [12] HAN Honggui, WANG Lidan, QIAO Junfei, et al. A spiking-based mechanism for self-organizing RBF neural networks[C]//2014 International Joint Conference on Neural Networks (IJCNN). Beijing, China, 2014: 3775–3782. [13] HAN Honggui, WU Xiaolong, QIAO Junfei. Nonlinear systems modeling based on self-organizing fuzzy-neuralnetwork with adaptive computation algorithm[J]. IEEE transactions on cybernetics, 2014, 44(4): 554–564. [14] LENG Gang, MCGINNITY T M, PRASAD G. An approach for on-line extraction of fuzzy rules using a selforganising fuzzy neural network[J]. Fuzzy sets and systems, 2005, 150(2): 211–243. [15] WU Shiqian, ER M J. Dynamic fuzzy neural networks-a novel approach to function approximation[J]. IEEE transactions on systems, man, and cybernetics, part B (cybernetics), 2000, 30(2): 358–364. [16] WU Shiqian, ER M J, GAO Yang. A fast approach for automatic generation of fuzzy rules by generalized dynamic fuzzy neural networks[J]. IEEE transactions on fuzzy systems, 2001, 9(4): 578–594. [17] 陈冠益, 张雯, 侯立安, 等. 天津蓟县夏季 PM2.5 污染特 征及影响因素 [J]. 天津大学学报: 自然科学与工程技术 版, 2015, 48(2): 95–102. CHEN Guanyi, ZHANG Wen, HOU Lian, et al. Pollution characteristics and influence factors of PM2.5 in summer in Jixian county of Tianjin[J]. Journal of Tianjin university: science and technology, 2015, 48(2): 95–102. [18] ZHENG Yu, YI Xiuwen, LI Ming, et al. Forecasting finegrained air quality based on big data[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, NY, USA, 2015: 2267–2276. [19] AZID A, JUAHIR H, TORIMAN M E, et al. Prediction of the level of air pollution using principal component analysis and artificial neural network techniques: A case study in Malaysia[J]. Water, air, and soil pollution, 2014, 225: 2063. [20] VOUKANTSIS D, KARATZAS K, KUKKONEN J, et al. Intercomparison of air quality data using principal com- [21] 第 4 期 周杉杉,等:基于自组织递归模糊神经网络的 PM2.5 浓度预测 ·515·
·516· 智能系统学报 第13卷 ponent analysis,and forecasting of PMo and PM2.5 con- Santiago de Chile with emphasis on night episodes[J].At- centrations using artificial neural networks,in Thes- mospheric environment,2016,124:22-27 saloniki and Helsinki[J].Science of the total environment, [31]WU G D,HUANG P H.A maximizing-discriminability- 2011,4097):1266-1276. based self-organizing fuzzy network for classification [22]HAN Honggui.GUO Yanan,QIAO Junfei.Self-organiza- problems[J].IEEE transactions on fuzzy systems,2010. tion of a recurrent RBF neural network using an informa- 18(2)362-373. tion-oriented algorithm[J].Neurocomputing,2017,225: [32]许少鹏,韩红桂,乔俊飞.基于模糊递归神经网络的污 80-91. 泥容积指数预测模型).化工学报,2013,64(12):4550- [23]QIAO Junfei.ZHANG Wei,HAN Honggui.Self-organiz- 4556. ing fuzzy control for dissolved oxygen concentration us- XU Shaopeng,HAN Honggui,QIAO Junfei.Prediction ing fuzzy neural networkI [J].Journal of intelligent and of activated sludge bulking based on recurrent fuzzy neur- fuzzy systems,.2016,30(6):3411-3422 al network[J].CIESC journal,2013,64(12):4550-4556. [24]WANG Ning,ER M J,MENG Xianyao.A fast and accur- [33]MADRIGANO J.KLOOG I,GOLDBERG R.et al. ate online self-organizing scheme for parsimonious fuzzy Long-term exposure to PM2.5 and incidence of acute neural networks[J].Neurocomputing,2009,72(16/17/18): myocardial infarction[.Environmental health perspect- 3818-3829. ives,2013,121(2):192-196. [25]余辉,袁晶,于旭耀,等.基于ARMAX的PM2.5小时 [34]城市计算EB/OL].(2008-03-18).htps:www.microsoft. 浓度跟踪预测模型仞.天津大学学报:自然科学与工程 技术版,2017,50(1):105-111. com/en-us/research/.project/城市计算 YU Hui,YUAN Jing,YU Xuyao,et al.Tracking predic- 作者简介: tion model for PM2.5 hourly concentration based on 周杉杉,女,1992年生,硕士研究 ARMAX[J].Journal of Tianjin university:science and 生,主要研究方向为智能信息处理与 technology,2017,50(1)105-111. 神经网络非线性系统建模。获得软件 [26]ZOU Bin,WANG Min,WAN Neng,et al.Spatial model- 著作权1项。发表学术论文1篇。 ing of PM2.5 concentrations with a multifactoral radial basis function neural network[J].Environmental science and pollution research,2015,22(14):10395-10404 [27]MISHRA D,GOYAL P.Neuro-fuzzy approach to fore- 李文静,女,1985年生,副教授, cast NO,pollutants addressed to air quality dispersion 博士,主要研究方向为神经计算、人工 神经网络、模式识别。主持国家自然 model over Delhi,India[J].Aerosol and air quality re- 科学基金青年项目、中国博土后第 search,2016,16(1):166-174. 57批面上资助项目、北京市博土后科 [28]FU Minglei,WANG Weiwen,LE Zichun,et al.Predic- 研活动经费资助项目各1项。申请美 tion of particular matter concentrations by developed 国发明专利1项。近5年来发表学术 feed-forward neural network with rolling mechanism and 论文10余篇,其中SCI收录8篇。 gray model[J].Neural computing and applications,2015, 乔俊飞.男.1968年生教授博士生 26(8):1789-1797. [29]ELANGASINGHE M A.SINGHAL N,DIRKS K N,et 导师。中国人工智能学会科普工作委 员会主任,中国自动化学会理事,主要 al.Complex time series analysis of PM10 and PM2.5 for 研究方向为智能信息处理、智能控制 a coastal site using artificial neural network modelling 理论与应用。获教育部科技进步奖一 and k-means clustering[J].Atmospheric environment, 等奖和北京市科学技术奖三等奖各 2014.94:106-116. 1项。获得发明专利20余项。发表学 [30]PEREZ P,GRAMSCH E.Forecasting hourly PM2.5 in 术论文100余篇,其中被SCI收录20余篇,EI收录60余篇
ponent analysis, and forecasting of PM10 and PM2.5 concentrations using artificial neural networks, in Thessaloniki and Helsinki[J]. Science of the total environment, 2011, 409(7): 1266–1276. HAN Honggui, GUO Yanan, QIAO Junfei. Self-organization of a recurrent RBF neural network using an information-oriented algorithm[J]. Neurocomputing, 2017, 225: 80–91. [22] QIAO Junfei, ZHANG Wei, HAN Honggui. Self-organizing fuzzy control for dissolved oxygen concentration using fuzzy neural network1[J]. Journal of intelligent and fuzzy systems, 2016, 30(6): 3411–3422. [23] WANG Ning, ER M J, MENG Xianyao. A fast and accurate online self-organizing scheme for parsimonious fuzzy neural networks[J]. Neurocomputing, 2009, 72(16/17/18): 3818–3829. [24] 余辉, 袁晶, 于旭耀, 等. 基于 ARMAX 的 PM2.5 小时 浓度跟踪预测模型 [J]. 天津大学学报: 自然科学与工程 技术版, 2017, 50(1): 105–111. YU Hui, YUAN Jing, YU Xuyao, et al. Tracking prediction model for PM2.5 hourly concentration based on ARMAX[J]. Journal of Tianjin university: science and technology, 2017, 50(1): 105–111. [25] ZOU Bin, WANG Min, WAN Neng, et al. Spatial modeling of PM2.5 concentrations with a multifactoral radial basis function neural network[J]. Environmental science and pollution research, 2015, 22(14): 10395–10404. [26] MISHRA D, GOYAL P. Neuro-fuzzy approach to forecast NO2 pollutants addressed to air quality dispersion model over Delhi, India[J]. Aerosol and air quality research, 2016, 16(1): 166–174. [27] FU Minglei, WANG Weiwen, LE Zichun, et al. Prediction of particular matter concentrations by developed feed-forward neural network with rolling mechanism and gray model[J]. Neural computing and applications, 2015, 26(8): 1789–1797. [28] ELANGASINGHE M A, SINGHAL N, DIRKS K N, et al. Complex time series analysis of PM10 and PM2.5 for a coastal site using artificial neural network modelling and k-means clustering[J]. Atmospheric environment, 2014, 94: 106–116. [29] [30] PEREZ P, GRAMSCH E. Forecasting hourly PM2.5 in Santiago de Chile with emphasis on night episodes[J]. Atmospheric environment, 2016, 124: 22–27. WU G D, HUANG P H. A maximizing-discriminabilitybased self-organizing fuzzy network for classification problems[J]. IEEE transactions on fuzzy systems, 2010, 18(2): 362–373. [31] 许少鹏, 韩红桂, 乔俊飞. 基于模糊递归神经网络的污 泥容积指数预测模型 [J]. 化工学报, 2013, 64(12): 4550– 4556. XU Shaopeng, HAN Honggui, QIAO Junfei. Prediction of activated sludge bulking based on recurrent fuzzy neural network[J]. CIESC journal, 2013, 64(12): 4550–4556. [32] MADRIGANO J, KLOOG I, GOLDBERG R, et al. Long-term exposure to PM2.5 and incidence of acute myocardial infarction[J]. Environmental health perspectives, 2013, 121(2): 192–196. [33] 城市计算 [EB/OL]. (2008–03–18). https://www.microsoft. com/en-us/research/project/城市计算. [34] 作者简介: 周杉杉,女,1992 年生,硕士研究 生,主要研究方向为智能信息处理与 神经网络非线性系统建模。获得软件 著作权 1 项。发表学术论文 1 篇。 李文静,女,1985 年生,副教授, 博士,主要研究方向为神经计算、人工 神经网络、模式识别。主持国家自然 科学基金青年项目、中国博士后第 57 批面上资助项目、北京市博士后科 研活动经费资助项目各 1 项。申请美 国发明专利 1 项。近 5 年来发表学术 论文 10 余篇,其中 SCI 收录 8 篇。 乔俊飞,男,1968 年生,教授,博士生 导师。中国人工智能学会科普工作委 员会主任,中国自动化学会理事,主要 研究方向为智能信息处理、智能控制 理论与应用。获教育部科技进步奖一 等奖和北京市科学技术奖三等奖各 1 项。获得发明专利 20 余项。发表学 术论文 100 余篇,其中被 SCI 收录 20 余篇,EI 收录 60 余篇。 ·516· 智 能 系 统 学 报 第 13 卷