第12卷第5期 智能系统学报 Vol.12 No.5 2017年10月 CAAI Transactions on Intelligent Systems 0ct.2017 D0I:10.11992/is.201706015 网络出版地址:http:/kns.cmki.net/kcms/detail/23.1538.TP.20170831.1058.010.html 基于递归神经网络的风暴潮增水预测 雷森',史振威,石天阳,高松2,李亚茹2,钟山2 (1.北京航空航天大学宇航学院图像处理中心,北京100191:2.国家海洋局北海预报中心,山东青岛266000) 摘要:风暴潮增水的准确预测能极大地减少人员伤害和经济损失,具有重要的实用价值。传统的风暴潮预报方法 主要包括经验和数值预报,很难建立起相对准确的模型。现有的基于机器学习风暴潮预报方法大都只提取出静态 数据间的关系,并没有充分挖掘出风暴潮数据背后的时序关联特性。文中提出了一种基于递归神经网络的风暴潮 增水预测方法。本文对风暴潮时序数据进行特定的处理,并设计合适结构的递归神经网络,从而完成时序数据的预 测。相较于传统的BP神经网络,递归神经网络能更好地应对时序数据的预测问题。将该方法用于潍坊水站的增水 预测中,结果表明,相对于B即神经网络,递归神经网络能得到更好的预测结果,误差更小。 关键词:风暴潮增水;预测;数值预报;机器学习;静态数据;时序特性;BP神经网络;递归神经网络 中图分类号:TP751文献标志码:A文章编号:1673-4785(2017)05-0640-05 中文引用格式:雷森,史振威,石天阳,等.基于递归神经网络的风暴潮增水预测[J].智能系统学报,2017,12(5):640-644. 英文引用格式:LEI Sen,SHI Zhenwei,SHI Tianyang,etal.Prediction of storm surge based on recurrent neural network[J】. CAAI transactions on intelligent systems,2017,12(5):640-644. Prediction of storm surge based on recurrent neural network LEI Sen',SHI Zhenwei',SHI Tianyang',GAO Song?,LI Yaru2,ZHONG Shan2 (1.Image Processing Center,School of Astronautics,Beihang University,Beijing 100191,China;2.Beihai Forecast Center of State Oceanic Administration,Qingdao 266000,China) Abstract:Accurately forecasting storm surges can greatly reduce personnel injuries and economic losses,and so has great practical value.Traditional methods for predicting storm surge mainly involve experience and numerical forecasting,which makes it very hard to establish accurate models.Most of today's storm surge forecast methods based on machine learning only extract the relationships among static data and fail to identify the relevant time series properties of these data.In this paper,we propose a storm surge forecast method based on the recurrent neural network.The storm surge data is rearranged with particular treatments,and an appropriate recurrent neural network is designed to perform the prediction of the time series.Compared with traditional BP neural networks,the recurrent neural network can better forecast time series data.In this study,we used a recurrent neural network to predict surges at the Weifang gauge station.The results show that the recurrent neural network produces a better prediction with a smaller error than the BP neural network. Keywords:storm surge;prediction;numerical forecast;machine learning;static data;temporal properties;BP neural networks:recurrent neural network 风暴潮(storm surge)是一种由于强烈大气扰 结合所引起的沿岸海水暴涨常常酿成巨大潮灾山。 动,如热带气旋(台风、飓风)、温带气旋等,引起的 风暴潮灾害的及时预报能极大地减少其对沿海地 海面异常升高现象。它具有数小时至数天的周期, 区带来的人员伤害和经济损失,具有很强的实用 通常叠加在正常潮位之上,而风浪、涌浪(具有数秒 价值。 的周期)则叠加在风暴潮和正常潮位之上。它们的 传统的风暴潮预报方法主要分为两大类:经验 收稿日期:2017-06-07.网络出版日期:2017-08-31 预报方法和数值预报方法。经验预报方法通常是 基金项目:国家自然科学基金项目(61671037). 指预报员的主观经验和经验统计预报方法,而数值 通信作者:史振威.E-mail:shizhenwei(@bua.edu.cm
第 12 卷第 5 期 智 能 系 统 学 报 Vol.12 №.5 2017 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2017 DOI:10.11992 / tis.201706015 网络出版地址:http: / / kns.cnki.net / kcms/ detail / 23.1538.TP.20170831.1058.010.html 基于递归神经网络的风暴潮增水预测 雷森1 ,史振威1 ,石天阳1 ,高松2 ,李亚茹2 ,钟山2 (1.北京航空航天大学 宇航学院图像处理中心,北京 100191; 2. 国家海洋局 北海预报中心,山东 青岛 266000) 摘 要:风暴潮增水的准确预测能极大地减少人员伤害和经济损失,具有重要的实用价值。 传统的风暴潮预报方法 主要包括经验和数值预报,很难建立起相对准确的模型。 现有的基于机器学习风暴潮预报方法大都只提取出静态 数据间的关系,并没有充分挖掘出风暴潮数据背后的时序关联特性。 文中提出了一种基于递归神经网络的风暴潮 增水预测方法。 本文对风暴潮时序数据进行特定的处理, 并设计合适结构的递归神经网络,从而完成时序数据的预 测。 相较于传统的 BP 神经网络,递归神经网络能更好地应对时序数据的预测问题。 将该方法用于潍坊水站的增水 预测中,结果表明,相对于 BP 神经网络,递归神经网络能得到更好的预测结果,误差更小。 关键词:风暴潮增水;预测;数值预报;机器学习;静态数据;时序特性;BP 神经网络;递归神经网络 中图分类号:TP751 文献标志码:A 文章编号:1673-4785(2017)05-0640-05 中文引用格式:雷森,史振威,石天阳,等.基于递归神经网络的风暴潮增水预测[J]. 智能系统学报, 2017, 12(5): 640-644. 英文引用格式:LEI Sen, SHI Zhenwei, SHI Tianyang,et al. Prediction of storm surge based on recurrent neural network[ J]. CAAI transactions on intelligent systems, 2017, 12(5): 640-644. Prediction of storm surge based on recurrent neural network LEI Sen 1 , SHI Zhenwei 1 , SHI Tianyang 1 , GAO Song 2 , LI Yaru 2 , ZHONG Shan 2 (1. Image Processing Center, School of Astronautics, Beihang University, Beijing 100191, China; 2. Beihai Forecast Center of State Oceanic Administration, Qingdao 266000, China) Abstract:Accurately forecasting storm surges can greatly reduce personnel injuries and economic losses, and so has great practical value. Traditional methods for predicting storm surge mainly involve experience and numerical forecasting, which makes it very hard to establish accurate models. Most of today’ s storm surge forecast methods based on machine learning only extract the relationships among static data and fail to identify the relevant time series properties of these data. In this paper, we propose a storm surge forecast method based on the recurrent neural network. The storm surge data is rearranged with particular treatments, and an appropriate recurrent neural network is designed to perform the prediction of the time series. Compared with traditional BP neural networks, the recurrent neural network can better forecast time series data. In this study, we used a recurrent neural network to predict surges at the Weifang gauge station. The results show that the recurrent neural network produces a better prediction with a smaller error than the BP neural network. Keywords:storm surge; prediction; numerical forecast; machine learning; static data; temporal properties; BP neural networks; recurrent neural network 收稿日期:2017-06-07. 网络出版日期:2017-08-31. 基金项目:国家自然科学基金项目(61671037). 通信作者:史振威.E⁃mail:shizhenwei@ buaa.edu.cn. 风暴潮( storm surge) 是一种由于强烈大气扰 动,如热带气旋(台风、飓风)、温带气旋等,引起的 海面异常升高现象。 它具有数小时至数天的周期, 通常叠加在正常潮位之上,而风浪、涌浪(具有数秒 的周期)则叠加在风暴潮和正常潮位之上。 它们的 结合所引起的沿岸海水暴涨常常酿成巨大潮灾[1] 。 风暴潮灾害的及时预报能极大地减少其对沿海地 区带来的人员伤害和经济损失,具有很强的实用 价值。 传统的风暴潮预报方法主要分为两大类:经验 预报方法和数值预报方法。 经验预报方法通常是 指预报员的主观经验和经验统计预报方法,而数值
第5期 雷森,等:基于递归神经网络的风暴潮增水预测 ·641 预报方法主要包括诺模图方法和数值预报方法[) 是一种常用的进行预报的方法。它是一种应用类 曾德美[)研究了青岛港的风暴潮概况,提出了青岛 似于大脑神经连接的结构进行信号处理的数学模 港极值增减水的经验公式。谢亚力和黄世昌[4]将 型,广泛应用于语音识别、自然语言处理、图像处理 风暴潮经验预报与动力线性模型相结合,建立了经 等领域[5-15)。目前,在大数据分析中主要采用前馈 验预报方程,并在钱塘江风暴潮预报中取得了不错 神经网络来提取静态数据之间的关系。 的效果。高清清等]通过研究位于长江入海口的 前馈神经网络[6]是一种具有前向结构的人工 南通单站历史水文气象资料,分析该站的风暴增水 神经网络,一般是多层结构,包含输入层、隐含层以 特征,提出了针对该站台风风暴潮经验预报公式。 及输出层,隐含层可以有多层。每一层神经元的输 从20世纪80年代以来,基于数值模拟方法的 入是上一层的输出,并通过全连接将其输出传递给 风暴潮预报技术取得了较大的发展和进步。朱建 下一层,且整个网络中没有反馈。每一个神经元可 荣和朱首贤[s]将原正交的ECOM模式改进为非正 以是多输入的,但是只有一个输出。多层前馈神经 交曲线坐标系下模式,以更好地拟合河岸线的形 网络是感知器的推广,只要有一层包含足够多神经 状,应用于长江河口、杭州湾及邻近海区,取得了不 元的隐含层就能够以任意精度逼近任意复杂度的 错的效果。黄世昌等[6)基于河口海岸水动力二维 连续函数]。以3层前馈神经网络为例,结构如图 数值模型,建立起了风暴潮与天文潮相互耦合的数 值模式,可用于浙江沿海增水预测。王培涛等)提 1所示。 出了一种基于高级环流模型(ADCIRC)适合台湾海 峡及福建沿海区域的精细化台风风暴潮数值预报 模式。 然而,基于经验和数值的传统风暴潮预报通常 需要研究员对风暴潮的动力学规律具有非常深入 的研究,操作复杂难懂,并且很难建立起相对准确 的模型。后来,随着计算机技术的发展和大数据时 代的到来,许多学者将基于海量数据的机器学习方 法用于风暴潮预报中。T.L.Lee)将风速、风向、压 强等要素作为输入训练前馈神经网络(feedforward 图1多层感知器 Fig.1 Multi-layer perceptron neural network,FNN),用来进行风暴潮的预测。S. Rajasekaran等9则使用支持向量回归(support 图1中,Lm表示输人层,x=[x1x2x3]T是多层 vector regression,SVR)来对风暴潮进行预报。 感知器输入;Ladm表示隐含层,包含4个神经元,表 现存的基于机器学习的风暴潮预测方法虽不 示为h=[h,h2h3ha]T;Lm是输出层,输出维数为 需要引入风暴潮动力学先验,直接通过数据本身进 3(y=[y1y2y】T)。前向传播是指数据从输入到 行预测,但大都只提取出风暴潮数据间的静态关 输出这个传播过程,可以用式(1)表示: 系,并没有充分挖掘其背后的时序关联特性。递归 h=f(Wix +b) 神经网络[Io-1](recurrent neural network,RNN)中隐 y=f(W2x +b2) (1)》 藏层神经元间相互连接构成有向图,网络状态随时 式中:W,∈R3x4表示输入层和隐含层之间的连接 间变化,耦合了时间参数,非常适合分析具有时序 权重,b,∈R4x1为隐含层的偏置,W2∈R4x3表示 特征的数据。受此启发,本文基于递归神经网络来 进行风暴潮增水预测。风暴潮是随时间变化发展 隐含层和输出层之间的连接权重,b,∈R3x1为输 的,得到的风暴潮数据明显具有时序特性。相比于 出层的偏置。对于激活函数,通常采用双曲正切函 传统的机器学习方法,递归神经网络更加适用于风 数、logistic函数或sigmoid函数,来使网络获得逼近 暴潮预报问题。本文采用递归神经网络进行风 非线性函数的能力。对于多层前馈神经网络的训 暴潮增水过程预测,并在真实数据上进行了实验 练,通常采用著名的误差反向传播(back 验证。 propagation,BP)算法[18),因此也常将多层前馈神经 网络直接称为BP网络。 1原理说明 虽然多层前馈神经网络能够一定程度上解决 1.1前馈神经网络 非线性问题,但其仍然属于静态网络,网络当前时 人工神经网络(artificial neural network,ANN) 刻的输出与上一时刻的输入无关,因此对于具有时
预报方法主要包括诺模图方法和数值预报方法[2] 。 曾德美[3]研究了青岛港的风暴潮概况,提出了青岛 港极值增减水的经验公式。 谢亚力和黄世昌[4] 将 风暴潮经验预报与动力线性模型相结合,建立了经 验预报方程,并在钱塘江风暴潮预报中取得了不错 的效果。 高清清等[2] 通过研究位于长江入海口的 南通单站历史水文气象资料,分析该站的风暴增水 特征,提出了针对该站台风风暴潮经验预报公式。 从 20 世纪 80 年代以来,基于数值模拟方法的 风暴潮预报技术取得了较大的发展和进步。 朱建 荣和朱首贤[5] 将原正交的 ECOM 模式改进为非正 交曲线坐标系下模式,以更好地拟合河岸线的形 状,应用于长江河口、杭州湾及邻近海区,取得了不 错的效果。 黄世昌等[6] 基于河口海岸水动力二维 数值模型,建立起了风暴潮与天文潮相互耦合的数 值模式,可用于浙江沿海增水预测。 王培涛等[7] 提 出了一种基于高级环流模型(ADCIRC)适合台湾海 峡及福建沿海区域的精细化台风风暴潮数值预报 模式。 然而,基于经验和数值的传统风暴潮预报通常 需要研究员对风暴潮的动力学规律具有非常深入 的研究,操作复杂难懂,并且很难建立起相对准确 的模型。 后来,随着计算机技术的发展和大数据时 代的到来,许多学者将基于海量数据的机器学习方 法用于风暴潮预报中。 T. L. Lee [8]将风速、风向、压 强等要素作为输入训练前馈神经网络( feedforward neural network, FNN),用来进行风暴潮的预测。 S. Rajasekaran 等[9] 则 使 用 支 持 向 量 回 归 ( support vector regression, SVR)来对风暴潮进行预报。 现存的基于机器学习的风暴潮预测方法虽不 需要引入风暴潮动力学先验,直接通过数据本身进 行预测,但大都只提取出风暴潮数据间的静态关 系,并没有充分挖掘其背后的时序关联特性。 递归 神经网络[10-12] (recurrent neural network, RNN)中隐 藏层神经元间相互连接构成有向图,网络状态随时 间变化,耦合了时间参数,非常适合分析具有时序 特征的数据。 受此启发,本文基于递归神经网络来 进行风暴潮增水预测。 风暴潮是随时间变化发展 的,得到的风暴潮数据明显具有时序特性。 相比于 传统的机器学习方法,递归神经网络更加适用于风 暴潮预报问题。 本文采用递归神经网络进行风 暴潮增水过程预测,并在真实数据上进行了实验 验证。 1 原理说明 1.1 前馈神经网络 人工神经网络( artificial neural network, ANN) 是一种常用的进行预报的方法。 它是一种应用类 似于大脑神经连接的结构进行信号处理的数学模 型,广泛应用于语音识别、自然语言处理、图像处理 等领域[13-15] 。 目前,在大数据分析中主要采用前馈 神经网络来提取静态数据之间的关系。 前馈神经网络[16] 是一种具有前向结构的人工 神经网络,一般是多层结构,包含输入层、隐含层以 及输出层,隐含层可以有多层。 每一层神经元的输 入是上一层的输出,并通过全连接将其输出传递给 下一层,且整个网络中没有反馈。 每一个神经元可 以是多输入的,但是只有一个输出。 多层前馈神经 网络是感知器的推广,只要有一层包含足够多神经 元的隐含层就能够以任意精度逼近任意复杂度的 连续函数[17] 。 以 3 层前馈神经网络为例,结构如图 1 所示。 图 1 多层感知器 Fig.1 Multi⁃layer perceptron 图 1 中, Lin 表示输入层, x = x1 x2 x3 [ ] T 是多层 感知器输入; Lhidden 表示隐含层,包含 4 个神经元,表 示为 h = h1 h2 h3 h4 [ ] T ; Lout 是输出层,输出维数为 3( y = y1 y2 y3 [ ] T )。 前向传播是指数据从输入到 输出这个传播过程,可以用式(1)表示: h = f W T 1 x + b1 ( ) y = f W T 2 x + b2 ( ) (1) 式中: W1 ∈ ℝ 3×4 表示输入层和隐含层之间的连接 权重, b1 ∈ ℝ 4×1 为隐含层的偏置, W2 ∈ ℝ 4×3 表示 隐含层和输出层之间的连接权重, b2 ∈ ℝ 3×1 为输 出层的偏置。 对于激活函数,通常采用双曲正切函 数、logistic 函数或 sigmoid 函数,来使网络获得逼近 非线性函数的能力。 对于多层前馈神经网络的训 练, 通 常 采 用 著 名 的 误 差 反 向 传 播 ( back propagation, BP)算法[18] ,因此也常将多层前馈神经 网络直接称为 BP 网络。 虽然多层前馈神经网络能够一定程度上解决 非线性问题,但其仍然属于静态网络,网络当前时 刻的输出与上一时刻的输入无关,因此对于具有时 第 5 期 雷森,等:基于递归神经网络的风暴潮增水预测 ·641·
·642. 智能系统学报 第12卷 序特征的数据无能为力。为了解决输入之间前后 若训练样本中包含T个时刻的数据,则递归神 关联的问题,多层前馈神经网络的隐含层不仅需要 经网络将展开成一个包含T个隐含层的前馈神经 接收当前的输入,也要接收上一时刻的输出,由此 网络。理论上来说,递归神经网络可以处理任意长 产生了递归神经网络。 度的序列数据,但是当处理无限长的序列数据时, 1.2递归神经网络 展开的多层前馈神经网络也是无限层的。因此,在 为了克服前馈神经网络无法处理序列数据的 实际应用中通常只假设当前状态与之前有限个状 问题,递归神经网络将隐含层之间的节点相互连 态相关,以降低复杂度。与传统的前馈神经网络不 接,使得隐含层的输入不仅仅是当前时刻输入层的 同的是,展开的递归神经网络有如下特点。 输出还包括了上一时刻隐含层的输出。通过这种 1)每个隐含层的输入都由两部分组成,即对应 方式,递归神经网络可以将当前时刻以前的信息记 时刻输入层的输出和上一时刻隐含层的输出。而 忆在网络之中1。如图2所示,递归神经网络与前 传统前馈神经网络的输入只能是上一层(隐含层或 馈神经网络的结构大致相同,不同之处在于隐含层 输入层)的输出。 之间的连接关系,即增加了隐含层间的权重W。。 2)如图3所示,展开的递归神经网络相同位置 的参数W、b,、W2b2、W是共享的,而传统前馈神 经网络则是非共享的,这也大大地降低了网络所要 学习的参数。 3)对于递归神经网络,每一个时刻都会给出一 个输出,但是并不是必要的,只有t时刻的输出y,才 是模型的预测结果,其余的输出结果都保存在了隐 图2递归神经网络 含层中。 Fig.2 Recurrent neural networks 1.3递归神经网络用于风暴潮增水预测 若Ldn隐含层包含m个神经元,则W。为m× 风暴潮增水数据是一维的时间序列,基于递归 m维的权重矩阵。递归神经网络的传播过程可以用 神经网络进行预报的具体做法如下。 式(2)表示: 假设样本数据为d={d,d2,…,d},利用前k h,=f(Wix Wih-1+b) 个数据作为特征预测下一个数据,则可以组成训练 y =f(Wih,+b2) (2) 样本X和标签y: 式中:W,表示输入层和隐含层之间的连接权重: X={x1,2,…,x-k}= W2表示隐含层和输出层之间的连接权重;b,和b2 {d1,4,…,d4},{d2,4,…d},…,{dr4,d-1…,d-}} 分别表示隐含层和输出层的偏置;x,、h,和y,分别 y={y1,y2,…yr-}={d+1,ds+2,…,dr} 表示第t时刻网络的输入、隐含层输出和网络的输 一般假设当前状态只和前1个状态有关,因此 出;h,表示第t-1时刻隐含层的输出。激活函数一 再将X和y进一步按照状态数目分割,制作最终的 般是双曲正切函数或者Relu函数。 训练样本和相应标签夕。利用和y即可对递归 此外,递归神经网络还可以展开成相对应的多 神经网络进行训练。同理,预测时,按照上述步骤 层前馈神经网络,从而可以使用BPTT(back- 制作测试样本,输入到递归神经网络中获得预测 propagation through time)算法[2o]进行训练,展开过 值,由此实现风暴潮增水预测。 程如图3所示。 递归神经网络 多层前馈神经网路 ={{x1x2,…,x},{x2,x3,…,x1+1},… {xr-s-+1,xr-k-42,…,xr-4}} w.b w b. y={{y1y2,…y},{y2y3,…y+},… W {yr-k-41Jr-k-142,…yr-k} 展开 hidden 2 实验结果 W b 本文的实验数据集是潍坊水站从2008~2014 年记录的风暴潮增水过程数据。每个增水过程共 图3递归神经网络展开过程 历时3天,每隔1记录1个水位数据,总计72个 Fig.3 The unfolding of recurrent neural networks 数据。图4展示了2008年里的2个增水过程
序特征的数据无能为力。 为了解决输入之间前后 关联的问题,多层前馈神经网络的隐含层不仅需要 接收当前的输入,也要接收上一时刻的输出,由此 产生了递归神经网络。 1.2 递归神经网络 为了克服前馈神经网络无法处理序列数据的 问题,递归神经网络将隐含层之间的节点相互连 接,使得隐含层的输入不仅仅是当前时刻输入层的 输出还包括了上一时刻隐含层的输出。 通过这种 方式,递归神经网络可以将当前时刻以前的信息记 忆在网络之中[19] 。 如图 2 所示,递归神经网络与前 馈神经网络的结构大致相同,不同之处在于隐含层 之间的连接关系,即增加了隐含层间的权重 Wh 。 图 2 递归神经网络 Fig.2 Recurrent neural networks 若 Lhidden 隐含层包含 m 个神经元,则 Wh 为 m × m 维的权重矩阵。 递归神经网络的传播过程可以用 式(2)表示: ht = f W T 1 x + W T hht-1 + b1 ( ) y = f W T 2ht + b2 ( ) (2) 式中: W1 表示输入层和隐含层之间的连接权重; W2 表示隐含层和输出层之间的连接权重; b1 和 b2 分别表示隐含层和输出层的偏置;xt、ht 和 yt 分别 表示第 t 时刻网络的输入、隐含层输出和网络的输 出;ht-1表示第 t-1 时刻隐含层的输出。 激活函数一 般是双曲正切函数或者 Relu 函数。 此外,递归神经网络还可以展开成相对应的多 层前 馈 神 经 网 络, 从 而 可 以 使 用 BPTT ( back⁃ propagation through time) 算法[20] 进行训练,展开过 程如图 3 所示。 图 3 递归神经网络展开过程 Fig.3 The unfolding of recurrent neural networks 若训练样本中包含 T 个时刻的数据,则递归神 经网络将展开成一个包含 T 个隐含层的前馈神经 网络。 理论上来说,递归神经网络可以处理任意长 度的序列数据,但是当处理无限长的序列数据时, 展开的多层前馈神经网络也是无限层的。 因此,在 实际应用中通常只假设当前状态与之前有限个状 态相关,以降低复杂度。 与传统的前馈神经网络不 同的是,展开的递归神经网络有如下特点。 1)每个隐含层的输入都由两部分组成,即对应 时刻输入层的输出和上一时刻隐含层的输出。 而 传统前馈神经网络的输入只能是上一层(隐含层或 输入层)的输出。 2)如图 3 所示,展开的递归神经网络相同位置 的参数 W1 、b1 、W2 、b2 、Wh 是共享的,而传统前馈神 经网络则是非共享的,这也大大地降低了网络所要 学习的参数。 3)对于递归神经网络,每一个时刻都会给出一 个输出,但是并不是必要的,只有 t 时刻的输出 yt 才 是模型的预测结果,其余的输出结果都保存在了隐 含层中。 1.3 递归神经网络用于风暴潮增水预测 风暴潮增水数据是一维的时间序列,基于递归 神经网络进行预报的具体做法如下。 假设样本数据为 d = d1 ,d2 ,…,dT { } ,利用前 k 个数据作为特征预测下一个数据,则可以组成训练 样本 X 和标签 y: X = x1 ,x2 ,…,xT-k { } = d1,d2,…,dk { } , d2,d3,…,dk+1 { } ,…, dT-k,dT-k+1,…,dT-1 { { } } y = y1 ,y2 ,…,yT-k { } = dk+1 ,dk+2 ,…,dT { } 一般假设当前状态只和前 l 个状态有关,因此 再将 X 和 y 进一步按照状态数目分割,制作最终的 训练样本 X^ 和相应标签 ^y。 利用 X^ 和 ^y 即可对递归 神经网络进行训练。 同理,预测时,按照上述步骤 制作测试样本,输入到递归神经网络中获得预测 值,由此实现风暴潮增水预测。 X^ = {{x1 ,x2 ,…,xl},{x2 ,x3 ,…,xl+1 },…, {xT-k-l+1 ,xT-k-l+2 ,…,xT-k}} ^y = {{y1 ,y2 ,…,yl},{y2 ,y3 ,…,yl+1 },…, {yT-k-l+1 ,yT-k-l+2 ,…,yT-k}} 2 实验结果 本文的实验数据集是潍坊水站从 2008 ~ 2014 年记录的风暴潮增水过程数据。 每个增水过程共 历时 3 天,每隔 1 h 记录 1 个水位数据,总计 72 个 数据。 图 4 展示了 2008 年里的 2 个增水过程。 ·642· 智 能 系 统 学 报 第 12 卷
第5期 面森,等:基于递归神经网络的风暴潮增水预测 643· 2501 值。对于增水过程中的峰值预报,递归神经网络的 200Y 预测结果较BP神经网络偏离得更小。整体而言, 150 BP神经网络的预测结果波动很大,而递归神经网络 的预测结果则相对平滑。 250 一真实观测值 0 200 递归神经网络预测值 50 150 -100 100 -150 1020304050607080 50 时间h (a)过程1 250 -100 200 -150 150 0 50 100150200250300350 时间h 100 图5递归神经网络3h预测结果 50 Fig.5 The prediction of recurrent neural network for 3 hour later -50 -100 250 一真实观测值 -150 0 BP神经网络预测值 1020304050607080 200 时间h 150 100 (b)过程2 图4风暴潮增水过程 50 Fig.4 The process of storm surge -50 使用递归神经网络进行预测时,时间延迟选3, -100 即输入层的神经单元数目为3,隐含层的神经单元 -150 数目为15。训练时,为了避免因为数据的数量级差 0 50 100150200250300350 别而造成递归神经网络预测误差较大,首先对输入 时间h 数据进行归一化处理,将它们归一化到区间[0,1] 图6 BP神经网络3h预测结果 之中,采用的归一化公式如下: Fig.6 The prediction of back propagation network multilayer perceptron)for 3 hour later 本文采用平均绝对误差(mean absolute error, Xmx -Xmin MAE)来定量地评价预测误差,如下式所示: 式中:元表示数据归一化后的值;x为原始数据的 N 值;x和x。分别表示原始数据中最大值和最小 MAE ,ly:- 值。网络隐含层神经单元的激活函数选用双曲正 切函数,输出层神经单元的激活函数选用线性函数。 式中y,和y:分别表示第i时刻风暴潮增水的真值和 预测值。 本文选取了2008~2013年记录到的31个增水 从表1中可以看出,随着预测时间的延长,递归 过程当作训练数据,训练得到递归神经网络的参 神经网络和BP神经网络的预测误差是逐渐升高 数,并将2014年记录的5个增水过程当作测试数 的。但不管预测时间是多少,递归神经网的预测 据,对3h后的水位进行预测。如图5所示,实线表 精度都优于BP神经网络的预测精度。从中可以看 示真实的观测值,虚线表示用训练好的递归神经网 出,相当于BP神经网络,递归神经网络更加适合于 络预测出的结果。为了便于分析实验结果,将测试 对风暴潮增水进行预测。 数据中的5个增水过程串联在一起进行显示。为了 表12014年增水过程预测的平均绝对误差 更好地验证递归神经网络对风暴潮增水预测的效 Table 1 The mean absolute error of the prediction of 果,图6展示了使用BP神经网络进行预测的结果。 storm surge in 2014 BP神经网络采用与递归神经网络一样的结构,也是 预测时间/h 123 45 6 3个输入层单元,15个隐含层单元。 递归神经网络/cm4.7110.015.721.026.030.3 从图5和图6可以看出,相比于BP神经网络, 递归神经网络的3h预测结果更加接近真实的观测 BP神经网络/cm6.3315.125.234.040.544.5
(a)过程 1 (b)过程 2 图 4 风暴潮增水过程 Fig.4 The process of storm surge 使用递归神经网络进行预测时,时间延迟选 3, 即输入层的神经单元数目为 3,隐含层的神经单元 数目为 15。 训练时,为了避免因为数据的数量级差 别而造成递归神经网络预测误差较大,首先对输入 数据进行归一化处理,将它们归一化到区间[0,1] 之中,采用的归一化公式如下: ^x = x - xmin xmax - xmin 式中: ^x 表示数据归一化后的值; x 为原始数据的 值; xmax 和 xmin 分别表示原始数据中最大值和最小 值。 网络隐含层神经单元的激活函数选用双曲正 切函数,输出层神经单元的激活函数选用线性函数。 本文选取了 2008~ 2013 年记录到的 31 个增水 过程当作训练数据,训练得到递归神经网络的参 数,并将 2014 年记录的 5 个增水过程当作测试数 据,对 3 h 后的水位进行预测。 如图 5 所示,实线表 示真实的观测值,虚线表示用训练好的递归神经网 络预测出的结果。 为了便于分析实验结果,将测试 数据中的 5 个增水过程串联在一起进行显示。 为了 更好地验证递归神经网络对风暴潮增水预测的效 果,图 6 展示了使用 BP 神经网络进行预测的结果。 BP 神经网络采用与递归神经网络一样的结构,也是 3 个输入层单元,15 个隐含层单元。 从图 5 和图 6 可以看出,相比于 BP 神经网络, 递归神经网络的 3 h 预测结果更加接近真实的观测 值。 对于增水过程中的峰值预报,递归神经网络的 预测结果较 BP 神经网络偏离得更小。 整体而言, BP 神经网络的预测结果波动很大,而递归神经网络 的预测结果则相对平滑。 图 5 递归神经网络 3 h 预测结果 Fig.5 The prediction of recurrent neural network for 3 hour later 图 6 BP 神经网络 3 h 预测结果 Fig.6 The prediction of back propagation network (multilayer perceptron) for 3 hour later 本文采用平均绝对误差( mean absolute error, MAE)来定量地评价预测误差,如下式所示: MAE = 1 N∑ N i yi - y ^ i 式中 yi 和 ^yi 分别表示第 i 时刻风暴潮增水的真值和 预测值。 从表 1 中可以看出,随着预测时间的延长,递归 神经网络和 BP 神经网络的预测误差是逐渐升高 的。 但不管预测时间是多少,递归神经网络的预测 精度都优于 BP 神经网络的预测精度。 从中可以看 出,相当于 BP 神经网络,递归神经网络更加适合于 对风暴潮增水进行预测。 表 1 2014 年增水过程预测的平均绝对误差 Table 1 The mean absolute error of the prediction of storm surge in 2014 预测时间/ h 1 2 3 4 5 6 递归神经网络/ cm 4.71 10.0 15.7 21.0 26.0 30.3 BP 神经网络/ cm 6.33 15.1 25.2 34.0 40.5 44.5 第 5 期 雷森,等:基于递归神经网络的风暴潮增水预测 ·643·
.644. 智能系统学报 第12卷 1989,1(2):270-280 3 结束语 [11 ELMAN J L.Finding structure in time J].Cognitive 本文采用递归神经网络对风暴潮增水进行预 science,1990,14(2):179-211. [12]BOTVINICK MM,PLAUT D C.Short-term memory for 测。传统的BP神经网络只能用来提取静态数据之 serial order:a recurrent neural network model [J]. 间的关系,而由于增添了反馈连接,递归神经网络 Psychological review,2006,113(2):201-233. 就更加适合用于时序数据的处理。本文在真实的 [13]SAINATH T N,KINGSBURY B,SAON G,et al.Deep 数据集上进行了验证,结果表明,相对于BP神经网 convolutional neural networks for large-scale speech tasks 络,递归神经网络能更好地对风暴潮增水进行预 [J].Neural networks,2015,64:39-48. 测,误差精度更低。 [14]SARIKAYA R,HINTON G E,DEORAS A,et al. Application of deep belief networks for natural language 在实验中发现,随着预测时间的增加,递归神 understanding[J.IEEE transactions on audio,speech, 经网络预测误差会逐步加大,并且预测结果与真实 and language processing,2014,22(4):778-784. 测量值的相位差会越来越大。如何采取有效的措 [15]KRIZHEVSKY A,SUTSKEVER I,HINTON G E,et al. 施对这一现象进行缓解,是作者下一步需要研究的 ImageNet classification with deep convolutional neural 工作。 networks C ]//International Conference on Neural Information Processing Systems.Nevada,America,2012: 参考文献: 1097-1105. [16]SVOZIL D,KVASNICKA V,POSPICHAL J,et al. [1]王喜年.风暴潮预报知识讲座[J].海洋预报,2001,18 Introduction to multi-layer feed-forward neural networks (1):73-78 [J].Chemometrics and intelligent laboratory systems, [2]高清清,曹兵,高鑫鑫,等.南通沿海台风风暴潮分析及 1997,39(1):43-62. 其经验预报初探[J].海洋预报.2014,31(1):29-35. [17]HORNIK K,STINCHCOMBE M B,WHITE H,et al. GAO Qingqing,CAO Bing,GAO Xinxin,et al.Analysis of the Multilayer feedforward networks are universal approximators typhoon storm surge in the Nantong coastal zone and the [J].Neural networks,1989,2(5):359-366. forecasting formulas[J].Marine forecasts,2014,31(1):29-35. [18]RUMELHART D E,HINTON G E,WILLIAMS R J,et al. [3]曾德美.青岛港风暴潮经验统计预报[J].海洋预报 Learning representations by back-propagating errors[J]. 1992,9(3):66-73. Nature,1988,323(6088):533-536. ZENG Demei.A statistical forecasting of storm surge in 19]KOSMATOPOULOS E B.POLYCARPOU MM.CHRISTODOULOU qingdao harbor[J].Marine forecasts,1992,9(3):66-73. M A,et al.High-order neural network structures for [4]谢亚力,黄世昌.钱塘江河口风暴潮经验预报[J].海洋 identification of dynamical systems[J].IEEE transactions 预报,2006,23(1):54-58. on neural networks,1995,6(2):422-431. XIE Yali,HUANG Shichang.Effects on watercourse and [20]WERBOS P J.Backpropagation through time:what it does hydrological factor in downstrean nanxi river due to water and how to do it[J].Proceedings of the IEEE,1990,78 diversion[J].Marine forecasts,2006,23(1):54-58. (10):1550-1560. [5]朱建荣,朱首贤.ECOM模式的改进及在长江河口、杭州 作者简介: 湾及邻近海区的应用[J].海洋与湖沼,2003,34(4): 雷森,男,1992年生,博士研究生 364-373. 主要研究方向为图像处理、机器学习、 ZHU Jianrong,ZHU Shouxian.Improvement of the ECOM 遥感影像质量提升。 with application to the changjiang river estuary,Hangzhou bay and adjacent waters [J.Oceanologia Et limnologia sinica,2003.34(4):364-373. [6]黄世昌,李玉成,赵鑫,等.浙江沿海超强台风作用下 风暴潮增水数值分析[J].海洋工程,2008,26(3): 58-64. 史振威,男,1977年生,教授,博士 HUANG Shichang,LI Yucheng,ZHAO Xin,et al. 生导师,博士,主要研究方向为图像处 Numerical analysis of storm surge due to a super typhoon in 理、模式识别、机器学习、遥感影像处 coastal region of Zhejiang province [J].The ocean 理。发表SCI国际期刊检索论文70 engineering,2008,26(3):58-64. 余篇。 [7]王培涛,于福江,刘秋兴,等.福建沿海精细化台风风暴 潮集合数值预报技术研究及应用[J].海洋预报,2010 27(5):7-15. [8]LEE T L.Neural network prediction of a storm surge[J] 石天阳,男,1994年生,硕士研究 Ocean engineering,2006,33(3):483-494. 生,主要研究方向为机器学习和人工 [9]RAJASEKARAN S,GAYATHRI S,LEE T L,et al.Support 智能。 vector regression methodology for storm surge predictions[]. 0 cean engineering,2008,35(16):1578-1587 [10]WILIIAMS R J,ZIPSER D.A learning algorithm for continually running fully recurrent neural networks[J.Neural computation
3 结束语 本文采用递归神经网络对风暴潮增水进行预 测。 传统的 BP 神经网络只能用来提取静态数据之 间的关系,而由于增添了反馈连接,递归神经网络 就更加适合用于时序数据的处理。 本文在真实的 数据集上进行了验证,结果表明,相对于 BP 神经网 络,递归神经网络能更好地对风暴潮增水进行预 测,误差精度更低。 在实验中发现,随着预测时间的增加,递归神 经网络预测误差会逐步加大,并且预测结果与真实 测量值的相位差会越来越大。 如何采取有效的措 施对这一现象进行缓解,是作者下一步需要研究的 工作。 参考文献: [1]王喜年. 风暴潮预报知识讲座[ J]. 海洋预报, 2001, 18 (1): 73-78. [2]高清清,曹兵,高鑫鑫,等. 南通沿海台风风暴潮分析及 其经验预报初探[J]. 海洋预报, 2014, 31(1): 29-35. GAO Qingqing, CAO Bing, GAO Xinxin, et al. Analysis of the typhoon storm surge in the Nantong coastal zone and the forecasting formulas[J]. Marine forecasts, 2014, 31(1): 29-35. [3]曾德美. 青岛港风暴潮经验统计预报[ J]. 海洋预报, 1992, 9(3): 66-73. ZENG Demei. A statistical forecasting of storm surge in qingdao harbor[J]. Marine forecasts, 1992, 9(3): 66-73. [4]谢亚力, 黄世昌. 钱塘江河口风暴潮经验预报[ J]. 海洋 预报, 2006, 23(1): 54-58. XIE Yali, HUANG Shichang. Effects on watercourse and hydrological factor in downstrean nanxi river due to water diversion[J]. Marine forecasts, 2006, 23(1): 54-58. [5]朱建荣, 朱首贤. ECOM 模式的改进及在长江河口、杭州 湾及邻近海区的应用[ J]. 海洋与湖沼, 2003, 34( 4): 364-373. ZHU Jianrong, ZHU Shouxian. Improvement of the ECOM with application to the changjiang river estuary, Hangzhou bay and adjacent waters [ J ]. Oceanologia Et limnologia sinica, 2003, 34(4): 364-373. [6]黄世昌, 李玉成, 赵鑫, 等. 浙江沿海超强台风作用下 风暴潮增水数值分析 [ J]. 海洋工程, 2008, 26 ( 3): 58-64. HUANG Shichang, LI Yucheng, ZHAO Xin, et al. Numerical analysis of storm surge due to a super typhoon in coastal region of Zhejiang province [ J ]. The ocean engineering, 2008, 26(3): 58-64. [7]王培涛,于福江,刘秋兴,等. 福建沿海精细化台风风暴 潮集合数值预报技术研究及应用[ J]. 海洋预报,2010, 27(5): 7-15. [8]LEE T L. Neural network prediction of a storm surge[ J]. Ocean engineering, 2006, 33(3): 483-494. [9]RAJASEKARAN S, GAYATHRI S, LEE T L, et al. Support vector regression methodology for storm surge predictions[J]. Ocean engineering, 2008, 35(16): 1578-1587. [10]WILLIAMS R J, ZIPSER D. A learning algorithm for continually running fully recurrent neural networks[J]. Neural computation, 1989, 1(2): 270-280. [11] ELMAN J L. Finding structure in time [ J]. Cognitive science, 1990, 14(2):179-211. [12] BOTVINICK M M, PLAUT D C. Short-term memory for serial order: a recurrent neural network model [ J ]. Psychological review, 2006, 113(2): 201-233. [13] SAINATH T N, KINGSBURY B, SAON G, et al. Deep convolutional neural networks for large⁃scale speech tasks [J]. Neural networks, 2015, 64: 39-48. [14 ] SARIKAYA R, HINTON G E, DEORAS A, et al. Application of deep belief networks for natural language understanding[ J]. IEEE transactions on audio, speech, and language processing, 2014, 22(4): 778-784. [15]KRIZHEVSKY A, SUTSKEVER I, HINTON G E, et al. ImageNet classification with deep convolutional neural networks [ C ] / / International Conference on Neural Information Processing Systems. Nevada, America, 2012: 1097-1105. [16 ] SVOZIL D, KVASNICKA V, POSPICHAL J, et al. Introduction to multi⁃layer feed⁃forward neural networks [ J ]. Chemometrics and intelligent laboratory systems, 1997, 39(1): 43-62. [17] HORNIK K, STINCHCOMBE M B, WHITE H, et al. Multilayer feedforward networks are universal approximators [J]. Neural networks, 1989, 2(5): 359-366. [18]RUMELHART D E, HINTON G E, WILLIAMS R J, et al. Learning representations by back⁃propagating errors [ J]. Nature, 1988, 323(6088): 533-536. [19]KOSMATOPOULOS E B,POLYCARPOU M M,CHRISTODOULOU M A, et al. High⁃order neural network structures for identification of dynamical systems[ J]. IEEE transactions on neural networks, 1995, 6(2): 422-431. [20]WERBOS P J. Backpropagation through time: what it does and how to do it[ J]. Proceedings of the IEEE, 1990, 78 (10): 1550-1560. 作者简介: 雷森,男,1992 年生,博士研究生, 主要研究方向为图像处理、机器学习、 遥感影像质量提升。 史振威,男,1977 年生,教授,博士 生导师,博士,主要研究方向为图像处 理、模式识别、机器学习、遥感影像处 理。 发表 SCI 国 际 期 刊 检 索 论 文 70 余篇。 石天阳,男,1994 年生,硕士研究 生,主要研究方向为机器学习和人工 智能。 ·644· 智 能 系 统 学 报 第 12 卷