序特征的数据无能为力。为了解决输入之间前后关联的问题，多层前馈神经网络

正在加载图片...

·642. 智能系统学报第12卷序特征的数据无能为力。为了解决输入之间前后若训练样本中包含T个时刻的数据，则递归神关联的问题，多层前馈神经网络的隐含层不仅需要经网络将展开成一个包含T个隐含层的前馈神经接收当前的输入，也要接收上一时刻的输出，由此网络。理论上来说，递归神经网络可以处理任意长产生了递归神经网络。度的序列数据，但是当处理无限长的序列数据时， 1.2递归神经网络展开的多层前馈神经网络也是无限层的。因此，在为了克服前馈神经网络无法处理序列数据的实际应用中通常只假设当前状态与之前有限个状问题，递归神经网络将隐含层之间的节点相互连态相关，以降低复杂度。与传统的前馈神经网络不接，使得隐含层的输入不仅仅是当前时刻输入层的同的是，展开的递归神经网络有如下特点。输出还包括了上一时刻隐含层的输出。通过这种 1)每个隐含层的输入都由两部分组成，即对应方式，递归神经网络可以将当前时刻以前的信息记时刻输入层的输出和上一时刻隐含层的输出。而忆在网络之中1。如图2所示，递归神经网络与前传统前馈神经网络的输入只能是上一层（隐含层或馈神经网络的结构大致相同，不同之处在于隐含层输入层)的输出。之间的连接关系，即增加了隐含层间的权重W。。 2)如图3所示，展开的递归神经网络相同位置的参数W、b,、W2b2、W是共享的，而传统前馈神经网络则是非共享的，这也大大地降低了网络所要学习的参数。 3)对于递归神经网络，每一个时刻都会给出一个输出，但是并不是必要的，只有t时刻的输出y,才是模型的预测结果，其余的输出结果都保存在了隐图2递归神经网络含层中。 Fig.2 Recurrent neural networks 1.3递归神经网络用于风暴潮增水预测若Ldn隐含层包含m个神经元，则W。为m× 风暴潮增水数据是一维的时间序列，基于递归 m维的权重矩阵。递归神经网络的传播过程可以用神经网络进行预报的具体做法如下。式(2)表示：假设样本数据为d={d,d2,…,d},利用前k h,=f(Wix Wih-1+b) 个数据作为特征预测下一个数据，则可以组成训练 y =f(Wih,+b2) (2) 样本X和标签y: 式中：W,表示输入层和隐含层之间的连接权重： X={x1,2,…,x-k}= W2表示隐含层和输出层之间的连接权重；b,和b2 {d1,4,…,d4},{d2,4,…d},…,{dr4,d-1…,d-}} 分别表示隐含层和输出层的偏置；x,、h,和y,分别 y={y1,y2,…yr-}={d+1,ds+2,…,dr} 表示第t时刻网络的输入、隐含层输出和网络的输一般假设当前状态只和前1个状态有关，因此出；h,表示第t-1时刻隐含层的输出。激活函数一再将X和y进一步按照状态数目分割，制作最终的般是双曲正切函数或者Relu函数。训练样本和相应标签夕。利用和y即可对递归此外，递归神经网络还可以展开成相对应的多神经网络进行训练。同理，预测时，按照上述步骤层前馈神经网络，从而可以使用BPTT(back- 制作测试样本，输入到递归神经网络中获得预测 propagation through time)算法[2o]进行训练，展开过值，由此实现风暴潮增水预测。程如图3所示。递归神经网络多层前馈神经网路 ={{x1x2,…,x},{x2,x3,…,x1+1},… {xr-s-+1,xr-k-42,…,xr-4}} w.b w b. y={{y1y2,…y},{y2y3,…y+},… W {yr-k-41Jr-k-142,…yr-k} 展开 hidden 2 实验结果 W b 本文的实验数据集是潍坊水站从2008~2014 年记录的风暴潮增水过程数据。每个增水过程共图3递归神经网络展开过程历时3天，每隔1记录1个水位数据，总计72个 Fig.3 The unfolding of recurrent neural networks 数据。图4展示了2008年里的2个增水过程。序特征的数据无能为力。为了解决输入之间前后关联的问题，多层前馈神经网络的隐含层不仅需要接收当前的输入，也要接收上一时刻的输出，由此产生了递归神经网络。１．２递归神经网络为了克服前馈神经网络无法处理序列数据的问题，递归神经网络将隐含层之间的节点相互连接，使得隐含层的输入不仅仅是当前时刻输入层的输出还包括了上一时刻隐含层的输出。通过这种方式，递归神经网络可以将当前时刻以前的信息记忆在网络之中［１９］。如图２所示，递归神经网络与前馈神经网络的结构大致相同，不同之处在于隐含层之间的连接关系，即增加了隐含层间的权重Ｗｈ。图２递归神经网络Ｆｉｇ．２Ｒｅｃｕｒｒｅｎｔｎｅｕｒａｌｎｅｔｗｏｒｋｓ若Ｌｈｉｄｄｅｎ隐含层包含ｍ个神经元，则Ｗｈ为ｍ × ｍ维的权重矩阵。递归神经网络的传播过程可以用式（２）表示：ｈｔ＝ｆＷＴ１ｘ＋ＷＴｈｈｔ－１＋ｂ１ ( ) ｙ＝ｆＷＴ２ｈｔ＋ｂ２ ( ) （２）式中：Ｗ１表示输入层和隐含层之间的连接权重；Ｗ２表示隐含层和输出层之间的连接权重；ｂ１和ｂ２分别表示隐含层和输出层的偏置；ｘｔ、ｈｔ和ｙｔ分别表示第ｔ时刻网络的输入、隐含层输出和网络的输出；ｈｔ－１表示第ｔ－１时刻隐含层的输出。激活函数一般是双曲正切函数或者Ｒｅｌｕ函数。此外，递归神经网络还可以展开成相对应的多层前馈神经网络，从而可以使用ＢＰＴＴ（ｂａｃｋ⁃ ｐｒｏｐａｇａｔｉｏｎｔｈｒｏｕｇｈｔｉｍｅ）算法［２０］进行训练，展开过程如图３所示。图３递归神经网络展开过程Ｆｉｇ．３Ｔｈｅｕｎｆｏｌｄｉｎｇｏｆｒｅｃｕｒｒｅｎｔｎｅｕｒａｌｎｅｔｗｏｒｋｓ若训练样本中包含Ｔ个时刻的数据，则递归神经网络将展开成一个包含Ｔ个隐含层的前馈神经网络。理论上来说，递归神经网络可以处理任意长度的序列数据，但是当处理无限长的序列数据时，展开的多层前馈神经网络也是无限层的。因此，在实际应用中通常只假设当前状态与之前有限个状态相关，以降低复杂度。与传统的前馈神经网络不同的是，展开的递归神经网络有如下特点。１）每个隐含层的输入都由两部分组成，即对应时刻输入层的输出和上一时刻隐含层的输出。而传统前馈神经网络的输入只能是上一层（隐含层或输入层）的输出。２）如图３所示，展开的递归神经网络相同位置的参数Ｗ１、ｂ１、Ｗ２、ｂ２、Ｗｈ是共享的，而传统前馈神经网络则是非共享的，这也大大地降低了网络所要学习的参数。３）对于递归神经网络，每一个时刻都会给出一个输出，但是并不是必要的，只有ｔ时刻的输出ｙｔ才是模型的预测结果，其余的输出结果都保存在了隐含层中。１．３递归神经网络用于风暴潮增水预测风暴潮增水数据是一维的时间序列，基于递归神经网络进行预报的具体做法如下。假设样本数据为ｄ＝ｄ１，ｄ２，…，ｄＴ { } ，利用前ｋ个数据作为特征预测下一个数据，则可以组成训练样本Ｘ和标签ｙ：Ｘ＝ｘ１，ｘ２，…，ｘＴ－ｋ { } ＝ｄ１，ｄ２，…，ｄｋ { } ，ｄ２，ｄ３，…，ｄｋ＋１ { } ，…，ｄＴ－ｋ，ｄＴ－ｋ＋１，…，ｄＴ－１ { { } } ｙ＝ｙ１，ｙ２，…，ｙＴ－ｋ { } ＝ｄｋ＋１，ｄｋ＋２，…，ｄＴ { } 一般假设当前状态只和前ｌ个状态有关，因此再将Ｘ和ｙ进一步按照状态数目分割，制作最终的训练样本Ｘ＾和相应标签＾ｙ。利用Ｘ＾和＾ｙ即可对递归神经网络进行训练。同理，预测时，按照上述步骤制作测试样本，输入到递归神经网络中获得预测值，由此实现风暴潮增水预测。Ｘ＾＝｛｛ｘ１，ｘ２，…，ｘｌ｝，｛ｘ２，ｘ３，…，ｘｌ＋１｝，…，｛ｘＴ－ｋ－ｌ＋１，ｘＴ－ｋ－ｌ＋２，…，ｘＴ－ｋ｝｝＾ｙ＝｛｛ｙ１，ｙ２，…，ｙｌ｝，｛ｙ２，ｙ３，…，ｙｌ＋１｝，…，｛ｙＴ－ｋ－ｌ＋１，ｙＴ－ｋ－ｌ＋２，…，ｙＴ－ｋ｝｝２实验结果本文的实验数据集是潍坊水站从２００８～２０１４年记录的风暴潮增水过程数据。每个增水过程共历时３天，每隔１ｈ记录１个水位数据，总计７２个数据。图４展示了２００８年里的２个增水过程。 ·６４２· 智能系统学报第１２卷

<<向上翻页向下翻页>>

点击下载：【智能系统】基于递归神经网络的风暴潮增水预测