正在加载图片...
第1期 杨博等:面向匹配决策问题的漏整合神经元稀疏ESN网络 7 式即可从状态池中读取所需的状态,其参数学习过 输出;隐层中的神经元完全随机连接,包含反馈连接 程则仅需调节输出连接权.目前ESN网络己被广泛 和自连接.根据脑科学的观点,自然界中的网络是 地应用于时间序列的逼近与预测任务中) 稀疏的,其连接度很低.参照这一观点,设计ESN网 在决策任务中,匹配决策问题一直是人们研究 络输入层与隐层稀疏连接,连接度αp=0.5:隐层 的热点,国际上有很多学者使用了各种模型对此类 内神经元间也是稀疏连接,连接度α=0.1.这些 问题进行建模0;但这些模型对网络结构的要求 数据与脑科学中的实验结果相吻合;输出层与隐层 较为严格,甚至是特殊设计,并不符合生物神经网络 之间随机全连接.这样构建的ESN网络结构如图2 的结构特点.本文则试图通过构建一种更加接近生 所示 物神经网络特性的模型来解释匹配决策问题 输入层 隐层 输出层 1 一种具有漏整合神经元的稀疏ESN网络 发放 1.1问题描述 人类日常的决策过程常常包含短期记忆.为了 解该记忆在决策过程中的作用,生理学家设计了两 类典型的实验模式:一类是判断之后的刺激与前一 反馈连接 个刺激是否相同,其中第二个刺激在一个时延后给 图2本文使用的ESN模型示意图 出(match-to-sample,配对);另一类是给定两个连续 Fig.2 ESN structure used in this paper 的刺激后,需要判断这两个刺激是否属于同一类别 (match/.non-match decision,匹配决策).前一类任务 漏整合神经元(leaky integrator)在递归神经网 只需要知道刺激是否发生了重复,而匹配决策任务 络中有着广泛的应用四.该神经元可记忆之前的历 则还需要对刺激进行合适的分类,并根据分类结果 史状态,因此可用来改善网络对缓慢变化时间序列 给出两个刺激是否属于同一类别的判断结果. 学习和分类的性能.使用的漏整合神经元更新方程 本文将刺激简化为神经元发放来对匹配决策问 有两种,分别在激发函数前和后使用.这里使用前 题进行建模.假设存在两个输入序列A和B.当A 者,此时网络的状态空间表达式为 或B序列包含同时两个连续的发放,而另一个序列 =-ax+f(wx+w"Y+w"U+V). 并不包含任何发放,则认为匹配(match);当A或B Y=Wf(X) (2) 序列包含一个发放,另一序列也包含一个发放,则认 式中,X为状态池的状态变量,Y为网络输出,U为 为不匹配(non-match).因此,匹配决策问题可简化 输入,W为隐层连接权矩阵,W为反馈连接权矩 为时间序列模式识别问题,即匹配模式和非匹配模 阵,W为输入连接权矩阵,W为输出连接权矩阵, 式,如图1所示 V为网络噪声,f为神经元激发函数,?和α分别为 时间常数和漏衰减率.当输入为“(冰)时,可以将 式(1)展开为 B B 匹配 不匹配 Xk+)=(1-g)x)+(wx)+ wY(k)+wiU(k)+V(k)). (3) 式中,X()、Y(k)、U()和V(k)分别为网络在第k B 时刻的状态池变量、网络输出、网络输入和网络 噪声 图1神经元脉冲序列的匹配/不匹配模式 Fig.I Match and non-match patterns of neuron spikes 1.3输出权的在线监督学习算法 网络训练时使用了在线监督学习算法回,该算 1.2网络结构 法被证明是收敛的,具体证明过程参见文献4].算 这里使用ESN网络来构建模型.输入层包含两 法的具体步骤描述如下. 个神经元,分别输入两组待识别的输入序列:输出层 (1)初始状态:X和Y置为0,随机选取“的 包含一个神经元,用于从状态池中读取状态并产生 值,满足均匀分布:定义P(0)=I·(1/a),I为N×N第 1 期 杨 博等: 面向匹配决策问题的漏整合神经元稀疏 ESN 网络 式即可从状态池中读取所需的状态,其参数学习过 程则仅需调节输出连接权. 目前 ESN 网络已被广泛 地应用于时间序列的逼近与预测任务中[7--9]. 在决策任务中,匹配决策问题一直是人们研究 的热点,国际上有很多学者使用了各种模型对此类 问题进行建模[10--11]; 但这些模型对网络结构的要求 较为严格,甚至是特殊设计,并不符合生物神经网络 的结构特点. 本文则试图通过构建一种更加接近生 物神经网络特性的模型来解释匹配决策问题. 1 一种具有漏整合神经元的稀疏 ESN 网络 发放 1. 1 问题描述 人类日常的决策过程常常包含短期记忆. 为了 解该记忆在决策过程中的作用,生理学家设计了两 类典型的实验模式: 一类是判断之后的刺激与前一 个刺激是否相同,其中第二个刺激在一个时延后给 出( match-to-sample,配对) ; 另一类是给定两个连续 的刺激后,需要判断这两个刺激是否属于同一类别 ( match /non-match decision,匹配决策) . 前一类任务 只需要知道刺激是否发生了重复,而匹配决策任务 则还需要对刺激进行合适的分类,并根据分类结果 给出两个刺激是否属于同一类别的判断结果. 本文将刺激简化为神经元发放来对匹配决策问 题进行建模. 假设存在两个输入序列 A 和 B. 当 A 或 B 序列包含同时两个连续的发放,而另一个序列 并不包含任何发放,则认为匹配( match) ; 当 A 或 B 序列包含一个发放,另一序列也包含一个发放,则认 为不匹配( non-match) . 因此,匹配决策问题可简化 为时间序列模式识别问题,即匹配模式和非匹配模 式,如图 1 所示. 图 1 神经元脉冲序列的匹配/不匹配模式 Fig. 1 Match and non-match patterns of neuron spikes 1. 2 网络结构 这里使用 ESN 网络来构建模型. 输入层包含两 个神经元,分别输入两组待识别的输入序列; 输出层 包含一个神经元,用于从状态池中读取状态并产生 输出; 隐层中的神经元完全随机连接,包含反馈连接 和自连接. 根据脑科学的观点,自然界中的网络是 稀疏的,其连接度很低. 参照这一观点,设计 ESN 网 络输入层与隐层稀疏连接,连接度 αinput = 0. 5; 隐层 内神经元间也是稀疏连接,连接度 αres = 0. 1. 这些 数据与脑科学中的实验结果相吻合; 输出层与隐层 之间随机全连接. 这样构建的 ESN 网络结构如图 2 所示. 图 2 本文使用的 ESN 模型示意图 Fig. 2 ESN structure used in this paper 漏整合神经元( leaky integrator) 在递归神经网 络中有着广泛的应用[4]. 该神经元可记忆之前的历 史状态,因此可用来改善网络对缓慢变化时间序列 学习和分类的性能. 使用的漏整合神经元更新方程 有两种,分别在激发函数前和后使用. 这里使用前 者,此时网络的状态空间表达式为 τ dX dt = - αX + f( Wres X + Wfb Y + Win U + V) ,( 1) Y = Wout f( X) . ( 2) 式中,X 为状态池的状态变量,Y 为网络输出,U 为 输入,Wres 为隐层连接权矩阵,Wfb 为反馈连接权矩 阵,Win 为输入连接权矩阵,Wout 为输出连接权矩阵, V 为网络噪声,f 为神经元激发函数,τ 和 α 分别为 时间常数和漏衰减率. 当输入为 u( δk) 时,可以将 式( 1) 展开为 X( k + 1) = ( 1 - δα ) τ X( k) + δ τ ·f( Wres X( k) + Wfb Y( k) + Win U( k) + V( k) ) . ( 3) 式中,X( k) 、Y( k) 、U( k) 和 V( k) 分别为网络在第 k 时刻的状态池变量、网 络 输 出、网络输入和网络 噪声. 1. 3 输出权的在线监督学习算法 网络训练时使用了在线监督学习算法[4],该算 法被证明是收敛的,具体证明过程参见文献[4]. 算 法的具体步骤描述如下. ( 1) 初始状态: X 和 Y 置为 0,随机选取 Wout 的 值,满足均匀分布; 定义 P( 0) = I·( 1 /α) ,I 为 N × N ·7·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有