正在加载图片...
王鼎:一类离散动态系统基于事件的迭代神经控制 417. 0.6 式中,状态向量为x()=[x1(),x2(k)],控制变量是 0.5 ().为了解决事件驱动最优控制问题,这里除了 P=2L,x(0)=[1,-1T,以及在[-1,1]中随机选择执 0.4 行网络的初始权值之外,其他主要参数的设置都 与例1一样.在进行300轮迭代运算之后,代价函 数的收敛性如图8所示.与文献24不同的是,本 e, 文的方法可以很好地观察迭代代价函数的收敛性 0.1 当关注值函数学习过程时,对收敛性能的观测就 很有意义.实际上,这也是事件驱动环境下离散动 50100 150200250300350400450500 态系统迭代自适应评判算法的优点之一. Time index 0.8 图5触发阈值(例1) 0.7 Fig.5 Triggering threshold(Example 1) 0.6 ---Case2 0.6 ●ase 0.5 0.4 02 0.1 03 0 50 100150200250300 0.1 Iteration index 图8迭代代价函数的收敛性(例2) 0.1 Fig.8 Convergence of the iterative cost function(Example 2) 0 50100150200250300350400450500 Time index 分别考虑基于事件和基于时间的控制模式,图9 图6两种情况下的控制输人(例1) 给出两种情况下的状态轨迹.可以看到,图9中的 Fig.6 Control input of the two cases (Example 1) 两条轨迹非常接近,都具有很好的稳定效果.此外, 触发阈值和控制输入分别如图10和图11所示.与 状态曲线不同,两种情况下的控制轨迹具有明显 10 区别.在这个例子中,基于时间和基于事件框架的 控制输入分别更新了300次和85次,这里的驱动 时刻间隔如图12所示.也就是说,事件驱动结构使 6 得控制信号更新次数下降了71.67%.上述仿真结 果表明,基于事件的设计策略在保持较好稳定性能 的前提下,可以有效地减少控制信号的更新次数 ---·Case2 -0.1 -Case I 050100150200250300350400450500 -0.2 Time index -0.3 图7驱动时刻间隔(例1) -0.4 Fig.7 Triggering interval (Example 1) -0.5 率确实得以提高 -0.6 例2这里引入非线性因素,考虑如下离散时间 0.7 -0.8 非线性系统 -0.9 -0.5cos(1.4x2(k)sin(0.4x1(k) x(k+1)= 102 0.2 0.40.6 0.8 1.0 0.1x3(k) x1(k)+0.03x2() 0 u(k) 图9:两种情况下的状态轨迹(例2) -0.1x1(k)+x2(k) 0.008 (39) Fig.9 State trajectory of the two cases(Example 2)率确实得以提高. 例 2 这里引入非线性因素, 考虑如下离散时间 非线性系统 x(k+1) = [ −0.5 cos(1.4x2(k)) sin(0.4x1(k)) 0.1x 2 2 (k) ] + [ x1(k)+0.03x2(k) −0.1x1(k)+ x2(k) ] + [ 0 0.008 ] u(k) (39) x(k) = [x1(k), x2(k)]T u(k) P = 2I x(0) = [1,−1]T [−1,1] 式中, 状态向量为 , 控制变量是 . 为了解决事件驱动最优控制问题, 这里除了 , , 以及在 中随机选择执 行网络的初始权值之外, 其他主要参数的设置都 与例 1 一样. 在进行 300 轮迭代运算之后, 代价函 数的收敛性如图 8 所示. 与文献 [24] 不同的是, 本 文的方法可以很好地观察迭代代价函数的收敛性. 当关注值函数学习过程时, 对收敛性能的观测就 很有意义. 实际上, 这也是事件驱动环境下离散动 态系统迭代自适应评判算法的优点之一. 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 Iteration index Cost function 150 200 250 300 图 8    迭代代价函数的收敛性 (例 2) Fig.8    Convergence of the iterative cost function (Example 2) 分别考虑基于事件和基于时间的控制模式, 图 9 给出两种情况下的状态轨迹. 可以看到, 图 9 中的 两条轨迹非常接近, 都具有很好的稳定效果. 此外, 触发阈值和控制输入分别如图 10 和图 11 所示. 与 状态曲线不同, 两种情况下的控制轨迹具有明显 区别. 在这个例子中, 基于时间和基于事件框架的 控制输入分别更新了 300 次和 85 次, 这里的驱动 时刻间隔如图 12 所示. 也就是说, 事件驱动结构使 得控制信号更新次数下降了 71.67%. 上述仿真结 果表明, 基于事件的设计策略在保持较好稳定性能 的前提下, 可以有效地减少控制信号的更新次数. 0 −0.1 −0.2 −0.3 −0.4 −0.5 −0.6 −0.7 −0.8 −0.9 −1.0−0.2 0 0.2 0.4 x1 x2 0.6 Case 2 Case 1 0.8 1.0 图 9    两种情况下的状态轨迹 (例 2) Fig.9    State trajectory of the two cases (Example 2) 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 200 250 Time index Threshold 300 350 400 450 500 图 5    触发阈值 (例 1) Fig.5    Triggering threshold (Example 1) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 200 250 Time index Case 2 Case 1 Control input 300 350 400 450 500 −0.1 图 6    两种情况下的控制输入 (例 1) Fig.6    Control input of the two cases (Example 1) 12 10 8 6 4 2 0 0 50 100 150 Time index Triggering interval 200 250 300 350 400 450 500 图 7    驱动时刻间隔 (例 1) Fig.7    Triggering interval (Example 1) 王    鼎: 一类离散动态系统基于事件的迭代神经控制 · 417 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有