率确实得以提高. 例 2 这里引入非线性因素, 考虑如下离散时间

正在加载图片...

王鼎：一类离散动态系统基于事件的迭代神经控制 417. 0.6 式中，状态向量为x()=[x1(),x2(k)],控制变量是 0.5 ().为了解决事件驱动最优控制问题，这里除了 P=2L,x(0)=[1,-1T,以及在[-1,1]中随机选择执 0.4 行网络的初始权值之外，其他主要参数的设置都与例1一样.在进行300轮迭代运算之后，代价函数的收敛性如图8所示.与文献24不同的是，本 e, 文的方法可以很好地观察迭代代价函数的收敛性 0.1 当关注值函数学习过程时，对收敛性能的观测就很有意义.实际上，这也是事件驱动环境下离散动 50100 150200250300350400450500 态系统迭代自适应评判算法的优点之一. Time index 0.8 图5触发阈值（例1） 0.7 Fig.5 Triggering threshold(Example 1) 0.6 ---Case2 0.6 ●ase 0.5 0.4 02 0.1 03 0 50 100150200250300 0.1 Iteration index 图8迭代代价函数的收敛性（例2） 0.1 Fig.8 Convergence of the iterative cost function(Example 2) 0 50100150200250300350400450500 Time index 分别考虑基于事件和基于时间的控制模式，图9 图6两种情况下的控制输人（例1）给出两种情况下的状态轨迹.可以看到，图9中的 Fig.6 Control input of the two cases (Example 1) 两条轨迹非常接近，都具有很好的稳定效果.此外，触发阈值和控制输入分别如图10和图11所示.与状态曲线不同，两种情况下的控制轨迹具有明显 10 区别.在这个例子中，基于时间和基于事件框架的控制输入分别更新了300次和85次，这里的驱动时刻间隔如图12所示.也就是说，事件驱动结构使 6 得控制信号更新次数下降了71.67%.上述仿真结果表明，基于事件的设计策略在保持较好稳定性能的前提下，可以有效地减少控制信号的更新次数 ---·Case2 -0.1 -Case I 050100150200250300350400450500 -0.2 Time index -0.3 图7驱动时刻间隔（例1） -0.4 Fig.7 Triggering interval (Example 1) -0.5 率确实得以提高 -0.6 例2这里引入非线性因素，考虑如下离散时间 0.7 -0.8 非线性系统 -0.9 -0.5cos(1.4x2(k)sin(0.4x1(k) x(k+1)= 102 0.2 0.40.6 0.8 1.0 0.1x3(k) x1(k)+0.03x2() 0 u(k) 图9：两种情况下的状态轨迹（例2） -0.1x1(k)+x2(k) 0.008 (39) Fig.9 State trajectory of the two cases(Example 2)率确实得以提高. 例 2 这里引入非线性因素, 考虑如下离散时间非线性系统 x(k+1) = [ −0.5 cos(1.4x2(k)) sin(0.4x1(k)) 0.1x 2 2 (k) ] + [ x1(k)+0.03x2(k) −0.1x1(k)+ x2(k) ] + [ 0 0.008 ] u(k) （39） x(k) = [x1(k), x2(k)]T u(k) P = 2I x(0) = [1,−1]T [−1,1] 式中, 状态向量为 , 控制变量是 . 为了解决事件驱动最优控制问题, 这里除了 , , 以及在中随机选择执行网络的初始权值之外, 其他主要参数的设置都与例 1 一样. 在进行 300 轮迭代运算之后, 代价函数的收敛性如图 8 所示. 与文献 [24] 不同的是, 本文的方法可以很好地观察迭代代价函数的收敛性. 当关注值函数学习过程时, 对收敛性能的观测就很有意义. 实际上, 这也是事件驱动环境下离散动态系统迭代自适应评判算法的优点之一. 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 Iteration index Cost function 150 200 250 300 图 8 迭代代价函数的收敛性 (例 2) Fig.8 Convergence of the iterative cost function (Example 2) 分别考虑基于事件和基于时间的控制模式, 图 9 给出两种情况下的状态轨迹. 可以看到, 图 9 中的两条轨迹非常接近, 都具有很好的稳定效果. 此外, 触发阈值和控制输入分别如图 10 和图 11 所示. 与状态曲线不同, 两种情况下的控制轨迹具有明显区别. 在这个例子中, 基于时间和基于事件框架的控制输入分别更新了 300 次和 85 次, 这里的驱动时刻间隔如图 12 所示. 也就是说, 事件驱动结构使得控制信号更新次数下降了 71.67%. 上述仿真结果表明, 基于事件的设计策略在保持较好稳定性能的前提下, 可以有效地减少控制信号的更新次数. 0 −0.1 −0.2 −0.3 −0.4 −0.5 −0.6 −0.7 −0.8 −0.9 −1.0−0.2 0 0.2 0.4 x1 x2 0.6 Case 2 Case 1 0.8 1.0 图 9 两种情况下的状态轨迹 (例 2) Fig.9 State trajectory of the two cases (Example 2) 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 200 250 Time index Threshold 300 350 400 450 500 图 5 触发阈值 (例 1) Fig.5 Triggering threshold (Example 1) 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 200 250 Time index Case 2 Case 1 Control input 300 350 400 450 500 −0.1 图 6 两种情况下的控制输入 (例 1) Fig.6 Control input of the two cases (Example 1) 12 10 8 6 4 2 0 0 50 100 150 Time index Triggering interval 200 250 300 350 400 450 500 图 7 驱动时刻间隔 (例 1) Fig.7 Triggering interval (Example 1) 王鼎：一类离散动态系统基于事件的迭代神经控制 · 417 ·

<<向上翻页向下翻页>>

点击下载：《工程科学学报》：一类离散动态系统基于事件的迭代神经控制