电子科技大学：《先进控制技术 Advanced Control Technology》课程教学资源（课件讲稿）05 迭代学习控制.pdf_大学文库

第9章选代举习控制意代单习控暖合于有为性圆的被对康，过地代整选代举习(Lc,terative Learning Control)的题量录钉由实东控制中存在一类轨迹穿问题，它的控制任务是博找控制牌日*单请Jchiyama于H978年调出。于184年由Arimoto等人最出丁正站某弹拉制同标的放曹。地代学好拉州方线不食酸于菜统的精闲使得被控对象编出山在有限时问瓜止沿著整个期里轨迹实现零开的性的完。这数草请滑落人庄复过根中速来端意常标达到锦最学型，能在地定的时时范圆内.上以常剪单的续实调不纯定性误差林迹球避。这列课琼问是是具有扰战性的控制问题，高的战性盟明合孙客服旋的花制，并高定果草输亮票想轨克，园盟行为的筒单原通。地使海人有、合中黄性*卖量钠工机哪人们在处理实际场合中的重复操作任务时，柱柱依据对象的可重复人快填高精度难典行辣速事任务，其高本量选是对于一个在有限时面一经推出，在为拉州球州测丁广花的提用，动态行为与期望行为的差距来离整决策，通过重复操作，使得对像行周区同上教行盖是库在务的机鼻人，利用前一次或输几次操作时调处代学习控圳仿使具有很的工青景，这业青限招执行请为与期卫行为的配合达到要求。这时，衡量动态行为的渐标是某种满骨的误维物喜正控输入，使海城复任务在下一次操作拉超中触仰界换、喷除、纯泥、搬这体美在务的工最人指◆物号为周意惭标。舞更好，加此不所量复。直更在整十时间区风上输出轨诚章上期量湘国的风眼果集：最控机床，歌流光查地原菜机输树境中使用教迹。的壶标量机峰，由于达代学习控制核物了人魅学习和白我调节的功施，因而是一式中，：e段：”，”分别为系统的状态，输出和输入变量，选代学习控制可分为开环学习和闭环学习。种典型的智能控制方法，经历了三十多年的发展，迷代学习控制已成、小、g山为适当绅数的内量函数，其结构与数数均未知。若期望控开环学习控制的方法是：第k+1次的控制等于第k次控制再加上第k欢为智能控制中具有严格数学抽选的一个分支。日前选代学习控制在学制存在则选代学习控制的日标为：给定期望编出，们和年次运输出误差的校正项。即习算法。收敏性、鲁棒性、学习速度及工程应用研究上取得了很大的行的初始状态1，©要求在给定的时洞：和，】内按照一定的学习控制进煨。算法通过多次重复的运行，使控制输入马，，一，叫，而系统输出，→ s.cin-Lin..( 9.4) 91芯本6圆第k次运行时。式(91)表示为：闭环学习薰略是：取第K+1次运行的误差作为学习的修正项，即设被控对象的动态过程为 (92购 n-uu明 9.5 但.1) 跟踪误差为式中。L为线性城非线性算子。 ()-fsrir).yir-glunokr) -y-0 9.3 1

1 第9章迭代学习控制实际控制中存在一类轨迹跟踪问题，它的控制任务是寻找控制律，使得被控对象输出在有限时间上沿着整个期望轨迹实现零误差轨迹跟踪。这列跟踪问题是具有挑战性的控制问题。人们在处理实际场合中的重复操作任务时，往往依据对象的可重复动态行为与期望行为的差距来调整决策。通过重复操作，使得对象行为与期望行为的配合达到要求。这时，衡量动态行为的指标是某种满意指标。 u t  y t  0,T 迭代学习控制（ILC,Iterative Learning Control）的思想最初由日本学者Uchiyama于1978年提出，于1984年由Arimoto等人做出了开创性的研究。这些学者借鉴人们在重复过程中追求满意指标达到期望行为的简单原理，成功地使得具有强耦合非线性多变量的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法是对于一个在有限时间区间上执行轨迹跟踪任务的机器人，利用前一次或前几次操作时测得的误差信息修正控制输入，使得该重复任务在下一次操作过程中做得更好。如此不断重复，直至在整个时间区间上输出轨迹跟踪上期望轨迹。迭代学习控制适合于具有重复运动性质的被控对象，通过迭代修正达到某种控制目标的改善。迭代学习控制方法不依赖于系统的精确数学模型，能在给定的时间范围内,以非常简单的算法实现不确定性高的非线性强耦合动态系统的控制，并高精度跟踪给定期望轨迹，因而一经推出，就在运动控制领域得到了广泛的运用。迭代学习控制方法具有很强的工程背景，这些背景包括：执行诸如焊接、喷涂、装配、搬运等重复任务的工业机器人；指令信号为周期函数的伺服系统；数控机床；磁盘光盘驱动系统；机械制造中使用的坐标测量机等。由于迭代学习控制模拟了人脑学习和自我调节的功能，因而是一种典型的智能控制方法。经历了三十多年的发展，迭代学习控制已成为智能控制中具有严格数学描述的一个分支。目前,迭代学习控制在学习算法、收敛性、鲁棒性、学习速度及工程应用研究上取得了很大的进展。 9.1 基本原理设被控对象的动态过程为 x x u ( ) ( ( ), ( ), ) t f t t t  ，y x u ( ) ( ( ), ( ), ) t g t t t  (9.1) 式中，、、分别为系统的状态，输出和输入变量，、、为适当维数的向量函数，其结构与参数均未知。若期望控制存在,则迭代学习控制的目标为：给定期望输出和每次运行的初始状态 ,要求在给定的时间内,按照一定的学习控制算法通过多次重复的运行,使控制输入，而系统输出第k 次运行时，式(9.1) 表示为： (9.2) 跟踪误差为 (9.3) n x R  m y R  r u R  f ( ) g ( ) d u ( )t d y ( )t (0) k x t T 0,  d ( ) ( ) k u u t t  d ( ) ( ) k y y t t  ( ) ( ( ), ( ), ) k k k x x u  t f t t t  ( ) ( ( ), ( ), ) k k k y x u t g t t t  d ( ) ( ) ( ) k k e y y t t t   迭代学习控制可分为开环学习和闭环学习。开环学习控制的方法是：第k+1次的控制等于第k次控制再加上第k次输出误差的校正项，即 (9.4) 闭环学习策略是：取第K+1次运行的误差作为学习的修正项，即 (9.5) 式中，L为线性或非线性算子。 1 ( ) L( ( ), ( )) k k k t t t u u e   1 1 ( ) L( ( ), ( )) k k k t t t u u e   

9.2蓄体地代弹习控算接此养，延有南地代学整常法、兼食造代录习量的选、意店于地 932端信同量作单习提时体效市反编前维造代学可法体独博， Arimoto年黄先峰出丁鱼性时变选编基旅的D里选代学习恤到停得边代苹好维木量计控时，只要■比项得特独豆3造代厚用指纳关故球对康的监试进微微号，在地整制批水中，流代平习融焉秋州点马-马元0 9. 立3.1单习常法的晚轻最敏借开抛。口始加和州本减和地地岛。几所有的黄性证则要水州条式中，「为常量州撞矩韩，在D业算法的盖随上相验出真丁P业、输安性使教性何渐究当单习神被接家镇境见什么本并树，地代件是州同的，解进代学牙数地中的抛州间置一直是人地求物周 P列业、PD进代#习撞制牌，从一量童义本滑它打事是PD型进代习州过寸是造定收教的。南地的量定鞋量延了整增学习次量的物，标之一，同前已璃出的地代单习产州算城大多源要家进编欢运行时胸单习拉制掉的绿形式，PD透代学习撞制辣家示为控制保不突放，绳，对于草好性制那桌有，仅仅南具发有标意义地快毒定道载壶对应的地状喜上即喷蜂冰米 )马，0++，价+g:(8刀的。只有使平习址其值才恤置的控为茶意义下量瓷的 (9.8) 整州。轨是时学习州的绿盖木的两求，微学墙在刺出新特单习棒的调墙那镜的始本不荆速上，在用铁地钠常一氧小的城钠式中「、小、￥为学习增拉序，幕放中的满进物惠使用常为开许境时，蓄于对时桌的业银慢。轴由丁批黄的琳并。Arimoto由最物时，是常丝类河白维为单习牡制的海排性具直听究代单习业响。如果使用则常为环地代单习壮铺，如果同时使用市舞曲PD单时，仅新物性核在夏单降下的量史性故条测靠为开东造代学习控响，件作丁项 9.33学习境发询厘 9.34音神闻酒且.4被学嫩毫璃雕地代学习控制仿高实州在选代苹习常独研汽中，其收放绿件盖术上解局在单习次兼：一示处代学习社通地的绳出有律厚的工青最，置此仅仅在无干找 41控前D没计下输出的。圆在实际应用据合，举习次最：+x是篇鼻设有任★实霹常件下时地收业性铜题绳不等韵，还应时地存在各州干找的情形下票考准一个关节的机人，其动结性可以由以下一前中州性缘分方意文的。因此加有使造代学习过福更快地收敏于舞温管具进代学习策的果膝性施。一个得线行静选代学习控制原能敬丁存始物够意捕地控斜将汽中的另一个量要同题。外，还减本硫少存在状喜批地、师声、抛入挑动尊客种干找.鲁叫q54c4+Ggj-r- (9.9) 选代季习控响林视上局一群满钟腔树锐术，大解分学习律厚管正神性何厘时地存在客料干就时透代学可拉响票策的佩性施。具体地式中，4取为共节角位事量，（回a双为最人的性麻，C() 喷丁学习收蒙的充分并，祖收就地皮还局很量。可利用套次学习过视，一十地代单闪控原统局鲁神游，局湘果转在各种有界干枕的形悬中将测的加来球进镇样习过室的速麦。加，禾用高前选代拉响下，其德代教旋物收敏到阑慢克的端纳，可墙这整干找湖雕时老示青化力和哥民力，G(k为力项：为挂力把。为各种提塘和找地。制算波、意境右四于的单习律、用墙前球夏现等方陵来南造 ,意代林建会收敏到用里软速苹习株，可使收敏速度大大加快。世系装要康的速铁造为，件，血，小，续算次输出为， ◆0-小-间- 2

2 9.2 基本迭代学习控制算法 Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律 (9.6) 式中，为常数增益矩阵。在D 型算法的基础上，相继出现了P 型、 PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代学习控制律的特殊形式，PID迭代学习控制律表示为 (9.7) 式中, 、、为学习增益矩阵。算法中的误差信息使用称为开环迭代学习控制，如果使用则称为闭环迭代学习控制，如果同时使用和则称为开闭环迭代学习控制。 1 ( ) ( ) ( ) k k k t t t u u Γe     Γ 1 ( ) ( ) ( ) ( ) ( )d t k k k k k t t t t          0 u u Γe Φe Ψ e Γ Φ Ψ 此外，还有高阶迭代学习控制算法、最优迭代学习控制算法、遗忘因子迭代学习控制算法和反馈-前馈迭代学习控制算法等。 9.3 迭代学习控制的关键技术 9.3.1 学习算法的稳定性和收敛性稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时，迭代学习控制过程才是稳定收敛的。算法的稳定性保证了随着学习次数的增加，控制系统不发散，但是，对于学习控制系统而言，仅仅稳定是没有实际意义的，只有使学习过程收敛到真值，才能保证得到的控制为某种意义下最优的控制。收敛是对学习控制的最基本的要求，多数学者在提出新的学习律的同时，基于被控对象的一些假设，给出了收敛的条件。例如，Arimoto在最初提出PID型学习控制律时，仅针对线性系统在D型学习律下的稳定性和收敛条件作了证明 9.3.2 初始值问题运用迭代学习控制技术设计控制器时，只需要通过重复操作获得的受控对象的误差或误差导数信号。在这种控制技术中，迭代学习总要从某初始点开始，初始点指初始状态或初始输出。几乎所有的收敛性证明都要求初始条件是相同的，解决迭代学习控制理论中的初始条件问题一直是人们追求的目标之一。目前已提出的迭代学习控制算法大多数要求被控系统每次运行时的初始状态在期望轨迹对应的初始状态上，即满足初始条件：（9.8）当系统的初始状态不在期望轨迹上，而在期望轨迹的某一很小的邻域内时，通常把这类问题归结为学习控制的鲁棒性问题研究。 d (0) (0), 0,1,2, k x x k   … 9.3.3 学习速度问题在迭代学习算法研究中，其收敛条件基本上都是在学习次数下给出的。而在实际应用场合，学习次数显然是没有任何实际意义的。因此，如何使迭代学习过程更快地收敛于期望值是迭代学习控制研究中的另一个重要问题。迭代学习控制本质上是一种前馈控制技术，大部分学习律尽管证明了学习收敛的充分条件，但收敛速度还是很慢。可利用多次学习过程中得到的知识来改进后续学习过程的速度，例如，采用高阶迭代控制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造学习律，可使收敛速度大大加快。 k   k   9.3.4 鲁棒性问题迭代学习控制理论的提出有浓厚的工程背景，因此仅仅在无干扰条件下讨论收敛性问题是不够的，还应讨论存在各种干扰的情形下系统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移外，还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地说，一个迭代学习控制系统是鲁棒的，是指系统在各种有界干扰的影响下，其迭代轨迹能收敛到期望轨迹的邻域内，而当这些干扰消除时，迭代轨迹会收敛到期望轨迹。 9.4 机械手轨迹跟踪迭代学习控制仿真实例 9.4.1控制器设计考虑一个关节的机器人，其动态性能可以由以下二阶非线性微分方程描述：（9.9）式中：为关节角位移量，为机器人的惯性矩阵，表示离心力和哥氏力，为重力项，为控制力矩，为各种误差和扰动。设系统所要跟踪的期望轨迹为，。系统第次输出为令。       d D q q C q q q G q τ        , τ n q R   n n D q R  ,  n C q q R     n G q R n τ  R d n τ R yd t t T 0,  yi t e y y i i t t t    d    

3 在学习开始时，系统的初始状态为。学习控制的任务为通过学习控制律设计，使第次运动误差减少。采用三种基于反馈的迭代学习控制律：（1）闭环D型（9.10）（2）闭环PD型：（9.11）（3）指数变增益D型：（9.12） x0 0 ui1 t i 1 ei1 t u u K q q k k k   1 d d 1 t t t t              u u K q q K q q k k k k    1 p d 1 d d 1 t t t t t t                     u u K q q K q q k k k k    1 p d 1 d d 1 t t t t t t                     9.4.2 仿真实例针对二关节机械手，介绍一种机器人PD型反馈迭代学习控制的仿真设计方法。针对二关节机器人控制系统式（9.9），各项表示为： 2 2 ij d       D   2 2 2 11 1 1 2 1 2 1 2 2 1 2 2 cos c c c d d l d l l l l q I I         2 12 21 2 2 1 2 2 2 cos c c d d d l l l q l     2 22 2 2 2 c d d l I   2 2 ij c       C 11 2 c hq   12 1 2 c hq hq     21 1 c hq    22 c  0 2 1 2 2 sin c h m l l q     T G  G G 1 2 干扰项为机器人系统参数为，，，，采用三种闭环迭代学习控制律，其中为D型迭代学习控制，为PD型迭代学习控制，为变增益指数D型迭代学习控制。两个关节的位置指令分别为和，为了保证被控对象初始输出与指令初值一致，取被控对象的初始状态为。取 PD型迭代学习控制，即，仿真结果如图9-1至图9-3所示。 G d l d l q d l q q 1 1 1 2 1 1 2 2 1 2      c c  g cos g cos  G d l q q 2 2 2 1 2   c g cos    T d 0.3sin 0.1 1 e t  t        1 2 d d  1 kg 1 2 l l   0.5m 1 2 l l c c   0.25m 2 1 2 I I    0.1 kg m 2 g  9.81 m/s M  1 M  2 M  3 sin(3 )t cos(3 )t     T x 0 0 3 1 0  M  3 图9-1 20次迭代学习的跟踪过程图9-2 第20次迭代学习的位置跟踪图9-3 20次迭代过程中误差范数的收敛过程

4 9.5 线性时变连续系统迭代学习控制 9.5.1 系统描述 Arimoto等给出了线性时变连续系统（9.13）的开环PID型迭代学习控制律：（9.14）其中，，为学习增益矩阵。                 t t t t t t t t    x A x B u y C x  1       d d d k k k t t t t t             u u Γ L Ψ e Γ L Ψ 9.5.2 控制器设计及收敛性分析定理1 若由式（9.13）和式（9.14）式描述的系统满足如下条件：（1）；（2）每次迭代初始条件一致，即则当时，有，。证明：由式（9.13）及条件式（2）得则，即系统满足初始条件。 I C B Γ    t t t       1 x x y y k 0 1, 2,3, , 0 0     0 0 d k      k   y y k t t   d    t T 0,  y Cx Cx y k k k k   1 1 0 0 0 0           ek 0 0 0,1, 2,    k  非齐次一阶线性微分方程的解为：取，则由于，，则 x A x B u  t t t t t                                            0 0 0 0 0 0 exp d exp d exp d d exp exp exp d exp exp d t t t t t t t t t t                               x C A A B u A C A A B u A C A A B u Φ A t t , exp                     1 1   0 , d t k k k k t t t       x x Φ B u u            d e y y k k t t t         1 d 1 e y y k k t t t                               1 1 1 1 0 , d e e y y C x x C Φ B u u k k k k k k t k k t t t t t t t t t                  即将PID型控制律式（9.14）代入上式，则第k+1次输出的误差为：（9.15）利用分部积分公式，令，有（9.16）将式（9.16）代入式（9.15），得（9.17） 1 1                 0 e e C Φ B u u , d t k k k k t t t t                                  1 0 0 e e C Φ B Γ e L e Ψ e , d d t k k k k k t t t t                          G C B Γ t t ,                                       0 0 0 0 d , , d , d t t t k k k t k k t t t t t                             C B Γ e G e G e C B Γ e G e                                    1 0 0 0 0 , d , d , d d e I C B Γ e G e C Φ B L e C Φ B ψ e t k k k t t k k t t t t t t t t t t                                 将式（9.17）两端取范数，有（9.18）式中根据范数的定义可知，函数的范数为。将式（9.18）两端同乘以，，并考虑到有                                               1 0 0 0 0 1 2 0 0 0 , d , d , d d d d d e I C B Γ e G e C Φ B L e C Φ B ψ e I C B Γ e e e t k k k t t k k t t k k k t t t t t t t t t t t t t t b b                                                        1 , 0, , 0, max sup , , sup , t T t T b t t t            G C Φ B L                  2 , 0, sup , C Φ B ψ t T b t t        : 0,   n f T R      0 sup e t t T f f t       expt   0     0 exp 1 exp d t t       （9.19）根据范数的定义，函数的范数为：由于，，，则有。将式（9.19）的结果应用于下式，得：                                         1 1 1 0 0 0 1 1 1 1 exp d exp exp exp d exp exp d exp 1 1 exp exp exp exp 1 1 exp t t t k k k k k k k t b t b b t t b t b t t t b T b                                                     e e e e e e e  : 0,   n f T R      0 sup t t T f f t e        t T 0,    0,t     0,  k k       e e   

5 其中。即（9.20）                                                 2 2 0 0 0 0 2 0 2 0 2 0 2 2 exp d d exp exp exp d d 1 exp exp exp d 1 exp exp exp d 1 exp exp exp d 1 exp exp 1 exp 1 exp 1 ex t t k k t k t k t k k k t b t b T t b T b t T b t T t b t T b                                                                             e e e e e e e       2 2 p 1 exp k t T b                 e 1 exp 1 exp     0   t T                 2 2 2 0 0 1 exp exp d d t k k T t b b                      e e 则（9.19）和（9.20）代入（9.18），得（9.21）其中。由于，则当取足够大时，可以使。因此。定理得证。如果将控制律式（9.14）中的改为，则为闭环PID型迭代学习控制律。同定理1的证明过程，可证明闭环PID迭代学习控制律。 1 e e k k          2 1 2 1 exp 1 exp T T b b                      1    1 lim 0 ek k   ek  ek 1 9.5.3 仿真实例考虑2输入2输出线性系统：期望跟踪轨迹为             1 1 1 2 2 2 2 3 1 1 1 1 0 1 x t x t u t x t x t u t                                            1 1 2 2 2 0 0 1 y t x t y t x t                        1d 2d sin(3 ) cos(3 ) y t t y t t                t 0,1 由于，取，可满足定理1中的条件（1），在控制律式（9.14）中取，，系统的初始状态为。在chap9_2sim.mdl程序中，选择Simulink的Manual Switch开关，将开关向下，取PD型开环迭代学习控制律，仿真结果见图9-4至9-6所示。将开关向上，采用PD型闭环迭代学习控制律，仿真结果见图9-7至9-9 所示。可见，闭环收敛速度好于开环收敛速度。 2 2 0 1        CB 0.95 0 0 0.95 Γ        2.0 0 0 2.0        L Ψ  0         1 0 2 0 0 0 0 1 x x                图9-4 30次迭代学习的跟踪过程（开环PD控制）图9-5 第30次迭代学习的位置跟踪（开环PD控制）

7 9.6.2 系统描述图9-10为移动机器人运动模型，它在同一根轴上有两个独立的推进轮，机器人在二维空间移动，点代表机器人的当前位置，广义坐标定义为，和为直角坐标系下的坐标，为机器人的方位角。当机器人的标定方向为地理坐标系的横轴正半轴时，定义为0。移动机器人受不完全约束的影响而只能在驱动轮轴的方向运动，点的线速度和角速度定义为和。图9-10 移动机器人运动模型根据图9-10，针对P点，移动机器人的离散运动学方程可由下式描述 • （9.25）其中为采样时间，机器人状态向量为，速度向量为。式（9.25）可写为：（9.26）其中 • （9.27） p p p p p p p p p p ( 1) ( ) cos ( ) 0 ( ) ( 1) ( ) sin ( ) 0 ( ) ( 1) ( ) 0 1 x k x k k v k y k y k T k k k k                                       T T p p p ( ) ( ), ( ), ( ) k x k y k k       q T p p p ( ) ( ), ( ) k v k k       u p q q B q u ( 1) ( ) ( ( ), ) ( ) k k k k k    p p p cos ( ) 0 ( ( ), ) sin ( ) 0 0 1 k k k T k               B q 如图9-10所示，期望轨迹为。运动轨迹跟踪的控制问题就是为确定，使跟踪。线速度和角速度误差分别为：（9.28）（9.29）移动机器人迭代学习控制系统结构如图9-11所示。 pd d d d ( ) ( ), ( ), ( ) , 1 k x k y k k k n         T u( ) ( ), ( ) k v k k   P k( ) d P k( ) v k v k v k     p     p    ( ) ( ) ( ) k k k   图9-11 移动机器人迭代学习控制系统结构移动机器人离散运动学方程可描述如下：（9.30) （9.31) q q B q u ( 1) ( ) ( ( ), ) ( ) ( ), k k k k k k     β y q ( ) ( ) ( ) k k k   γ 其中为状态干扰，为输出测量噪声，为系统输出，。考虑迭代过程，由（9.30）和（9.31）可得：（9.32）（9.33）其中为迭代次数，为离散时间，。，分别代表第次迭代的状态、输入、输出、状态干扰和输出噪声。机器人运动方程（9.32）和（9.33）满足下列性质和假设：性质1：考虑理想情况，取均为零，，则期望轨迹的方程可写为（9.34）（9.35） β( ) k γ( ) k   T y( ) ( ), ( ), ( ) k x k y k k   ( ) ( ), ( ) k v k k     T u ( 1) ( ) ( ( ), ) ( ) ( ), i i i i i q q B q u β k k k k k k     ( ) ( ) ( ) i i i y q γ k k k   i k k n 1, ,  ( ) i q k ( ), ( ), ( ), ( ) i i i i u y β γ k k k k i ( ), ( ) i i β γ k k k N  d d d d q q B u ( 1) ( ) (q ( ), ) ( ), k k k k k    d d y q ( ) ( ), k k 

8 性质2：矩阵函数满足Lipschitz条件：，，为正常数（9.36）性质3：矩阵是有界的 , ,为正常数，矩阵为的满秩矩阵。假设1: ；假设2：干扰和噪声有界（9.37）其中，为正常数。假设3：在每一次迭代中，轨迹都是从的邻域开始，即，，。 1 2 B 1 2 || ( , ) ( , ) || || || B q B q q q k k c    k N  B c ( ( ), ) i B q k k B || ( ( ), ) || i B q k k b  ( ( ), ) i B q k k ( ( ), ) i q k k d ud 1 max || ( ) || k n k b   u  1 1 k n 1 1 k n max max || ( ) || , max max || ( ) || i i i i k b k b           β γ   b b d q (0) 0 d q || (0) (0) || i q q  b 0 q b  0 i 1 9.6.3 控制律设计及收敛性分析迭代学习控制律设计为：（9.38）对于第i次迭代，跟踪误差信号为，和为学习的增益矩阵，满足，，，，。通过控制律（9.38），使状态变量、控制输入、系统输出分别收敛于期望值。 1 1 2 1 ( ) ( ) ( ) ( 1) ( ) ( ) i i i i k k k k k k u u L e L e       d ( ) ( ) ( ) i i e y y k k k   1 L ( ) k 2 L ( ) k 1 1 L || ( ) || L k b  2 2 L || ( ) || L k b  k N  L1 b  0 L2 b  0 ( ) i q k ( ) i u k ( ) i y k 定理 1：考虑离散系统（9.32）和（9.33），满足假设1-3，采用控制律（9.38），则（9.39）对于所有都成立。如果忽略状态干扰，输出噪声和初始状态误差（即），则分别收敛于期望值。如果考虑干扰、噪声和误差的存在，则，，有界，且收敛于的函数。证明：由式（9.34）和（9.32）得： 1 || ( ) ( , ) || 1 i I L B q    k k  ( , ) n i q k R N   0 q b b b 0      d || ( ) ( ) ||| i u u k k  d || ( ) ( ) || i q q k k  d || ( ) ( ) || i y y k k  0 q b b b , ,   （9.40）考虑性质2和3及假设1和2，得令，则对上式进行递推并考虑假设3，得：（9.41）                                                               d d d d d d d d d d 1 1 1 , , , , , , , i i i i i i i i i i i i i i i k k k k k k k k k k k k k k k k q k k k k k k k k k k k k k k k k                                      q q q q B q u q B q u β q B q u B u u u β q B q B q u B q u β             B u B d 1 i i i i k k c b k b k b q q q u           d 2 B u h c b  1 q q u i i i k h k b k b     1 2 B             0 1 1 2 B 2 q 0 k k j k i i j k h b j b h b              q u   • 由（9.38）式得：         1 d 1 d 1 2 1 1 d 2 d 1 1 d 2 d 1 1 1 d d ( ) ( ) ( ) ( ) ( ) ( ) ( 1) ( ) ( ) ( ) ( ) ( 1) ( 1) ( ) ( ) ( ) ( ) ( ) ( 1) ( 1) ( 1) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ( ), ) i i i i i i i i i i i i i i k k k k k k k k k k k k k k k k k k k k k k k k k k k k k k                                  u u u u u L e L e u L y y L y y u L q q γ L q q γ u L q B q u                 d 1 2 1 1 1 1 d d d d 1 1 2 1 1 1 ( ) ( ) ( ( ), ) ( ) ( ) ( ) ( 1) ( ) ( ) ( 1) ( ) ( ) ( ) ( ) ( ( ), ) ( ) ( ( ), ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( 1) ( ) ( i i i i i i i i i i i i i i i i k k k k k k k k k k k k k k k k k k k k k k k k k k k k k k k                               q B q u L β γ L q γ u L q L B q u B q u u u L β γ L q γ u L              1 1 d d 2 1 1 1 2 1 1 1 1 d d 2 1 1 ) ( ) ( ) ( ( ), ) ( ) ( ) ( ( ), ) ( ( ), ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ( ), ) ( ) ( ) ( ) ( ) ( ( ), ) ( ( ), ) ( ) ( ) ( ) ( ) i i i i i i i i i i i i i k k k k k k k k q k k k k k k k k k k k k k k k k k k k k k k k k k                   q L B q u L B q B u L q L β γ L γ I L B q u L q L B q B q u L q L β         1 2 1 ( ) ( ) ( ) ( ) i i i k k k k     γ L γ 利用性质2和假设2，得令，，则将（9.39）和（9.41）代入上式，得 1 1 d 2 1 2 1 1 L L B u L 1 L L ( ) ( ) ( ( ), ) ( ) ( ) ( ) ( ) ( ) i i i i i i k k k k k b k b c b k b k b b b b b             u I L B q u q q q      1 d 1 1 L B u L 2 h b c b b h    (1 ) 1 2 1 L L b b b b b b ( )       2 1 1 1 L 1 1 ( ) ( ) ( ( ), ) ( ) ( ) ( ) i i i i i k k k k k h k b k b u I L B q u q q            0 2 0 1 1 1 1 2 B 2 0 1 1 L 2 B 1 2 q 1 0 ( ) ( ) ( ) ( ) k k j k i i i q j k k j k i j k k h h b j b h b b h b j b h b b                                            u u u u    

9 因此上式两端同乘，取范数，得   2 0 2 1 1 1 1 2 1 1 2 B 0 1 1 L 2 B 1 0 ( ) ( ) ( ) ( ) k k k j i i L q i j k k j i j k k h b h b b h h b j b b h b j b                                u u u u     2 0 2 2 1 1 L q 1 1 1 2 1 B 0 1 1 L 2 B 1 0 1 1 ( ) ( ) ( ) 1 1 1 ( ) 1 1 ( ) k k k i i k j j k j k i j k j j k i j h k k h b b h h b b j b b h b j b                                                                                                                    u u u u     j       • 取，得   max 1,  h2       2 0 2 2 0 2 1 1 1 2 1 1 q 1 B 0 1 1 L 2 B 1 0 1 2 1 q 1 B 2 L 2 B 1 ( ) ( ) 1 / ( ) ( ) 1 / ( ) k j k i i L i j k j k i j n i L i n i h h h b b b b b b h b b h h h b b b b b h b h b b                                                                                             u u u u u u u                2 2 0 2 2 2 2 B 1 B L 1 1 L q 1 2 2 1 L 2 2 1 / 1 / | ( ) 1 / n n i i n h h h b h b b h b b b h h b h b h h                                            u u   即（9.42）其中，根据等比数列有（9.43） • 。         2 2 0 2 2 2 B L 1 B 1 1 L q 1 2 2 1 L 2 2 1 / 1 / 1 ( ) 1 / n n i i n h h b b b h h b b b h h b h b h h                                          u u             1 1 1 1 1 1 2 2 2 2 0 0 0 2 1 1 2 2 2 2 2 2 2 2 2 2 1 1 1 1 1 / ( / ) 1 1 / 1 / / 1 1 j k j k j k k k k j j j k k k k k n h h h h h h h h h h h h h h h                                                                                            k n  1, ,  • 令，则（9.42）变为 • （9.44） • 其中。 • 对（9.44）式进行递推，得 • 取足够大，使，可得 • （9.45）    max 1, ,  h h b b 2 2 B L2  1 ˆ i i     u u          2 2 B 1 2 2 B L 2 1 / ˆ 1 / 1 n n h b h h h b b h                  2 0 2 2 1 L q 1 2 2 B L 2 1 / ( ) 1 / 1 n n h h b b b b h h b b h                      1 1 1 1 0 (1 ) ˆ ˆ ˆ ˆ 1 ˆ i i i j i i j                    u u u        ˆ  1 lim || || 1 ˆ i i       u • 同理, （9.41)式两端同时乘以，得 • 由于，，并利用（9.43）式，得 • 将式（9.45）代入上式，得 • （9.46） • 将（9.35)式减（9.33)式，得 0 1 1 2 2 B q 0 1 1 1 1 | ( ) ( ) k j j k j k k i i j h h k b j b b                                                   q u    1 j b b           2 1 h           0 0 2 2 2 B q B q 2 2 2 1 / 1 / 1 / n n n i i i h h h b b b b b b h h h                        q u u    y y y q q γ q γ  i i i i i i k k k k k k k k         d d        ( ) ( ) ( )     y y y q q γ q γ  i i i i i i k k k k k k k k         d d        ( ) ( ) ( )     • 将（9.35)式减（9.33)式，得 • 将上式两端同时乘以得到 • 将（9.46）代入上式，得 • （9.47） • 由（9.45）-（9.47）式，可得结论为：当时， • ，，收敛于零，否则，，，按基于的函数有界收敛。 y y y q q γ q γ  i i i i i i k k k k k k k k         d d        ( ) ( ) ( )     i i b      y q       0 2 2 B q 2 2 1 / 1 / lim 1 ˆ n n i i h h b b b b h h                    y 0 q b b b 0, 0, 0      i  u i  q i  y i  u i  q i  y 0 q b b b , ,  