正在加载图片...
9.2蓄体地代弹习控算接 此养,延有南地代学整常法、兼食造代录习量的选、意店于地 932端信同量 作单习提时体效市反编前维造代学可法体独博, Arimoto年黄先峰出丁鱼性时变选编基旅的D里选代学习恤到停 得边代苹好维木量计控时,只要■比项得特独 豆3造代厚用指纳关故球 对康的监试进微微号,在地整制批水中,流代平习融焉秋州点 马-马元0 9. 立3.1单习常法的晚轻最敏借 开抛。口始加和州本减和地地岛。几所有的黄性证则要水州条 式中,「为常量州撞矩韩,在D业算法的盖随上相验出真丁P业、 输安性使教性何渐究当单习神被接家镇境见什么本并树,地代 件是州同的,解进代学牙数地中的抛州间置一直是人地求物周 P列业、PD进代#习撞制牌,从一量童义本滑它打事是PD型进代 习州过寸是造定收教的。南地的量定鞋量延了整增学习次量的物, 标之一,同前已璃出的地代单习产州算城大多源要家进编欢运行时胸 单习拉制掉的绿形式,PD透代学习撞制辣家示为 控制保不突放,绳,对于草好性制那桌有,仅仅南具发有标意义 地快毒定道载壶对应的地状喜上即喷蜂冰米 )马,0++,价+g:(8刀 的。只有使平习址其值才恤置的控为茶意义下量瓷的 (9.8) 整州。轨是时学习州的绿盖木的两求,微学墙在刺出新特单习棒的调 墙那镜的始本不荆速上,在用铁地钠常一氧小的城钠 式中「、小、¥为学习增拉序,幕放中的满进物惠使用常为开许境 时,蓄于对时桌的业银慢。轴由丁批黄的琳并。Arimoto由最物 时,是常丝类河白维为单习牡制的海排性具直听究 代单习业响。如果使用则常为环地代单习壮铺,如果同时使用市 舞曲PD单时,仅新物性核在夏单降下的量史性故条 测靠为开东造代学习控响, 件作丁项 9.33学习境发询厘 9.34音神闻酒 且.4被学嫩毫璃雕地代学习控制仿高实州 在选代苹习常独研汽中,其收放绿件盖术上解局在单习次兼:一示 处代学习社通地的绳出有律厚的工青最,置此仅仅在无干找 41控前D没计 下输出的。圆在实际应用据合,举习次最:+x是篇鼻设有任★实霹 常件下时地收业性铜题绳不等韵,还应时地存在各州干找的情形下票 考准一个关节的机人,其动结性可以由以下一前中州性缘分方 意文的。因此加有使造代学习过福更快地收敏于舞温管具进代学习 策的果膝性施。一个得线行静选代学习控制原能敬丁存始物够 意捕地 控斜将汽中的另一个量要同题。 外,还减本硫少存在状喜批地、师声、抛入挑动尊客种干找.鲁 叫q54c4+Ggj-r- (9.9) 选代季习控响林视上局一群满钟腔树锐术,大解分学习律厚管正 神性何厘时地存在客料干就时透代学可拉响票策的佩性施。具体地 式中,4取为共节角位事量,(回a双为最人的性麻,C() 喷丁学习收蒙的充分并,祖收就地皮还局很量。可利用套次学习过 视,一十地代单闪控原统局鲁神游,局湘果转在各种有界干枕的形 悬中将测的加来球进镇样习过室的速麦。加,禾用高前选代拉 响下,其德代教旋物收敏到阑慢克的端纳,可墙这整干找湖雕时 老示青化力和哥民力,G(k为力项:为挂力把。为各 种提塘和找地。 制算波、意境右四于的单习律、用墙前球夏现等方陵来南造 ,意代林建会收敏到用里软速 苹习株,可使收敏速度大大加快。 世系装要康的速铁造为,件,血,小,续算次输出为, ◆0-小-间- 22 9.2 基本迭代学习控制算法 Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律 (9.6) 式中, 为常数增益矩阵。在D 型算法的基础上,相继出现了P 型、 PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代 学习控制律的特殊形式,PID迭代学习控制律表示为 (9.7) 式中, 、 、 为学习增益矩阵。算法中的误差信息使用称为开环迭 代学习控制,如果使用 则称为闭环迭代学习控制,如果同时使用和 则称为开闭环迭代学习控制。 1 ( ) ( ) ( ) k k k t t t u u Γe     Γ 1 ( ) ( ) ( ) ( ) ( )d t k k k k k t t t t          0 u u Γe Φe Ψ e Γ Φ Ψ 此外,还有高阶迭代学习控制算法、最优迭代学习控制算法、遗忘因子迭 代学习控制算法和反馈-前馈迭代学习控制算法等。 9.3 迭代学习控制的关键技术 9.3.1 学习算法的稳定性和收敛性 稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时,迭代 学习控制过程才是稳定收敛的。算法的稳定性保证了随着学习次数的增加, 控制系统不发散,但是,对于学习控制系统而言,仅仅稳定是没有实际意义 的,只有使学习过程收敛到真值,才能保证得到的控制为某种意义下最优的 控制。收敛是对学习控制的最基本的要求,多数学者在提出新的学习律的同 时,基于被控对象的一些假设,给出了收敛的条件。例如,Arimoto在最初 提出PID型学习控制律时,仅针对线性系统在D型学习律下的稳定性和收敛条 件作了证明 9.3.2 初始值问题 运用迭代学习控制技术设计控制器时,只需要通过重复操作获得的受控 对象的误差或误差导数信号。在这种控制技术中,迭代学习总要从某初始点 开始,初始点指初始状态或初始输出。几乎所有的收敛性证明都要求初始条 件是相同的,解决迭代学习控制理论中的初始条件问题一直是人们追求的目 标之一。目前已提出的迭代学习控制算法大多数要求被控系统每次运行时的 初始状态在期望轨迹对应的初始状态上,即满足初始条件: (9.8) 当系统的初始状态不在期望轨迹上,而在期望轨迹的某一很小的邻域内 时,通常把这类问题归结为学习控制的鲁棒性问题研究。 d (0) (0), 0,1,2, k x x k   … 9.3.3 学习速度问题 在迭代学习算法研究中,其收敛条件基本上都是在学习次数 下给出的。而在实际应用场合,学习次数 显然是没有任何实际 意义的。因此,如何使迭代学习过程更快地收敛于期望值是迭代学习 控制研究中的另一个重要问题。 迭代学习控制本质上是一种前馈控制技术,大部分学习律尽管证 明了学习收敛的充分条件,但收敛速度还是很慢。可利用多次学习过 程中得到的知识来改进后续学习过程的速度,例如,采用高阶迭代控 制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造 学习律,可使收敛速度大大加快。 k   k   9.3.4 鲁棒性问题 迭代学习控制理论的提出有浓厚的工程背景,因此仅仅在无干扰 条件下讨论收敛性问题是不够的,还应讨论存在各种干扰的情形下系 统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移 外,还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁 棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地 说,一个迭代学习控制系统是鲁棒的,是指系统在各种有界干扰的影 响下,其迭代轨迹能收敛到期望轨迹的邻域内,而当这些干扰消除时 ,迭代轨迹会收敛到期望轨迹。 9.4 机械手轨迹跟踪迭代学习控制仿真实例 9.4.1控制器设计 考虑一个关节的机器人,其动态性能可以由以下二阶非线性微分方 程描述: (9.9) 式中: 为关节角位移量, 为机器人的惯性矩阵, 表示离心力和哥氏力, 为重力项, 为控制力矩, 为各 种误差和扰动。 设系统所要跟踪的期望轨迹为 , 。系统第次输出为 令 。       d D q q C q q q G q τ        , τ n q R   n n D q R  ,  n C q q R     n G q R n τ  R d n τ R yd t t T 0,  yi t e y y i i t t t    d    
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有