D0I:10.13374/j.issn1001053x.1986.01.025 北京钢铁学院学报 1986年3月 Journal of Beijing University No.1 第1期 of Iron and steel Technology March 1986 类多变量自校正控制器 及其收敛性的研究 黄程阳舒迪前 (自动控制教研室) 摘要 本文结合极点配置的基本设计思想,提出了一类具有输出跟踪的多变量自校正控制算法。该算法将工程应 用中提出的要求与系统的性能指标联系起来,尖现了闭环极点配置的广义及小方差控制,而性能指标中加 权多项式矩阵R(z)的选取是根据使闭环系统输出对参考信号实现稳态无偏跟踪的原则进行的。进而运 用Martingale收敛理论对算法进行了研究,导出了控制器的无编收敛条件。数字仿真研究表明了该算法的 可行性和有效性。 关键词:多变量系统、自校正控制、极点配置、无偏跟踪、收敛性分析 A Class of Multivariable Self-Tuning Controller and Its Convergence Analysis Huang Chengyang Shu Diqian Abstract This Paper discusses a class of multivarable self-tuning controller wi- th generalized cost-function.Relating to the demands of the engineering application with the cost-function,a generlized minimum-variance control strategy with prespecified closed-loop pole assignment is developed.Mean- while the polynomial matrix R(Z)in the cost-function is so determined as to elimineting the steady state output tracking error of the system.when the parameters of the system are unknown,the parameters of the controller may be estimated directly by using a muitivariable recursive least squares method.The convergent property of the proposed approach is given by using the Martingale convergence theory and the convergence conditions are also given.Simulation results show that the feasibility and the effectiveness of the proposed algorithm. 1985一10-10收到 ·94·
年 月 第 期 北 京 钢 铁 学 院 学 报 一类多变量 自校正控制器 及其收敛性的研究 黄程 阳 舒 迪前 自动控制教 研 室 摘 要 本文结 合极 点配置 的基 本设 计思 想 , 提 出了一 类具有输 出跟 踪 的 多变 量 自校正控 制算 法 。 该 算 法将 工程应 用 中提 出的要 求与系统 的 性能 指标联 系起 来 , 笑现 了 闭 环极 点配置的广 义 最 小方差控 制 , 而 性 能 指标中加 权 多项 式矩阵 一 ’ 的选 取 是根据使闭 环 系统输 出对参 考信号 实现稳 态 无偏跟踪 的原 则进行的 。 进而运 用 以 收 敛理论对算 法进行了 研究 , 导 出了控 制器 的无偏 收敛条 件 。 数 字仿 真研究表明了 该算 法的 可行 性和有效性 。 关键 词 多 变量系统 、 自校正控制 、 极 点配置 、 无偏跟踪 、 收敛 性分析 一 万 ” 人 夕 人“ 一 一 。 一 , 一 一 。 一 ‘ 一 “ 孟 , 。 侧户 目 曰口 ‘ 口 启 睡 ‘ ‘ 声 , 曰 口 门 目 曰口 一 一 收到 · DOI :10.13374/j .issn1001-053x.1986.01.025
Key words;multivariable system,self-tuning,pole-assignment,non-error tracking,convergence analysis. 引言 自校正控制理论作为自适应控制的一个分支,目前变得越来越活跃。继D.W,C1arke 1975年提出的自校正控制器(STC)1门之后,各种不同形式的自校正控制算法不断出现, 使该理论日趋完善。但其中不少文章都是从数学的角度对算法进行演化、推广和改进,如 Borisson2)、Allidinac3)和Keviczky(4们等,而应用于工程实际的例子尚不多。Clarke提 出的自校正控制器是针对下面的性能指标优化得到的: J=E{P(21)Y(t+d)-R(2-1)W(t)2+Q'(21)u(t)2{项:} (0-1) 其中的P(21)、Q'(21)和R(21)均为特定的加权多项式。但Clarke没有给出选择这 些多项式的一般方法。因此若这些加权多项式选择不当,那么由优化指标导出的控制器也就 失去“最优”的意义了。 为此,本文从工程应用的角度出发,提出了“闭环极点配置+稳态无差跟随”的自校正 控制方案,其基本设计思想是根据过程的物理要求确定算法的性能指标,从而在控制系统的 动态性能和控制要求的数学描述之间建立了内在联系。具体说就是根据对系统性能的要求提 出闭环极点的分布,再通过极点配置确定加权多项式矩阵P(2-1)和Q(21),而R(21)的 确定则是使系统稳态输出完全跟踪给定参考信号。整个算法形式简洁,控制器阶次较低,便 于实时控制应用。同时,运用鞅收敛理论对该算法进行了研究,结果表明:在满足一定条件 下控制器收敛且无偏,从而为算法的工业应用提供了理论依据。 1多变量自校正控制算法 1.1控制问题的表述 设被控制过程可用如下的CARMA模型来描述: A(z-1)Y(t)=2dB(z1)u(t)+C(21)e(t) (1-1) 其中Y(t)为p维系统输出向量,u(t)为p维系统控制向量,了e(t)}t1,2…为独立同分布 的p维正态随机向量序列,E{e(t)er(t)}=R,d为系统延时,A(2-1)、B(2~1)和 C(21)为p×p维多项式矩阵: A(2-1)=I+A,(21+…+An.E n (1-2.a) B(21)=B。+B,21+…+Bn6En(B。非奇异) (1-2.b) C(21)=I+C1+.+CncE-n (1-2.c) 且C(21)的特征根都在单位圆外,系统本身可以开环不稳定或非最小相位的。 系统的性能指标即(0-1)式,其中免:={Y(t),Y(t-1),…多u(t-1),u(t-2),… W(t),形(t-1),…},W(t)为p维给定参考向量,P(21)、Q'(21)和R(21)均为 p×p维加权多项式矩阵: P(21)=P。+P,21+…+PnpZ"p (1-3.a) Q'(21)=Q'。+Q,'Z1+…+Q'ngZ"g (1-3.b) ·95·
了 、 一 二 、 一 、 。 一 、 已砂 自‘二 刀 自校正 控制理 论作为 自适应 控制 的一个分 支 , 目前变得 越来越活 跃 。 继 年提出的 自校正 控制 器 〔 〕之后 , 各种不 同形式 的 自校正 控制 算法不 断 出现 , 使该理 论 日趋完善 。 但 其 中不少文章都是 从数学 的角度对 算法进行 演化 、 推广 和 改 进 , 如 〔 〕 、 〔 〕 和 〔 〕等 , 而 应 用于工程实际 的例子 尚不 多 。 提 出的 自校正 控制器是 针对下 面 的性能指标优化得 到 的 一 , 一 一 ‘ 班 , 一 ‘ 厌 , 一 其 中的尸 一 ‘ 、 尹 一 ’ 和 一 ‘ 均为 特定 的加权多项式 。 但 没 有给 出选 择 这 些多项式 的一般方 法 。 因此若这 些加权多 项式选 择不 当 , 那 么 由优化 指标导 出 的控制器 也就 失去 ,’ 最 优” 的意 义了 。 为此 , 本文从工 程应 用的角度 出发 , 提出 了 “ 闭环极点 配置 十 稳态无 差跟 随” 的 自校正 控制方案 , 其基 本设计思 想是根据过程 的物理 要求确定算法 的性能指标 , 从而 在控制系 统 的 动态 性能和控制要求的数学描述之 间建立 了内在联 系 。 具 体说就是 根据对系 统性能 的要求提 出 闭环极点 的分 布 , 再通 过极点配置确定加权多项式 矩 阵 一 ’ 和 , 一 ’ , 而 一 ’ 的 确定则是 使系统稳态输出完全跟 踪给定参考信号 。 整 个算法形 式 简洁 , 控制器 阶次较低 , 便 于实时控制应 用 。 同时 , 运 用秧收敛理 论对该算法进 行 了研究 , 结果 表明 在满 足一定条件 下 控制器收敛且 无偏 , 从而为算法 的工业应用提供了理论 依据 。 多变量 自校正控制算法 控制 问题 的表 述 设 被控制过程可用如下 的 模型 来描述 一 ‘ 之 一 一 ’ 一 ‘ 召 一 其中 为 维系统输出向量 , 为 维系统控制 向量 , 弓 卜 , , … 为 独立 同 分 布 的刀维 正 态随机 向量序列 , 考 。 。 了 卜 刀 , 为系 统延 时 , 一 ‘ 、 ‘ 和 一 ’ 为 夕维多 项式 矩 阵 一 ’ 十 月 , 之 一 ‘ … 十 。 一 “ 一 一 ‘ 。 , 一 ‘ … 。 一 ‘ 。 非 奇异 一 之 “ ‘ 二 工 一 ‘ … ‘ 一 ‘ 一 且 二 一 ‘ 的特征根 都在单位圆外 , 系统本身可 以开 环不 稳定 或非最小相位的 。 系统 的性能指标即 一 式 , 其中况 , 谧 , 一 , … , 。 一 , 一 , 那 , 研 一 , … 卜 , 沁 为 维 给定参 考 向量 , 二 一 ‘ 、 ‘ 一 ‘ 和 一 ‘ 均 为 维加权多 项式 矩 阵 尸 “ ‘ 二 。 尸 , 之 一 ‘ 十 … 尸 一 ” , , 二 一 ‘ , 。 , 产 一 ‘ … , 一 ” 、 一 。 一
R(21)=R。+R1z1+…+Rn,2", (1-3.c) 给定闭环系统特征多项式矩阵: T(之1)=T。+T1z1+…+Tn,2m: (1-4) 其中Ti(i=0,1,2,…n:)为p×p维矩阵。detT(z1)的根即为期望的闭环系统极点。 下面的问题就是确定性能指标(0-1)中的加权阵P(z1)、Q'(z1)、R(21)和使性 能指标取极小值并能保证闭环系统其有给定极点分布和实现输出稳态无偏跟踪的最低控制 律。 1.2广义最小方差控制器 为求得广义最小方差挖制律,引入一组多项式矩阵F(2)、G(21)、F(2)和C(21), 它们由如下的矩阵方程组确定: C(2)P(2)=F(21)A(2)+Z4G(21) (1-5.a) {F(e)C(2)=C(21)F(2) (1-5.b) 其中F(21)△F。+F,21+…+Fd-1Zd+1 (1-5.c) G(21)△G。+G121+…+Gmo2ngn。=max(na-1,ne+n。-d) (1-5.d) F(2)△F。+f121+…+Fd.12d1 (1-5.e) C(e)△C。+C,e1+…+Cnee (1-5.f) 要求F(2)与C(2)右互质,F(2)与C(21)左互质,且detC(2)=detC(2), detF(z)=detF(z1)。 用F(2)左乘(1-1)式,并引用(1-5.a)和(1-5.b)式,可得: P(z1)Y(t+d)=C-1(z1)[G(z1)Y(t)+F(z1)B(z1)4(t)]+F(21)e(t+d) (1-6) 将上式代入(0-1)并注意到其中除F(z1)(t+d)外的各项均属于死,且与 F(z)e(t+d)不相关的事实,有: J=IC1(z1)[G(21)Y(t)+F(z1)B(z)u(t)-C(2)R(z)W(t)I2 +Q(2)u(t)F()e(t+d) 上式对u(t)求极值: 30=2.f,BraaytceY0+Faer")ue)-ce) R(21)w(t)]}+2Q',T[Q'(21)u(t)]=0 于是可得最优控制律如下: G(2)Y(t)+[F(e)B(2)+C(2)Q(21)]u(t)-C(e)R(21)w()=0 (1-7) 或 L(z1)Y(t)+M(2-1)w(t)+N(2-1)W(t)=0 (1-8) 式中 Q(21)△[Q。'B。F。1C。]rQ'(2) (1-9) L(21)△G(2-1) (1-10.a) M(21)△F(2)B(z1)+C(21)Q(21) (1-10.b) ·96·
二 一 ‘ 左 。 左 ,二 “ … , 二‘ ” , 一 》 给定 闭环系统特征 多项式 矩 阵 一 ’ 。 , 一 ‘ … , 一 ” , 一 其 中 ‘ 二 , , , … 。 , 为 维 矩 阵 。 扩 ’ 的根 即为 期望 的 闭环系统极点 。 下面 的间题就是确 定性能指标 一 中的加权 阵尸 扩 ’ 、 尹 二一 ‘ 、 二 ’ 和使 性 能指标取极小值并能保证闭环系统具有给定极 点分布 和实现输出稳态无偏跟殊的最 低 控 制 律 。 , 广 义最 小 方位 控斜器 为求得广义最小方差控制律 , 引入一组多项式矩 阵 二 一 ’ 、 二一 ‘ 、 二 一 ‘ 和 二一 ’ , 它们 由如下 的 矩 阵方程组确定 ’ 尸 之 “ ‘ 之 月 宕 ‘ 一 之 “ 互 一 ’ 才 一 ’ 之 一 ’ 之 一 其 中 二 一 ‘ 鱼尸 。 , 一 ‘ … 一 一 ‘ 十 ’ 二 一 ‘ 全 。 一 ‘ … , 。 二 一 。 。 。 一 , 。 , 一 之 一 工 之一 鱼万 。 厂 ,二 一 ‘ … 厂 卫二 一 · 全三 三 二 一 … 氏 二 一 一 ‘ 一 。 一 。 一 一 。 一 ︸闻 要求 二 一 ‘ 与 二一 ’ 右互 质 , 二 一 ’ 与 一 ‘ 左互质 , 且 二一 ‘ 二 一 ’ , 之 一 一 ’ 。 用 二 一 ’ 左 乘 一 式 , 并引用 一 和 一 式 , 之 一 一 工 之 一 〔 之 一 之 一 工 之一 二 〕 之 一 一 将上式代入 一 并 注意 到其 中除 扩 ’ 十 外 的各项均属 于况 ,且 与 之一 。 不 相关的事实 , 有 一 一 ’ 一 ‘ 〔 之 一 ’ 尸 之 一 ‘ 之 一 ‘ 一 之 一 ‘ 之 一 ’ 附 一 十 上式对 “ 求极 值 一 ‘ 二一 ‘ 尸 一 ’ 况 。 一 ‘ 。 。 , 谧 么 一 ’ 二 一 ‘ 〔 二一 ‘ 二 一 ‘ 二 一 ‘ 。 一 二 “ ‘ 二 一 ‘ 二 〕 卜 , , 〔 , 二 一 ’ 。 〕 于是 可得最优控制律如下 一 ‘ 〔 之 一 ‘ 之 一 ‘ 一 ‘ 之 一 ’ 〕 一 之 一 ‘ 之 一 ‘ 班 一 或 二 一 ’ 之一 , 一 ‘ 砂 一 式中 二 一 鱼〔 。 ,刀 。 一 ‘ 。 一 ,己〕 , 一 一 。 乙 二一 , 鱼‘ 二 一 ‘ 一 万 二 一 , 叠尸 二 一 ‘ 刀 一 ‘ 子 一 , 。 二 一 一
N(21)△-C(21)R(21) (1-10.c) degL(21)=max(no-1,n.+no-d)Ane (1-10.a) degM(21)=max(n6+d-1,nc+n)Anm (1-10.b) degN(21)=ne+nrAn (1-10.c) 1.3自校正控制算法 当系统模型参数未知或缓慢时变时,需用自校正算法来实时估计控制器参数。 定义广义输出向量④(t)如下: Φ(t)△P(21)V(t)+Q(z1)u(t-d)-R(2-1)W(t-d) (1-12) 由(1-6)式有 Φ(t+d)=C1(21)[G(2)Y(t)+F(21)B(2)u(t)] +Q(21)u(t)-R(z1)W(t)+F(z1)e(t+d) (1-13) 于是广义输出的最优预报为 Φ(t+d|t)=C-1(21)[G(z1)Y(t)+F(z1)B(z1)u(t)]+Q(z1)u(t) -R(21)W(t) 利用上式及(1-10)式,可得: (t+d)=0.TX(t)+[I-C(2)(t+d)+F(z-)e(t+d) (1-14) 其中0△[L。,L1,…Lme3Mo,M1,…Mmm3N。,N,…Vm]r (1-15) X(t)△[Yr(t),Yr(t-1),…Yr(tne]5ur(t)muT(t-1),…ur(t-nn); WT(t),WT(t-1),...WT(t-n.)] (1-16) 因n(t)满足(1-8)式时Φ(t+d」t)=0,故(1-14)式右边第二项将消失,于是得到如下 的递推最小二乘算法: 0(t)=0(t-1)+K(t)[ΦT(t)-Xr(t-d)0(t-1)] k(t)=P(t-1)X(t-d)[1+XT(t-d)p(t-1)X(t-d)]1 (1-17) P(t)=P(t-1)-K(t)XT(t-d)P(t-1) 将多维向量估计化为算量估计,并考虑到数据饱和问题,在估计中引入遗忘因子进行指 数衰诚递推,则(1-17)式可改写为: 0i(t)=0:-1(t)+P(t)X(t-d)[Φ:(t)-Xr(t-d)6:(t-1)] (1-18.a) P()=[P(-1)-P(-Dx(-d)xT(-d)P (-1 +XT(t-d)P(t-1)X(t-d) (i=1、2、…p) (1-18.b) 其中遗忘因子满足0<A<1,且 0(t)△[0,(t),02(t),…0p(t)] (1-19.a) Φ(t)△[Φ,(t),Φ2(t)1,…Φ(t)]r (1-19.b) 2加权多项式矩阵的确定 前面假设性能指标中加权阵P(21)、Q(21)和R(z1)已知时得到了自校正控制 算法。下面将分别根据极点配置和稳态无偏的原则导出P(21)、Q(21)和R(21)的 ·97·
一 ’ 全 一 一 ’ 刀 一 ‘ 去 二一 ‘ 。 。 一 , , 。 , 一 全” 。 万 二 一 ‘ , 。 一 , 。 。 。 、 叠 , , 二 一 ‘ 。 全 。 一 。 一 。 一 一 。 自校 正控制 算法 当系统模型参数未知或缓慢时变时 , 需用 自校正 算法来实时估计控制器参数 。 定义广义输出向量中 如 下 中 垒尸 一 ’ 二 一 ‘ 。 一 一 尸 一 ‘ 甲 一 一 由 一 式 有 中 一 ’ 一 ‘ 一 ’ 一 ‘ 之 一 ‘ “ 〕 二 一 ‘ 。 一 二 一 ’ 尸 一 ’ 一 于是广义输 出的最 优 预报为 中 一 ‘ 一 ‘ 〔 一 ‘ 一 ‘ 一 ‘ 。 〕 一 ‘ 一 一 研 利用上式及 一 式 , 可得 中 。 〔 , 一 二 一 ‘ 〕中 二 一 ’ 其中口 。 鱼〔 。 , , , … 二 , , 万 。 , 好 , , … 叮 。 , 万 。 , 万 …万 。 。 〕 全〔 , 一 , … 、 。 。 〕 ,。 。 。 一 , … 。 一 , 。 , 班 一 , … 牙 一 。 」 因, 满足 一 式 时中 二 , 故 一 式 右边第二项 将消失 , 的递推最小二 乘算法 一 一 一 于是得到如 下 夕 一 〔小 一 一 口 一 〕 一 一 一 一 一 〕 一 ‘ 一 一 一 一 一 仁气卜犷、 将多维 向量估计化为算量 估计 , 并考虑到数据 饱和间题 , 在估计 中引 入遗忘 因子进 行指 数衰减递推 , 则 一 式可改 写为 叭 , 砂 , , , ,一 〔中 , 一 ,一 成 ,一 〕 , , 、 。 , , , 、 一 尤 一 尤 一 一 , , 一 , 、 咨 , 气‘ 一 , 一 一一丁 一二下 二 丁一一 下二二于不 丁 一 二下二二二 丁二一 一石 一 几 咬 元 人 又 一 口 少厂 一 式 吸 一 口 少 一 、 、 … 一 其中遗忘因 子满足 。 只 , 且 云 , 叠〔 , ,叭 , , … 云 , 〕 中 虫 。 , , 中 , , … 。 , 〕 加权多项式矩阵的确定 前面假 设性能指标 中加权 阵 广 ’ 、 ‘ 和 “ 算法 , 下面 将分别根据极点配置和稳态无偏的原则导 出 ‘ 一 ‘ 、 一 。 一 已 知时得 到 了 自校正 控制 一 ‘ 和 一 ‘ 的
计算公式。 2.1P(z1)和Q(z1)的选择 定义系统状态向量X(t)和输入向量V(t)如下: Y(t) e(t) x(t)△ V(t)△ (2-1) u(f) W() 则(1-1)和(1-8)式可改写作: Ae)Zae)x)=fCe)r0 (2-2) -L(21)M(z-1) 0 -N(1)J Y(t)=[l o]X(1) 经推导,可得闭环系统特征方程为: det C(2)dei[P(21)B(a-1)+Q(2-1)A(2-1)]=o (2-3) 其中A(21)、B(z1)满足 A(21)B(21)=B(2)A(21) (2-4) 由于C(21)的特征根全在单位圆外,且detC(21)=detC(z1),故只需对特征方程中的第 二部分进行极点配置即可: P(21)B(21)+Q(21)A(21)=π(21) (2-5) 这就是确定P(21)和Q(21)的闭环极点配置方程。为保证P、Q的唯一性,可按下式选择其 阶次: (no=na-1 (2-6) nq=n6-1 n i=n a n6-1 2.2多项式矩阵R(z1)的确定 R(21)的选择是按使系统稳态传递误差为零的原则进行的。 系统输出跟踪偏差E(t)与参考信号W()之间的传递关系为: E(t)△Y(t)-W(t)=[ZB(21)T-'(21)R(z1)-I]W(t)△er(21)W(t) (2-7) 运用终值定理,可以证明下述结论: 〔定理1〕设闭环系统的误差向量由(2-7)式给出。 W(t)∈砂(:)。则系统(在零噪声意义下) 稳态无差传递的充分必要条件是 g0.40-0 (i=0、1、2…) (2-8) 根据上述定理可推出对于一些基本参考输入信号的无偏条件,如: (1)阶跃信号:W(t)=1(t),R(21)=R。=T(1)B1(1) (2-9) /R(21)=R。+R21 (2)斜坡信号:W(t)=, R*=T(1)B1(1) (2-10) R,=-R*{dIb+[B(z1)T-1(z-1)]'z-1R*} R。=R*-R, ·98·
计算公 式 。 一 ‘ 和 一 ‘ 的选择 定 义 系 统状 态 向量 和输 入 向量 厂 如下 式可改写 作 一 一 一 一 厂 △ 研 一 厂 △一一 则 一 和 一 份 之 一 ‘ 一 一 ‘ 比 , 二 厂 一 一 一 ‘ 、 〔 〕 经推导 , 可得 闭环系 统特 征方程为 其中刃 ‘ 、 一 ‘ 〔 二 一 ‘ 一 ‘ 一 ‘ 一 ‘ 〕 一 ‘ 满 足 一 若 一 一 ‘ 一 ‘ 一 工 由于 ‘ 的特征 根 全在单位 圆外 , 且 ’ 二 ‘ , 二 部分进 行极 点配置 即可 一 故只需对 特 征 方程 中的第 一 主 一 ‘ 一 月 之 一 ‘ 二 二 之 一 ‘ 一 这就 是确定 一 ‘ 和 二 一 ‘ 的闭环极点配置方程 。 为保证 、 的唯一 性 , 可 按下式选择其 阶 次 「 ” ‘ “ ” “ 一 “ “ 。 一 贬 常 十 一 多 项式 矩阵 ‘ 的 确定 一 。 一 ‘ 的 选择是按使系 统稳态传递误 差为 零 的原则进 行的 。 系统输 出跟 踪 偏 差 约 与参考信号班 以 之 间 的传递关系为 百 , 全犷 , 一 邢 , 一 ‘ 万 之 一 ‘ 丁 一 ‘ 二一 ‘ 尸 二 一 ‘ 一 ,, 〕班 全 。 二 一 ‘ 牙 , 一 运 用终值定理 , 可 以证 明下 述 结论 〔定理 〕 设 闭环系统 的误 差 向量 由 一 式给出 。 研 〔 夕 。 则系统 在零噪声意 义下 稳态 无差传递 的充分 必要 条件是 一 气卜 乡 £ 乡 一 ‘ 班, 二 、 、 … 一 根据 上述定 理 可推 出对 于 一 些 基本 参考输入信号 的无偏条件 , 如 阶跃 信 号 班 二 , 一 ‘ 。 刀 “ ‘ 。 十 , 一 ‘ 一 ’ 一 斜坡信号 研 二 , 一 且 , 二 一 辛 亏 。 〔 刀。 二 牵 一 尸 , 、 ‘ ‘、护 ︸ 、 了‘ 、 一 万 一 ‘ 一 ‘ 一 〕 尹 , , 资
由定理1不难看出,若系统对于阶次较高的参考输入稳态无偏,则对阶次较低的输入信 号亦无偏。 3算法的收敛性研究 对控制算法的收敛性研究是一项很重要的工作。L.Lju·g等人曾运用ODE法成功地证 明了一些递推算法的收敛性,而V.Solot5)和I.D.Landau等人则借助Martingale理论研 究控制算法的收敛问题。本文适用后一种证明的方法,将辩识过程转化为一Martingale过 程,然后应用Martingale收敛定理分析本算法的收敛性质C6)。 C定理2〕(Martingale收敛定理)设{Tm}、{an}、Bn}均为非负随机变t序 列,它们对于σ一代数的递增序列子,可测,且满足 E{T。|怀m-1}≤Tm-1+a-Bm (3-1.a) 如果 L,an∞ (3-5.a) ii)lim S.A=o >o (3-5.b) ·99·
由定理 不难看出 , 若系统对于阶次较高的参考输入稳态无偏 , 则对 阶次较低的输 入信 号 亦无偏 。 算法的收敛性研究 对控制算法的收敛性研究是一 项很重要 的工作 。 等人曾运用 法成功地 证 明了一 些递推算法 的收敛性 , 而 。 〔 〕和 等人则借助 理 论 研 究控制算 法 的收敛 问 题 。 本文适用后 一种证 明 的方 法 , 将辩识 过程转化 为 一 “ 过 程 , 然后 应用 收敛定理分析 本算法 的收敛性质〔“ 〕 。 〔定理幻 收敛定理 设 谧 , 卜 、 弓 , 、 谧刀 。 十均为非 负随机 变 最 序 列 , 它们对 于 一代数 的递 增序列 谧多 。 卜可 测 , 且 满 足 谧 。 多 ” 卜蕊 。 , 。 一 刀 , 一 如果 互 。 , 。 则有如下 结论成 立 一 ‘, 叉、 · 一 。 。 ” 其 中 为 一有限非 负随机 变量 一 下面 用这 一定理来研究上述算法 的收 敛性 。 考虑概率空间 口 , 了 , 夕 , 其中 口 为样 本空 间 非空 为口 的子集的 一 代数 , 夕 为瑟 中定义 的概率 测度 。 定 义 多 的 递 增 序 列 谧尹 ,, 〔 卜 , 该序列 由时刻 一 及其 以前 的所有观测 信息构成 。 并 设 代 。 卜 ,一 , , 为可转化 为序列 弓多 , 卜的 向量序列 , 满足 一 弓 尹 , , 卜二 一 谧 , , 一 , 卜 重 写 控制 器参数估计方程如下 羲 二 一 。 , 二 。 万 ,一 、 子 二 一 , 万 二 一 ‘ 。 , 闭环最优控制律 。 二 , , … 一 一 如 〔引理 〕 若 叉 “ ‘ 为, ,半正 定矩 阵, 壳 妞 。 一 乏 、 。 , 贝。由 掩 尹 。 二 , 叫 一 万’ 刀 。 二 少。 一
5:40 (3-5.b) 1 可得mS:∑Xx=0 (3-5.c) 质■1 〔定理3〕(收敛性定理一)对于系统(1-1)应用控制算法(3-3)和(3-4),如果条件 (3-2)成立,且设(1)C(z1)=I。 (3-6.a) (2)lim Amin〔P-'(t)=∞ (3-6.b) (3)lim supmx[P-1(f)]/Amio[p()] (3-6.c) 则有0(t)→0。a.s (3-6.d) 〔证明):定义估计参数偏量0(t)△(t)-0。 (3-7) 残差行向量v(t)△r(t)-Xr(t-d)0(t-1) (3-8) 并引入下列向量(t)△-0r(t-1)X(t-d) (3-9) 5t)△F(21)e(t) (3-10) 考虑到(3-3)式,有 vT(t)=中(t-1)-0r(t)X(t-d)-8。TX(t-d)=b(t)+5(t) (3-11) 由参数递推估计方程可得: 0(t)=60(t-1)+p()X(t-d)u(t) (3-12) p(t)=p(t-1)+X(t-d)XT(i-d) (3-13) 定义Lyapunov函数矩阵如下: V(t)△0r(t)p1(t)8(t) 注意到关系式(3-12)、(3-13)、(3-9)和(3-11)可推出下面的结果: V(t)=0r(t-1)p1(t-1)0(t-1)+0r(t-1)X(t-d)Xr(t-d)0(t-1)-b(t)v(t) -vT(t)bT(t)+vT(t)XT(t-d)P(t)X(t-d)v(t) VG-D-xPG-DG) b(t)bT(t)+b(1)ET(1)+E(t)bT(t) +()x-d)p()x(-d)gr() 由(3-10)式可知5(t)不属于-1)与6(t)不相关,故 b(t)bT(t) EV()川7,-:}=Vt-1)-i+Xr4-apt-i)X-d)+Xrt-d)P(t)Xt -d)Fv(-1)+X(t-d)P(t-d)F (3-15) -IP 其中F=CF)p×p, 户:=2∑户a…户…R,j=1,2-p) F,:,为F(21)的第I个矩阵中第行第列的元素,R。,为R阵中第m行第n列的元素。 引入新变量Y(t)△traceP1(t)(t=0,1,2…) (3-16) ·100·
犷 可 得 叉, ’ “ , 笋 · 自 一 。 〔定理 〕 , 丫 二 。 血一 收敛 性定理 一 对 于系 统 一 应 用控制算法 一 和 一 一 成 立 , 且设 二 一 ‘ , 兄 〔 一 ‘ 〕 则有 二 弓之。 。 二 〔 一 ’ 〕 元二 。 一 ‘ 〕 卜 ‘ · 〔证 明〕 定义估 计参数偏量 荻 , 垒叭, 一 。 。 残 差行 向量 。 叠必 一 一 百 一 并引 入下 列 向量 , 全 一 沂 ,一 ,一 , 叠厂 二 一 ‘ 。 , 考虑 到 式 , 有 。 , 功 一 一 , 一 一 。 犷 一 由参数 递推估计方程可 得 一 一 刀一 ‘ 刀一 ‘ 一 一 , 一 定义 函数 矩 阵如下 犷 , 叠沂 , ,一 ‘ , 员 , 注意 到关系 式 一 、 一 、 一 和 一 一 。 如 果 条 件 一 。 一 一 。 一 一 一 一 一 占 一 一 一 可推出下面 的结果 犷 二 一 一 ‘ 一 一 夕, 一 才一 尤 一 一 一 吞 一 , 口 , 一 一 二 厂 一 一 占 雪 一 一 丫 一 蜜 一 一 舀 , 由 一 式可 知睿 不 属 于萝 , 与 不 相关 , 故 弓犷 才 多 , , 卜 犷 一 一 一 一 一 一 一 廷厂 一 一 尸 卜 一 其中 二 〔 、 , 〕 , 厂 户 叉 艺声 卫 二 · 一 一 。 · 。 。 , 二 , , … 儿尸习, 一 万, 为 二 一 ‘ 的第 个 矩 阵中第 行第 列的元素 , 引入新变量 叠 尸 一 , , , 一 二 , 为 阵中第。 行第。 列 的元素 。 ‘ 二 一
由式(3-13)有r(t)=r(t-1)+XT(t-d)X(t-d)≥r(t-1)>o,即r(t)为一递增序列。再定 义W(t)△V(t)/Y(t), aax-uPuX-dir0.ar4-〔4ij7门. 则(3-15)式可写为 Ew14}<-》-r-1Dtr-)-1r]+的X-dnw X(t-d)/r(t)=W(t-1)-B(t)+a(t) (3-17) 不难看曲,序列{W(),{a(),)}非负。下面证明∑a()<c。 41 rp-(t)mx[P-1(t)]=Amim[P(t)] 及XrP(t)X≥XTAmin(P(t)门X 2ae2Xri-pecprptX- t 1=1 ≤P∑Xrt-dP(Xt-d) =F∑Xt-d)P)P:-1DXt-d/1+Xrt-dP(t-1)X-d〕 ir P(-1)X(t-d)xT(-d)P()) 1 D 又:P(t)=P(t-1)-P(t)X(t-d)Xr(t-d)P(t-1) tr P(t-1)X(t-d)XT(t-d)P(t)=trP(t-1)-trP(t) 于是a()≤产∑〔rP-1)-trPe)=产,P0<(:rP(o)=0) 1.1 11 这样,定理2的条件全都满足,于是得到 (1)∑r(t-1)C1/r(t-1)-1/r(4)<∞a.s (3-18.a) t"1 (2)形(t)→Wa.s (3-18.b) 又由条件(3-6.b)知1imr(t)=0,若∑〔r(f)-r(t-1)/r(4)<0,则由引理知 ▣1 ,10re)-s-1D=im)-ro1=0 ·101·
由式 一 有 二 一 刃丁 一 一 一 , 即 为 一递 增序 列 。 再定 义 研 垒犷 , , 全 尤 一 尸 卜 , 刀 , △ 厂 卜 一 一 入 、 勺 心一 气不 尹洲 脚 泌 则 一 式可 写 为 弓研 资 , , 卜簇 筹写乏一 卜 〔 · 卜 卜 · , 万、 · 卜 、 , 才 一 甲 一 一 刀 一 不 难看 出 , 序列 代砂 卜 , 谧 卜 , ·了 一 ‘ 毛 只 。 、 一 ‘ 〕 二 尸 尤 万 以 。 〔尸 〕万 谧刀 , 卜非 负 。 下面 证 明 叉 。 , 。 弓兄 ,。 ,。 卜 一 ‘ 及 芝 。 , 叮 卜 、 尸 气 兀,· 尸一 , 〕一 尸 勺 卜 “ 、 苦叉二 ‘ 一 “ ,尸 “ , ‘ 一 “ ’ 笋叉 尤 · ,一 , ‘ , “ 一 ‘ , “ 一 , 〔 ‘ 尤 · “ 一 , “ 一 ‘ , ‘ 一 ,〕 、 苦叉 , “ 一 ‘ , “ 一 , · “ 一 , “ , 又 一 一 一 一 一 故 谧 一 万 一 一 卜 一 一 于是 芝 。 , 赤芝 〔 才 卜 卜 , 尸 , 〕 笋, 。 。 ,’ 的 。 这 样 , 定理 的条件全都满 足 , 于是得 到 厂 一 〔 一 一 〕 冲乙尸 一 班 ,研 一 、产‘, ,工自 、 ‘了、了 又 由条件 一 知 , 若 芝 〔 · “ ,一 “ 一 ‘ ,〕 “ , 二 , 贝‘由 ” 理 知 目 〔 一 一 〕 , 蚊 〔 护习、 一
但r(o)0,则多容花>0,使当 >时,二>e。令=mi[e,"二品e1)1,引用3-190)式有 V(t-1)、 8二r)-ra-】7≥24)--]高=0 00 1 两武牙后。故,典份=0a, (3-20) 10 又V(t)/r(t)≥1mi[P-1(t)门8r(t)0(t)/trP-1(t) 故有()0()≤以atPl(t)门/airp()·y r(t) 其中s是P(t)阵的维数。利用(3-6c)式和(3-20)式,最后得到1im0r(t)0(t)=0a.s 〔定理4〕(收敛性定理二)对于系统(1-1)应用控制算法(3-3)和(3-4),若条件(3-2) 成立,d=1,且设(1)1 imAmia[P-1(t)]=∞ (3-21.a) 0 (2)1 imsup{1max[P-1(t)]/im1.[P-1(t)]}<∞ (3-21.b) (3)I1X(t)1|2<∞ (3-21.c) (0C产(2)-21,正实 (3-21.d) 则有0(t)+0。a.s (3-21.e) 因篇幅所限,本定理证明从略。 4算法的仿真研究 为验证算法的可行性和有效性,已将本算法编成仿真研究程序包,进行多方面的考察, 包括控制器收敛速度和收敛精度,参考信号跟踪效果,极点配置效果,遗忘因子的选择、参 数可辩识性,初值对参数估计的影响等等。下面通过对一个2×2系统的仿真实例说明控制算 法的应用情况。 〔例〕有一双输入双输出电加热炉系统,其模型如下C7们: ·102·
但 。 , 故 〔 一 〕 “ 二 , 与 一 式 矛盾 , 故 有 艺 , 一 ,一 , 一 一 、 ,、 , 犷 一 尸 , 、 , 司 、 , , , 、 , 。 , 、 。 丹 田 一 饥 “ 少 式得 些 乙 八矛二丽 一 犷 少 一 犷 “ 一 ‘ 犷 , , “ ” 驭双 一 ,卜 鳞袋诀 · ,卜 · 卜 〕 , 收敛 , 若 悠 黔井 。 , 则 必存在一 。 , 使当 , ·时飞珊 一 。 令一 、· 一 尸涤毛号 、 , , · … 〕 , 引用 一 式 , 有 及卒华共 目 〔 , 一 ,一 〕 一 一 二 一 、 叹、 尸 , , 、 , , 、 , 一 一 丁 万 一 了丁二义 一 ‘ , 己 气若 少 一 气‘ 一 夕 犷 吸 、 夕 两式矛 盾 。 故 犷 一 又 故有 厂 兄 。 〔 一 ‘ 〕 , 一 ‘ 毛 之 。 二 〔 一 ‘ 〕 汽 。 〔 一 ‘ · 厂 其 中 是 阵的维数 。 利用 一 式和 一 式 , 最后 得 到 口 口 口 。 〔定理 〕 收敛性定理二 对 于系 统 一 应 用控制算 法 和 一 , 成立 , , 且设 只 。 〔 一 ‘ 〕 口 一一卜 若 条件 一 一 谧几 。 二 〔 一 ‘ 〕 几 。 。 〔 一 ‘ 〕 卜 一 。 川 “ 一 了、了 、 ︺, 、产、砚刀 , 、 护 之 , , 、 , 七 ‘ 又 ‘ 一 万一 乙 止 买 一 。 则有口 ‘ 因 篇幅所 限 , 口 。 舌 一 本定理 证 明从略 。 算法的仿真研究 为验 证算法的可行性和有效性 , 已将 本算法编成仿真研究程序包 , 进行多方面 的考察 , 包括控制器收敛速度和收敛精度 , 参考信号跟踪 效果 , 极点配置效果 , 遗忘因子 的选择 、 参 数可辩识性 , 初值对参数估计的影 响等等 。 下面通 过对 一个 系 统 的仿真实例说 明控制算 法的应 用情况 。 〔例〕 有一 双输入双输 出电加热炉系统 , 其模型如 下〔 〕
na=2,h6=1,nr=0,d=2。 -0.2424-0.0977 -0.3426 -0.2105 41=-0.1322 -0.4265 A2=-0.1070 -0.2404 0.10370.0763 0.09160.0575- B。=0.0531 0.1352 B,=0.0670 0.1181 (1-0.221)(1-0.421) 0 给定闭环极点T(之1)= 0 (1-0.121)(1-0,321)考虑阶跃输入信 号,按公式(2-4)、(2-5)、(2-6)和(2-9)可求得 np=1,ng=n.=0 f-15.3219 -1.282957 11.80325.20239 p0=7.1583 -0.44849 D1= -4.7435-0.17894 广2.6571 1.34252 3.50883 -1.76432 Q0= -0.71850.51446 R。= -2.022283.59746 由(1-5)、(1-10)、 (1-11)可求出控制器参数理论值如下: -3.0533 -1.4102 3.0479 2.4189 L0= 1.7063 1.2399 L,= -1.0142 -0.5632 1.0000 0.0000 -0.5021 -0.0054 M。= 0.00001.0000 M,= 0.3258 0.1710 0.9350 0.8249- -3.50881.7643 M:= -0.2580-0.1358 N。= 2.0223-3.5975 仿真结果示于图1~图6,递推运算250次,全部估计参量及系统变量初值设为零, 元=1,噪声强度R=0.125Ip,1,给定不参加辩识。从图1中可以看出,输出跟踪情况良好 (调节时间约为3步)。图3~图6表明控制器参数经20步迭代后就几乎收敛于理论值。t=52 时的估计参数如下: L。s [-3.0193-1.43297 3.0150 2,4384 1.6956 1.2463 -1.0030-0.5697 「-0.5011-0.00341 「0.9333 0.8242 7 M:= 0.3254 0.1705 M:= -0.2571-0.1354 N。=2.0597 [-3.48181.7287 -3.6075 5结论 本文给出了一种多变量自校正控制算法并证明了算法在一定条件下的收敛性。最优控制 律简洁明了,控制器阶次较文献[8]低。性能指标中的算子多项式矩阵根据控制系统的物理 要求来确定,便于工程应用。运用鞅收敛理论对递推算法进行分析导出了其无偏收敛的条 ·103·
。 , 九 。 , 。 二 , 二 。 二 厂 一 “ · “ ‘ 一 ” · 一 · 一 刀 一 。 一 。 一 。 一 。 八 一一 勺 。 , 。 。 刃 日︸ 一 一 一 一 一 ‘ 给定 闭环极 点 ‘ ’ 一 一 一 一 ’ 考虑 阶 跃 输 入 信 号 , 按 公 式 一 、 一 、 一 和 一 可求得 护 。 , … 一 一 二 。 。 一 。 刁 一 。 、 、 厂 · · 尸 。 , 八 , , 。 。 一 任 ‘ 任 。 。 一 处 · 〔 乙, 。 一 尸。 一 。 一 。 。 〕 夕 材 任月 曰住︸ 产 自,八 仁一 一 一 可求 出控制器 参数理 论值如 下 , 。 一 。 孟月 少 ︸ 自 ‘ , 左 一 由 一 、 一 一 , 一 一 〕 。 , 曰甘︸ 八八 日日︸﹃︸ 八︸ 。 一 。 。 一 一 。 一 。 。 一 仿 真结果 示于图 图 , 递推运算 次 , 全 部估计参量及 系 统 变 量 初 值 设 为 零 , 汽二 , 噪声强度 刀 ,, 。 给定不参加辩识 。 从 图 中可 以看出 , 输 出跟 踪 情况 良好 调 节时间约为 步 。 图 图 表明控制器 参数 经 步 迭代 后 就几 乎收敛 于理 论值 。 二 时的估计参数如 下 「 一 · “ ‘ 一 ‘ · ‘ “ 。 。 。 。 一 。 「一 · 对 一 。 一 。 一 刁通 月 八 八‘ ︻︸了今日八︸ 任尸 一 一 。 。 一 。 〕 结 论 本文给出了一种多变量 自校正 控制算法并证 明了算法在一 定条件下 的收敛性 。 最 优控制 律简洁明了 , 控制器 阶次较文献 〕低 。 性 能指标 中的算子多项式矩 阵根据 控制系统 的 物 理 要求来确定 , 便 于工 程应 用 。 运用 鞍收敛理 论对递 推算法进 行分析 导 出了其无偏 收 敛 的 条