线性二次型调节器(LQR)原理详解

这篇具有很好参考价值的文章主要介绍了线性二次型调节器(LQR)原理详解。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

LQR(Linaer Quadratic Regulator),即线性二次型调节器,是一种现代控制理论中设计状态反馈控制器(State Variable Feedback,SVFB)的方法。

算法解释

对于一个系统 x ˙ = A x + B u \dot{x}=Ax+Bu x˙=Ax+Bu,假设我们要设计一个线性反馈控制器 u = − K x u=-Kx u=Kx,则此时状态方程可以写为
x ˙ = A x − B K x = ( A − B K ) ⏟ A c l x (1) \dot{x}=Ax-BKx=\underbrace{(A-BK)}_{A_{cl}}x \tag{1} x˙=AxBKx=Acl (ABK)x(1)
由于让系统稳定的条件是矩阵 A c l A_{cl} Acl的特征值的实部均为负数,因此我们可以手动选择几个满足上述条件的特征值,然后反解出 K K K,从而得到控制器。

那么问题来了,我们该如何选择特征值,才能让控制器的控制效果最好呢?

现在我们定义一种代价函数(cost function) J J J
J = ∫ 0 ∞ x T Q x + u T R u   d t (2) J=\int_0^\infty {x^TQx+u^TRu}\ \mathrm{d}t \tag{2} J=0xTQx+uTRu dt(2)
其中, Q Q Q R R R是两个对角参数矩阵,分别决定了状态向量 x x x和输入向量 u u u的重要性。显然,J是一个二次型函数,这也是LQR中“Q”的由来。

线性代数中定义形如 x T A x x^TAx xTAx的形式为二次型。具体可参考矩阵的二次型,矩阵的迹、正定矩阵、Hessian矩阵、实对称_kking_edc的博客-CSDN博客_矩阵二次型。

我们希望的是在满足系统稳定的前提下,通过设计合适的 K K K,让代价函数 J J J最小

下面我们来分析代价函数的意义。

代价函数的意义

考虑一个双变量系统,即 x = [ x 1 x 2 ] x=\begin{bmatrix}x_1\\x_2\end{bmatrix} x=[x1x2],我们希望设计的控制器可以表示为 u = − [ k 1   k 2 ] [ x 1 x 2 ] = − k 1 x 1 − k 2 x 2 u=-[k_1\ k_2]\begin{bmatrix}x_1\\x_2\end{bmatrix}=-k_1x_1-k_2x_2 u=[k1 k2][x1x2]=k1x1k2x2

此时代价函数可以写为:
J = ∫ 0 ∞ [ x 1   x 2 ] Q [ x 1 x 2 ] + ( − [ k 1   k 2 ] [ x 1 x 2 ] ) T R ( − [ k 1   k 2 ] [ x 1 x 2 ] )   d t (3) J=\int_0^\infty [x_1\ x_2]Q \begin{bmatrix}x_1\\x_2\end{bmatrix} + \left(-[k_1\ k_2]\begin{bmatrix}x_1\\x_2\end{bmatrix}\right)^TR\left(-[k_1\ k_2]\begin{bmatrix}x_1\\x_2\end{bmatrix}\right)\ \mathrm{d}t \tag{3} J=0[x1 x2]Q[x1x2]+([k1 k2][x1x2])TR([k1 k2][x1x2]) dt(3)
Q Q Q R R R分别为
Q = [ q 1 q 2 ] R = r ( u 是一维向量 ) (4) \begin{aligned} Q&=\begin{bmatrix} q_1\\ &q_2\end{bmatrix} \\ R&=r \quad (u是一维向量) \end{aligned} \tag{4} QR=[q1q2]=r(u是一维向量)(4)
则代价函数可以写为:
J = ∫ 0 ∞ q 1 x 1 2 + q 2 x 2 2 + r u 2   d t (5) J=\int_0^\infty q_1x_1^2+q_2x_2^2+ru^2 \tag{5} \ \mathrm{d}t J=0q1x12+q2x22+ru2 dt(5)
显然,如果令 q 1 > q 2 > r q_1>q_2>r q1>q2>r,则状态变量 x 1 x_1 x1在代价函数中的占比就更大,这意味着如希望代价函数最小, x 1 x_1 x1必须更小。又因为 Q Q Q越大意味着闭环系统矩阵 A c l A_{cl} Acl极点在s平面中更偏左,因此 x 1 x_1 x1收敛得更快。若 r > q 1 > q 2 r>q_1>q_2 r>q1>q2,则希望输入量收敛得更快,也就是以更小得代价实现系统稳定,通常意味着更加节省能量。

因为对象是线性的,并且代价函数是二次型,因此这种选择 K K K设计状态反馈控制器以最小化代价函数 J J J的方法被称为“线性二次型调节器(LQR)”。Regular意味着这种反馈的功能是将系统状态调节为0,这在一些追踪问题中会受到约束,因为我们可能希望稳定状态是给定的非零值。

现在的问题是,我们该如何求解 K K K才能让代价函数 J J J最小呢?

推导过程

对于式 ( 2 ) (2) (2),我们定义一个辅助常量矩阵 P P P,使得
d d t x T P x = − ( x T Q x + u T R u ) (6) \frac{\mathrm{d}}{\mathrm{d}t}x^TPx=-(x^TQx+u^TRu) \tag{6} dtdxTPx=(xTQx+uTRu)(6)
将式 ( 6 ) (6) (6)带入式 ( 2 ) (2) (2)可得
J = − ∫ 0 ∞ d d t x T P x   d t = − ( x T P x ∣ ∞ − x T P x ∣ 0 ) = − ( 0 − x T P x ∣ 0 ) = x T ( 0 ) P x ( 0 ) (7) \begin{aligned} J&=-\int_0^\infty \frac{\mathrm{d}}{\mathrm{d}t}x^TPx \ \mathrm{d}t \\ &=-(x^TPx|_\infty - x^TPx|_0)\\ &=-(0 - x^TPx|_0)\\ &=x^T(0)Px(0) \tag{7} \end{aligned} J=0dtdxTPx dt=(xTPxxTPx0)=(0xTPx0)=xT(0)Px(0)(7)

注:由于我们假设系统稳定,当 t → ∞ , x ( t ) → 0 t\rightarrow \infty,x(t)\rightarrow 0 t,x(t)0

显然,式 ( 7 ) (7) (7)只和参数矩阵 P P P以及系统的初始状态有关,让 P P P最小也就是让代价函数最小。现在就要找出满足式 ( 6 ) (6) (6) P P P。将式 ( 6 ) (6) (6)左边的微分项展开可得:
x ˙ T P x + x T P x ˙ + x T Q x + x T K T R K x = 0 x T A c l T P x + x T P A c l x + x T Q x + x T K T R K x = 0 x T ( A c l T P + P A c l + Q + K T R K ) x = 0 (8) \begin{aligned} \dot{x}^TPx+x^TP\dot{x}+x^TQx+x^TK^TRKx&=0\\ x^TA_{cl}^TPx+x^TPA_{cl}x+x^TQx+x^TK^TRKx&=0\\ x^T(A^T_{cl}P+PA_{cl}+Q+K^TRK)x&=0 \tag{8} \end{aligned} x˙TPx+xTPx˙+xTQx+xTKTRKxxTAclTPx+xTPAclx+xTQx+xTKTRKxxT(AclTP+PAcl+Q+KTRK)x=0=0=0(8)

注意: ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT

由于上式对于所有 x ( t ) x(t) x(t)来说都要满足,因此括号中的项要恒等于零。带入 A c l = A − B K A_{cl}=A-BK Acl=ABK可以得到
A c l T P + P A c l + Q + K T R K = 0 ( A − B K ) T P + P ( A − B K ) + Q + K T R K = 0 A T P + P A + Q + K T R K − K T B T P − P B K = 0 (9) \begin{aligned} A^T_{cl}P+PA_{cl}+Q+K^TRK&=0\\ (A-BK)^TP+P(A-BK)+Q+K^TRK&=0\\ A^TP+PA+Q+K^TRK-K^TB^TP-PBK&=0 \tag{9} \end{aligned} AclTP+PAcl+Q+KTRK(ABK)TP+P(ABK)+Q+KTRKATP+PA+Q+KTRKKTBTPPBK=0=0=0(9)
上式是一个复杂的二次型矩阵方程,有没有化简的方法呢?假设我们选择
K = R − 1 B T P (10) K=R^{-1}B^TP \tag{10} K=R1BTP(10)
则式 ( 9 ) (9) (9)可被写为
A T P + P A + Q + ( R − 1 B T P ) T R ( R − 1 B T P ) − ( R − 1 B T P ) T B T P − P B ( R − 1 B T P ) = 0 A T P + P A + Q − P B R − 1 B T P = 0 (11) \begin{aligned} &A^TP+PA+Q+(R^{-1}B^TP)^TR(R^{-1}B^TP)-(R^{-1}B^TP)^TB^TP-PB(R^{-1}B^TP)=0\\ &A^TP+PA+Q-PBR^{-1}B^TP=0 \end{aligned} \tag{11} ATP+PA+Q+(R1BTP)TR(R1BTP)(R1BTP)TBTPPB(R1BTP)=0ATP+PA+QPBR1BTP=0(11)
上式在现代控制理论中非常重要,也被称为Algebraic Riccati Equation (ARE)。ARE是一个矩阵二次方程,对于给定的(A,B,Q,R)可以解出辅助矩阵 P P P。之后,优化反馈控制器的 K K K就可通过式 ( 10 ) (10) (10)得出,代价函数的最小值可以用式 ( 7 ) (7) (7)得到。

综上,求解LQR反馈控制器参数 K K K的过程为:

  • 设计参数矩阵 Q , R Q,R Q,R
  • 求解ARE方程以得到辅助矩阵 P P P
  • K = R − 1 B T P K=R^{-1}B^TP K=R1BTP

目前已有求解ARE很完善的数值程序,例如MATLAB把它封装进了lqr(A,B,Q,R)函数中。

可控性

只要满足一些基本条件,LQR的设计过程就能保证得到一个让系统稳定的反馈控制器。

  • LQR定理

    令系统 ( A , B ) (A,B) (A,B)可控, R R R Q Q Q都是正定的,则闭环系统 ( A − B K ) (A-BK) (ABK)渐近稳定。

    注意,不管系统的开环稳定性如何,这都是成立的。

    回顾现控的相关知识:可控性可以通过检查可控性矩阵 U = [ B A B A 2 B ⋯ A n − 1 B ] U=\begin{bmatrix}B&AB&A^2B&\cdots & A^{n-1}B\end{bmatrix} U=[BABA2BAn1B]是否满秩来判断。

在以下形式中LQR定理依然成立。

已知半正定矩阵 Q Q Q的平方根被定义为 Q \sqrt{Q} Q Q = Q T Q Q=\sqrt{Q}^T\sqrt{Q} Q=Q TQ ,且半正定矩阵的平方根永远存在。

  • LQR定理2

    令系统 ( A , B ) (A,B) (AB)可控, R R R为正定矩阵, Q Q Q为半正定矩阵,并且 ( A , Q ) (A,\sqrt{Q}) (A,Q )是可观测的。则闭环系统 ( A − B K ) (A-BK) (ABK)渐近稳定。

用LQR设计反馈控制器和经典控制的思想有很大不同,例如:

  • 设计参数矩阵 Q , R Q,R Q,R与希望的闭环性能密切相关
  • 引入了辅助矩阵 P P P
  • 求解矩阵设计方程
  • 能得到一个保证系统稳定的解
  • 对闭环系统的鲁棒性或结构了解有限

使用现代控制和经典控制结合方法来获得额外的鲁棒性insight很重要,例如基于奇异值伯德图的LQG/LTR方法。

LQR控制实例

参考【Advanced控制理论】8_LQR 控制器_状态空间系统Matlab/Simulink建模分析_哔哩哔哩_bilibili

参考资料

F.L Lewis - Linear Quadratic Regulator (LQR) State Feedback Design文章来源地址https://www.toymoban.com/news/detail-447984.html

到了这里,关于线性二次型调节器(LQR)原理详解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【自动电压调节器】无功功率控制的终端电压控制研究(Simulink)

     💥💥💞💞 欢迎来到本博客 ❤️❤️💥💥 🏆博主优势: 🌞🌞🌞 博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️ 座右铭: 行百里者,半于九十。 📋📋📋 本文目录如下: 🎁🎁🎁 目录 💥1 概述 📚2 运行结果 🎉3 参考文献 🌈4 Simulink实现 在MATLAB

    2024年02月12日
    浏览(38)
  • Python GUI编程利器:Tkinker中的微调节器和滑块(6)

    小朋友们好,大朋友们好! 我是猫妹,一名爱上Python编程的小学生。 和猫妹学Python,一起趣味学编程。 今日目标 实现下面效果: 微调节器(Spinbox类) 微调节器可以通过箭头调整所需的数值。 创建微调节器对象语法格式: Spinbox(master,background,from_,to,value,increment,relief,command,t

    2024年02月12日
    浏览(39)
  • 线性代数(六)| 二次型 标准型转换 正定二次型 正定矩阵

    和第五章有什么样的联系 首先上一章我们说过对于对称矩阵,一定存在一个正交矩阵Q,使得$Q^{-1}AQ=B $ B为对角矩阵 那么这一章中,我们讲到,二次型写成矩阵后本质上就是一个对称矩阵,而我们想把它变的标准型,不就正好是一个对角矩阵,那么实际上我们的这个化标准型

    2024年02月03日
    浏览(47)
  • 线性代数——二次型

    学习高等数学和线性代数需要的初等数学知识 线性代数——行列式 线性代数——矩阵 线性代数——向量 线性代数——线性方程组 线性代数——特征值和特征向量 线性代数——二次型 本文大部分内容皆来自李永乐老师考研教材和视频课。 将含有 n n n 个变量 x 1 , x 2 , … ,

    2024年02月15日
    浏览(45)
  • 【线性代数】四、二次型

    如果系数a ij 全为实数,那么为实二次型。上述二次型展开式可表示用矩阵为 可以看出,二次型矩阵A是一个 对称矩阵 ,也就是满足A T =A,一个实对称矩阵对应的则是一个实二次型。一个二次型有多种写法,也有多个展开式,但是二次型矩阵是唯一的,各个等价的二次型展开

    2024年02月05日
    浏览(48)
  • 【考研数学】线性代数第六章 —— 二次型(3,正定矩阵与正定二次型)

    (1)二次型 f ( x 1 , x 2 , x 3 ) = x 1 2 + 3 x 2 2 + 2 x 3 2 = X T A X f(x_1,x_2,x_3)=x_1^2+3x_2^2+2x_3^2=pmb{X^TAX} f ( x 1 ​ , x 2 ​ , x 3 ​ ) = x 1 2 ​ + 3 x 2 2 ​ + 2 x 3 2 ​ = X T A X 有如下特点: 对任意的 x 1 , x 2 , x 3 x_1,x_2,x_3 x 1 ​ , x 2 ​ , x 3 ​ ,有 f ( x 1 , x 2 , x 3 ) ≥ 0 f(x_1,x_2,x_3)geq0 f ( x 1 ​

    2024年02月07日
    浏览(48)
  • 线性代数 第六章 二次型

    一、矩阵表示 称为二次型的秩。只含有变量的平方项,所有混合项系数全是零,称为标准形;平方项的系数为1、-1或0,称为规范形。 二次型的标准形不唯一,可以用不用的坐标变换化二次型为标准形;二次型的规范形唯一。 可以用正交变换先把二次型化为标准形,然后再做

    2024年02月06日
    浏览(46)
  • 线性代数---第六章---二次型

    我起码要会如何根据二次型写矩阵A

    2024年02月11日
    浏览(77)
  • 【考研数学】线性代数第六章 —— 二次型(2,基本定理及二次型标准化方法)

    了解了关于二次型的基本概念以及梳理了矩阵三大关系后,我们继续往后学习二次型的内容。 定理 1 —— (标准型定理)任何二次型 X T A X pmb{X}^Tpmb{AX} X T A X 总可以经过可逆的线性变换 X = P Y pmb{X=PY} X = P Y ,即 P pmb{P} P 为可逆矩阵,把二次型 f ( X ) f(pmb{X}) f ( X ) 化为标准

    2024年02月07日
    浏览(41)
  • 线性代数-二次型及其正定性

    二次型:含有n个变量的二次齐次多项式 二次型矩阵:x T Ax,其中A为实对称矩阵 任给一个实二次型,就唯一确定一个实对称矩阵;反之,任给一个实对称矩阵,也可以唯一确认一个实二次型,因此,实二次型与实对称矩阵之间存在一一对应关系, 称实对称矩阵A为二次型f的矩阵,二次型f称为

    2024年02月08日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包