基本概念
全称:Model-based Predictive Control(MPC)—模型预测控制
本质:MPC利用一个已有的模型、系统当前的状态和未来的控制量,来预测系统未来的输出,然后与我们期望的系统输出做比较,得到代价函数,通过优化的方法,优化出未来控制量,使得代价函数最小。优化出来的控制量即算法的输出。
核心思想:以优化方法求解最优控制器,其中优化方法大多时候采用二次规划(Quadratic Programming)
控制输出:MPC控制器优化得到的控制输出也是系统在未来有限时间步的控制序列。 当然,由于理论构建的模型与系统真实模型都有误差,所以,实际上更远未来的控制输出对系统控制的价值很低,故MPC仅执行输出序列中的第一个控制输出。
模型分类:
- 机理模型
- 基于数据的模型,例如用神经网络训练一个modle,使用基于数据的模型的MPC可以结合model based RL使用
预测:根据已有模型,已经未来有限时间步的控制序列,预测出未来的系统状态
控制:优化的控制量,是一个未来有限时间步的控制序列
预测区间(Predictive Horizon):
对于一般的离散化系统,在k时刻,我们可以测量出系统的当前状态y(k),再通过优化计算得到u(k),u(k+1),u(k+2),u(k+j),根据模型与控制量,得到系统未来状态的估计值y(k),y(k+1),y(k+2),y(k+j)。
其中系统未来状态的估计值y(k),y(k+1),y(k+2),y(k+j)这部分就称为预测区间的系统预测值,指的是一次优化后预测未来输出的时间步的个数
控制区间(Control Horizon)
将控制估计的部分称为控制区间,通过优化计算得到u(k),u(k+1),u(k+2),u(k+j)这部分就称为控制区间的控制量,
在得到最优输入之后,我们只施加当前时刻的输入u(k),即控制区间的第一位控制输入
区间参数配置:
过小的控制区间,可能无法做到较好的控制,而较大的控制区间,比如与预测区间相等,则会导致只有前一部分的控制范围才会有较好的效果,而后一部分的控制范围则收效甚微,而且将带来大量的计算开销。
约束:对于约束,一般分为:
- Hard约束:物理性质的约束,不可以违背,例如方向盘的转向,刹车的深度
- Soft约束:软件约束,可以违反,例如最大的速度
MPC 优点:
- 善于处理多输入多输出系统(MIMO)
- 可以处理约束,如安全性约束,上下阈值
- 是一种向前考虑未来时间步的有限时域优化方法(一定的预测能力)
控制框图:
MPC算法 整体流程
模型预测控制在k时刻共需三步
-
第一步:获取系统的当前状态;
-
第二步:基于u(k),u(k+1),u(k+2),u(k+j)进行最优化处理,代价函数为
其中EN 表示误差的终值,也是衡量优劣的一种标准。 -
第三步:只取u ( k )作为控制输入施加在系统上。
在下一时刻重复以上三步,在下一步进行预测时使用的就是下一步的状态值,我们将这样的方案称为滚动优化控制(Receding Horizon Control)。
数学建模
线性模型
当模型是线性的时候,MPC的设计求解一般使用二次规划方法。
设线性模型为以下形式:
假定未来m步的控制输入已知u(k),u(k+1),u(k+2),u(k+m),根据以上模型与输入,我们可以计算未来m步的状态:
将上面m步写成矩阵向量形式:
其中,
上式B中的下三角形式,直接反映了系统在时间上的因果关系,即k + 1时刻的输入对k 时刻的输出没有影响,k+2时刻的输入对k和k+1时刻没有影响。
假定参考轨迹为
则MPC的一个简单的目标代价函数如下:
uTRu 这一项是为了让控制输入不会太大,因此代价函数中添加了一项对控制量的约束。文章来源:https://www.toymoban.com/news/detail-402503.html
将状态方程带入代价函数,变量仅剩u,以上最优化问题可用二次规划方法求解,得到满足目标代价函数的最优控制序列文章来源地址https://www.toymoban.com/news/detail-402503.html
MPC与PID的区别
- PID控制器不具有“前瞻性”:参与计算的各个量,有当前的 ,上个控制周期的 ,以及之前所有的 累计和,没有未来的 。
- PID属于无模型控制。PID仅仅通过目标和当前状态的差距,以及三个控制参数,就输出控制量
Matlab实现MPC函数
function [M,C,Q_bar,R_bar,G,E,H,U_k] = MPC_Zero_Ref(A,B,N,x_k,Q,R,F)
%%%%%%%%%%%建立一个以0为参考目标的MPC求解函数
%%%%%%%%%%%其中,状态矩阵A,输入矩阵B系统维度N,初始条件x_k,权重矩阵Q,R及终端误差矩阵F为输入
%%%%%%%%%%%输出中U_k为所求控制器,其余为简化过程中引入的中间变量
n=size(A,1); %A是n×n矩阵,求n
p=size(B,2); %B是n×p矩阵,求p
M=[eye(n);zeros(N*n,n)];%初始化M矩阵,M矩阵是(N+1)n × n的,
%它上面是n × n个“I”,这一步先把下半部分写成0
C=zeros((N+1)*n,N*p);%初始化C矩阵,这一步令它有(N+1)n × NP个0
%定义M和C
tmp=eye(n);%定义一个n × n的I矩阵
for i=1:N%循环,i从1到N
rows = i*n+(1:n);%定义当前行数,从i×n开始,共n行
C(rows,:)=[tmp*B,C(rows-n,1:end-p)];%将C矩阵填满
tmp=A*tmp;%每一次将tmp左乘一次A
M(rows,:)=tmp;%将M矩阵写满
end
%定义Q_bar
S_q=size(Q,1);%找到Q的维度
S_r=size(R,1);%找到R的维度
Q_bar=zeros((N+1)*S_q,(N+1)*S_q);%初始化Q_bar为全0矩阵
for i=0:N
Q_bar(i*S_q+1:(i+1)*S_q,i*S_q+1:(i+1)*S_q)=Q;%将Q写到Q_bar的对角线上
end
Q_bar(N*S_q+1:(N+1)*S_q,N*S_q+1:(N+1)*S_q)=F;%将F放在最后一个位置
%定义R_bar
R_bar=zeros(N*S_r,N*S_r);%初始化R_bar为全0矩阵
for i=0:N-1
R_bar(i*S_r+1:(i+1)*S_r,i*S_r+1:(i+1)*S_r)=R;
end
%求解
G=M'*Q_bar*M;%G
E=C'*Q_bar*M;%E
H=C'*Q_bar*C+R_bar;%H
%最优化
f=(x_k'*E')';%定义f矩阵
U_k=quadprog(H,f);%用二次规划求解最优化U_k
end
到了这里,关于模型预测控制(MPC)简介及matlab实现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!