模型预测控制（MPC）简介及matlab实现

这篇具有很好参考价值的文章主要介绍了模型预测控制（MPC）简介及matlab实现。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

基本概念

全称：Model-based Predictive Control(MPC)—模型预测控制

本质：MPC利用一个已有的模型、系统当前的状态和未来的控制量，来预测系统未来的输出，然后与我们期望的系统输出做比较，得到代价函数，通过优化的方法，优化出未来控制量，使得代价函数最小。优化出来的控制量即算法的输出。

模型预测控制（MPC）简介及matlab实现

核心思想：以优化方法求解最优控制器，其中优化方法大多时候采用二次规划（Quadratic Programming）

控制输出：MPC控制器优化得到的控制输出也是系统在未来有限时间步的控制序列。当然，由于理论构建的模型与系统真实模型都有误差，所以，实际上更远未来的控制输出对系统控制的价值很低，故MPC仅执行输出序列中的第一个控制输出。

模型分类：

机理模型
基于数据的模型，例如用神经网络训练一个modle，使用基于数据的模型的MPC可以结合model based RL使用

预测：根据已有模型，已经未来有限时间步的控制序列，预测出未来的系统状态

控制：优化的控制量，是一个未来有限时间步的控制序列

预测区间（Predictive Horizon）：
对于一般的离散化系统，在k时刻，我们可以测量出系统的当前状态y(k),再通过优化计算得到u(k),u(k+1),u(k+2),u(k+j),根据模型与控制量，得到系统未来状态的估计值y(k),y(k+1),y(k+2),y(k+j)。

其中系统未来状态的估计值y(k),y(k+1),y(k+2),y(k+j)这部分就称为预测区间的系统预测值，指的是一次优化后预测未来输出的时间步的个数

控制区间（Control Horizon）
将控制估计的部分称为控制区间，通过优化计算得到u(k),u(k+1),u(k+2),u(k+j)这部分就称为控制区间的控制量，
在得到最优输入之后，我们只施加当前时刻的输入u(k)，即控制区间的第一位控制输入

区间参数配置：
过小的控制区间，可能无法做到较好的控制，而较大的控制区间，比如与预测区间相等，则会导致只有前一部分的控制范围才会有较好的效果，而后一部分的控制范围则收效甚微，而且将带来大量的计算开销。

约束：对于约束，一般分为：

Hard约束：物理性质的约束，不可以违背，例如方向盘的转向，刹车的深度
Soft约束：软件约束，可以违反，例如最大的速度

MPC 优点：

善于处理多输入多输出系统（MIMO）
可以处理约束，如安全性约束，上下阈值
是一种向前考虑未来时间步的有限时域优化方法（一定的预测能力）

控制框图：
模型预测控制（MPC）简介及matlab实现

MPC算法整体流程

模型预测控制在k时刻共需三步

第一步：获取系统的当前状态；
第二步：基于u(k),u(k+1),u(k+2),u(k+j)进行最优化处理，代价函数为
其中EN 表示误差的终值，也是衡量优劣的一种标准。
第三步：只取u ( k )作为控制输入施加在系统上。

在下一时刻重复以上三步，在下一步进行预测时使用的就是下一步的状态值，我们将这样的方案称为滚动优化控制（Receding Horizon Control）。

数学建模

线性模型

当模型是线性的时候，MPC的设计求解一般使用二次规划方法。
设线性模型为以下形式：
模型预测控制（MPC）简介及matlab实现
假定未来m步的控制输入已知u(k),u(k+1),u(k+2),u(k+m),根据以上模型与输入，我们可以计算未来m步的状态：

将上面m步写成矩阵向量形式：

其中，

上式B中的下三角形式，直接反映了系统在时间上的因果关系，即k + 1时刻的输入对k 时刻的输出没有影响，k+2时刻的输入对k和k+1时刻没有影响。

假定参考轨迹为
模型预测控制（MPC）简介及matlab实现
则MPC的一个简单的目标代价函数如下：

uTRu 这一项是为了让控制输入不会太大，因此代价函数中添加了一项对控制量的约束。

将状态方程带入代价函数，变量仅剩u,以上最优化问题可用二次规划方法求解，得到满足目标代价函数的最优控制序列文章来源地址https://www.toymoban.com/news/detail-402503.html

MPC与PID的区别

PID控制器不具有“前瞻性”：参与计算的各个量，有当前的，上个控制周期的，以及之前所有的累计和，没有未来的。
PID属于无模型控制。PID仅仅通过目标和当前状态的差距，以及三个控制参数，就输出控制量

Matlab实现MPC函数

function [M,C,Q_bar,R_bar,G,E,H,U_k] = MPC_Zero_Ref(A,B,N,x_k,Q,R,F)
 
%%%%%%%%%%%建立一个以0为参考目标的MPC求解函数
%%%%%%%%%%%其中，状态矩阵A，输入矩阵B系统维度N，初始条件x_k,权重矩阵Q,R及终端误差矩阵F为输入
%%%%%%%%%%%输出中U_k为所求控制器，其余为简化过程中引入的中间变量
 
n=size(A,1); %A是n×n矩阵，求n
p=size(B,2); %B是n×p矩阵，求p
M=[eye(n);zeros(N*n,n)];%初始化M矩阵，M矩阵是(N+1)n × n的，
                        %它上面是n × n个“I”，这一步先把下半部分写成0
C=zeros((N+1)*n,N*p);%初始化C矩阵，这一步令它有(N+1)n × NP个0
%定义M和C
tmp=eye(n);%定义一个n × n的I矩阵
for i=1:N%循环，i从1到N
    rows = i*n+(1:n);%定义当前行数，从i×n开始，共n行
    C(rows,:)=[tmp*B,C(rows-n,1:end-p)];%将C矩阵填满
    tmp=A*tmp;%每一次将tmp左乘一次A
    M(rows,:)=tmp;%将M矩阵写满
end
%定义Q_bar
S_q=size(Q,1);%找到Q的维度
S_r=size(R,1);%找到R的维度
Q_bar=zeros((N+1)*S_q,(N+1)*S_q);%初始化Q_bar为全0矩阵
for i=0:N
    Q_bar(i*S_q+1:(i+1)*S_q,i*S_q+1:(i+1)*S_q)=Q;%将Q写到Q_bar的对角线上
end
Q_bar(N*S_q+1:(N+1)*S_q,N*S_q+1:(N+1)*S_q)=F;%将F放在最后一个位置
 
%定义R_bar
R_bar=zeros(N*S_r,N*S_r);%初始化R_bar为全0矩阵
for i=0:N-1
    R_bar(i*S_r+1:(i+1)*S_r,i*S_r+1:(i+1)*S_r)=R;
end
 
%求解
G=M'*Q_bar*M;%G
E=C'*Q_bar*M;%E
H=C'*Q_bar*C+R_bar;%H
%最优化
f=(x_k'*E')';%定义f矩阵
U_k=quadprog(H,f);%用二次规划求解最优化U_k
end