最优化：建模、算法与理论（最优性理论2-Toy模板网

这篇具有很好参考价值的文章主要介绍了最优化：建模、算法与理论（最优性理论2。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

5.7 约束优化最优性理论应用实例

5.7.1 仿射空间的投影问题

考虑优化问题
$\min_{x{\in}R^n}\frac{1}{2}||x-y||_2^2,\\ s.t.{\quad}Ax=b$
其中 $A{\in}R^{m \times n},b{\in}R^m,y{\in}R^n$ 为给定的矩阵和向量，这里不妨设矩阵A是行满秩的，这个问题可以看成仿射平面 $\{x{\in}R^n|Ax=b\}$ 的投影问题
对于等式约束，我们引入拉格朗日乘子 $\lambda{\in}R^m$ ，构造拉格朗日函数
$L(x,\lambda)=\frac{1}{2}||x-y||^2+\lambda^T(Ax-b)$
因为只有仿射约束，估 $Sl a t er$ 条件满足， $x^*$ 为一个全局最优解，当且仅当存在 $\lambda^*{\in}R^m$ 使得
$\left\{ \begin{matrix} x^*-y+A^T\lambda=0\\ Ax^*=b \\ \end{matrix} \right.$
由上述KKT条件第一式，等号左右两边同时左乘 $A$ 可得
$Ax^*-Ay+AA^T\lambda=0$
注意到 $Ax^*=b$ 以及 $AA^T$ 是可逆矩阵，因此可以解出乘子
$\lambda=(AA^T)^{-1}(Ay-b)$
代入回去可以得到
$x^*=y-A^T(AA^T)^{-1}(Ay-b)$

5.7.2 线性规划问题

考虑线性规划问题
$\min_{x{\in}R^n}{\quad}c^Tx,\\ s.t.{\quad}Ax=b,\\ x{\ge}0\tag{5.7.1}$
其中 $A{\in}R^{m \times n},b{\in}R^m,c{\in}R^n$ 分别为给定的矩阵和向量
拉格朗日函数可以写为
$L(x,s,v)=c^Tx+v^T(Ax-b)-s^Tx\\ =-b^Tv+(A^Tv-s+c)^Tx,s{\ge}0$
其中 $s{\in}R^n,v{\in}R^m$ ，由于线性规划是凸问题且满足 $Sl a t er$ 条件的，因此对于任意一个全局最优解 $x^*$ ，我们有如下KKT条件
$\left\{ \begin{matrix} c+A^Tv^*-s^*=0,\\ Ax^*=b \\ x^*{\ge}0\\ s^*{\ge}0\\ s^*x^*=0 \end{matrix} \right.\tag{5.7.2}$
我们设原始问题和对偶问题最优解函数值分别为 $p^*$ 和 $d^*$ ，则根据 $p^*$ 取值情况，有如下三种可能
（1）如果 $-\infty<p^*<+\infty(有界)$ ，那么原始问题可行而且存在最优解，由 $Sl a t er$ 条件知强对偶原理成立，因此有 $d^*=p^*$ ，即对偶问题也是可行的且存在最优解
（2）如果 $p^*=-\infty$ ，那么原始问题可行，但目标函数值无下界，由弱对偶原理知 $d^*{\le}p^*=-\infty$ ，即 $d^*=-\infty$ ，因为对偶问题是对目标函数极大化，所以此时对偶问题不可行
（3）如果 $p^*=+\infty$ ，那么原始问题无可行解，注意到 $Sl a t er$ 条件对原始问题不成立，此时对偶问题既可能是函数值无界（ $d^*=+\infty$ ）也可能无可行解（ $d^*=-\infty$ ），我们说，不可能出现 $d^*<+\infty$ 的情形，这是因为如果对偶问题可行且存在最优解，那么可对对偶问题应用强对偶原理，进而导出原始问题也存在最优解，这矛盾了
最优化：建模、算法与理论（最优性理论2,算法

5.7.3 基追踪

$\min_{x{\in}R^n}||x||_1,\\ s.t.{\quad}Ax=b\tag{5.7.3}$
利用分解 $x_i=x_i^+-x_i^-$ ，其中 $x_i^+=max\{x_i,0\},x_i^-=\max\{-x_i,0\}$ 分别表示 $x$ 的正部和负部，问题5.7.3的一种等价形式可以写成
$\min{\sum_i}x_i^++x_i^-,\\ s.t.{\quad}Ax^+-Ax^-=b,\\ x^+,x^-{\ge}0$
进一步的，令 $y=[x_i^+,x_i^-]^T{\in}R^{2n}$ ，我们将问题5.7.3转化为如下线性规划问题
$\min_{y{\in}R^{2n}}1^Ty,\\ s.t.{\quad}[A,-A]y=b,\\ y{\ge}0$
其中 $1=(1,1,\cdots,1)^T{\in}R^{2n}$
那么根据一般线性规划的最优性条件，等价于求解
$\left\{ \begin{matrix} 1+[A,-A]^Tv^*-s^*=0,\\ [A,-A]y^*=b \\ y^*{\ge}0\\ s^*{\ge}0\\ s^*y^*=0 \end{matrix} \right.\tag{5.7.4}$
同样的，我们也可以直接推导5.7.3的最优性条件，拉格朗日函数为
$L(x,v)=||x||_1+v^T(Ax-b)$
$x^*$ 为全局最优解当且仅当存在 $v^*{\in}R^m$ 使得
$\left\{ \begin{matrix} 0{\in}\partial||x^*||_1+A^Tv^*,\\ Ax^*=b \\ \end{matrix} \right.\tag{5.7.5}$
最优性条件5.7.4和5.7.5本质上是等价的

5.7.4 最大割问题的半定规划松弛以及非凸分解模型

第三章说明了最大割问题的半定规划松弛问题。如下
$\max{\quad}<C,X>,\\ s.t.{\quad}X_{ii}=1,i=1,2,\cdots,n,\\ X{\succeq}0\tag{5.7.6}$
该问题是一个凸优化问题，并且Slater约束品性成立，对于等式约束，我们引入拉格朗日乘子 $\mu_{i}R,i=1,2,\cdots,n$ ；对于半正定约束，根据对偶锥，我们引入拉格朗日乘子 $\Lambda{\in}\mathcal{S}_+^n$ ，拉格朗日函数为
$L(X,\mu,\Lambda)=<C,X>+\sum_{i=1}^n\mu_i(X_{ii}-1)-Tr(X\Lambda)$
根据约束优化问题的最优性条件
$\left\{ \begin{matrix} C+Diag(u^*)-\Lambda^*=0,\\ X_{ii}^*=1 \\ X^*{\ge}0\\ \Lambda^*{\ge}0\\ Tr(X^*\Lambda^*)=0 \end{matrix} \right.$
这个转化成迹就是因为 $X和\Lambda$ 的半正定性，上述条件 $Tr(X^*\Lambda^*)=0$ 可以等价地用 $X^*\Lambda^*$ 代替
下面的非凸分解模型还没看明白。。。以后有机会回来补文章来源地址https://www.toymoban.com/news/detail-722677.html