一分钟读懂：矩阵的特征值分解、奇异值分解和伪逆矩阵-Toy模板网

这篇具有很好参考价值的文章主要介绍了一分钟读懂：矩阵的特征值分解、奇异值分解和伪逆矩阵。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

通过把矩阵运算分解成多个矩阵的乘法，可以简化矩阵运算，也可发现对应线性变换的一些内在规律和特性。根据不同的目的，有不同的分解策略。本文我们讨论最常用的特征值分解和奇异值分解。

1. 矩阵的乘方运算

定义了矩阵的加、减、乘、除（逆）运算后，数学家们自然希望探索矩阵更多的计算技巧。其中，矩阵的乘方运算 $A^n$ （ $A$ 是方阵）成为一个引人注目的目标。例如，在离散系统动力学这类应用中，需要经常研究下述计算：
$\bm{x}_n=A\bm x_{n-1}=A^n\bm x_0$

2. 特征值分解

矩阵的特征值分解可以解决矩阵的乘方问题，最关键的公式如下：
$A=PDP^{-1}$
有了特征值分解，矩阵乘方的计算可以大大简化，参见下面公式：
$A^n=(PDP^{-1})^n=PD^nP^{-1}$
特征值矩阵 $D$ 是对角矩阵，乘方运算特别简单：
$D^n=\left[ \begin{matrix} \lambda_1^n&&\\ &...&\\ &&\lambda_m^n \end{matrix} \right]$
于是，矩阵乘方问题得以解决。

3. 伪逆矩阵

满秩方阵是可以求逆的。奇异矩阵（不满秩方阵）和非方阵能否实现逆运算？具体一点，如果
$\bm y = A \bm x$
是否存在矩阵 $A^+$ ，使得
$\bm x = A^+ \bm y$
这里， $A^+$ 称为伪逆矩阵。

4. 对称矩阵

$A$ 可能不是方阵，但 $AA^T$ 或 $A^TA$ 都是方阵，而且还是对称矩阵。通过对矩阵 $AA^T$ 或 $A^TA$ 做特征值分解，可巧妙地解决伪逆矩阵的求法问题。不过先不要着急，我们介绍对称矩阵一个很重要的性质：对称矩阵的特征向量是相互正交的。 这一结论证明如下：

假设 $A^T=A$ ，其特征值 $\lambda_1, \lambda_2$ 对应的特征向量为 $\bm x_1, \bm x_2$ ，于是：
$\begin{array}{lll} \lambda_1\bm x_1 \cdot \bm x_2 & = & (\lambda_1\bm x_1)^T\bm x_2\\ & = &(A\bm x_1)^T\bm x_2\\ &=& \bm x_1^TA^T\bm x_2\\ &=& \bm x_1^TA\bm x_2\\ &=& \bm x_1^T\lambda_2\bm x_2\\ &=&\lambda_2\bm x_1^T\bm x_2\\ &=&\lambda_2\bm x_1\cdot\bm x_2 \end{array}$
由于 $\lambda_1 \neq \lambda_2$ ，于是，
$\bm x_1 \cdot \bm x_2 = 0$

5. 正交矩阵

因此，矩阵 $AA^T$ 或 $A^TA$ 的特征向量矩阵是正交矩阵。关于正交矩阵，有如下重要性质：

假设 $P$ 是正交矩阵，则：
$PP^T=I$
于是，得到
$P^{-1}=P^T$

6. A A T AA^T AAT 的特征值分解

接下来有好戏看了，我们来分解一下 $AA^T$ ：
$AA^T=PDP^{-1}=PDP^T$
其中， $D$ 是特征值矩阵，也是一个对角矩阵， $P$ 则是一个正交矩阵。上面的这个公式在强烈地提醒我们，矩阵 $A$ 大概可以分解成下面的形式：
$A = PSQ$
其中 $S$ 是对角矩阵， $P$ 是 $\times m$ 正交矩阵， $Q$ 是 $n\times n$ 正交矩阵。如果真的如此的话，下面的公式应该成立：
$AA^T=(PSQ)(PSQ)^T=PSQQ^TS^TP^T=PS^2P^T$
豁然开朗，原来对角矩阵 $S$ 是特征值矩阵 $D$ 的平方根，对角线上的这些非零数值就是所谓的奇异值。 $S$ 和 $P$ 求出来后， $Q$ 可以如下求解：
$A=PSQ\\ Q=S^{-1}P^TA=S^{-1}P^TA$
另外， $Q$ 是正交矩阵，原因如下：
$\begin{array}{lll} QQ^T&=&(S^{-1}P^TA)(S^{-1}P^TA)^T\\ &=&S^{-1}P^TAA^TPS^{-1}\\ &=&S^{-1}P^TPDP^TPS^{-1}\\ &=&S^{-1}DS^{-1}\\ &=&S^{-1}SSS^{-1}\\ &=&I \end{array}$
于是，我们得到一般性的结论，奇异值分解对任何矩阵都有效，甚至适用于非方阵。

7. 奇异值分解

根据前面的分析，假设矩阵 $A$ 是 $\times n (m \neq n)$ ，我们可以将矩阵 $A$ 分解如下。
$A=U\Sigma V^T$

$U$ 是一个正交矩阵 $\times m)$
$\Sigma$ 是一个对角线矩阵 $\times n)$
$V$ 是一个正交矩阵 $\times n)$ 。

这就是矩阵的奇异值分解。矩阵 $A$ 的奇异值实际上就是 $AA^T$ 的特征值的平方根。

8. 求伪逆矩阵

有了前面的基础，终于可以求伪逆矩阵了。定义矩阵 $A$ 的伪逆矩阵 $A^+$ 如下：
$A=U\Sigma V^T\\ A^+=VD^+U^T$

假设 $\Sigma$ 的定义如下：

$\Sigma= \left[ \begin{matrix} \sigma_1&&&&&&\\ &\sigma_2&&&&&\\ &&...&&&&&\\ &&&\sigma_s&&&\\ &&&&0&&&\\ &&&&&...&\\ &&&&&&0 \end{matrix} \right]$

那么D+的定义如下：
$D^+= \left[ \begin{matrix} \frac1{\sigma_1}&&&&&&\\ &\frac1{\sigma_2}&&&&&\\ &&...&&&&&\\ &&&\frac1{\sigma_s}&&&\\ &&&&0&&&\\ &&&&&...&\\ &&&&&&0 \end{matrix} \right]$
我们计算 $A^+A$ ：