一分钟读懂:矩阵的特征值分解、奇异值分解和伪逆矩阵

这篇具有很好参考价值的文章主要介绍了一分钟读懂:矩阵的特征值分解、奇异值分解和伪逆矩阵。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

通过把矩阵运算分解成多个矩阵的乘法,可以简化矩阵运算,也可发现对应线性变换的一些内在规律和特性。根据不同的目的,有不同的分解策略。本文我们讨论最常用的特征值分解和奇异值分解。

1. 矩阵的乘方运算

定义了矩阵的加、减、乘、除(逆)运算后,数学家们自然希望探索矩阵更多的计算技巧。其中,矩阵的乘方运算 A n A^n An A A A 是方阵)成为一个引人注目的目标。例如,在离散系统动力学这类应用中,需要经常研究下述计算:
x n = A x n − 1 = A n x 0 \bm{x}_n=A\bm x_{n-1}=A^n\bm x_0 xn=Axn1=Anx0

2. 特征值分解

矩阵的特征值分解可以解决矩阵的乘方问题,最关键的公式如下:
A = P D P − 1 A=PDP^{-1} A=PDP1
有了特征值分解,矩阵乘方的计算可以大大简化,参见下面公式:
A n = ( P D P − 1 ) n = P D n P − 1 A^n=(PDP^{-1})^n=PD^nP^{-1} An=(PDP1)n=PDnP1
特征值矩阵 D D D 是对角矩阵,乘方运算特别简单:
D n = [ λ 1 n . . . λ m n ] D^n=\left[ \begin{matrix} \lambda_1^n&&\\ &...&\\ &&\lambda_m^n \end{matrix} \right] Dn= λ1n...λmn
于是,矩阵乘方问题得以解决。

3. 伪逆矩阵

满秩方阵是可以求逆的。奇异矩阵(不满秩方阵)和非方阵能否实现逆运算?具体一点,如果
y = A x \bm y = A \bm x y=Ax
是否存在矩阵 A + A^+ A+,使得
x = A + y \bm x = A^+ \bm y x=A+y
这里, A + A^+ A+ 称为伪逆矩阵。

4. 对称矩阵

A A A 可能不是方阵,但 A A T AA^T AAT A T A A^TA ATA 都是方阵,而且还是对称矩阵。通过对矩阵 A A T AA^T AAT A T A A^TA ATA 做特征值分解,可巧妙地解决伪逆矩阵的求法问题。不过先不要着急,我们介绍对称矩阵一个很重要的性质:对称矩阵的特征向量是相互正交的。 这一结论证明如下:

假设 A T = A A^T=A AT=A,其特征值 λ 1 , λ 2 \lambda_1, \lambda_2 λ1,λ2 对应的特征向量为 x 1 , x 2 \bm x_1, \bm x_2 x1,x2,于是:
λ 1 x 1 ⋅ x 2 = ( λ 1 x 1 ) T x 2 = ( A x 1 ) T x 2 = x 1 T A T x 2 = x 1 T A x 2 = x 1 T λ 2 x 2 = λ 2 x 1 T x 2 = λ 2 x 1 ⋅ x 2 \begin{array}{lll} \lambda_1\bm x_1 \cdot \bm x_2 & = & (\lambda_1\bm x_1)^T\bm x_2\\ & = &(A\bm x_1)^T\bm x_2\\ &=& \bm x_1^TA^T\bm x_2\\ &=& \bm x_1^TA\bm x_2\\ &=& \bm x_1^T\lambda_2\bm x_2\\ &=&\lambda_2\bm x_1^T\bm x_2\\ &=&\lambda_2\bm x_1\cdot\bm x_2 \end{array} λ1x1x2=======(λ1x1)Tx2(Ax1)Tx2x1TATx2x1TAx2x1Tλ2x2λ2x1Tx2λ2x1x2
由于 λ 1 ≠ λ 2 \lambda_1 \neq \lambda_2 λ1=λ2,于是,
x 1 ⋅ x 2 = 0 \bm x_1 \cdot \bm x_2 = 0 x1x2=0

5. 正交矩阵

因此,矩阵 A A T AA^T AAT A T A A^TA ATA 的特征向量矩阵是正交矩阵。关于正交矩阵,有如下重要性质:

假设 P P P 是正交矩阵,则:
P P T = I PP^T=I PPT=I
于是,得到
P − 1 = P T P^{-1}=P^T P1=PT

6. A A T AA^T AAT 的特征值分解

接下来有好戏看了,我们来分解一下 A A T AA^T AAT
A A T = P D P − 1 = P D P T AA^T=PDP^{-1}=PDP^T AAT=PDP1=PDPT
其中, D D D 是特征值矩阵,也是一个对角矩阵, P P P 则是一个正交矩阵。上面的这个公式在强烈地提醒我们,矩阵 A A A 大概可以分解成下面的形式:
A = P S Q A=PSQ A=PSQ
其中 S S S 是对角矩阵, P P P m × m m \times m m×m 正交矩阵, Q Q Q n × n n\times n n×n 正交矩阵。如果真的如此的话,下面的公式应该成立:
A A T = ( P S Q ) ( P S Q ) T = P S Q Q T S T P T = P S 2 P T AA^T=(PSQ)(PSQ)^T=PSQQ^TS^TP^T=PS^2P^T AAT=(PSQ)(PSQ)T=PSQQTSTPT=PS2PT
豁然开朗,原来对角矩阵 S S S 是特征值矩阵 D D D 的平方根,对角线上的这些非零数值就是所谓的奇异值。 S S S P P P 求出来后, Q Q Q 可以如下求解:
A = P S Q Q = S − 1 P T A = S − 1 P T A A=PSQ\\ Q=S^{-1}P^TA=S^{-1}P^TA A=PSQQ=S1PTA=S1PTA
另外, Q Q Q 是正交矩阵,原因如下:
Q Q T = ( S − 1 P T A ) ( S − 1 P T A ) T = S − 1 P T A A T P S − 1 = S − 1 P T P D P T P S − 1 = S − 1 D S − 1 = S − 1 S S S − 1 = I \begin{array}{lll} QQ^T&=&(S^{-1}P^TA)(S^{-1}P^TA)^T\\ &=&S^{-1}P^TAA^TPS^{-1}\\ &=&S^{-1}P^TPDP^TPS^{-1}\\ &=&S^{-1}DS^{-1}\\ &=&S^{-1}SSS^{-1}\\ &=&I \end{array} QQT======(S1PTA)(S1PTA)TS1PTAATPS1S1PTPDPTPS1S1DS1S1SSS1I
于是,我们得到一般性的结论,奇异值分解对任何矩阵都有效,甚至适用于非方阵。

7. 奇异值分解

根据前面的分析,假设矩阵 A A A m × n ( m ≠ n ) m \times n (m \neq n) m×n(m=n),我们可以将矩阵 A A A 分解如下。
A = U Σ V T A=U\Sigma V^T A=UΣVT

  • U U U是一个正交矩阵 ( m × m ) (m \times m) (m×m)
  • Σ \Sigma Σ 是一个对角线矩阵 ( m × n ) (m \times n) (m×n)
  • V V V 是一个正交矩阵 ( n × n ) (n \times n) (n×n)

这就是矩阵的奇异值分解。矩阵 A A A 的奇异值实际上就是 A A T AA^T AAT 的特征值的平方根。

8. 求伪逆矩阵

有了前面的基础,终于可以求伪逆矩阵了。定义矩阵 A A A 的伪逆矩阵 A + A^+ A+ 如下:
A = U Σ V T A + = V D + U T A=U\Sigma V^T\\ A^+=VD^+U^T A=UΣVTA+=VD+UT

假设 Σ \Sigma Σ 的定义如下:

Σ = [ σ 1 σ 2 . . . σ s 0 . . . 0 ] \Sigma= \left[ \begin{matrix} \sigma_1&&&&&&\\ &\sigma_2&&&&&\\ &&...&&&&&\\ &&&\sigma_s&&&\\ &&&&0&&&\\ &&&&&...&\\ &&&&&&0 \end{matrix} \right] Σ= σ1σ2...σs0...0

那么D+的定义如下:
D + = [ 1 σ 1 1 σ 2 . . . 1 σ s 0 . . . 0 ] D^+= \left[ \begin{matrix} \frac1{\sigma_1}&&&&&&\\ &\frac1{\sigma_2}&&&&&\\ &&...&&&&&\\ &&&\frac1{\sigma_s}&&&\\ &&&&0&&&\\ &&&&&...&\\ &&&&&&0 \end{matrix} \right] D+= σ11σ21...σs10...0
我们计算 A + A A^+A A+A

A + A = ( V D + U T ) ( U Σ V T ) = V D Σ V T N o t e : D + Σ = I = V V T = I \begin{array}{ccl} A^+A&=&(VD^+U^T)(U\Sigma V^T)\\ &=&VD\Sigma V^T & Note: D^+\Sigma = I\\ &=&VV^T\\ &=&I \end{array} A+A====(VD+UT)(UΣVT)VDΣVTVVTINote:D+Σ=I

以同样的方式, A A + = I AA^+ = I AA+=I
综上所述,如果我们能够对矩阵 A A A 进行奇异值分解,我们就可以通过 V D + U T VD^+U^T VD+UT 来计算 A + A^+ A+,这是一个 A A A 的伪逆矩阵。文章来源地址https://www.toymoban.com/news/detail-770832.html

到了这里,关于一分钟读懂:矩阵的特征值分解、奇异值分解和伪逆矩阵的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 矩阵的谱分解 (详细推导步骤~~~特征值分解特征向量

           所谓矩阵的分解,就是将一个矩阵写成结构比较简单的或性质比较熟悉的另一些矩阵的乘积。矩阵的分解方法有很多种,包括三角分解、QR(正交三角)分解、最大秩分解、奇异值分解和谱分解,所有这些分解在数值代数和最优化问题的解法中都扮演着十分重要的角

    2024年02月05日
    浏览(39)
  • 线性代数高级--二次型--特征值与特征向量--特征值分解--多元函数的泰勒展开

    目录 二次型 概念 示例   性质和特点 特征值与特征向量 概念 示例  注意  性质和特点  特征值分解 注意 多元函数的泰勒展开  回顾一元函数泰勒展开  多元函数的泰勒展开 概念 二次型是一个关于向量的二次多项式,通常用矩阵表示。 考虑一个n维向量x = [x₁, x₂, ...,

    2024年02月11日
    浏览(41)
  • 特征值和特征向量的解析解法--带有重复特征值的矩阵

    当一个矩阵具有重复的特征值时,意味着存在多个线性无关的特征向量对应于相同的特征值。这种情况下,我们称矩阵具有重复特征值。 考虑一个n×n的矩阵A,假设它有一个重复的特征值λ,即λ是特征值方程det(A-λI) = 0的多重根。我们需要找到与特征值λ相关的特征向量。 首

    2024年02月05日
    浏览(33)
  • 线性代数|证明:矩阵特征值的倒数是其逆矩阵的特征值

    性质 1 若 λ lambda λ 是 A boldsymbol{A} A 的特征值,当 A boldsymbol{A} A 可逆时, 1 λ frac{1}{lambda} λ 1 ​ 是 A − 1 boldsymbol{A}^{-1} A − 1 的特征值。 证明 因为 λ lambda λ 是 A boldsymbol{A} A 的特征值,所以有 p ≠ 0 boldsymbol{p} ne 0 p  = 0 使 A p = λ p boldsymbol{A} boldsymbol{p} = lambda

    2024年02月08日
    浏览(36)
  • 【问题证明】矩阵方程化为特征值方程求得的特征值为什么是全部特征值?不会丢解吗?

    这个问题困扰了我好久,一直感觉如果有其他的特征值没法证伪,不过一直存在思想的层面,没有实际解决,今天突然想到动笔来解决,遂得解,证明如下。 这个证明看似证明过后很直观,但实际上思维走向了牛角尖的时候光靠思考是无法得出令人信服的结论的,唯有实际动

    2024年02月05日
    浏览(46)
  • 《数值分析》-3-特征值与特征矩阵

    搜索技术的很多方面的知识发现都依赖于特征值或奇异值问题,涉及到特征值计算问题。 计算特征值没有直接的方法。 定位特征值的计算方法基于幂迭代的思想,这是求解特征值的一类迭代方法。该思想的一个复杂版本被称为QR算法,是确定典型矩阵所有特征值的一般方法。

    2024年02月08日
    浏览(35)
  • 5.1 矩阵的特征值和特征向量

    学习特征值和特征向量的定义和性质,我会采取以下方法: 1. 学习线性代数基础知识:特征值和特征向量是线性代数中的重要概念,需要先掌握线性代数的基础知识,例如向量、矩阵、行列式、逆矩阵、转置、内积、外积等基本概念。 2. 学习特征值和特征向量的定义:特征

    2024年02月02日
    浏览(38)
  • MATLAB矩阵的特征值与特征向量

    设A是n阶方阵,如果存在常数λ和n维非零列向量x,使得等式Ax = λx 成立,则称λ为A的特征值,x是对应特征值λ的特征向量。 在MATLAB中,计算矩阵的特征值与特征向量的函数是eig,常用的调用格式有两种: E = eig(A):求矩阵A的全部特征向量值,构成向量E。 [X,D] = eig(A):

    2024年02月11日
    浏览(32)
  • 特征值与相似矩阵

    应用:求幂,对角化,二次型,动力系统等等 通俗 ​ 向量α在矩阵A的线性变换作用下,保持方向不变,进行比例为λ的伸缩。 官方(注意是方阵) 特征方程 ​ (λE-A)α = 0 (α!=0)特征向量不能为0,但是 特征值可以为0或虚数 。方程中λ的次数应与A的 阶数相同 ,否则不是

    2024年02月06日
    浏览(38)
  • 从浅到深研究矩阵的特征值、特征向量

    本篇特征值、特征向量笔记来源于MIT线性代数课程。 对于方阵而言,现在要找一些特殊的数字,即特征值,和特殊的向量,即特征向量。 给定矩阵A,矩阵A作用在向量上,得到向量Ax(A的作用,作用在一个向量上,这其实就类似于函数,输入向量x,得到向量Ax) 在这些向量

    2024年02月12日
    浏览(36)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包