矩阵论的所有文章,主要内容参考北航赵迪老师的课件
[注]由于矩阵论对计算机比较重要,所以选修了这门课,但不是专业搞数学的,所以存在很多口语化描述,而且对很多东西理解不是很正确与透彻,欢迎大家指正。我可能间歇性忙,但有空一定会回复修改的。
矩阵论
1. 准备知识——复数域上矩阵,Hermite变换
1.准备知识——复数域上的内积域正交阵
1.准备知识——Hermite阵,二次型,矩阵合同,正定阵,幂0阵,幂等阵,矩阵的秩
2. 矩阵分解——SVD准备知识——奇异值
2. 矩阵分解——SVD
2. 矩阵分解——QR分解
2. 矩阵分解——正定阵分解
2. 矩阵分解——单阵谱分解
2. 矩阵分解——正规分解——正规阵
2. 矩阵分解——正规谱分解
2. 矩阵分解——高低分解
3. 矩阵函数——常见解析函数
3. 矩阵函数——谱公式,幂0与泰勒计算矩阵函数
3. 矩阵函数——矩阵函数求导
4. 矩阵运算——观察法求矩阵特征值特征向量
4. 矩阵运算——张量积
4. 矩阵运算——矩阵拉直
4.矩阵运算——广义逆——加号逆定义性质与特殊矩阵的加号逆
4. 矩阵运算——广义逆——加号逆的计算
4. 矩阵运算——广义逆——加号逆应用
4. 矩阵运算——广义逆——减号逆
5. 线性空间与线性变换——线性空间
5. 线性空间与线性变换——生成子空间
5. 线性空间与线性变换——线性映射与自然基分解,线性变换
6. 正规方程与矩阵方程求解
7. 范数理论——基本概念——向量范数与矩阵范数
7.范数理论——基本概念——矩阵范数生成向量范数&谱范不等式
7. 矩阵理论——算子范数
7.范数理论——范数估计——许尔估计&谱估计
7. 范数理论——非负/正矩阵
8. 常用矩阵总结——秩1矩阵,优阵(单位正交阵),Hermite阵
8. 常用矩阵总结——镜面阵,正定阵
8. 常用矩阵总结——单阵,正规阵,幂0阵,幂等阵,循环阵
6.1 正规方程
A H A x = A H b 为 A x = b 的正规方程 \begin{aligned} A^HAx=A^Hb为Ax=b的正规方程 \end{aligned} AHAx=AHb为Ax=b的正规方程
6.1.1 正规方程必有解
正规方程 A H A x = A H b A^HAx=A^Hb AHAx=AHb 必有解 ,且特解为 x 0 = A + b x_0=A^+b x0=A+b ,使 A H A x 0 = A H b A^HAx_0=A^Hb AHAx0=AHb
证明
由于
A
H
A
A
+
=
(
A
A
+
)
H
=
A
A
+
A
H
(
A
A
+
)
H
=
(
A
A
+
A
)
H
=
A
H
,
令
x
0
=
A
+
b
,
则
A
A
H
x
0
=
A
H
A
A
+
b
=
A
H
b
\begin{aligned} &由于A^HAA^+\xlongequal{(AA^+)^H=AA^+}A^H(AA^+)^H=(AA^+A)^H=A^H,\\ &令x_0=A^+b,则AA^Hx_0=A^HAA^+b=A^Hb \end{aligned}
由于AHAA+(AA+)H=AA+AH(AA+)H=(AA+A)H=AH,令x0=A+b,则AAHx0=AHAA+b=AHb
推论
若矩阵方程 A X D = B AXD=B AXD=B 有解,则有特解 X 1 = A + B D + X_1=A^+BD^+ X1=A+BD+
6.1.2 Ax=b 与 A H A x = A H b A^HAx=A^Hb AHAx=AHb 的关系
1. 若 A x = b 有解,则 A H A x = A H b 有解,且两个方程组同解(相容) 2. 若 A x = b 无解,则 A H x = A H b 仍然有解,且特解为 A + b (不相容) 1. 若Ax=b有解,则 A^HAx=A^Hb有解,且两个方程组同解(相容)\\ 2. 若Ax=b无解,则 A^Hx=A^Hb仍然有解,且特解为A^+b(不相容) 1.若Ax=b有解,则AHAx=AHb有解,且两个方程组同解(相容)2.若Ax=b无解,则AHx=AHb仍然有解,且特解为A+b(不相容)
a. A x = b Ax=b Ax=b 有解判定
若 A x = b Ax=b Ax=b 有解(相容),则可知 b ∈ R ( A ) = { y = A x ∣ x ∈ C n } b\in R(A)=\{y=Ax\vert x\in C^n\} b∈R(A)={y=Ax∣x∈Cn} ,即 A x = b Ax=b Ax=b 有解 ⟺ \iff ⟺ b ∈ R ( A ) b\in R(A) b∈R(A)
b. 无解定理
若 A x = b 无解 ( 不相容 ) ,则对一切 x ∈ C n , A x ≠ b , 即 A x = b 无解 ⟺ b ∉ R ( A ) 若 A x = b 无解,则队一切 x ∈ C n , A x ≠ b 必有 ∥ A x − b ∥ 2 > 0 , 即 A x = b 无解 ⟺ ∥ A x − b ∥ 2 > 0 \begin{aligned} &若Ax=b无解(不相容),则对一切x\in C^n,Ax\neq b,即Ax=b无解\iff b\notin R(A)\\ &若Ax=b无解,则队一切x\in C^n,Ax\neq b必有\Vert Ax-b\Vert^2>0,即 Ax=b无解\iff \Vert Ax-b \Vert^2>0 \end{aligned} 若Ax=b无解(不相容),则对一切x∈Cn,Ax=b,即Ax=b无解⟺b∈/R(A)若Ax=b无解,则队一切x∈Cn,Ax=b必有∥Ax−b∥2>0,即Ax=b无解⟺∥Ax−b∥2>0
若 x 0 = A + b 使 A x 0 ≠ b , 则 A x = b 无解(不相容) 若x_0=A^+b 使Ax_0\neq b,则 Ax=b 无解(不相容) 若x0=A+b使Ax0=b,则Ax=b无解(不相容)
c. 高阵的解
若 A = A m × n A=A_{m\times n} A=Am×n 为列满秩阵,则有 N ( A ) = { 0 ⃗ } N(A)=\{\vec{0}\} N(A)={0} ,即 A X = 0 AX=0 AX=0 只有零解 X = 0 ⃗ X=\vec{0} X=0
若A为高阵,则 A x = b Ax=b Ax=b 的解为 x 0 = A + b x_0=A^+b x0=A+b 的唯一解
eg
6.1.3 通解公式
a. A x = b Ax=b Ax=b 有解情形
设 A y = 0 Ay=0 Ay=0 基本解为 Y 1 , Y 2 , ⋯ , Y k Y_1,Y_2,\cdots,Y_k Y1,Y2,⋯,Yk ,则 A y = 0 Ay=0 Ay=0 有通解, y = t 1 Y 1 + t 2 Y 2 + ⋯ + t k Y k y=t_1Y_1+t_2Y_2+\cdots+t_kY_k y=t1Y1+t2Y2+⋯+tkYk ,可写 N ( A ) = { y ∣ A y = 0 } = { 全体 y = t 1 Y 1 + t 2 Y 2 + ⋯ + t k Y k } N(A)=\{y\vert Ay=0\}=\{全体y=t_1Y_1+t_2Y_2+\cdots+t_kY_k\} N(A)={y∣Ay=0}={全体y=t1Y1+t2Y2+⋯+tkYk}
且 A y = b Ay=b Ay=b 通解公式为 x = x 0 + ( t 1 Y 1 + t 2 Y 2 + ⋯ + t k Y k ) = Δ x 0 + y , ∀ y ∈ N ( A ) x=x_0+(t_1Y_1+t_2Y_2+\cdots+t_kY_k)\xlongequal{\Delta}x_0+y,\forall y\in N(A) x=x0+(t1Y1+t2Y2+⋯+tkYk)Δx0+y,∀y∈N(A) ,k=n-r(A)
最小二乘解
若 A x = b Ax=b Ax=b 有解,则哪个解x的长度平方 $\vert x\vert2=xHx=\vert x_1\vert^2+\cdots+\vert x_k\vert^2 $ 最小: x 0 = A + b x_0=A^+b x0=A+b
eg
r ( A ) = r ( A ∣ b ) = 1 ,故 A x = b 有解 x 0 = A + b = ( 1 1 2 2 ) + b = 1 10 ( 1 2 1 2 ) ( 1 2 ) = 1 10 ( 5 5 ) = ( 1 2 1 2 ) A x = 0 ⇒ ( 1 1 2 2 ) ( x 1 x 2 ) = 0 ⇒ x 1 + x 2 = 0 ⇒ A x = 0 通解 x = ( 1 − 1 ) A x = b 的通解公式为 X = ( 1 2 1 2 ) + t ( 1 − 1 ) \begin{aligned} &r(A)=r(A\vert b)=1,故Ax=b有解\\ &x_0=A^+b=\left( \begin{matrix} 1&1\\2&2 \end{matrix} \right)^+b=\frac{1}{10}\left( \begin{matrix} 1&2\\1&2 \end{matrix} \right)\left( \begin{matrix} 1\\2 \end{matrix} \right)=\frac{1}{10}\left( \begin{matrix} 5\\5 \end{matrix} \right)=\left( \begin{matrix} \frac{1}{2}\\\frac{1}{2} \end{matrix} \right)\\ &Ax=0\Rightarrow\left( \begin{matrix} 1&1\\2&2 \end{matrix} \right)\left( \begin{matrix} x_1\\x_2 \end{matrix} \right)=0\Rightarrow x_1+x_2=0\Rightarrow Ax=0通解x=\left( \begin{matrix} 1\\-1 \end{matrix} \right)\\ &Ax=b的通解公式为 X=\left( \begin{matrix} \frac{1}{2}\\\frac{1}{2} \end{matrix} \right)+t\left( \begin{matrix} 1\\-1 \end{matrix} \right) \end{aligned} r(A)=r(A∣b)=1,故Ax=b有解x0=A+b=(1212)+b=101(1122)(12)=101(55)=(2121)Ax=0⇒(1212)(x1x2)=0⇒x1+x2=0⇒Ax=0通解x=(1−1)Ax=b的通解公式为X=(2121)+t(1−1)
b. A x = b A x=b Ax=b 无解情形
若 A x = b Ax=b Ax=b 无解,则 ∣ A x − b ∣ 2 > 0 \vert Ax-b\vert^2>0 ∣Ax−b∣2>0 ,对于 x ∈ C n x\in C^n x∈Cn ,如何使 ∣ A x − b ∣ \vert Ax-b\vert ∣Ax−b∣ 最小: x 0 = A + b x_0=A^+b x0=A+b
若 ∣ A x 0 − b ∣ 2 \vert Ax_0-b\vert ^2 ∣Ax0−b∣2 为 ∣ A x − b ∣ 2 \vert Ax-b\vert^2 ∣Ax−b∣2 的最小值,则 x 0 x_0 x0 为 A x − b Ax-b Ax−b 的一个极小二乘解,即 ∣ A x 0 − b ∣ 2 \vert Ax_0-b\vert^2 ∣Ax0−b∣2 为 A X AX AX 与 b b b 的最小平方距离
证明
A
x
−
A
x
0
=
A
(
x
−
x
0
)
∈
R
(
A
)
,
∴
(
b
−
A
x
0
)
⊥
A
(
x
−
x
0
)
∣
A
x
−
b
∣
2
=
勾股定理
∣
A
(
x
−
x
0
)
+
A
(
x
0
−
b
)
∣
2
≥
∣
A
(
x
−
x
0
)
∣
2
+
∣
A
(
x
0
−
b
)
∣
2
≥
∣
A
(
x
0
−
b
)
∣
2
当且仅当
A
(
x
−
x
0
)
=
0
时,
∣
A
x
0
−
b
∣
2
=
∣
A
(
x
0
−
b
)
∣
2
最小
\begin{aligned} &Ax-Ax_0=A(x-x_0)\in R(A),\therefore (b-Ax_0)\bot A(x-x_0)\\ &\vert Ax-b\vert^2\xlongequal{勾股定理}\vert A(x-x_0)+A(x_0-b)\vert^2 \ge \vert A(x-x_0)\vert^2 + \vert A(x_0-b)\vert^2\ge \vert A(x_0-b)\vert^2\\ &当且仅当A(x-x_0) =0时, \vert Ax_0-b\vert^2=\vert A(x_0-b)\vert ^2最小 \end{aligned}
Ax−Ax0=A(x−x0)∈R(A),∴(b−Ax0)⊥A(x−x0)∣Ax−b∣2勾股定理∣A(x−x0)+A(x0−b)∣2≥∣A(x−x0)∣2+∣A(x0−b)∣2≥∣A(x0−b)∣2当且仅当A(x−x0)=0时,∣Ax0−b∣2=∣A(x0−b)∣2最小
小二解公式
令 x 0 = A + b x_0=A^+b x0=A+b ,则 A x = b Ax=b Ax=b 的全体小二解为 x = x 0 + Y , Y ∈ N ( A ) , A Y = 0 x=x_0+Y,Y\in N(A),AY=0 x=x0+Y,Y∈N(A),AY=0
最佳小二解
若 A x = b Ax=b Ax=b 无解,则 x 0 = A + b x_0=A^+b x0=A+b 为最佳小二解
eg
r ( A ) = 1 , r ( A ∣ b ) = 3 ,故 A x = b 无解 最佳小二解 x 0 = A + b = 1 6 ( 1 1 1 1 1 1 ) ( 1 2 3 ) = ( 1 1 ) , 令 A y = 0 , ⇒ x 1 + x 2 = 0 , 即 Y = ( 1 − 1 ) 全体小二解为 X = x 0 + t Y = ( 1 1 ) + t ( 1 − 1 ) \begin{aligned} &r(A)=1,r(A\vert b)=3,故Ax=b无解\\ &最佳小二解x_0=A^+b=\frac{1}{6}\left( \begin{matrix} 1&1&1\\1&1&1 \end{matrix} \right)\left( \begin{matrix} 1\\2\\3 \end{matrix} \right)=\left( \begin{matrix} 1\\1 \end{matrix} \right),令Ay=0,\Rightarrow x_1+x_2=0,即Y=\left( \begin{matrix} 1\\-1 \end{matrix} \right)\\ &全体小二解为X=x_0+tY=\left( \begin{matrix} 1\\1 \end{matrix} \right)+t\left( \begin{matrix} 1\\-1 \end{matrix} \right) \end{aligned} r(A)=1,r(A∣b)=3,故Ax=b无解最佳小二解x0=A+b=61(111111) 123 =(11),令Ay=0,⇒x1+x2=0,即Y=(1−1)全体小二解为X=x0+tY=(11)+t(1−1)
r ( A ) = 1 ≠ r ( A ∣ b ) = 2 , ∴ A x = b 无解 最佳小二解 x 0 = A + b = 1 10 ( 1 2 1 2 ) ( 1 3 ) = 1 10 ( 7 7 ) 设 A y = 0 ⇒ ( 1 1 2 2 ) ( y 1 y 2 ) = y 1 + y 2 = 0 ⇒ 齐次方程 A y = 0 的通解为 y = ( 1 − 1 ) ∴ A x = b 的通解为 x = x 0 + t y = 1 10 ( 7 7 ) + t ( 1 − 1 ) \begin{aligned} &r(A)=1\neq r(A\vert b)=2,\therefore Ax=b无解\\ &最佳小二解x_0=A^+b=\frac{1}{10}\left( \begin{matrix} 1&2\\1&2 \end{matrix} \right)\left( \begin{matrix} 1\\3 \end{matrix} \right)=\frac{1}{10}\left( \begin{matrix} 7\\7 \end{matrix} \right)\\ &设Ay=0\Rightarrow \left( \begin{matrix} 1&1\\2&2 \end{matrix} \right)\left( \begin{matrix} y_1\\y_2 \end{matrix} \right)=y_1+y_2=0\Rightarrow 齐次方程Ay=0的通解为 y=\left( \begin{matrix} 1\\-1 \end{matrix} \right)\\ &\therefore Ax=b的通解为 x=x_0+ty=\frac{1}{10}\left( \begin{matrix} 7\\7 \end{matrix} \right)+t\left( \begin{matrix} 1\\-1 \end{matrix} \right) \end{aligned} r(A)=1=r(A∣b)=2,∴Ax=b无解最佳小二解x0=A+b=101(1122)(13)=101(77)设Ay=0⇒(1212)(y1y2)=y1+y2=0⇒齐次方程Ay=0的通解为y=(1−1)∴Ax=b的通解为x=x0+ty=101(77)+t(1−1)
6.1.4 其他通解公式
a. A x = 0 Ax=0 Ax=0 的通解公式
A x = 0 的通解为 ξ = ( I n − A + A ) y , y ∈ C n Ax=0的通解为 \xi=(I_n-A^+A)y,y\in C^n\\ Ax=0的通解为ξ=(In−A+A)y,y∈Cn
可写核空间公式 N ( A ) = { w = ( I − A + A ) y ∣ y ∈ C n } N(A)=\{w=(I-A^+A)y\vert y\in C^n\} N(A)={w=(I−A+A)y∣y∈Cn}
b. A x = b Ax=b Ax=b 的通解
A x = b Ax=b Ax=b 的通解公式为 x = ( A + b ) + ( I n − A + A ) y , y ∈ C n x=(A^+b)+(I_n-A^+A)y,y\in C^n x=(A+b)+(In−A+A)y,y∈Cn
6.2 矩阵方程AXB=C求解
6.2.1 有解判定
a. 定理
拉直可求解线性矩阵方程 A X B = C AXB=C AXB=C ,其中 A = A m × n , X = X n × p , B = B p × q A=A_{m\times n},X=X_{n\times p},B=B_{p\times q} A=Am×n,X=Xn×p,B=Bp×q
记 X = ( x i j ) n × p X=(x_{ij})_{n\times p} X=(xij)n×p ,即为 n p np np 个未知量 x i j x_{ij} xij 的线性方程组
根据拉直公式,则方程 A X B = C AXB=C AXB=C 可被拉直为 ( A ⊗ B T ) X ⃗ = C ⃗ (A\otimes B^T)\vec{X}=\vec{C} (A⊗BT)X=C
推广:一般的线性矩阵方程
A
1
X
B
1
+
A
2
X
B
2
+
⋯
+
A
S
X
B
S
=
C
A_1XB_1+A_2XB_2+\cdots+A_SXB_S=C
A1XB1+A2XB2+⋯+ASXBS=C
A
1
X
B
1
+
A
2
X
B
2
+
⋯
+
A
s
X
B
s
→
=
C
⃗
⟺
(
A
1
⊗
B
1
T
+
⋯
+
A
s
⊗
B
s
T
)
X
⃗
=
C
⃗
\begin{aligned} \overrightarrow{A_1XB_1+A_2XB_2+\cdots+A_sXB_s}=\vec{C}\iff(A_1\otimes B_1^T+\cdots+A_s\otimes B_s^T)\vec{X}=\vec{C} \end{aligned}
A1XB1+A2XB2+⋯+AsXBs=C⟺(A1⊗B1T+⋯+As⊗BsT)X=C
拉直前有解则拉直后也有解
- A X B = C AXB=C AXB=C 有解的充要条件为 r ( A ⊗ B T ∣ C ⃗ ) = r ( A ⊗ B T ) r(A\otimes B^T\mid\vec{C})=r(A\otimes B^T) r(A⊗BT∣C)=r(A⊗BT)
- 齐次方程 A X B = 0 AXB=0 AXB=0 的基础解系含有 n p − r ( A ⊗ B T ) = n p − r ( A ) r ( B ) np-r(A\otimes B^T)=np-r(A)r(B) np−r(A⊗BT)=np−r(A)r(B) 个无关向量
b. 有解与唯一解条件
6.2.2 AXB=C求解
a. 有解情况
若矩阵方程
A
X
B
=
C
AXB=C
AXB=C 有解相容,则有特解
X
0
=
A
+
C
B
+
X_0=A^+CB^+
X0=A+CB+
证明:
若方程
A
X
B
=
C
有解,可设
X
=
W
是一个解
A
W
B
=
C
令特解
X
0
=
A
+
C
B
+
,
可证
A
X
0
B
=
A
A
+
C
B
+
B
=
C
=
A
W
B
A
A
+
A
W
B
B
+
B
=
A
W
B
=
C
\begin{aligned} 证明: &若方程 AXB=C 有解,可设X=W是一个解AWB=C\\ &令特解X_0=A^+CB^+,\\ &可证AX_0B=AA^+CB^+B\xlongequal{C=AWB}AA^+AWBB^+B=AWB=C \end{aligned}
证明:若方程AXB=C有解,可设X=W是一个解AWB=C令特解X0=A+CB+,可证AX0B=AA+CB+BC=AWBAA+AWBB+B=AWB=C
-
无解定理:若 X 0 = A + C B + X_0=A^+CB^+ X0=A+CB+ ,使 A X 0 B ≠ C AX_0B\neq C AX0B=C ,则矩阵方程无解
-
齐次方程 A X B = 0 AXB=0 AXB=0 的通解公式为: X = Y − A + A Y B B + X=Y-A^+AYBB^+ X=Y−A+AYBB+ Y为任一矩阵
-
矩阵方程 A X B = C AXB=C AXB=C 的通解公式为: X = X 0 + ( Y − A + A Y B B + ) = A + C B + + ( Y − A + A Y B B + ) X=X_0+(Y-A^+AYBB^+) = A^+CB^++(Y-A^+AYBB^+) X=X0+(Y−A+AYBB+)=A+CB++(Y−A+AYBB+)
A X A = A AXA=A AXA=A必有解,特解为 X 0 = A + A A + = A + X_0=A^+AA^+=A^+ X0=A+AA+=A+,通解为 X = X 0 + ( Y − A + A Y A A + ) X=X_0+(Y-A^+AYAA^+) X=X0+(Y−A+AYAA+)
eg
A 有特解 A 0 = A + = ( 1 , 0 , 0 ) 1 × 3 ,通解公式为 X = A + + ( Y − A + A Y A A + ) Y 与 A + 同型即 Y = Y 1 × 3 令 Y = ( a , b , c ) , 其中 a , b , c ∈ C X = A + + ( a , b , c ) − A + A ( a , b , c ) A A + = ( 1 , 0 , 0 ) + ( a , b , c ) − ( a , 0 , 0 ) = ( 1 , b , c ) \begin{aligned} &A有特解 A_0=A^+=\left(1,0,0\right)_{1\times 3},通解公式为 X=A^++(Y-A^+AYAA^+) \\ &Y与A^+同型即 Y=Y_{1\times 3}\\ &令Y=(a,b,c),其中a,b,c\in C\\ &X=A^++\left(a,b,c\right)-A^+A\left(a,b,c\right)AA^+=\left(1,0,0\right)+\left(a,b,c\right)-\left(a,0,0\right)=\left(1,b,c\right) \end{aligned} A有特解A0=A+=(1,0,0)1×3,通解公式为X=A++(Y−A+AYAA+)Y与A+同型即Y=Y1×3令Y=(a,b,c),其中a,b,c∈CX=A++(a,b,c)−A+A(a,b,c)AA+=(1,0,0)+(a,b,c)−(a,0,0)=(1,b,c)
解得: X = ( 1 , b , c ) T = ( 1 b c ) 即若 A X A = A 有解,则 A T X T A T = A T 有解 解得:X=(1,b,c)^T=\left(\begin{matrix}1\\b\\c\end{matrix}\right) 即若 AXA=A 有解,则 A^TX^TA^T=A^T 有解 解得:X=(1,b,c)T= 1bc 即若AXA=A有解,则ATXTAT=AT有解
b. 无解情况
若矩阵方程 A X B = C AXB=C AXB=C 无解,矩阵 X = ( x i j ) p × q X=(x_{ij})_{p\times q} X=(xij)p×q 的欧式范数或模长记为 ∥ X ∥ = ∥ X ∥ F = ∑ ∣ x i j ∣ 2 = t r ( X H X ) \Vert X\Vert=\Vert X\Vert_F=\sqrt{\sum\vert x_{ij}\vert^2}=\sqrt{tr(X^HX)} ∥X∥=∥X∥F=∑∣xij∣2=tr(XHX)
定理1:若矩阵方程 A X B = C AXB=C AXB=C 有解(相容),则 X 0 = A + C B + X_0=A^+CB^+ X0=A+CB+ 是最小范数解,即 A X B = C AXB=C AXB=C 的通解满足 ∥ X ∥ 2 ≥ ∥ X 0 ∥ 2 ( 最小模长 ) \Vert X\Vert^2\ge \Vert X_0\Vert^2(最小模长) ∥X∥2≥∥X0∥2(最小模长)
定理2 :若矩阵方程 A X B = C AXB=C AXB=C 无解(不相容),则 X 0 = A + C B + X_0=A^+CB^+ X0=A+CB+ 是最佳最小二乘解,即任一 X X X 满足 ∥ A X B − C ∥ 2 ≥ ∥ A X 0 B − C ∥ 2 ( 最小误差 ) \Vert AXB-C\Vert^2\ge \Vert AX_0B-C\Vert^2(最小误差) ∥AXB−C∥2≥∥AX0B−C∥2(最小误差)
6.2.3 AX+XB=C(里亚普诺夫)
A X + X B = C AX+XB=C AX+XB=C ,其中 A ∈ C m × m . B ∈ C n × n , X ∈ C m × n A\in C^{m\times m}.B\in C^{n\times n},X\in C^{m\times n} A∈Cm×m.B∈Cn×n,X∈Cm×n
-
使用拉直公式
A X + X B = C ⟺ ( A X I n + I m X B ) = C ⟺ ( A X I n + I m X B → ) = C ⃗ ⟺ ( A ⊗ I n + I m ⊗ B T ) X ⃗ = C ⃗ AX+XB=C\iff (AXI_n+I_mXB)=C\iff(\overrightarrow{AXI_n+I_mXB})=\vec{C}\\\iff(A\otimes I_n+I_m\otimes B^T)\vec{X}=\vec{C} AX+XB=C⟺(AXIn+ImXB)=C⟺(AXIn+ImXB)=C⟺(A⊗In+Im⊗BT)X=C
-
有解的充要条件为 r ( A ⊗ I n + I m ⊗ B T ∣ C ⃗ ) = r ( A ⊗ I n + I m ⊗ B T ) r(A\otimes I_n+I_m\otimes B^T\mid\vec{C})=r(A\otimes I_n+I_m\otimes B^T) r(A⊗In+Im⊗BT∣C)=r(A⊗In+Im⊗BT)
-
唯一解充要条件 : ∣ A ⊗ I n + I m ⊗ B T ∣ ≠ 0 \vert A\otimes I_n+I_m\otimes B^T\vert\neq 0 ∣A⊗In+Im⊗BT∣=0
根据特征值计算 ∣ A ⊗ I n + I m ⊗ B T ∣ \vert A\otimes I_n+I_m\otimes B^T\vert ∣A⊗In+Im⊗BT∣
定理1:
- A X + X B = C AX+XB=C AX+XB=C 有唯一解 ⟺ ∣ A X + X B ∣ ≠ 0 \iff \vert AX+XB\vert \neq 0 ⟺∣AX+XB∣=0 ⟺ A ⊗ I n + I m ⊗ B T \iff A\otimes I_n+ I_m\otimes B^T ⟺A⊗In+Im⊗BT 可逆 ⟺ A \iff A ⟺A 和 ( − B ) (-B) (−B) 无公共特根
- A X − X B = C AX-XB=C AX−XB=C 有唯一解 ⟺ ∣ A X − X B ∣ ≠ 0 \iff \vert AX-XB\vert \neq 0 ⟺∣AX−XB∣=0 ⟺ A ⊗ I n − I m ⊗ B T \iff A\otimes I_n- I_m\otimes B^T ⟺A⊗In−Im⊗BT 可逆 ⟺ A \iff A ⟺A 和 B B B 无公共特根
若 A = A m × m A=A_{m\times m} A=Am×m 的特根为 λ 1 , λ 2 , ⋯ , λ m \lambda_1,\lambda_2,\cdots,\lambda_m λ1,λ2,⋯,λm ; B = B n × n B=B_{n\times n} B=Bn×n 的特根为 t 1 , t 2 , ⋯ , t n t_1,t_2,\cdots,t_n t1,t2,⋯,tn
则 A ⊗ I n + I m ⊗ B T A\otimes I_n+I_m\otimes B^T A⊗In+Im⊗BT 的 m n mn mn 个特根为 { λ k + t j } \{\lambda_k+t_j\} {λk+tj} ; A ⊗ I n − I m ⊗ B T A\otimes I_n-I_m\otimes B^T A⊗In−Im⊗BT 的 m n mn mn 个特征值 { λ k − t j } \{\lambda_k-t_j\} {λk−tj} ( k = 1 , 2 , ⋯ , m , j = 1 , 2 , ⋯ , n ) (k=1,2,\cdots,m,j=1,2,\cdots,n) (k=1,2,⋯,m,j=1,2,⋯,n)
因为 B B B 与 B T B^T BT 有相同的特征值
⇒ \Rightarrow ⇒ ∣ A ⊗ I n ± I m ⊗ B T ∣ \vert A\otimes I_n\pm I_m\otimes B^T\vert ∣A⊗In±Im⊗BT∣ 的 m n mn mn 个特征值为 ( λ k ± t j ) (\lambda_k\pm t_j) (λk±tj)
⇒ A ⊗ I n ± I m ⊗ B \Rightarrow A\otimes I_n\pm I_m\otimes B ⇒A⊗In±Im⊗B 不可逆的条件为 无零根 即 { λ k ± t j ≠ 0 } \{\lambda_k\pm t_j\neq 0\} {λk±tj=0}
⟺ A \iff A ⟺A 与 ( ± B ) (\pm B) (±B) 没有公共特征值
定理2: 若 A 和 B 的特根都有负实部,则 A X + X B = C AX+XB=C AX+XB=C 有唯一解
- 若特根都在左半平面,则 A A A 与 − B -B −B 不会有公共特根
定理3 :若 A A A 和 B B B 分别为 m m m 阶和 n n n 阶方阵,若 A A A 和 B B B 没有公共特征值,则 [ A C 0 B ] \left[\begin{matrix}A&C\\0&B\end{matrix}\right] [A0CB] 与 [ A 0 0 B ] \left[\begin{matrix}A&0\\0&B\end{matrix}\right] [A00B] 相似
定理4 :若 A ∈ C m × m , B ∈ C n × n , F ∈ C m × n A \in C^{m\times m},B\in C^{n\times n},F\in C^{m\times n} A∈Cm×m,B∈Cn×n,F∈Cm×n ,若 A A A 和 B B B 没有公共特根,则 [ A 0 F B ] \left[\begin{matrix}A&0\\F&B\end{matrix}\right] [AF0B] 与 [ A 0 0 B ] \left[\begin{matrix}A&0\\0&B\end{matrix}\right] [A00B] 相似
- 证明:令 P = ( I 0 X I ) , P − 1 = ( I 0 − X I ) P=\left(\begin{matrix}I&0\\X&I\end{matrix}\right),P^{-1}=\left(\begin{matrix}I&0\\-X&I\end{matrix}\right) P=(IX0I),P−1=(I−X0I) ,则有许尔公式, P ( A 0 F B ) P − 1 = ( A 0 X A − B X + F B ) P\left(\begin{matrix}A&0\\F&B\end{matrix}\right)P^{-1}=\left(\begin{matrix}A&0\\XA-BX+F&B\end{matrix}\right) P(AF0B)P−1=(AXA−BX+F0B) ,若为对角阵,则 A X − B X = − F ⇒ A X − B X = F AX-BX=-F\Rightarrow AX-BX=F AX−BX=−F⇒AX−BX=F
a. 求解矩阵方程
A的特征值为 -2,3;B的特征值为1,1。矩阵方程拉直为 A X + X B = C ⟺ ( A ⊗ I 2 + I 2 ⊗ B T ) X ⃗ = C ⃗ AX+XB=C\iff(A\otimes I_2+I_2\otimes B^T)\vec{X}=\vec{C} AX+XB=C⟺(A⊗I2+I2⊗BT)X=C 。而 A A A 与 − B -B −B 没有公共特征值,则拉直后方程具有唯一解。
λ ( A ) = { 2 , 2 } , λ ( B ) = { 1 , 2 } \lambda(A)=\{2,2\},\lambda(B)=\{1,2\} λ(A)={2,2},λ(B)={1,2} ,故A和B有公共特征值,故解不唯一,
A X − X B = C AX-XB=C AX−XB=C 可拉直为 ( A ⊗ I 2 × 2 − I 2 × 2 ⊗ B T ) X ⃗ = C ⃗ (A\otimes I_{2\times 2}-I_{2\times 2}\otimes B^T)\vec{X}=\vec{C} (A⊗I2×2−I2×2⊗BT)X=C ,有 X = [ x 1 x 2 x 3 x 4 ] , X ⃗ = ( x 1 x 2 x 3 x 4 ) X=\left[\begin{matrix}x_1&x_2\\x_3&x_4\end{matrix}\right],\vec{X}=\left(\begin{matrix}x_1\\x_2\\x_3\\x_4\end{matrix}\right) X=[x1x3x2x4],X= x1x2x3x4
( A ⊗ I 2 × 2 − I 2 × 2 ⊗ B T ) X ⃗ = ( − 1 − 1 − 1 0 2 2 0 − 1 0 0 − 1 − 1 0 0 2 2 ) ( x 1 x 2 x 3 x 4 ) = ( 0 − 2 2 − 4 ) ⟺ G X = b (A\otimes I_{2\times 2}-I_{2\times 2}\otimes B^T)\vec{X}=\left(\begin{matrix}-1&-1&-1&0\\2&2&0&-1\\0&0&-1&-1\\0&0&2&2\end{matrix}\right)\left(\begin{matrix}x_1\\x_2\\x_3\\x_4\end{matrix}\right)=\left(\begin{matrix}0\\-2\\2\\-4\end{matrix}\right) \iff GX=b (A⊗I2×2−I2×2⊗BT)X= −1200−1200−10−120−1−12 x1x2x3x4 = 0−22−4 ⟺GX=b 由于 r ( G ∣ b ) = r ( G ) = 3 r(G\vert b)=r(G)=3 r(G∣b)=r(G)=3 ,故方程有解,其解为 ( G ∣ b ) → ( 1 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 − 4 4 − 6 0 ) (G\vert b)\rightarrow \left(\begin{array}{c:c} \begin{matrix} 1&1&0&0\\ 0&0&1&0\\0&0&0&1\\0&0&0&0 \end{matrix}& \begin{matrix} -4\\ 4\\-6\\0 \end{matrix} \end{array}\right) (G∣b)→ 1000100001000010−44−60
故 G 的解为 X = ( − 4 0 4 6 ) + t ( 1 − 1 0 0 ) X=\left(\begin{matrix}-4\\0\\4\\6\end{matrix}\right)+t\left(\begin{matrix}1\\-1\\0\\0\end{matrix}\right) X= −4046 +t 1−100 原矩阵方程的解为 X = ( − 4 0 4 6 ) + t ( 1 − 1 0 0 ) X=\left(\begin{matrix}-4&0\\4&6 \end{matrix}\right)+t\left(\begin{matrix}1&-1\\0&0\end{matrix}\right) X=(−4406)+t(10−10)
b. 求解一般的矩阵方程 A 1 X B 1 + ⋯ + A s X B s = C A_1XB_1+\cdots+A_sXB_s=C A1XB1+⋯+AsXBs=C
c. 求解 A X − X A = μ X AX-XA=\mu X AX−XA=μX
-
将方程拉直为 ( A ⊗ I n − I n ⊗ A T ) X ⃗ = μ X ⃗ (A\otimes I_n-I_n\otimes A^T)\vec{X}=\mu \vec{X} (A⊗In−In⊗AT)X=μX
-
记 G = A ⊗ I n − I n ⊗ A T G=A\otimes I_n-I_n\otimes A^T G=A⊗In−In⊗AT 原方程化为 G X ⃗ = μ X ⃗ ⇒ ( G − μ I ) X ⃗ = 0 G\vec{X}=\mu \vec{X}\Rightarrow (G-\mu I)\vec{X}=0 GX=μX⇒(G−μI)X=0
有非零解条件为 ∣ G − μ I ∣ = 0 \vert G-\mu I\vert=0 ∣G−μI∣=0 ,即 μ \mu μ 是 G的特征值,而 λ ( G ) = { λ r − λ s } \lambda(G)=\{\lambda_r-\lambda_s\} λ(G)={λr−λs}
故 有非零解条件为: ∃ r , s \exist r,s ∃r,s ,使 μ = λ r − λ s , 1 ≤ r , s ≤ n \mu=\lambda_r-\lambda_s,1\le r,s\le n μ=λr−λs,1≤r,s≤n
λ ( A ) = { 1 , 3 } \lambda(A)=\{1,3\} λ(A)={1,3}, G = A ⊗ I 2 − I 2 ⊗ A T = ( 0 − 2 0 0 0 − 2 0 0 2 0 2 − 2 0 2 0 0 ) G=A\otimes I_2-I_2\otimes A^T=\left(\begin{matrix}0&-2&0&0\\0&-2&0&0\\2&0&2&-2\\0&2&0&0\end{matrix}\right) G=A⊗I2−I2⊗AT= 0020−2−202002000−20 λ ( G ) = { λ ( A ) i − λ ( A ) j } = { 2 , 0 , 0 , − 2 } \lambda(G)=\{\lambda(A)_i-\lambda(A)_j\}=\{2,0,0,-2\} λ(G)={λ(A)i−λ(A)j}={2,0,0,−2} ,故 ∃ λ ( G ) = μ = − 2 \exist \lambda(G)=\mu=-2 ∃λ(G)=μ=−2 ,矩阵方程有非零解
X = ( x 1 x 2 x 3 x 4 ) X=\left(\begin{matrix}x_1&x_2\\x_3&x_4\end{matrix}\right) X=(x1x3x2x4) , X ⃗ = ( x 1 x 2 x 3 x 4 ) \vec{X}=\left(\begin{matrix}x_1\\x_2\\x_3\\x_4\end{matrix}\right) X= x1x2x3x4 ,解 G X ⃗ = 0 G\vec{X}=0 GX=0 ⇒ X ⃗ = t 1 ( − 1 0 ) + t 2 ( 1 0 ) = ( − t 1 t 2 0 0 ) \Rightarrow \vec{X}=t_1\left(\begin{matrix}-1\\0\end{matrix}\right)+t_2\left(\begin{matrix}1\\0\end{matrix}\right)=\left(\begin{matrix}-t_1&t_2\\0&0\end{matrix}\right) ⇒X=t1(−10)+t2(10)=(−t10t20) ,故原矩阵方程的解 X = ( − t 1 t 2 0 0 ) X=\left(\begin{matrix}-t_1\\t_2\\0\\0\end{matrix}\right) X= −t1t200
文章来源:https://www.toymoban.com/news/detail-780826.html
由拉直公式
d
X
d
t
=
A
X
+
X
B
=
(
A
⊗
I
n
+
I
m
⊗
B
T
)
X
⃗
=
C
⃗
\frac{dX}{dt}=AX+XB=(A\otimes I_n+I_m\otimes B^T)\vec{X}=\vec{C}
dtdX=AX+XB=(A⊗In+Im⊗BT)X=C
X
⃗
=
e
t
(
A
⊗
I
n
+
I
m
⊗
B
T
)
D
⃗
=
e
t
(
A
⊗
I
n
)
e
t
(
I
m
⊗
B
T
)
D
⃗
=
=
(
e
t
A
⊗
I
n
)
(
I
m
⊗
e
t
B
T
)
D
⃗
=
(
e
t
A
I
m
⊗
I
n
e
t
B
T
)
D
⃗
=
(
e
t
A
⊗
e
t
B
T
)
D
⃗
=
e
t
A
D
(
(
e
t
B
T
)
)
T
→
=
.
.
.
\begin{aligned} &\vec{X}=e^{t(A\otimes I_n+I_m\otimes B^T)}\vec{D}=e^{t(A\otimes I_n)}e^{t(I_m\otimes B^T)}\vec{D}==(e^{tA}\otimes I_n)(I_m\otimes e^{tB^T})\vec{D}\\ &=(e^{tA}I_m\otimes I_ne^{tB^T})\vec{D}=(e^{tA}\otimes e^{tB^T})\vec{D }=\overrightarrow{e^{tA}D((e^{tB^T}))^T}=... \end{aligned}
X=et(A⊗In+Im⊗BT)D=et(A⊗In)et(Im⊗BT)D==(etA⊗In)(Im⊗etBT)D=(etAIm⊗InetBT)D=(etA⊗etBT)D=etAD((etBT))T=...文章来源地址https://www.toymoban.com/news/detail-780826.html
到了这里,关于【矩阵论】6. 正规方程与矩阵方程求解的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!