矩阵论的所有文章,主要内容参考北航赵迪老师的课件
[注]由于矩阵论对计算机比较重要,所以选修了这门课,但不是专业搞数学的,所以存在很多口语化描述,而且对很多东西理解不是很正确与透彻,欢迎大家指正。我可能间歇性忙,但有空一定会回复修改的。
矩阵论
1. 准备知识——复数域上矩阵,Hermite变换
1.准备知识——复数域上的内积域正交阵
1.准备知识——Hermite阵,二次型,矩阵合同,正定阵,幂0阵,幂等阵,矩阵的秩
2. 矩阵分解——SVD准备知识——奇异值
2. 矩阵分解——SVD
2. 矩阵分解——QR分解
2. 矩阵分解——正定阵分解
2. 矩阵分解——单阵谱分解
2. 矩阵分解——正规分解——正规阵
2. 矩阵分解——正规谱分解
2. 矩阵分解——高低分解
3. 矩阵函数——常见解析函数
3. 矩阵函数——谱公式,幂0与泰勒计算矩阵函数
3. 矩阵函数——矩阵函数求导
4. 矩阵运算——观察法求矩阵特征值特征向量
4. 矩阵运算——张量积
4. 矩阵运算——矩阵拉直
4.矩阵运算——广义逆——加号逆定义性质与特殊矩阵的加号逆
4. 矩阵运算——广义逆——加号逆的计算
4. 矩阵运算——广义逆——加号逆应用
4. 矩阵运算——广义逆——减号逆
5. 线性空间与线性变换——线性空间
5. 线性空间与线性变换——生成子空间
5. 线性空间与线性变换——线性映射与自然基分解,线性变换
6. 正规方程与矩阵方程求解
7. 范数理论——基本概念——向量范数与矩阵范数
7.范数理论——基本概念——矩阵范数生成向量范数&谱范不等式
7. 矩阵理论——算子范数
7.范数理论——范数估计——许尔估计&谱估计
7. 范数理论——非负/正矩阵
8. 常用矩阵总结——秩1矩阵,优阵(单位正交阵),Hermite阵
8. 常用矩阵总结——镜面阵,正定阵
8. 常用矩阵总结——单阵,正规阵,幂0阵,幂等阵,循环阵
5.2 子空间
5.2.1 定义
设
W
⊂
V
W\subset V
W⊂V ,
W
W
W 是数域
K
K
K 上的线性空间
V
V
V 的一个非空子集合,且
(
1
)
对
∀
α
,
β
∈
W
,有
α
+
β
∈
W
(
对加法封闭
)
(
2
)
对
∀
α
∈
W
,
∀
k
∈
K
,有
k
α
∈
W
(
对数乘封闭
)
\begin{aligned} &(1)对\forall \alpha,\beta\in W,有\alpha+\beta\in W(对加法封闭)\\ &(2)对\forall \alpha\in W,\forall k\in K ,有k\alpha \in W(对数乘封闭) \end{aligned}
(1)对∀α,β∈W,有α+β∈W(对加法封闭)(2)对∀α∈W,∀k∈K,有kα∈W(对数乘封闭)
则称 W W W 为 V V V 的线性子空间或子空间
-
平凡子空间 W = V W=V W=V 或 φ = { 0 } \varphi=\{0\} φ={0} ;其余称为非平凡子空间
-
子空间 W W W 一定含有零向量 0 ⃗ ∈ W \vec{0} \in W 0∈W;若不包含零向量,则不是子空间
-
齐次方程解集 W ( A ) = { X ∈ C n ∣ A X = 0 } W(A)=\{X\in C^n\vert AX=0\} W(A)={X∈Cn∣AX=0} ,对加法,数乘封闭( A X 1 = 0 , A X 2 = 0 , A ( X 1 + X 2 ) = 0 AX_1=0,AX_2=0,A(X_1+X_2)=0 AX1=0,AX2=0,A(X1+X2)=0),( A X 1 = 0 AX_1 =0 AX1=0, A ( k X 1 ) = k ( A X 1 ) = 0 A(kX_1)=k(AX_1)=0 A(kX1)=k(AX1)=0) ,且有零向量,故是 C n C^n Cn 的子空间
-
非齐次方程解集 W ( A ) = { X ∈ C n ∣ A X = b ≠ 0 } W(A)=\{X\in C^n\vert AX=b\neq 0\} W(A)={X∈Cn∣AX=b=0} 不含零向量,故W(A) 不是子空间,且对加法,数乘不封闭
5.2.2 生成子空间
a. 引理
由 C n C^n Cn 中向量 α 1 , α 2 ⋯ , α m \alpha_1,\alpha_2\cdots,\alpha_m α1,α2⋯,αm 的所0有 线性组合生成的向量集合 W ( A ) = { x = k 1 α 1 + k 2 α 2 + ⋯ + k m α m } W(A)=\{x=k_1\alpha_1+k_2\alpha_2+\cdots+k_m\alpha_m\} W(A)={x=k1α1+k2α2+⋯+kmαm} 是一个子空间,称W为由 α 1 , ⋯ , α m \alpha_1,\cdots,\alpha_m α1,⋯,αm 生成的子空间,记为 W = L ( α 1 , ⋯ , α m ) W=L(\alpha_1,\cdots,\alpha_m) W=L(α1,⋯,αm) 或 W = s p a n ( α 1 , ⋯ , α m ) W=span(\alpha_1,\cdots,\alpha_m) W=span(α1,⋯,αm)
b. 维数公式
d i m ( V 1 + V 2 ) = d i m V 1 + d i m V 2 − d i m ( V 1 ⋂ V 2 ) dim (V_1+V_2)=dimV_1+dim V_2-dim(V_1\bigcap V_2) dim(V1+V2)=dimV1+dimV2−dim(V1⋂V2)
c. 子空间的交与和
交:如果 V 1 V_1 V1 , V 2 V_2 V2 是数域 K K K 上的线性空间 V V V 的两个子空间,那么 V 1 ⋂ V 2 V_1\bigcap V_2 V1⋂V2 也是 V V V 的子空间
和 :设 V 1 V_1 V1 , V 2 V_2 V2 都是 V V V 的子空间,则集合 { z ∣ z = x + y , x ∈ V 1 , y ∈ V 2 } \{z\vert z=x+y,x\in V_1,y\in V_2\} {z∣z=x+y,x∈V1,y∈V2} 称为 V 1 V_1 V1 与 V 2 V_2 V2 的和,记为 V 1 + V 2 V_1+V_2 V1+V2
如果 V 1 V_1 V1 , V 2 V_2 V2 都是 V V V 的子空间,则 V 1 + V 2 V_1+V_2 V1+V2 也是 V V V 的子空间
- V 1 ⋂ V 2 V_1\bigcap V_2 V1⋂V2 是包含在 V 1 V_1 V1 , V 2 V_2 V2 的最大子空间
- V 1 + V 2 V_1+V_2 V1+V2 是包含 V 1 , V 2 V_1,V_2 V1,V2 的最小子空间
eg
显然 V 1 + V 2 ⊃ L ( a 1 , ⋯ , a m , b 1 , ⋯ , b l ) , 又 ∀ x ∈ V 1 + V 2 ,有 x = x 1 + x 2 , x 1 ∈ V 1 , x 2 ∈ V 2 ∴ x 1 = k 1 a 1 + ⋯ + k m a m , x 2 = p 1 b 1 + ⋯ + p l b l ∴ x ∈ L ( a 1 , ⋯ , a m , b 1 , ⋯ , b l ) 可得 V 1 + V 2 ⊂ L ( a 1 , ⋯ , a m , b 1 , ⋯ , b l ) \begin{aligned} &显然V_1+V_2\supset L(a_1,\cdots,a_m,b_1,\cdots,b_l),\\ &又\forall x\in V_1+V_2,有x=x_1+x_2,x_1\in V_1,x_2\in V_2\\ &\therefore x_1=k_1a_1+\cdots+k_ma_m,x_2=p_1b_1+\cdots+p_lb_l\\ &\therefore x\in L(a_1,\cdots,a_m,b_1,\cdots,b_l)\\ &可得V_1+V_2\subset L(a_1,\cdots,a_m,b_1,\cdots,b_l) \end{aligned} 显然V1+V2⊃L(a1,⋯,am,b1,⋯,bl),又∀x∈V1+V2,有x=x1+x2,x1∈V1,x2∈V2∴x1=k1a1+⋯+kmam,x2=p1b1+⋯+plbl∴x∈L(a1,⋯,am,b1,⋯,bl)可得V1+V2⊂L(a1,⋯,am,b1,⋯,bl)
d. 直和
如果 V 1 + V 2 V_1+V_2 V1+V2 中的任一向量只能唯一地表示为 V 1 V_1 V1 的一个向量和 V 2 V_2 V2 中的一个向量的和,则称 V 1 + V 2 V_1+V_2 V1+V2 为 V 1 V_1 V1 与 V 2 V_2 V2 的直和,记为 V 1 ⊕ V 2 V_1\oplus V_2 V1⊕V2
定理:若 V 1 + V 2 V_1+V_2 V1+V2 为直和 ⟺ V 1 ⋂ V 2 = L ( 0 ) \iff V_1\bigcap V_2=L(0) ⟺V1⋂V2=L(0)
- 不存在公共部分,即无法用公共部分的向量代替
推论:
- 设 V 1 V_1 V1 , V 2 V_2 V2 都是 V V V 的子空间,则 V 1 + V 2 V_1+V_2 V1+V2 是直和 ⟺ d i m ( V 1 + V 2 ) = d i m V 1 + d i m V 2 \iff dim(V_1+V_2)=dim V_1+dimV_2 ⟺dim(V1+V2)=dimV1+dimV2
- 如果 x 1 , ⋯ , x k x_1,\cdots,x_k x1,⋯,xk 为 V 1 V_1 V1 的基, y 1 , ⋯ , y l y_1,\cdots,y_l y1,⋯,yl 为 V 2 V_2 V2 的基,且 V 1 + V 2 V_1+V_2 V1+V2 为直和,则 x 1 , ⋯ , x k , y 1 , ⋯ , y l x_1,\cdots,x_k,y_1,\cdots,y_l x1,⋯,xk,y1,⋯,yl 为 V 1 ⊕ V 2 V_1\oplus V_2 V1⊕V2 的基
eg
( 1 ) 由于 V 1 : ( ξ 1 , ξ 2 , ξ 3 , ξ 4 ) = ( ξ 1 , ξ 1 , ξ 1 , ξ 4 ) = ξ 1 ( 1 , 1 , 1 , 0 ) + ξ 4 ( 0 , 0 , 0 , 1 ) 设 y 1 = ( 1 , 1 , 1 , 0 ) , y 2 = ( 0 , 0 , 0 , 1 ) , 则有 V 1 = L ( y 1 , y 2 ) 则有 V 1 + V 2 = L ( y 1 , y 2 , x 1 , x 2 ) ( 2 ) ∵ x 2 = y 1 + y 2 − x 1 , ⇒ r ( y 1 , y 2 , x 1 , x 2 ) = d i m ( V 1 + V 2 ) = 3 y 1 , y 2 , x 1 为 V 1 + V 2 的一个基 ( 3 ) 设 x ∈ V 1 ⋂ V 1 , 则有 k 1 , k 2 , l 1 , l 2 , 使 x = k 1 y 1 + k 2 y 2 = l 1 x 1 + l 2 x 2 ∴ { k 1 − l 1 = 0 k 1 − l 2 = 0 k 1 − l 1 = 0 k 2 − l 2 = 0 ⇒ { k 1 = l 1 k 1 = l 2 k 2 = l 2 ⇒ k 1 = l 2 = l 1 = k 2 ∴ x = k 1 y 1 + k 1 y 2 = k 1 ( 1 , 1 , 1 , 1 ) ∴ ( 1 , 1 , 1 , 1 ) 为 V 1 ⋂ V 2 的一个基, d i m ( V 1 ⋂ V 2 ) = 1 \begin{aligned} (1)&由于V_1:(\xi_1,\xi_2,\xi_3,\xi_4)=(\xi_1,\xi_1,\xi_1,\xi_4)=\xi_1(1,1,1,0)+\xi_4(0,0,0,1)\\ &设 y_1=(1,1,1,0),y_2=(0,0,0,1),则有V_1=L(y_1,y_2)\\ &则有V_1+V_2=L(y_1,y_2,x_1,x_2)\\ (2)&\because x_2=y_1+y_2-x_1,\Rightarrow r(y_1,y_2,x_1,x_2)=dim(V_1+V_2)=3\\ &y_1,y_2,x_1为V_1+V_2的一个基\\ (3)&设x\in V_1\bigcap V_1,则有k_1,k_2,l_1,l_2,使x=k_1y_1+k_2y_2=l_1x_1+l_2x_2\\ &\therefore \left\{ \begin{aligned} k_1-l_1=0\\ k_1-l_2=0\\ k_1-l_1=0\\ k_2-l_2=0 \end{aligned} \right.\Rightarrow \left\{ \begin{aligned} &k_1=l_1\\ &k_1=l_2\\ &k_2=l_2 \end{aligned} \right.\Rightarrow k_1=l_2=l_1=k_2\\ &\therefore x=k_1y_1+k_1y_2=k_1(1,1,1,1)\\ &\therefore (1,1,1,1)为 V_1\bigcap V_2的一个基,dim (V_1\bigcap V_2)=1 \end{aligned} (1)(2)(3)由于V1:(ξ1,ξ2,ξ3,ξ4)=(ξ1,ξ1,ξ1,ξ4)=ξ1(1,1,1,0)+ξ4(0,0,0,1)设y1=(1,1,1,0),y2=(0,0,0,1),则有V1=L(y1,y2)则有V1+V2=L(y1,y2,x1,x2)∵x2=y1+y2−x1,⇒r(y1,y2,x1,x2)=dim(V1+V2)=3y1,y2,x1为V1+V2的一个基设x∈V1⋂V1,则有k1,k2,l1,l2,使x=k1y1+k2y2=l1x1+l2x2∴⎩ ⎨ ⎧k1−l1=0k1−l2=0k1−l1=0k2−l2=0⇒⎩ ⎨ ⎧k1=l1k1=l2k2=l2⇒k1=l2=l1=k2∴x=k1y1+k1y2=k1(1,1,1,1)∴(1,1,1,1)为V1⋂V2的一个基,dim(V1⋂V2)=1
5.2.3 A产生的子空间
a. 列空间(值域)
A
=
A
m
×
n
A=A_{m\times n}
A=Am×n 的值域
R
(
A
)
=
{
全体
y
=
A
x
∣
x
∈
C
n
}
⊂
C
m
R(A)=\{全体y=Ax\vert x\in C^n\}\subset C^m
R(A)={全体y=Ax∣x∈Cn}⊂Cm
A
=
A
m
×
n
=
(
α
1
,
⋯
,
α
n
)
,
其中
α
i
∈
C
m
,
X
=
(
x
1
⋮
x
n
)
∈
C
n
Y
=
A
X
=
x
1
α
1
+
⋯
+
x
n
α
n
=
(
x
1
α
1
,
⋯
,
x
n
α
n
)
为
A
的生成列空间
\begin{aligned} &A=A_{m\times n}=(\alpha_1,\cdots,\alpha_n),其中\alpha_i\in C^m ,X=\left( \begin{matrix} x_1\\\vdots\\x_n \end{matrix} \right)\in C^n\\ &Y=AX=x_1\alpha_1+\cdots+x_n\alpha_n=\left(x_1\alpha_1,\cdots,x_n\alpha_n\right)为A的生成列空间 \end{aligned}
A=Am×n=(α1,⋯,αn),其中αi∈Cm,X=
x1⋮xn
∈CnY=AX=x1α1+⋯+xnαn=(x1α1,⋯,xnαn)为A的生成列空间
即对
C
n
C^n
Cn 中的所有列向量进行
A
A
A 变换产生的列生成空间,记为
R
(
A
)
=
{
y
=
x
1
α
1
+
⋯
+
x
n
α
n
∣
X
∈
C
n
}
R(A)=\{y=x_1\alpha_1+\cdots+x_n\alpha_n\vert X\in C^n\}
R(A)={y=x1α1+⋯+xnαn∣X∈Cn}
R ( A ) = L ( α 1 , ⋯ , α n ) R(A)=L(\alpha_1,\cdots,\alpha_n) R(A)=L(α1,⋯,αn) 或 R ( A ) = s p a n ( α 1 , ⋯ , α n ) R(A)=span(\alpha_1,\cdots,\alpha_n) R(A)=span(α1,⋯,αn)
r ( A ) = r ( α 1 , ⋯ , α n ) = Δ r ( A ) ⇒ 维数: d i m R ( A ) = r ( A ) (维数 = 秩数) r(A)=r(\alpha_1,\cdots,\alpha_n)\overset{\Delta}{=}r(A)\Rightarrow 维数:dimR(A)=r(A)(维数=秩数) r(A)=r(α1,⋯,αn)=Δr(A)⇒维数:dimR(A)=r(A)(维数=秩数)
b. A的核空间
前置知识: A X = 0 AX=0 AX=0 的其他通解形式 X = ( I − A + A ) Y , ∀ Y ∈ C n X=(I-A^+A)Y,\forall Y\in C^n X=(I−A+A)Y,∀Y∈Cn
A = A m × n A=A_{m\times n} A=Am×n 的核空间为 N ( A ) = { X ∣ A X = 0 } ⊂ C n = { X = ( I − A + A ) Y ∣ ∀ Y ∈ C n } ⊂ C n N(A)=\{X\vert AX=0\}\subset C^n=\{X=(I-A^+A)Y\mid \forall Y\in C^n\}\subset C^n N(A)={X∣AX=0}⊂Cn={X=(I−A+A)Y∣∀Y∈Cn}⊂Cn (解空间)
可知, N ( A ) = R ( I − A − A ) = R ( I − A + A ) N(A)=R(I-A^-A)=R(I-A^+A) N(A)=R(I−A−A)=R(I−A+A) ,则有 d i m N ( A ) = d i m R ( I n − A − A ) = r ( I n − A + A ) dim N(A)=dim R(I_n-A^-A)=r(I_n-A^+A) dimN(A)=dimR(In−A−A)=r(In−A+A) 由于 A − A , A + A A^-A,A^+A A−A,A+A 为幂等阵 r ( I n − A − A ) = r ( I n − A + A ) = n − r ( A ) r(I_n-A^-A)=r(I_n-A^+A)=n-r(A) r(In−A−A)=r(In−A+A)=n−r(A) ,即 d i m N ( A ) = n − r ( A ) dimN(A)=n-r(A) dimN(A)=n−r(A)
维数公式
d i m N ( A ) + d i m R ( A ) = n dim N(A)+dim R(A)=n dimN(A)+dimR(A)=n 或 d i m N ( A ) + r ( A ) = n dim N(A)+r(A)=n dimN(A)+r(A)=n ,即 d i m N ( A ) = n − r ( A ) dim N(A)=n-r(A) dimN(A)=n−r(A)
c. 正交引理
C m C^m Cm 中正交引理(列空间中向量的正交向量)
任取 b ∈ C m b\in C^m b∈Cm ,令 x 0 = A + b ∈ C n x_0=A^+b\in C^n x0=A+b∈Cn ,则 ( b − A x 0 ) ⊥ A x , ∀ x ∈ C n (b-Ax_0)\bot Ax,\forall x\in C^n (b−Ax0)⊥Ax,∀x∈Cn
正交子空间
设 A ∈ C m × n A\in C^{m\times n} A∈Cm×n ,则有 N ( A ) ⊥ R ( A H ) N(A)\bot R(A^H) N(A)⊥R(AH) ,且 N ( A H ) ⊥ R ( A ) N(A^H)\bot R(A) N(AH)⊥R(A)
证明:
任取
y
∈
N
(
A
)
,
即满足
A
y
=
0
。任取
A
H
x
∈
R
(
A
H
)
,
若证
N
(
A
)
⊥
R
(
A
H
)
,则只需证
(
y
,
A
H
x
)
=
0
,
∵
(
y
,
A
H
x
)
=
(
A
H
x
)
H
y
=
x
H
A
y
=
X
H
(
A
y
)
=
X
H
0
=
0
,即有
N
(
A
)
⊥
R
(
A
H
)
\begin{aligned} &任取 y\in N(A),即满足Ay=0。任取A^Hx\in R(A^H),若证N(A)\bot R(A^H) ,则只需证(y,A^Hx)=0,\\ &\because (y,A^Hx)=(A^Hx)^Hy=x^HAy=X^H(Ay)=X^H0=0,即有N(A)\bot R(A^H) \end{aligned}
任取y∈N(A),即满足Ay=0。任取AHx∈R(AH),若证N(A)⊥R(AH),则只需证(y,AHx)=0,∵(y,AHx)=(AHx)Hy=xHAy=XH(Ay)=XH0=0,即有N(A)⊥R(AH)
A H ∈ C n × m A^H\in C^{n\times m} AH∈Cn×m , R ( A H ) ⊂ C n R(A^H)\subset C^n R(AH)⊂Cn , N ( A H ) ⊂ C m N(A^H)\subset C^m N(AH)⊂Cm , R ( A H ) + N ( A H ) = C n R(A^H)+N(A^H)=C^n R(AH)+N(AH)=Cn
C n C^n Cn 中正交引理(核空间的正交向量)
任取 b ∈ C m b\in C^m b∈Cm ,令 x 0 = A + b ∈ C n x_0=A^+b\in C^n x0=A+b∈Cn ,则 x 0 ⊥ N ( A ) x_0\bot N(A) x0⊥N(A) ,即 x 0 ⊥ y , y ∈ { y ∣ A y = 0 } x_0\bot y ,y\in \{y\vert Ay=0\} x0⊥y,y∈{y∣Ay=0}
证明:
由于
y
在
A
的解空间,则已知
A
y
=
0
,
要证
x
0
⊥
y
,
即证内积
(
y
,
x
0
)
=
0
(
y
,
x
0
)
=
x
0
H
y
=
(
A
+
b
)
H
y
=
(
A
+
A
A
+
b
)
H
y
=
(
A
+
b
)
H
(
A
+
A
)
H
y
=
(
A
+
b
)
H
A
+
A
y
=
0
⇒
x
0
⊥
y
,
即
x
0
⊥
N
(
A
)
\begin{aligned} &由于y在A的解空间,则已知Ay=0,要证x_0\bot y,即证内积(y,x_0)=0\\ &(y,x_0)=x_0^Hy=(A^+b)^Hy=(A^+AA^+b)^Hy=(A^+b)^H(A^+A)^Hy=(A^+b)^HA^+Ay=0\\ &\Rightarrow x_0\bot y,即 x_0\bot N(A) \end{aligned}
由于y在A的解空间,则已知Ay=0,要证x0⊥y,即证内积(y,x0)=0(y,x0)=x0Hy=(A+b)Hy=(A+AA+b)Hy=(A+b)H(A+A)Hy=(A+b)HA+Ay=0⇒x0⊥y,即x0⊥N(A)文章来源:https://www.toymoban.com/news/detail-411940.html
x 0 = A + b x_0=A^+b x0=A+b 为 A x = b Ax=b Ax=b 的最小解
令
x
0
=
A
+
b
,
∀
x
∈
N
(
A
)
,
A
y
=
b
有通解
y
=
x
0
+
t
x
,
而
∣
y
∣
2
=
∣
x
0
+
x
∣
2
∵
x
0
⊥
x
,
由勾股定理
⇒
∣
x
0
+
x
∣
2
=
∣
x
0
∣
2
+
∣
x
∣
2
≥
∣
x
0
∣
2
\begin{aligned} &令x_0=A^+b,\forall x\in N(A),Ay=b有通解y= x_0+tx,而\vert y\vert^2=\vert x_0+x\vert^2\\ &\because x_0\bot x,由勾股定理\Rightarrow \vert x_0+x\vert^2=\vert x_0\vert^2+\vert x \vert^2\ge \vert x_0\vert^2 \end{aligned}
令x0=A+b,∀x∈N(A),Ay=b有通解y=x0+tx,而∣y∣2=∣x0+x∣2∵x0⊥x,由勾股定理⇒∣x0+x∣2=∣x0∣2+∣x∣2≥∣x0∣2
文章来源地址https://www.toymoban.com/news/detail-411940.html
到了这里,关于【矩阵论】5. 线性空间与线性变换——生成子空间的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!