【线性代数07】马尔科夫矩阵和傅里叶矩阵

这篇具有很好参考价值的文章主要介绍了【线性代数07】马尔科夫矩阵和傅里叶矩阵。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  本篇可以看作对行列式和特征值应用的举例。但我会谈些我感兴趣的部分,即离散信源信道模型和循环矩阵的对角化。


马尔科夫矩阵

这个矩阵从概率论中概率的定义生发,因此各元素实际上就是非负的概率值。马尔科夫矩阵(Markov matrix)又称概率矩阵(probability matrix)、转移概率矩阵(transition probability matrix),在英语数学文献中的惯例是用概率的行向量和概率的右随机矩阵,于是参照维基百科上给出定义:

随机矩阵描述了一个有限状态空间 S S S上的马尔科夫链 X t X_t Xt如果在一个时间步长内从 i i i j j j移动的概率为 P r ( j ∣ i ) = P i , j Pr(j|i)=P_{i,j} Pr(ji)=Pi,j,随机矩阵 P P P的第 i i i行、第 j j j列元素由 P i , j P_{i,j} Pi,j给出:
P = [ P 1 , 1 P 1 , 2 … P 1 , j … P 1 , S P 2 , 1 P 2 , 2 … P 2 , j … P 2 , S ⋮ ⋮ ⋱ ⋮ ⋱ ⋮ P i , 1 P i , 2 … P i , j … P i , S ⋮ ⋮ ⋱ ⋮ ⋱ ⋮ P S , 1 P S , 2 … P S , j … P S , S ] . {\displaystyle P=\left[{\begin{matrix}P_{1,1}&P_{1,2}&\dots &P_{1,j}&\dots &P_{1,S}\\P_{2,1}&P_{2,2}&\dots &P_{2,j}&\dots &P_{2,S}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\P_{i,1}&P_{i,2}&\dots &P_{i,j}&\dots &P_{i,S}\\\vdots &\vdots &\ddots &\vdots &\ddots &\vdots \\P_{S,1}&P_{S,2}&\dots &P_{S,j}&\dots &P_{S,S}\\\end{matrix}}\right].}{\displaystyle} P= P1,1P2,1Pi,1PS,1P1,2P2,2Pi,2PS,2P1,jP2,jPi,jPS,jP1,SP2,SPi,SPS,S .


性质

一个显而易见的结论是矩阵 P P P有特征值 1 1 1(对应的是右随机矩阵,其中每一行求和为1,若每一列求和为1,取转置验证即可,理同) ,即
P x = 1 ⋅ x Px=1\cdot x Px=1x
基于概率的完备性和可列可加性,可以验证,或言之,由于转移的这个过程是必然发生的,因此各概率的和为1。


从一个概率空间转移到另一个概率空间,概率的完备性、非负性、可列可加性仍旧成立。因此如果 A 、 B A、B AB为两个 n × n n\times n n×n的转移矩阵,则其乘积(概率转移)、幂(自身演化)、算术平均仍旧是转移矩阵,即
A B 、   A n 、   A + B 2 AB、\ \ A^n、 \ \ \frac{A+B}{2} AB  An  2A+B

让我们来思考下 A n A^n An n → ∞ n \rightarrow \infty n时的场景,可证 A A A的最大特征值就是1,其余特征值的绝对值均小于1,因此 A n A^n An其实将趋于由 λ = 1 \lambda=1 λ=1所表征的那个稳态。


离散信源信道模型

学过《信息论》的朋友应该对类似形式的转移矩阵并不陌生,因此我们用一个离散的信源信道模型作为举例。准确地说,信源可描述为一个概率矩阵。所谓信源分布,即各发送信号各自占据一定的发射可能性。 如用行向量 P X P_X PX来描述一个三元等可能性的信源分布,即
P X = [ 1 / 3 1 / 3 1 / 3 ] P_X=\begin{bmatrix} 1/3 & 1/3 & 1/3 \end{bmatrix} PX=[1/31/31/3]
假设我们面临这样一个信道转移模型
【线性代数07】马尔科夫矩阵和傅里叶矩阵
则相应的信道转移矩阵为
P i j = [ 0.8 0.2 0.5 0.5 0.2 0.8 ]   行 i ( X 的概率空间 ) → 列 j ( Y 的概率空间 ) P_{ij}=\begin{bmatrix} 0.8 & 0.2 \\ 0.5 & 0.5 \\ 0.2 & 0.8 \end{bmatrix} \ \ 行i(X的概率空间)→列j(Y的概率空间) Pij= 0.80.50.20.20.50.8   i(X的概率空间)j(Y的概率空间)
于是有信宿的概率分布为
P Y = P X P i j = [ 1 / 3 1 / 3 1 / 3 ] [ 0.8 0.2 0.5 0.5 0.2 0.8 ] = [ 0.5 0.5 ] P_Y=P_XP_{ij}=\begin{bmatrix} 1/3 & 1/3 & 1/3 \end{bmatrix}\begin{bmatrix} 0.8 & 0.2 \\ 0.5 & 0.5 \\ 0.2 & 0.8 \end{bmatrix} =\begin{bmatrix} 0.5 & 0.5 \end{bmatrix} PY=PXPij=[1/31/31/3] 0.80.50.20.20.50.8 =[0.50.5]
但其实我们往往是面临这个问题,求信道的容量 C C C为?
C = max ⁡ [ H ( Y ) − H ( Y ∣ X ) ] C=\max [H(Y)-H(Y|X)] C=max[H(Y)H(YX)]
而已知
H ( Y ) ≤ H ( 0.5 , 0.5 ) = 1 比特,    H ( Y ∣ X ) ≥ H ( 0.2 , 0.8 ) = 0.7219 比特 H(Y) \le H(0.5,0.5)=1比特, \ \ \ H(Y|X) \ge H(0.2,0.8)=0.7219比特 H(Y)H(0.5,0.5)=1比特,   H(YX)H(0.2,0.8)=0.7219比特
而当两式均取等时,对应的信源分布为
P X = [ 1 / 2 0 1 / 2 ] P_X=\begin{bmatrix} 1/2 & 0 & 1/2 \end{bmatrix} PX=[1/201/2]
于是信道容量也就等于
C = H ( 0.5 , 0.5 ) − H ( 0.2 , 0.8 ) = 0.2781 比特 C =H(0.5,0.5)-H(0.2,0.8)=0.2781比特 C=H(0.5,0.5)H(0.2,0.8)=0.2781比特
这给人的直观感觉是,选取信道的转移概率越偏离0.5越好,等可能性差错的传输是无效的


傅里叶矩阵


选一组基底

傅里叶变换是信号处理中的经典操作,对照小波变换,其差异即在于所取基函数的不同。那么怎样选取基函数会让人觉得舒服呢?答案之一是选取一组标准正交基。如此,当我们将这些基向量排列在一起组成变换矩阵时,矩阵就会是一个正规矩阵,而其逆就是其共轭转置

老爷子说了这样一句话,“I need infinitely many, because my space is infinite dimensional.”,也就是说,无穷维的空间要用无穷维的基去描述。那么对于n维空间,其实我们就用n个标准正交基,即
v = x 1 q 1 + x 2 q 2 + ⋯ + x i q i + ⋯ + x n q n v=x_1q_1+x_2q_2+\cdots+x_iq_i+\cdots+x_nq_n v=x1q1+x2q2++xiqi++xnqn
其中 x i x_i xi表示对应基底 q i q_i qi上的延展系数。如何求得这个系数呢?这就要体现出标准正交性的巧妙了,令两边同乘共轭转置向量即可
q i H v = x 1 q i H q 1 + x 2 q i H q 2 + ⋯ + x i q i H q i + ⋯ + x n q i H q n = x i q_i^Hv=x_1q_i^Hq_1+x_2q_i^Hq_2+\cdots+x_iq_i^Hq_i+\cdots+x_nq_i^Hq_n=x_i qiHv=x1qiHq1+x2qiHq2++xiqiHqi++xnqiHqn=xi
此时由于彼此正交将得到0,由于自身标准化将得到1,从而方便求得系数 x i x_i xi


值得说明的是,正交性是十分有用的。在信号分析中,熟悉的傅里叶级数即采用了正交的三角函数作为基底,即 sin ⁡ ( n x ) \sin(nx) sin(nx) cos ⁡ ( n x ) \cos(nx) cos(nx),可以验证它们在单周期内的积分为0,也即正交,这种正交的思想也是OFDM子载波选取的原则。


傅里叶矩阵

参照维基百科,给出傅里叶矩阵的定义。

N点的离散傅立叶变换可以用一个 n × m n\times m n×m的矩阵乘法来表示,即 X = F x X=Fx X=Fx,其中 x x x是原始的输入信号, X X X是经过离散傅立叶变换得到的输出信号。 一个 n × n n\times n n×n的变换矩阵 F F F可以定义成 F = ( ω i j ) i , j = 0 , … , N − 1 / N F=(\omega ^{{ij}})_{{i,j=0,\ldots ,N-1}}/{\sqrt {N}} F=(ωij)i,j=0,,N1/N ,即
F = 1 N [ 1 1 1 1 ⋯ 1 1 ω ω 2 ω 3 ⋯ ω N − 1 1 ω 2 ω 4 ω 6 ⋯ ω 2 ( N − 1 ) 1 ω 3 ω 6 ω 9 ⋯ ω 3 ( N − 1 ) ⋮ ⋮ ⋮ ⋮ ⋮ 1 ω N − 1 ω 2 ( N − 1 ) ω 3 ( N − 1 ) ⋯ ω ( N − 1 ) ( N − 1 ) ] {\displaystyle F={\frac {1}{\sqrt {N}}}{\begin{bmatrix}1&1&1&1&\cdots &1\\1&\omega &\omega ^{2}&\omega ^{3}&\cdots &\omega ^{N-1}\\1&\omega ^{2}&\omega ^{4}&\omega ^{6}&\cdots &\omega ^{2(N-1)}\\1&\omega ^{3}&\omega ^{6}&\omega ^{9}&\cdots &\omega ^{3(N-1)}\\\vdots &\vdots &\vdots &\vdots &&\vdots \\1&\omega ^{N-1}&\omega ^{2(N-1)}&\omega ^{3(N-1)}&\cdots &\omega ^{(N-1)(N-1)}\\\end{bmatrix}}} F=N 1 111111ωω2ω3ωN11ω2ω4ω6ω2(N1)1ω3ω6ω9ω3(N1)1ωN1ω2(N1)ω3(N1)ω(N1)(N1)

其中 w w w定义为 1 1 1 n n n次方根的主值 ,即
w = e − 2 π i N w=e^{\frac{-2\pi i}{N}} w=eN2πi
注意到对于某列 j j j来说,其列向量为:
q j = [ w α × ( j − 1 ) ] T / N       α = 0 , 1 , 2 , ⋯   , N − 1 q_j=\begin{bmatrix} w^{\alpha \times (j-1)} \end{bmatrix}^T/\sqrt{N} \ \ \ \ \ \alpha=0,1,2,\cdots,N-1 qj=[wα×(j1)]T/N      α=0,1,2,,N1
此时我们再取另一列 q j + k q_{j+k} qj+k,令两者作内积,就有
q j + k H q j = 1 N ∑ α = 0 N − 1 w α × ( j − 1 ) w − α × ( j + k − 1 ) = ∑ α = 0 N − 1 w − α k q_{j+k}^Hq_{j}=\frac{1}{N} \sum_{\alpha = 0}^{N-1} w^{\alpha \times (j-1)}w^{-\alpha \times (j+k-1)}= \sum_{\alpha = 0}^{N-1}w^{-\alpha k} qj+kHqj=N1α=0N1wα×(j1)wα×(j+k1)=α=0N1wαk
k = 0 k=0 k=0时,即在求自身模值的平方,可知此时内积的结果为1,验证了标准性。
而当 − k ≠ 0 -k \ne 0 k=0时,可知 w − k w^{-k} wk是一个 N N N次的单位根,而 α \alpha α这个系数起到了在单位圆上旋转的作用 。不如举 − k = 1 -k=1 k=1为例,则此时可以想到当 α \alpha α 0 0 0遍取完 N − 1 N-1 N1时, N N N个结果将重新组成单位圆上 1 1 1 N N N N N N次单位根。于是问题变成了,为什么这 N N N个单位根的和为 0 0 0?在百度百科上给出了这三种解释:

一个基本方法是等比级数的求和,即 ∑ α = 0 ∞ w α = 1 − w N 1 − w = 0 \sum_{\alpha = 0}^{\infty} w^{\alpha} = \frac{1-w^N}{1-w}=0 α=0wα=1w1wN=0
第二个证法是它们在复平面上构成正多边形的顶点,而由对称性可知多边形的重心在原点。最后一个证法利用关于方程根与系数的韦达定理,由分圆方程 x n − 1 x_{n-1} xn1项但系数为零得出。

无论采用哪种解释,结论是一致的,即 k ≠ 0 k \ne 0 k=0时,内积的结果为0,从而验证了正交性。那么,傅里叶矩阵是一个正规矩阵,一个优良的性质就产生了,即
F − 1 = F H F^{-1}=F^H F1=FH

FFT开销 N l o g 2 N / 2 Nlog_2N/2 Nlog2​N/2 的说明


先从理论角度说明。在数字信号处理中,我们知道有两种典型思路来完成FFT,一种是时间抽选DIT,另一种是频率抽选DIF,经过一次分序后,两种方法都将减少一半的运算量。
对于DIT而言,对 x ( n ) x(n) x(n)序列的奇偶进行分序,结果输出 X ( k ) X(k) X(k)为前一半后一半
【线性代数07】马尔科夫矩阵和傅里叶矩阵
【线性代数07】马尔科夫矩阵和傅里叶矩阵
对于DIF而言,是对 x ( n ) x(n) x(n)序列的前一半后一半进行分序,结果输出 X ( k ) X(k) X(k)分奇和偶

【线性代数07】马尔科夫矩阵和傅里叶矩阵
【线性代数07】马尔科夫矩阵和傅里叶矩阵
又知DFT运算的定义为
X ( k ) = ∑ n = 0 N − 1 x ( n ) w N n k , k = 0 , 1 , ⋯   , N − 1 X(k)=\sum_{n=0}^{N-1} x(n)w_{N}^{nk}, k = 0,1,\cdots,N-1 X(k)=n=0N1x(n)wNnk,k=0,1,,N1

在运算中,乘法的运算开销是最大的对于 N N N点的DFT而言,其矩阵乘法开销为N,一共有N点,开销估计为 N 2 N^2 N2,而FFT使得最终转换成了 l o g 2 N log_2N log2N级的蝶形运算,每级采用蝶形运算后所用的乘法开销均为 N / 2 N/2 N/2(即每两个可共用一次系数,节约一半计算量),从而总开销为 N l o g 2 N / 2 Nlog_2N/2 Nlog2N/2


现在我们从矩阵变换的视角理解上述过程,来看展示一个64点的FFT转为32点FFT的过程:
F 64 = [ I D 32 I − D 32 ] [ F 32 0 0 F 32 ] [ 1 0 0 0 ⋯ 0 0 0 0 1 0 ⋯ 0 0 ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ 0 0 0 0 ⋯ 1 0 0 1 0 0 ⋯ 0 0 0 0 0 1 ⋯ 0 0 ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ 0 0 0 0 ⋯ 0 1 ]     odd  rows     even  rows F_{64}=\begin{bmatrix} I &D_{32} \\ I &-D_{32} \end{bmatrix}\begin{bmatrix} F_{32} &0 \\ 0 & F_{32} \end{bmatrix} \begin{bmatrix} \colorbox{yellow}1& 0 &0 &0 &\cdots & 0 & 0\\ 0 & 0 & \colorbox{yellow}1 & 0 & \cdots & 0 & 0\\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & \colorbox{yellow}1 & 0 \\ 0 & \colorbox{aqua}1 & 0 & 0 &\cdots & 0 & 0 \\ 0 & 0 & 0 & \colorbox{aqua}1 & \cdots & 0 & 0 \\ \vdots & \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & 0 & 0 & \cdots & 0 & \colorbox{aqua}1 \end{bmatrix} \ \ \ \colorbox{yellow}{odd \ rows} \ \ \ \colorbox{aqua}{even \ rows} F64=[IID32D32][F3200F32] 100000000100010000000010001000000001    odd  rows   even  rows
其中 D 32 D_{32} D32为用于修正的对角矩阵,元素为熟悉的修正因子 w w w,我们可以发现其正是蝶形运算中的修正系数 ,即
D 32 = [ w 0 0 0 0 ⋯ 0 w 1 0 0 ⋯ 0 0 w 2 0 ⋯ ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 0 w 31 ] D_{32} = \begin{bmatrix} w^0 & 0 & 0 & 0& \cdots \\ 0 & w^1 & 0 & 0 &\cdots \\ 0 & 0 & w^2 & 0& \cdots \\ \vdots & \vdots &\vdots & \ddots & \vdots \\ 0 & 0 & 0 & 0 & w^{31} \end{bmatrix} D32= w00000w10000w200000w31
最右端的矩阵为交换矩阵 P 64 P_{64} P64,实现奇偶分序的作用 。观察这个过程,我们发现增加的乘法开销主要在 D 32 D_{32} D32,故该级分解后运算量转换为两个 F 32 F_{32} F32的乘法计算量和一个 D 32 D_{32} D32的乘法运算量。依次类推, F 32 F_{32} F32也可以继续向下分解为 F 16 ⋯ F_{16} \cdots F16 于是最后得到的基本元素块将是 F 2 F_2 F2,展现如下
[ I D 32 I − D 32 ] [ I D 16 I D 16 0 0 I D 16 I − D 16 ] ⋯ [ I D 1 I D 1 ⋱ 0 0 I D 1 I − D 1 ] [ F 2 ⋱ 0 0 F 2 ] [ P 2 ⋱ 0 0 P 2 ] ⋯ [ P 32 0 0 P 32 ] [ P 64 ] \begin{bmatrix} I &D_{32} \\ I &-D_{32} \end{bmatrix} \begin{bmatrix} \begin{matrix} I & D_{16} \\ I & D_{16} \end{matrix} & \text{\Large 0} \\ \text{\Large 0} & \begin{matrix} I & D_{16} \\ I & -D_{16} \end{matrix} \end{bmatrix} \cdots \begin{bmatrix} \begin{matrix} I & D_{1} & \\ I & D_{1} & \\ & & \ddots \end{matrix} &\text{\Large 0} \\ \text{\Large 0} & \begin{matrix} I & D_{1} \\ I & -D_{1} \end{matrix} \end{bmatrix} \begin{bmatrix} \begin{matrix} F_2& \\& \ddots \end{matrix} & \text{\Large 0} \\ \text{\Large 0} & \begin{matrix} F_{2} \end{matrix} \end{bmatrix} \begin{bmatrix} \begin{matrix} P_2& \\& \ddots \end{matrix} & \text{\Large 0} \\ \text{\Large 0} & \begin{matrix} P_{2} \end{matrix} \end{bmatrix} \cdots \begin{bmatrix}P_{32} & 0 \\ 0 & P_{32} \end{bmatrix} \begin{bmatrix}P_{64} \end{bmatrix} [IID32D32] IID16D1600IID16D16 IID1D100IID1D1 F200F2 P200P2 [P3200P32][P64]
由此可见,修正矩阵共有 log ⁡ 2 N \log_2N log2N级,每级有 N / 2 N/2 N/2次乘法运算。因而最终运算开销为 N l o g 2 N / 2 Nlog_2N/2 Nlog2N/2。来直观感受下运算量的缩减,以 N = 1024 N=1024 N=1024为例,有
N 2 N l o g 2 N / 2 = 102 4 2 1024 ∗ 5 ≈ 205 \frac{N^2}{Nlog_2N/2}=\frac{1024^2}{1024*5} \approx 205 Nlog2N/2N2=1024510242205
由此可见,FFT为傅里叶变换处理的高性能提供了可能


循环矩阵对角化的说明

这个说明的背景是OFDM中的循环前缀,参照维基百科,先来看定义

形式为 A = [ c 0 c n − 1 c n − 2 … c 1 c 1 c 0 c n − 1 ⋯ c 2 c 2 c 1 c 0 ⋯ c 3 ⋮ ⋮ ⋮ ⋱ ⋮ c n − 1 c n − 2 c n − 3 … c 0 ] {\displaystyle A={\begin{bmatrix}c_{0}&c_{n-1}&c_{n-2}&\dots &c_{1}\\c_{1}&c_{0}&c_{n-1}& \cdots &c_{2}\\c_{2}&c_{1}&c_{0}&\cdots &c_3 \\\vdots &\vdots& \vdots&\ddots &\vdots \\c_{n-1}&c_{n-2}&c_{n-3}&\dots &c_{0}\end{bmatrix}}} A= c0c1c2cn1cn1c0c1cn2cn2cn1c0cn3c1c2c3c0 的矩阵就是循环矩阵。

我们关注这条性质:循环矩阵的特征向量矩阵是同样维数的离散傅立叶变换矩阵,因此循环矩阵的特征值可以很容易地通过快速傅立叶变换计算出来,或言为循环矩阵可被傅里叶矩阵对角化,即:
A F = F Λ ⇒ Λ = F H A F 或 A = F Λ F H AF=F\Lambda \Rightarrow \Lambda=F^HA F或 A = F\Lambda F^{H} AF=FΛΛ=FHAFA=FΛFH
让我们来浅浅地证明一下,预备条件主要有3个:一是DFT的定义,二是其时域循环移位性质,三是对称性。即
条件 1 : X ( k ) = ∑ n = 0 N − 1 x ( n ) w N n k , k = 0 , 1 , ⋯   , N − 1 条件 2 : x ( ( n + m ) ) N R N ( n ) ⇔ w N − k m X ( k ) 条件 3 : x ( N − n ) ⇔ X ( N − k ) 条件1:X(k)=\sum_{n=0}^{N-1} x(n)w_{N}^{nk}, k = 0,1,\cdots,N-1 \\ 条件2:x((n+m))_N R_N(n) \Leftrightarrow w_N^{-km}X(k) \\ 条件3:x(N-n) \Leftrightarrow X(N-k) 条件1X(k)=n=0N1x(n)wNnk,k=0,1,,N1条件2x((n+m))NRN(n)wNkmX(k)条件3:x(Nn)X(Nk)
取第二行为例,可以看到
c 1 w 0 × 1 + c 0 w 1 × 1 + c N − 1 w 2 × 1 + ⋯ + c 2 w N − 1 × 1 = ∑ n = 0 N − 1 c ( ( N − n + 1 ) ) N R N ( n ) w n × 1 = w − 1 × 1   ∑ n = 0 N − 1 c ( ( N − n ) ) N R N ( n ) w n × 1 = C ( N − 1 ) w − 1 × 1   此时 k = 1 c_1w^{0 \times 1} +c_0w^{1\times 1}+c_{N-1}w^{2 \times 1}+\cdots+c_2w^{N-1\times1}=\sum_{n=0}^{N-1}c((N-n+1))_NR_{N}(n)w^{n \times 1}=w^{-1 \times 1} \ \sum_{n=0}^{N-1}c((N-n))_NR_{N}(n)w^{n \times 1}=C(N-1)w^{-1 \times 1} \ \ 此时k=1 c1w0×1+c0w1×1+cN1w2×1++c2wN1×1=n=0N1c((Nn+1))NRN(n)wn×1=w1×1 n=0N1c((Nn))NRN(n)wn×1=C(N1)w1×1  此时k=1
依此类推,我们可以知道 i i i就是移位的 m m m i i i也是DFT结果中的 k k k j j j相当于序列号 n n n
∑ j = 0 N − 1 c ( ( N − j + i ) ) N R N ( n ) w j × i = C ( ( N − i ) ) N R N ( n ) w − i 2      i ( k , m ) , j ( n ) = 0 , 1 , 2 , ⋯   , N − 1 \sum_{j=0}^{N-1}c((N-j+i))_N R_{N}(n) w^{j \times i}=C((N-i))_NR_{N}(n) w^{-i^2} \ \ \ \ i(k,m),j(n)=0,1,2,\cdots,N-1 j=0N1c((Nj+i))NRN(n)wj×i=C((Ni))NRN(n)wi2    i(k,m),j(n)=0,1,2,,N1
将上述形式写成矩阵,即有
[ c ( ( N − j + i ) ) N R N ( n ) ] [ w i × j ] = [ C ( ( N − i ) ) N R N ( n ) ] [ w − i 2 ] \begin{bmatrix}c((N-j+i))_N R_{N}(n) \end{bmatrix} \begin{bmatrix}w^{i \times j} \end{bmatrix} = \begin{bmatrix}C((N-i))_NR_{N}(n) \end{bmatrix} \begin{bmatrix}w^{- i^2} \end{bmatrix} [c((Nj+i))NRN(n)][wi×j]=[C((Ni))NRN(n)][wi2]
两边再同除 N \sqrt{N} N 归一化,就可写成傅里叶矩阵的形式
A F = [ C ( 0 ) 0 0 ⋯ 0 0 C ( N − 1 ) 0 ⋯ 0 0 0 C ( N − 2 ) ⋯ 0 ⋮ ⋮ ⋮ ⋱ ⋮ 0 0 0 0 C ( 1 ) ] F H = Λ F H = H F H AF=\begin{bmatrix}C(0) & 0 & 0 & \cdots & 0 \\ 0 & C(N-1) &0 & \cdots & 0 \\ 0 & 0 & C(N-2) & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 &0 &C(1) \end{bmatrix} F^{H}=\Lambda F^H=HF^H AF= C(0)0000C(N1)0000C(N2)00000C(1) FH=ΛFH=HFH
由这个证明过程,我们还能看出 i i i行输入信号序列 c ( ( N − j + i ) ) N R N ( n ) c((N-j+i))_NR_{N}(n) c((Nj+i))NRN(n),对应输出的特征值为 C ( ( N − i ) ) N R N ( n ) C((N-i))_NR_{N}(n) C((Ni))NRN(n)。这样进行的目的在于可以将求信道响应相应的卷积运算转换为FFT运算,而FFT具有高性能的运算效率,或言之,此时的特征值对应了信道响应。由此可见,数字信号处理技术的进步为通信技术的进步打下基石,而这一切都需要数学。


注意,如果循环矩阵写成下列形式
A = [ c 0 c 1 c 2 … c n − 1 c n − 1 c 0 c 1 ⋯ c n − 2 c n − 2 c n − 1 c 0 ⋯ c n − 3 ⋮ ⋮ ⋮ ⋱ ⋮ c 1 c 2 c 3 … c 0 ] {\displaystyle A={\begin{bmatrix}c_{0}&c_{1}&c_{2}&\dots &c_{n-1}\\c_{n-1}&c_{0}&c_{1}& \cdots &c_{n-2}\\c_{n-2}&c_{n-1}&c_{0}&\cdots &c_{n-3} \\\vdots &\vdots& \vdots&\ddots &\vdots \\c_{1}&c_{2}&c_{3}&\dots &c_{0}\end{bmatrix}}} A= c0cn1cn2c1c1c0cn1c2c2c1c0c3cn1cn2cn3c0
求出的特征值即为 C ( i ) C(i) C(i),这也是《Toeplitz and Circulant Matrices: A review》这本书中给出的举例矩阵。书中对循环矩阵的对角化给出了一般性的证明(第三章),所不同的是,我在此结合了DFT的性质更简便地谈了谈。文章来源地址https://www.toymoban.com/news/detail-443244.html

到了这里,关于【线性代数07】马尔科夫矩阵和傅里叶矩阵的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 初识马尔科夫模型(Markov Model)

    马尔科夫模型(Markov Model)是一种概率模型,用于描述随机系统中随时间变化的概率分布。马尔科夫模型基于马尔科夫假设,即当前状态只与其前一个状态相关,与其他状态无关。 马尔科夫模型具有如下几个性质: ① 马尔科夫性 :即马尔科夫模型的下一个状态只与当前状态

    2024年02月04日
    浏览(29)
  • 机器学习基础 HMM模型(隐马尔科夫)

    推荐参考:https://juejin.cn/post/6844903891834781703 在机器学习算法中,马尔可夫链(Markov chain)是个很重要的概念。马尔可夫链(Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain),因俄国数学家安德烈·马尔可夫(俄语:Андрей Андреевич Марков)得名。 马尔科

    2024年02月02日
    浏览(70)
  • python之马尔科夫链(Markov Chain)

    马尔可夫链(Markov Chain)是一种随机过程,具有“马尔可夫性质”,即在给定当前状态的条件下,未来状态的概率分布仅依赖于当前状态,而与过去状态无关。马尔可夫链在很多领域都有广泛的应用,包括蒙特卡洛方法、统计物理学、自然语言处理等。 马尔可夫链的一般定义

    2024年02月21日
    浏览(44)
  • 8.(Python数模)(预测模型一)马尔科夫链预测

    马尔科夫链是一种进行预测的方法,常用于系统未来时刻情况只和现在有关, 而与过去无关 。 用下面这个例子来讲述马尔科夫链。 如何预测下一时刻计算机发生故障的概率? 当前状态只存在0(故障状态)和1(正常状态)两种,每种状态下各存在两个未来状态(00,01,11,10)

    2024年02月09日
    浏览(46)
  • 15、条件概率、全概率公式、贝叶斯公式、马尔科夫链

    定义:设A、B是两个事件,且,P(A) 0 则称 为事件A发生的条件下事件B的条件概率 对这个式子进行变形,即可得到概率的乘法公式: P(A) 0 时,则 P(B) 0 时,则 乍一看,这个式子不就是把除法形式写成了乘法形式嘛,不然不然,这个区别是本质的,分母不为0很关键,而且看法也

    2024年02月13日
    浏览(46)
  • 语音识别的进展:从隐马尔科夫模型到Transformers

    语音识别,也称为语音转文本,是一种将人类语音信号转换为文本的技术。它在人工智能领域具有重要的应用价值,例如语音助手、语音密码等。语音识别技术的发展历程可以分为以下几个阶段: 早期语音识别技术(1950年代至1970年代):这一阶段的语音识别技术主要基于隐

    2024年02月03日
    浏览(53)
  • 【RL】(task1)马尔科夫过程、动态规划、DQN

    递归结构形式的贝尔曼方程计算给定状态下的预期回报,这样的方式使得用逐步迭代的方法就能逼近真实的状态/行动值。 有了Bellman equation就可以计算价值函数了 马尔科夫过程描述了一个具有无记忆性质的随机过程,未来状态只依赖于当前状态,与过去状态无关,类似于一个

    2024年01月21日
    浏览(37)
  • 马尔科夫决策过程-策略迭代与值迭代(基于动态规划)

    强化学习入门笔记,基于easy RL RL基础 强化学习(reinforcement learning,RL):智能体可以在与复杂且不确定的环境进行交互时,尝试使所获得的奖励最大化的算法。 动作(action): 环境接收到的智能体基于当前状态的输出。 状态(state):智能体从环境中获取的状态。 奖

    2024年02月04日
    浏览(46)
  • 马尔科夫不等式和坎泰利不等式的证明

    马尔科夫不等式(Markov’s inequality) 对于随机变量 X X X ,有 P ( ∣ X ∣ ⩾ ε ) ⩽ E ∣ X ∣ k ε k , ε 0 , k ∞ Pleft( left| X right|geqslant varepsilon right) leqslant frac{Eleft| X right|^k}{varepsilon ^k},varepsilon 0,kinfty P ( ∣ X ∣ ⩾ ε ) ⩽ ε k E ∣ X ∣ k ​ , ε 0 , k ∞ 证明: P ( ∣ X ∣ ⩾ ε

    2024年02月08日
    浏览(40)
  • 阿白数模笔记之灰色-马尔科夫模型(Grey Markov model)

    目录 前言(preface) GM(1,1) 简介(brief introdution)  ①级比检验(Grade ratio test) ②建立GM(1,1)模型 Ⅰ、邻值生成序列(Adjacent value generating sequence ) Ⅱ、回归分析(regression analysis) Ⅲ、残差检验(Residual test) Markov chain ① 转移概率矩阵(Transition probability matrix) ②状态分布向

    2024年02月09日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包