【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差

这篇具有很好参考价值的文章主要介绍了【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

序号 内容
1 【数理知识】自由度 degree of freedom 及自由度的计算方法
2 【数理知识】刚体 rigid body 及刚体的运动
3 【数理知识】刚体基本运动,平动,转动
4 【数理知识】向量数乘,内积,外积,matlab代码实现
5 【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差
6 【数理知识】已知 N>=3 个点在前后时刻的坐标,求刚体平移矩阵,旋转矩阵,且这 N>=3 点间距离始终不变代表一个刚体

协方差是统计学中一个重要的概念,它用于衡量两个随机变量的总体误差。简单来说,协方差用于度量两个变量之间的线性关系。

如果协方差是正的,那么两个变量可能会同时增大或减小,这表明它们之间可能存在正相关的关系。
如果协方差是负的,那么其中一个变量增大时,另一个可能减小,这表明它们之间可能存在负相关的关系。
如果协方差是 0 0 0,那么两个变量可能不相关。

协方差的一个主要应用是在统计和概率理论中,用于衡量两个随机变量的联动性。此外,协方差矩阵在多元统计分析、信号处理、控制系统、投资组合优化等多个领域都有广泛的应用。

然而,协方差有一个缺点,就是它的值受到变量尺度的影响。例如,如果你测量同一个物理量,但是使用的单位不同(比如使用米和厘米),你会得到完全不同的协方差。为了克服这个问题,我们经常使用相关系数(协方差除以两个变量的标准差),这是一个标准化的协方差,不受尺度的影响,范围在-1到1之间。

1. 计算协方差

总的来说,计算协方差可以使用两种方式。区别在于是否知道全部的数据量,也就是说我们是知道随机变量的期望均值,还是仅知道样本数据的样本均值。至于期望均值和样本均值的区别,请查阅文章:【LinearAlgebra】12.1 Mean, Variance, and Probability。


第一种,当我们知道所有的数据(总数据量为 N N N)时,也就是知道了具体的期望值,可以使用公式

Cov ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] \begin{aligned} \text{Cov} (X,Y) &= \text{E} [(X-\mu X)(Y-\mu Y)] \end{aligned} Cov(X,Y)=E[(XμX)(YμY)]

来计算。其中 μ X 、 μ Y \mu X、\mu Y μXμY 分别是 X X X Y Y Y 的期望值。


第二种是仅知道样本数据(样本数量为 n n n,总数据量为 N N N)时,可以使用公式

Cov ( X , Y ) = ∑ i n ( x i − x ˉ ) ( y i − y ˉ ) n − 1 \begin{aligned} \text{Cov} (X,Y) &= \frac{\sum_i^n (x_i - \bar{x})(y_i - \bar{y})}{n-1} \end{aligned} Cov(X,Y)=n1in(xixˉ)(yiyˉ)

来估算(注意不是计算)协方差。其中 x i 、 y i x_i、y_i xiyi 是两个随机变量已知的样本数据, x ˉ 、 y ˉ \bar{x}、\bar{y} xˉyˉ 是两个随机变量的平均值。注意这里是除以( n − 1 n-1 n1)而不是 n n n,因为这是无偏估计,当样本数据用来估计总计参数时,需要这样处理。


接下来用同一组数据,分别使用两种方式来计算协方差,看下效果。


1. 计算方式一:使用期望值

假设有两个随机变量 X = { 1 , 2 , 2 , 2 , 3 } X = \{1, 2, 2, 2, 3\} X={1,2,2,2,3} Y = { 6 , 6 , 7 , 7 , 8 } Y = \{6, 6, 7, 7, 8\} Y={6,6,7,7,8}。我们能够分别计算二者的期望均值为
μ X = ( 1 + 2 + 2 + 2 + 3 ) / 5 = 2 μ Y = ( 6 + 6 + 7 + 7 + 8 ) / 5 = 6.8 \begin{aligned} \mu X &= (1+2+2+2+3)/5=2 \\ \mu Y &= (6+6+7+7+8)/5=6.8 \end{aligned} μXμY=(1+2+2+2+3)/5=2=(6+6+7+7+8)/5=6.8

那么协方差为

Cov ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] = [ ( 1 − 2 ) ( 6 − 6.8 ) + ( 2 − 2 ) ( 6 − 6.8 ) + ( 2 − 2 ) ( 7 − 6.8 ) + ( 2 − 2 ) ( 7 − 6.8 ) + ( 3 − 2 ) ( 8 − 6.8 ) ] / 5 = [ 0.8 + 0 + 0 + 0 + 1.2 ] / 5 = 0.4 \begin{aligned} \text{Cov} (X,Y) &= \text{E} [(X-\mu X)(Y-\mu Y)] \\ &= [(1-2)(6-6.8) + (2-2)(6-6.8) + (2-2)(7-6.8) + (2-2)(7-6.8) + (3-2)(8-6.8)] / 5 \\ &= [0.8 + 0 + 0 + 0 + 1.2] / 5 \\ &= 0.4 \end{aligned} Cov(X,Y)=E[(XμX)(YμY)]=[(12)(66.8)+(22)(66.8)+(22)(76.8)+(22)(76.8)+(32)(86.8)]/5=[0.8+0+0+0+1.2]/5=0.4

所以,这两个随机变量的协方差为 0.4 0.4 0.4


2. 计算方式二:使用样本数据

还是上边的两个随机变量。但假如我们仅知道其中的 3 3 3 个,如 X = { 1 , 2 , 2 , 3 } X = \{1, 2, 2, 3\} X={1,2,2,3} Y = { 6 , 6 , 7 , 8 } Y = \{6, 6, 7, 8\} Y={6,6,7,8},同时也不知道每个样本的概率。这时候,我们仅能计算出来样本均值,也就是

x ˉ = ( 1 + 2 + 2 + 3 ) / 4 = 2 y ˉ = ( 6 + 6 + 7 + 8 ) / 4 = 6.75 \begin{aligned} \bar{x} &= (1+2+2+3)/4=2 \\ \bar{y} &= (6+6+7+8)/4=6.75 \end{aligned} xˉyˉ=(1+2+2+3)/4=2=(6+6+7+8)/4=6.75

那么协方差为

Cov ( X , Y ) = ∑ i n ( x i − x ˉ ) ( y i − y ˉ ) n − 1 = [ ( 1 − 2 ) ( 6 − 6.75 ) + ( 2 − 2 ) ( 6 − 6.75 ) + ( 2 − 2 ) ( 7 − 6.75 ) + ( 3 − 2 ) ( 8 − 6.75 ) ] / ( 4 − 1 ) = [ 0.75 + 0 + 0 + 1.25 ] / 3 = 0.6667 \begin{aligned} \text{Cov} (X,Y) &= \frac{\sum_i^n (x_i - \bar{x})(y_i - \bar{y})}{n-1} \\ &= [(1-2)(6-6.75) + (2-2)(6-6.75) + (2-2)(7-6.75) + (3-2)(8-6.75)] / (4-1) \\ &= [0.75 + 0 + 0 + 1.25] / 3 \\ &= 0.6667 \end{aligned} Cov(X,Y)=n1in(xixˉ)(yiyˉ)=[(12)(66.75)+(22)(66.75)+(22)(76.75)+(32)(86.75)]/(41)=[0.75+0+0+1.25]/3=0.6667

所以,用这一组样本估算出来的协方差为 0.6667 0.6667 0.6667


在上述样本的基础上,假如我们知道了其概率,也就是样本为 X = { 1 , 2 , 2 , 3 } X = \{1, 2, 2, 3\} X={1,2,2,3} Y = { 6 , 6 , 7 , 8 } Y = \{6, 6, 7, 8\} Y={6,6,7,8},同时每个样本的概率为 P = { 0.2 , 0.2 , 0.4 , 0.2 } P = \{0.2, 0.2, 0.4, 0.2\} P={0.2,0.2,0.4,0.2}。那此时就可以计算出来随机变量的期望值为

μ X = 0.2 ∗ 1 + 0.2 ∗ 2 + 0.4 ∗ 2 + 0.2 ∗ 3 = 2 μ Y = 0.2 ∗ 6 + 0.2 ∗ 6 + 0.4 ∗ 7 + 0.2 ∗ 8 = 6.8 \begin{aligned} \mu X &= 0.2*1+0.2*2+0.4*2+0.2*3=2 \\ \mu Y &= 0.2*6+0.2*6+0.4*7+0.2*8=6.8 \end{aligned} μXμY=0.21+0.22+0.42+0.23=2=0.26+0.26+0.47+0.28=6.8

计算协方差为

Cov ( X , Y ) = ∑ p i ( x i − μ X ) ( y i − μ Y ) = 0.2 ∗ ( 1 − 2 ) ( 6 − 8 ) + 0.2 ∗ ( 2 − 2 ) ( 6 − 8 ) + 0.4 ∗ ( 2 − 2 ) ( 7 − 8 ) + 0.2 ∗ ( 3 − 2 ) ( 8 − 8 ) = 0.2 ∗ ( 2 ) + 0.2 ∗ ( 0 ) + 0.4 ∗ ( 0 ) + 0.2 ∗ ( 0 ) = 0.4 \begin{aligned} \text{Cov} (X,Y) &= \sum p_i (x_i - \mu X)(y_i - \mu Y) \\ &= 0.2*(1-2)(6-8) + 0.2*(2-2)(6-8) + 0.4*(2-2)(7-8) + 0.2*(3-2)(8-8) \\ &= 0.2*(2) + 0.2*(0) + 0.4*(0) + 0.2*(0) \\ &= 0.4 \end{aligned} Cov(X,Y)=pi(xiμX)(yiμY)=0.2(12)(68)+0.2(22)(68)+0.4(22)(78)+0.2(32)(88)=0.2(2)+0.2(0)+0.4(0)+0.2(0)=0.4


3. 对比两种方式

至于为什么知道了样本的概率就能知道精准知道协方差了,可以看一下数据的排列。

首先,全部数据可以排列成

Data N = [ x i 1 2 2 2 3 y i 6 6 7 7 8 p i 0.2 0.2 0.2 0.2 0.2 ] = [ x i 1 2 2 3 y i 6 6 7 8 p i 0.2 0.2 0.4 0.2 ] \text{Data}_N = \left[\begin{matrix} x_i & 1 & 2 & 2 & 2 & 3 \\ y_i & 6 & 6 & 7 & 7 & 8 \\ p_i & 0.2 & 0.2 & 0.2 & 0.2 & 0.2 \\ \end{matrix}\right] =\left[\begin{matrix} x_i & 1 & 2 & 2 & 3 \\ y_i & 6 & 6 & 7 & 8 \\ p_i & 0.2 & 0.2 & 0.4 & 0.2 \\ \end{matrix}\right] DataN= xiyipi160.2260.2270.2270.2380.2 = xiyipi160.2260.2270.4380.2

而使用样本估算的方法时,我们用的应该是

Data n = [ x i 1 2 2 3 y i 6 6 7 8 p i 0.25 0.25 0.25 0.25 ] \text{Data}_n = \left[\begin{matrix} x_i & 1 & 2 & 2 & 3 \\ y_i & 6 & 6 & 7 & 8 \\ p_i & 0.25 & 0.25 & 0.25 & 0.25 \\ \end{matrix}\right] Datan= xiyipi160.25260.25270.25380.25

所以,对比观看一下可以知道,我们在样本估算时,实际也是假设了每个样本出现的概率都是相同的。


2. 随机变量为二维平面的点

在上述描述中,我们随机变量中的样本都是数字,也就是每个样本数据的维度都是 1 1 1 维的。接下来假设样本为二维平面中的点,也就是样本数据的维度为 2 2 2 维。

假设随机变量的样本为: X = { ( 1 , 2 ) , ( 3 , 4 ) , ( 5 , 6 ) } X = \{(1,2), (3,4), (5,6)\} X={(1,2),(3,4),(5,6)} Y = { ( 2 , 3 ) , ( 4 , 5 ) , ( 6 , 7 ) } Y = \{(2,3), (4,5), (6,7)\} Y={(2,3),(4,5),(6,7)}。首先计算均值为

x ˉ = ( 1 + 3 + 5 , 2 + 4 + 6 ) / 3 = ( 3 , 4 ) y ˉ = ( 2 + 4 + 6 , 3 + 5 + 7 ) / 3 = ( 4 , 5 ) \begin{aligned} \bar{x} &= (1+3+5, 2+4+6)/3=(3,4) \\ \bar{y} &= (2+4+6, 3+5+7)/3=(4,5) \end{aligned} xˉyˉ=(1+3+5,2+4+6)/3=(3,4)=(2+4+6,3+5+7)/3=(4,5)

然后,我们计算协方差矩阵。在这种情况下,协方差矩阵是一个 2 × 2 2 \times 2 2×2 的矩阵,其每个元素 Cov ( X , Y ) i j \text{Cov}(X,Y)_{ij} Cov(X,Y)ij X X X 的第 i i i 个维度和 Y Y Y 的第 j j j 个维度的协方差。在这种情况下,我们计算的是 X X X Y Y Y 之间的协方差,而不是 X X X Y Y Y 内部的协方差,所以我们是在计算 X X X 的第 i i i 个维度和 Y Y Y 的第 j j j 个维度。

矩阵的每一个元素 ( i , j ) (i,j) (i,j) 都是通过以下公式计算得到的:

Cov ( X , Y ) i j = ∑ k n = 3 ( x k i − x ˉ i ) ( y k j − y ˉ i ) n − 1 \begin{aligned} \text{Cov} (X,Y)_{ij} &= \frac{\sum_k^{n=3} (x_{ki} - \bar{x}_i)(y_{kj} - \bar{y}_i)}{n-1} \end{aligned} Cov(X,Y)ij=n1kn=3(xkixˉi)(ykjyˉi)

其中 x k i x_{ki} xki 表示第 k k k 个样本的第 i i i 个维度的值, x ˉ i \bar{x}_i xˉi 表示均值的第 i i i 个维度。

依次代入数值并展开有

Cov ( X , Y ) i = 1 , j = 1 = ( 1 − 3 ) ( 2 − 4 ) + ( 3 − 3 ) ( 4 − 4 ) + ( 5 − 3 ) ( 6 − 4 ) 3 − 1 = 4 Cov ( X , Y ) i = 1 , j = 2 = ( 1 − 3 ) ( 3 − 5 ) + ( 3 − 3 ) ( 5 − 5 ) + ( 5 − 3 ) ( 7 − 5 ) 3 − 1 = 4 \begin{aligned} \text{Cov} (X,Y)_{i=1,j=1} &= \frac{(1-3)(2-4) + (3-3)(4-4) + (5-3)(6-4)}{3-1} = 4 \\ \text{Cov} (X,Y)_{i=1,j=2} &= \frac{(1-3)(3-5) + (3-3)(5-5) + (5-3)(7-5)}{3-1} = 4 \end{aligned} Cov(X,Y)i=1,j=1Cov(X,Y)i=1,j=2=31(13)(24)+(33)(44)+(53)(64)=4=31(13)(35)+(33)(55)+(53)(75)=4

Cov ( X , Y ) i = 2 , j = 1 = ( 2 − 4 ) ( 2 − 4 ) + ( 4 − 4 ) ( 4 − 4 ) + ( 6 − 4 ) ( 6 − 4 ) 3 − 1 = 4 Cov ( X , Y ) i = 2 , j = 2 = ( 2 − 4 ) ( 3 − 5 ) + ( 4 − 4 ) ( 5 − 5 ) + ( 6 − 4 ) ( 7 − 5 ) 3 − 1 = 4 \begin{aligned} \text{Cov} (X,Y)_{i=2,j=1} &= \frac{(2-4)(2-4) + (4-4)(4-4) + (6-4)(6-4)}{3-1} = 4 \\ \text{Cov} (X,Y)_{i=2,j=2} &= \frac{(2-4)(3-5) + (4-4)(5-5) + (6-4)(7-5)}{3-1} = 4 \end{aligned} Cov(X,Y)i=2,j=1Cov(X,Y)i=2,j=2=31(24)(24)+(44)(44)+(64)(64)=4=31(24)(35)+(44)(55)+(64)(75)=4

故协方差矩阵为

Cov ( X , Y ) = [ 4 4 4 4 ] \begin{aligned} \text{Cov} (X,Y) &= \left[\begin{matrix} 4 & 4 \\ 4 & 4 \\ \end{matrix}\right] \end{aligned} Cov(X,Y)=[4444]


3. 随机变量为三维空间的点

接下来假设样本为三维空间中的点,也就是样本数据的维度为 3 3 3 维。

假设随机变量的样本为: X = { ( 1 , 2 , 3 ) , ( 4 , 5 , 6 ) , ( 7 , 8 , 9 ) } X = \{(1,2,3), (4,5,6), (7,8,9)\} X={(1,2,3),(4,5,6),(7,8,9)} Y = { ( 2 , 3 , 4 ) , ( 5 , 6 , 7 ) , ( 8 , 9 , 10 ) } Y = \{(2,3,4), (5,6,7), (8,9,10)\} Y={(2,3,4),(5,6,7),(8,9,10)}。首先计算均值为

x ˉ = ( 1 + 4 + 7 , 2 + 5 + 8 , 3 + 6 + 9 ) / 3 = ( 4 , 5 , 6 ) y ˉ = ( 2 + 5 + 8 , 3 + 6 + 9 , 4 + 7 + 10 ) / 3 = ( 5 , 6 , 7 ) \begin{aligned} \bar{x} &= (1+4+7, 2+5+8, 3+6+9)/3=(4, 5, 6) \\ \bar{y} &= (2+5+8, 3+6+9, 4+7+10)/3=(5, 6, 7) \end{aligned} xˉyˉ=(1+4+7,2+5+8,3+6+9)/3=(4,5,6)=(2+5+8,3+6+9,4+7+10)/3=(5,6,7)

然后,我们计算协方差矩阵。在这种情况下,协方差矩阵是一个 3 × 3 3 \times 3 3×3 的矩阵,其每个元素 Cov ( X , Y ) i j \text{Cov}(X,Y)_{ij} Cov(X,Y)ij X X X 的第 i i i 个维度和 Y Y Y 的第 j j j 个维度的协方差。

矩阵的每一个元素 ( i , j ) (i,j) (i,j) 都是通过以下公式计算得到的:

Cov ( X , Y ) i j = ∑ k n = 3 ( x k i − x ˉ i ) ( y k j − y ˉ i ) n − 1 \begin{aligned} \text{Cov} (X,Y)_{ij} &= \frac{\sum_k^{n=3} (x_{ki} - \bar{x}_i)(y_{kj} - \bar{y}_i)}{n-1} \end{aligned} Cov(X,Y)ij=n1kn=3(xkixˉi)(ykjyˉi)

依次代入数值并展开有

Cov ( X , Y ) i = 1 , j = 1 = ( 1 − 4 ) ( 2 − 5 ) + ( 4 − 4 ) ( 3 − 5 ) + ( 7 − 4 ) ( 4 − 5 ) 3 − 1 = 3 Cov ( X , Y ) i = 1 , j = 2 = ( 1 − 4 ) ( 5 − 6 ) + ( 4 − 4 ) ( 6 − 6 ) + ( 7 − 4 ) ( 7 − 6 ) 3 − 1 = 3 Cov ( X , Y ) i = 1 , j = 3 = ( 1 − 4 ) ( 8 − 7 ) + ( 4 − 4 ) ( 9 − 7 ) + ( 7 − 4 ) ( 10 − 7 ) 3 − 1 = 3 \begin{aligned} \text{Cov} (X,Y)_{i=1,j=1} &= \frac{(1-4)(2-5) + (4-4)(3-5) + (7-4)(4-5)}{3-1} = 3 \\ \text{Cov} (X,Y)_{i=1,j=2} &= \frac{(1-4)(5-6) + (4-4)(6-6) + (7-4)(7-6)}{3-1} = 3 \\ \text{Cov} (X,Y)_{i=1,j=3} &= \frac{(1-4)(8-7) + (4-4)(9-7) + (7-4)(10-7)}{3-1} = 3 \end{aligned} Cov(X,Y)i=1,j=1Cov(X,Y)i=1,j=2Cov(X,Y)i=1,j=3=31(14)(25)+(44)(35)+(74)(45)=3=31(14)(56)+(44)(66)+(74)(76)=3=31(14)(87)+(44)(97)+(74)(107)=3

Cov ( X , Y ) i = 2 , j = 1 = ( 2 − 5 ) ( 2 − 5 ) + ( 5 − 5 ) ( 3 − 5 ) + ( 8 − 5 ) ( 4 − 5 ) 3 − 1 = 3 Cov ( X , Y ) i = 2 , j = 2 = ( 2 − 5 ) ( 5 − 6 ) + ( 5 − 5 ) ( 6 − 6 ) + ( 8 − 5 ) ( 7 − 6 ) 3 − 1 = 3 Cov ( X , Y ) i = 2 , j = 3 = ( 2 − 5 ) ( 8 − 7 ) + ( 5 − 5 ) ( 9 − 7 ) + ( 8 − 5 ) ( 10 − 7 ) 3 − 1 = 3 \begin{aligned} \text{Cov} (X,Y)_{i=2,j=1} &= \frac{(2-5)(2-5) + (5-5)(3-5) + (8-5)(4-5)}{3-1} = 3 \\ \text{Cov} (X,Y)_{i=2,j=2} &= \frac{(2-5)(5-6) + (5-5)(6-6) + (8-5)(7-6)}{3-1} = 3 \\ \text{Cov} (X,Y)_{i=2,j=3} &= \frac{(2-5)(8-7) + (5-5)(9-7) + (8-5)(10-7)}{3-1} = 3 \end{aligned} Cov(X,Y)i=2,j=1Cov(X,Y)i=2,j=2Cov(X,Y)i=2,j=3=31(25)(25)+(55)(35)+(85)(45)=3=31(25)(56)+(55)(66)+(85)(76)=3=31(25)(87)+(55)(97)+(85)(107)=3

Cov ( X , Y ) i = 3 , j = 1 = ( 3 − 6 ) ( 2 − 5 ) + ( 6 − 6 ) ( 3 − 5 ) + ( 9 − 6 ) ( 4 − 5 ) 3 − 1 = 3 Cov ( X , Y ) i = 3 , j = 2 = ( 3 − 6 ) ( 5 − 6 ) + ( 6 − 6 ) ( 6 − 6 ) + ( 9 − 6 ) ( 7 − 6 ) 3 − 1 = 3 Cov ( X , Y ) i = 3 , j = 3 = ( 3 − 6 ) ( 8 − 7 ) + ( 6 − 6 ) ( 9 − 7 ) + ( 9 − 6 ) ( 10 − 7 ) 3 − 1 = 3 \begin{aligned} \text{Cov} (X,Y)_{i=3,j=1} &= \frac{(3-6)(2-5) + (6-6)(3-5) + (9-6)(4-5)}{3-1} = 3 \\ \text{Cov} (X,Y)_{i=3,j=2} &= \frac{(3-6)(5-6) + (6-6)(6-6) + (9-6)(7-6)}{3-1} = 3 \\ \text{Cov} (X,Y)_{i=3,j=3} &= \frac{(3-6)(8-7) + (6-6)(9-7) + (9-6)(10-7)}{3-1} = 3 \end{aligned} Cov(X,Y)i=3,j=1Cov(X,Y)i=3,j=2Cov(X,Y)i=3,j=3=31(36)(25)+(66)(35)+(96)(45)=3=31(36)(56)+(66)(66)+(96)(76)=3=31(36)(87)+(66)(97)+(96)(107)=3

故协方差矩阵为

Cov ( X , Y ) = [ 3 3 3 3 3 3 3 3 3 ] \begin{aligned} \text{Cov} (X,Y) &= \left[\begin{matrix} 3 & 3 & 3 \\ 3 & 3 & 3 \\ 3 & 3 & 3 \\ \end{matrix}\right] \end{aligned} Cov(X,Y)= 333333333


4. 马同学视频例子

如果看公式比较抽象的,也可以看看马同学图解数学中的视频讲解:如何通俗地解释协方差 - bilibili。我截取了几个关键步骤的视频截图。

使用的是身高 x i x_i xi 和体重 y i y_i yi 这两个指标为例子。
【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差,数理知识,概率论

想要知道身高和体重的相关性,可以使用下边这种计算方式。

【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差,数理知识,概率论

∑ ( x i − x ˉ ) ( y i − y ˉ ) (1) \begin{aligned} \sum (x_i - \bar{x})(y_i - \bar{y}) \end{aligned} \tag{1} (xixˉ)(yiyˉ)(1)

其中 x ˉ , y ˉ \bar{x}, \bar{y} xˉ,yˉ 分别表示身高,体重的平均值。

但数据差异较大时,就会出现错误判断。

【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差,数理知识,概率论

这时候引入数据出现的概率 p i p_i pi,同时替换数字平均值 x ˉ , y ˉ \bar{x}, \bar{y} xˉ,yˉ 为加权平均值 μ X , μ Y \mu X, \mu Y μX,μY
此时公式(1)变为

∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ p i ( x i − μ X ) ( y i − μ Y ) (2) \begin{aligned} &\sum (x_i - \bar{x})(y_i - \bar{y}) \\ &\sum p_i (x_i - \mu X)(y_i - \mu Y) \end{aligned} \tag{2} (xixˉ)(yiyˉ)pi(xiμX)(yiμY)(2)

其中 μ X , μ Y \mu X, \mu Y μX,μY 表示加权平均, p i p_i pi 表示每一项的概率。

【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差,数理知识,概率论

最后,将式子改写成期望的形式有

∑ ( x i − x ˉ ) ( y i − y ˉ ) ∑ p i ( x i − μ X ) ( y i − μ Y ) Cov ( X , Y ) = E [ ( X − μ X ) ( Y − μ Y ) ] (3) \begin{aligned} &\sum (x_i - \bar{x})(y_i - \bar{y}) \\ &\sum p_i (x_i - \mu X)(y_i - \mu Y) \\ \text{Cov} (X,Y) &= \text{E} [(X-\mu X)(Y-\mu Y)] \end{aligned} \tag{3} Cov(X,Y)(xixˉ)(yiyˉ)pi(xiμX)(yiμY)=E[(XμX)(YμY)](3)文章来源地址https://www.toymoban.com/news/detail-628830.html


Ref

  1. 如何通俗地解释协方差 - bilibili
  2. 从3组对应点中求得最佳的旋转和平移变换

到了这里,关于【数理知识】协方差,随机变量的的协方差,随机变量分别是单个数字和向量时的协方差的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 二维随机向量的数学期望E与协方差σ

    目录 1. 二维随机向量(X,Y)的数学期望EX, EY 2. 二维随机向量函数z=g(X,Y)的数学期望EZ 3. 二维随机向量(X,Y)的方差DX, DY 4. 二维随机向量的性质(和、积的数学期望E与方差D) 5. 二维随机向量的协方差COV和相关系数ρ 5.1 协方差COV定义 5.2 协方差COV的性质  5.3 相关系数ρ 离散形式 和

    2024年02月02日
    浏览(43)
  • 协方差、样本协方差、协方差矩阵、相关系数详解(python代码)

    对于一个随机变量的分布特征,可以由均值、方差、标准差等进行描述。而对于两个随机变量的情况,有协方差和相关系数来描述两个随机变量的相互关系。 本文主要参考概率论与数理统计的教科书,整理了协方差、样本协方差、协方差矩阵、相关系数的概念解释和代码。

    2023年04月10日
    浏览(43)
  • 协方差,协方差矩阵,相关系数

    对于一个随机变量的分布特征,可以用均值,方差,标准差来描述。对于两个随机变量,可以用协方差,和相关系数来描述两个随机变量的相互关系。 注意在机器学习中一个向量为m*n,m表示样本个数,n表示特征个数,这里的随机变量表示的是每一列,而不是每一行。  协方

    2024年02月11日
    浏览(58)
  • 【概率论理论】协方差,协方差矩阵理论(机器学习)

      在许多算法中需要求出两个分量间相互关系的信息。协方差就是描述这种相互关联程度的一个特征数。   设 ( X , Y ) (X,Y) ( X , Y ) 是一个二维随机变量,若 E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] E[(X-E(X))(Y-E(Y))] E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] 存在,则称此数学期望为 X X X 与

    2024年02月14日
    浏览(49)
  • 【什么是自相关矩阵,自协方差矩阵,互相关矩阵,互协方差矩阵?】

    最近看模式识别课程的时候卡在了一个地方,见下图: 协方差矩阵倒还知道,自相关矩阵?怎么推导的?它有什么意义?上网查了资料,要么晦涩难懂,要么一堆废话,这里我想尽量用最简洁的语言讲清楚它们。 向量的内积与外积 场景:机器学习 样本(n个样本,N个维度(

    2023年04月20日
    浏览(43)
  • 协方差矩阵在torch和numpy中的比较,自行实现torch协方差矩阵

    数学中(教科书、大学课堂、数学相关的科普视频),一个矩阵的向量往往是竖着的, 一列作为一个vector ,这一点numpy库也是这样默认的。 但是在机器学习以torch框架为例,一个有意义的向量或者说embedding 是横着的 。 因为numpy库默认是一列是一个向量而torch等机器学习框架

    2023年04月08日
    浏览(38)
  • 矩阵运算_矩阵的协方差矩阵/两个矩阵的协方差矩阵_求解详细步骤示例

            在统计学中, 方差 是用来度量 单个随机变量 的 离散程度 ,而协方差则一般用来刻画 两个随机变量 的 相似程度。 参考: 带你了解什么是Covariance Matrix协方差矩阵 - 知乎 将输入数据A进行中心化处理得到A\\\'。即通过 减去每个维度的平均值 来实现中心化。 注意:

    2024年02月03日
    浏览(46)
  • 数学基础--均值、方差、标准差、协方差

      统计学中最核心的概念之一是:标准差及其与其他统计量(如方差和均值)之间的关系,本文将对标准差这一概念提供直观的视觉解释,在文章的最后我们将会介绍协方差的概念。   均值: 均值就是将所有的数据相加求平均,求得一个样本数据的中间值。 定义: 给定

    2024年02月07日
    浏览(45)
  • 概率论--数学期望与方差--协方差(详解)

    目录 数学期望与方差 离散型随机变量的数学期望 注意 连续型随机变量的数学期望          方差 常用随机变量服从的分布  二项分布 正态分布 随机向量与随机变量的独立性 随机向量 随机变量的独立性 协方差 协方差的定义 协方差的意义 协方差矩阵 离散型随机变量的

    2024年02月11日
    浏览(36)
  • 数字信号谱估计方法对比仿真——估计自相关,周期图法,协方差法,burg算法,修正协方差法

    目录 一、理论基础 1.1自相关谱估计 1.2周期图法谱估计 1.3协方差法谱估计 1.4burg算法谱估计 1.5修正协方差谱估计 二、核心程序 三、仿真结论        自相关谱估计、周期图法谱估计、协方差法谱估计、Burg算法谱估计和修正协方差谱估计是常见的信号谱估计方法,用于分析信

    2024年02月10日
    浏览(40)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包