对于一个随机变量的分布特征,可以用均值,方差,标准差来描述。对于两个随机变量,可以用协方差,和相关系数来描述两个随机变量的相互关系。
注意在机器学习中一个向量为m*n,m表示样本个数,n表示特征个数,这里的随机变量表示的是每一列,而不是每一行。
协方差
协方差表示了两个随机变量线性相关的程度。
样本协方差
为什么要除以n-1,因为这样可以样本协方差才是总体协方差的无偏估计。
相关系数
import numpy as np
x1 = [-2.1, -1, 4.3]
x2 = [3, 1.1, 0.12]
X = np.stack((x1, x2), axis=0)# 每一行作为一个变量
print('相关系数',np.corrcoef(X))
print('相关系数',np.corrcoef(x1,x2))
协方差矩阵
import numpy as np
x1 = [-2.1, -1, 4.3] #天气这个随机变量,独立采样3次,得到三个样本值
x2 = [3, 1.1, 0.12] #打球
X = np.stack((x1, x2), axis=0) # 每一行作为一个变量
print('X的协方差矩阵',np.cov(X))
print('协方差矩阵',np.cov(x1, x2))
print('x1的方差',np.cov(x1))
#公式计算
def de_mean(x):
xmean = np.mean(x)
return [xi - xmean for xi in x]
def covariance(x, y):
n = len(x) #这里的n可以理解为独立采样的次数
return np.dot(de_mean(x), de_mean(y)) / (n-1)
print('x1和x2的协方差',covariance(x1,x2))
参考文献:
协方差矩阵计算实例_lgcnongchaoer的博客-CSDN博客_协方差矩阵计算例题
协方差、样本协方差、协方差矩阵、相关系数详解(python代码)_虾米小馄饨的博客-CSDN博客_样本协方差文章来源:https://www.toymoban.com/news/detail-504041.html
为什么样本方差(sample variance)的分母是 n-1? - 知乎 (zhihu.com) 文章来源地址https://www.toymoban.com/news/detail-504041.html
到了这里,关于协方差,协方差矩阵,相关系数的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!