【概率论理论】协方差,协方差矩阵理论(机器学习)

这篇具有很好参考价值的文章主要介绍了【概率论理论】协方差,协方差矩阵理论(机器学习)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前言

  在许多算法中需要求出两个分量间相互关系的信息。协方差就是描述这种相互关联程度的一个特征数。


一、协方差是什么?

  设 ( X , Y ) (X,Y) (X,Y)是一个二维随机变量,若 E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] E[(X-E(X))(Y-E(Y))] E[(XE(X))(YE(Y))]存在,则称此数学期望为 X X X Y Y Y的协方差,或称为 X X X Y Y Y的相关(中心)矩,并记为
c o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] cov(X,Y)=E[(X-E(X))(Y-E(Y))] cov(X,Y)=E[(XE(X))(YE(Y))]特别有 C o v ( X , X ) = V a r ( X ) Cov(X,X)=Var(X) Cov(X,X)=Var(X).

  • 当cov(X,Y)>0时,称X与Y正相关,这时两个偏差(X-E(X))与有同时增加或同时减少的倾向.由于E(X)与E(Y)都是常数,故等价于X与Y同时增加或同时减少的倾向,这就是正相关的含义。
  • 当cov(X,Y)>0时,称X与Y负相关.
  • 当cov(X,Y)=0时,称X与Y不相关.

C o v ( a X , b X ) = a b C o v ( X , Y ) Cov(aX,bX)=abCov(X,Y) Cov(aX,bX)=abCov(X,Y)
由上述性质可得,未预处理的数据的协方差仅有正负号为有用信息,即表示变量间呈现正负相关。

二、协方差矩阵是什么?

  记n维随机变量为 X = ( X 1 , X 2 , . . . , X n ) ′ X= (X_1,X_2,...,X_n)^{'} X=(X1,X2,...,Xn),若其每个分量的数字期望都存在,则称
E ( X ) = ( E ( X 1 ) , E ( X 2 ) , . . . , E ( X n ) ) ′ E(X)=(E(X_1),E(X_2),...,E(X_n))^{'} E(X)=(E(X1),E(X2),...,E(Xn))
为n维随机向量X的数学期望向量,简称为X的数学期望,而称
E [ ( X − E ( X ) ) ( X − E ( X ) ) ′ ] = [ V a r ( X 1 ) C o v ( X 1 , X 2 ) ⋯ C o v ( X 1 , X n ) C o v ( X 2 , X 1 ) V a r ( X 2 ) ⋯ C o v ( X 2 , X p ) ⋮ ⋮ ⋱ ⋮ C o v ( X n , X 1 ) C o v ( X n , X 2 ) ⋯ V a r ( X n ) ] E[(X-E(X))(X-E(X))^{'}]=\begin{bmatrix} Var(X_1) &Cov(X_1,X_2) &\cdots&Cov(X_1,X_n) \\ Cov(X_2,X_1)&Var(X_2) &\cdots &Cov(X_2,X_p) \\ \vdots& \vdots& \ddots& \vdots\\ Cov(X_n,X_1)&Cov(X_n,X_2) &\cdots &Var(X_n) \\\end{bmatrix} E[(XE(X))(XE(X))]=Var(X1)Cov(X2,X1)Cov(Xn,X1)Cov(X1,X2)Var(X2)Cov(Xn,X2)Cov(X1,Xn)Cov(X2,Xp)Var(Xn)
为该随机向量的 方差协方差矩阵,简称协方差阵,记为Cov(X).
协方差矩阵的一般求法:

# 求矩阵X_train的协方差矩阵cov_X;
# 只有去均值后才可以直接X与X的逆相乘取均值得协方差矩阵
import numpy as np

# 通过推导公式求协方差  (XX.T,因为是属性与属性的相关关系,所以公式中矩阵X为每一行表示一个feature)
def get_cov(X):
    """
    注意:分母为样本数减1
    """
    X_ = X-np.vstack(X.mean(axis= 1))
    cov_X = np.dot(X_, X_.T)/(X_.shape[1]-1)
    return cov_X

#get_cov(X.T)等价于
cov_X = np.cov(X,rowvar=0) # 计算协方差矩阵,rowvar=0表示数据的每一列代表一个feature

#可直接求出相关系数矩阵
coef_X = no.coffcoef(X_train)

三、协方差矩阵与相关系数矩阵

  协方差矩阵与相关系数矩阵区别为,相关系数矩阵是标准后的协方差矩阵,即在PCA中,当量纲相同时用 协方差矩阵&相关系数矩阵,但是当量纲不同时为了消除不同量纲间的影响(出现大数吃小数现象),要使用相关系数矩阵,相关系数矩阵除了描述正负相关外还描述关联的程度大小。
Pearson相关系数的公式:
ρ X , Y = c o v ( X , Y ) σ X σ Y = E [ ( X − E ( X ) ) ( Y − E ( Y ) ] σ X σ Y \rho_{X,Y}=\frac{cov(X,Y)}{\sigma_X\sigma_Y}=\frac{E[(X-E(X))(Y-E(Y)]}{\sigma_X\sigma_Y} ρX,Y=σXσYcov(X,Y)=σXσYE[(XE(X))(YE(Y)]
注意:在求相关系数矩阵是,当两个变量之间的有一个的标准差为0,那么求得的相关系数矩阵会出现nan。

参考资料:概率论与数理统计教程(第三版)文章来源地址https://www.toymoban.com/news/detail-630662.html

到了这里,关于【概率论理论】协方差,协方差矩阵理论(机器学习)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

    一个随机变量,的值的变化程度可以用方差计算:  ;其中 是期望。 另外一种等价表达式:      其中为均值,N为总体例数 我们举个例子: 服从均一分布,取值为0.1,0.2,0.3,0.4,0.5 ,每种值的概率是20%,可算出期望是0.3,那么方差就是: 标准差是方差的平方根,随机

    2024年02月09日
    浏览(33)
  • 【概率论与数理统计】猴博士 笔记 p36-37 协方差、相关系数、不相关、相互独立时的期望和方差

    接下来做几道例题,练习一下套公式: 例1: 解: 前4个就是简单的套公式: 第5个有点类似分配律: C o v ( 2 X + 3 Y , 4 X + 5 Y ) = 8 C o v ( X , X ) + 10 C o v ( X , Y ) + 12 C o v ( X , Y ) + 15 C o v ( Y , Y ) Cov(2X+3Y,4X+5Y)=\\\\8Cov(X,X)+10Cov(X,Y)+12Cov(X,Y)+15Cov(Y,Y) C o v ( 2 X + 3 Y , 4 X + 5 Y ) = 8 C o v ( X , X

    2023年04月08日
    浏览(48)
  • 【数据处理】Python:实现求条件分布函数 | 求平均值方差和协方差 | 求函数函数期望值的函数 | 概率论

         猛戳订阅!  👉 《一起玩蛇》🐍 💭 写在前面: 本章我们将通过 Python 手动实现条件分布函数的计算,实现求平均值,方差和协方差函数,实现求函数期望值的函数。部署的测试代码放到文后了,运行所需环境 python version = 3.6,numpy = 1.15,nltk = 3.4,tqdm = 4.24.0,sci

    2024年02月05日
    浏览(37)
  • 【应用统计学】随机变量的概率分布,数学期望和方差及协方差

     【例4-5】某厂对一批产品进行抽检,该批产品含有10件正品及3件次品。设每次抽取时,各件产品被抽到的可能性相等。一件一件抽取产品进行检验,每次抽取的产品都不放回该批产品中,求直到抽得正品为止所需次数X的分布律。 解: 由于每次抽取的产品不再放回,因此离散型

    2024年02月05日
    浏览(39)
  • 协方差,协方差矩阵,相关系数

    对于一个随机变量的分布特征,可以用均值,方差,标准差来描述。对于两个随机变量,可以用协方差,和相关系数来描述两个随机变量的相互关系。 注意在机器学习中一个向量为m*n,m表示样本个数,n表示特征个数,这里的随机变量表示的是每一列,而不是每一行。  协方

    2024年02月11日
    浏览(42)
  • 协方差、样本协方差、协方差矩阵、相关系数详解(python代码)

    对于一个随机变量的分布特征,可以由均值、方差、标准差等进行描述。而对于两个随机变量的情况,有协方差和相关系数来描述两个随机变量的相互关系。 本文主要参考概率论与数理统计的教科书,整理了协方差、样本协方差、协方差矩阵、相关系数的概念解释和代码。

    2023年04月10日
    浏览(30)
  • 【什么是自相关矩阵,自协方差矩阵,互相关矩阵,互协方差矩阵?】

    最近看模式识别课程的时候卡在了一个地方,见下图: 协方差矩阵倒还知道,自相关矩阵?怎么推导的?它有什么意义?上网查了资料,要么晦涩难懂,要么一堆废话,这里我想尽量用最简洁的语言讲清楚它们。 向量的内积与外积 场景:机器学习 样本(n个样本,N个维度(

    2023年04月20日
    浏览(29)
  • 矩阵运算_矩阵的协方差矩阵/两个矩阵的协方差矩阵_求解详细步骤示例

            在统计学中, 方差 是用来度量 单个随机变量 的 离散程度 ,而协方差则一般用来刻画 两个随机变量 的 相似程度。 参考: 带你了解什么是Covariance Matrix协方差矩阵 - 知乎 将输入数据A进行中心化处理得到A\\\'。即通过 减去每个维度的平均值 来实现中心化。 注意:

    2024年02月03日
    浏览(34)
  • 协方差矩阵在torch和numpy中的比较,自行实现torch协方差矩阵

    数学中(教科书、大学课堂、数学相关的科普视频),一个矩阵的向量往往是竖着的, 一列作为一个vector ,这一点numpy库也是这样默认的。 但是在机器学习以torch框架为例,一个有意义的向量或者说embedding 是横着的 。 因为numpy库默认是一列是一个向量而torch等机器学习框架

    2023年04月08日
    浏览(28)
  • 协方差矩阵的研究

    (1)协方差矩阵的定义、计算过程。         协方差(Covariance):在概率论和统计学中用于衡量两个变量的总体误差。协方差在某种意义上给出了两个变量线性相关性的强度以及这些变量的尺度。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。协方差矩阵

    2024年02月13日
    浏览(22)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包