概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

这篇具有很好参考价值的文章主要介绍了概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

方差和标准差:

一个随机变量,的值的变化程度可以用方差计算:

 ;其中 是期望。

另外一种等价表达式:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关     其中为均值,N为总体例数

我们举个例子:

服从均一分布,取值为0.1,0.2,0.3,0.4,0.5 ,每种值的概率是20%,可算出期望是0.3,那么方差就是:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

标准差是方差的平方根,随机变量的标准差是

此处为了方便,计算方差和标准差时,分母是N,计算的是总体方差和总体标准差。(在实际应用中,因为样本是抽样样本,计算方差和标准差时,分母应是N-1,也就是说计算的是样本方差和样本标准差。)

协方差:

协方差可以用来衡量两个变量的线性相关性,并且可以化简到容易计算的形式(化简过程有问题可以找下证明或者举个例子亲自算一下):

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

我们举第一个例子: 

服从均一分布,取值为0.1,0.2,0.3,0.4,0.5 ,每种值的概率是20%,可算出期望是0.3,标准差是;

服从均一分布,取值为10000,20000,30000,40000,50000 ,每种值的概率是20%,可算出期望是30000,标准差是;

假设 和  线性相关,此时 ,那么取0.1取10000的概率为0.2,取0.1取20000、30000、40000、50000的概率都为0,以此类推。

和的协方差就是:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

我们再举第二个例子:

把上个例子中的随机变量改变,随机变量不改变。

服从均一分布,取值为1,2,3,4,5 ,每种值的概率是20%,可算出期望是3,标准差是;

假设 和  线性相关,此时 ,那么取0.1取1的概率为0.2,取0.1取2、3、4、5的概率都为0,以此类推。

和的协方差就是:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

两个例子对比一下,两个例子中的两个随机变量都是线性相关的,求出来的协方差都大于0,但是两个协方差的数值有较大差异,相差了10000倍。

皮尔逊相关系数:

皮尔逊相关系数是两个随机变量 和 的协方差与标准差之商:

我们可以计算上述两个例子里的皮尔逊相关系数:

第一个例子:

第二个例子:

皮尔逊相关系数都为1。

协方差、皮尔逊相关系数与线性相关

完全线性相关、线性相关、线性独立、完全独立:

如果变量可以用表示成 概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关,那么两个随机变量完全线性相关,否则不是完全线性相关。不是完全线性相关的两个变量有可能线性相关,有可能线性独立。如果两个变量有一定的线性关系,那么两个变量线性相关;如果和没有任何关系(完全独立)或者左右对称的线性关系可以抵消掉,那么两个变量线性独立。我们举一些例子。

完全线性相关的例子:

如果概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关,点集如散点图所示,那么概率矩阵和计算协方差如下,协方差为4大于0(绿色部分值的加和),皮尔逊系数为1:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关                     概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

线性相关的例子:

如果,点集如散点图所示,那么概率矩阵和计算协方差如下,协方差为12大于0,皮尔逊系数为0.98:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关                   概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

线性独立的例子:

仍然是,取不同的数值再算一下,点集如散点图所示,协方差为0,皮尔逊系数为0,此时左右对称的线性关系可以抵消掉:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关                 概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

线性独立的另外一个例子,点集如散点图所示,此时和  完全独立,协方差为0,皮尔逊系数为0:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关                  概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

通过上述例子可以看出,当两变量线性独立时,协方差一定等于0;当协方差等于0时,两变量也一定线性独立,但是并不代表两变量完全独立(完全独立的例子)。

下图是皮尔逊相关系数的一个图示便于理解:

概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关

 总结

如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

协方差和皮尔逊相关系数都可以衡量两个随机变量的线性相关性(注意只是线性相关性),协方差受随机变量数值大小的影响,而皮尔逊相关系数不受随机变量数值大小的影响。所以两随机变量的协方差越大并不代表这两个变量越线性相关,而两随机变量的皮尔逊相关系数绝对值越大这两个变量越线性相关。

协方差的范围是;协方差<0时,线性负相关;协方差>0时,线性正相关;协方差=0时,线性独立。皮尔逊相关系数的范围是;当为-1时,完全线性负相关;当为1时,完全线性正相关;当>-1且<0时,线性负相关,绝对值越大越线性负相关;当>0且<1时,线性正相关,绝对值越大越线性正相关;当=0时,线性独立。文章来源地址https://www.toymoban.com/news/detail-493866.html

到了这里,关于概率论:方差、标准差、协方差、皮尔逊相关系数、线性相关的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 概率论之 多维随机变量的期望,协方差矩阵

    上一次写了一维随机变量的期望,方差,协方差。本次来记录多维随机变量的期望和协方差矩阵。这一块内容由浅入深,因此会有更新。 假设系统状态有多个分量 x 1 , x 2 , … , x n x_1,x_2,dots,x_n x 1 ​ , x 2 ​ , … , x n ​ ,则将其表示为向量的形式 X = ( x 1 , x 2 , … , x n ) T X=

    2024年02月04日
    浏览(45)
  • 【概率论与数理统计】猴博士 笔记 p36-37 协方差、相关系数、不相关、相互独立时的期望和方差

    接下来做几道例题,练习一下套公式: 例1: 解: 前4个就是简单的套公式: 第5个有点类似分配律: C o v ( 2 X + 3 Y , 4 X + 5 Y ) = 8 C o v ( X , X ) + 10 C o v ( X , Y ) + 12 C o v ( X , Y ) + 15 C o v ( Y , Y ) Cov(2X+3Y,4X+5Y)=\\\\8Cov(X,X)+10Cov(X,Y)+12Cov(X,Y)+15Cov(Y,Y) C o v ( 2 X + 3 Y , 4 X + 5 Y ) = 8 C o v ( X , X

    2023年04月08日
    浏览(63)
  • 【数据处理】Python:实现求条件分布函数 | 求平均值方差和协方差 | 求函数函数期望值的函数 | 概率论

         猛戳订阅!  👉 《一起玩蛇》🐍 💭 写在前面: 本章我们将通过 Python 手动实现条件分布函数的计算,实现求平均值,方差和协方差函数,实现求函数期望值的函数。部署的测试代码放到文后了,运行所需环境 python version = 3.6,numpy = 1.15,nltk = 3.4,tqdm = 4.24.0,sci

    2024年02月05日
    浏览(51)
  • 数学基础--均值、方差、标准差、协方差

      统计学中最核心的概念之一是:标准差及其与其他统计量(如方差和均值)之间的关系,本文将对标准差这一概念提供直观的视觉解释,在文章的最后我们将会介绍协方差的概念。   均值: 均值就是将所有的数据相加求平均,求得一个样本数据的中间值。 定义: 给定

    2024年02月07日
    浏览(45)
  • 【应用统计学】随机变量的概率分布,数学期望和方差及协方差

     【例4-5】某厂对一批产品进行抽检,该批产品含有10件正品及3件次品。设每次抽取时,各件产品被抽到的可能性相等。一件一件抽取产品进行检验,每次抽取的产品都不放回该批产品中,求直到抽得正品为止所需次数X的分布律。 解: 由于每次抽取的产品不再放回,因此离散型

    2024年02月05日
    浏览(53)
  • MATLAB中均值、方差、标准差、协方差、相关性的计算

    xmean = 2 ans = 2 xvar = 0.6667 ans = 0.6667 xvar_1 = 0.8000 ans = 0.8000 ans = 0.6667 xstd = 0.8165 ans = 0.8165 ans = 0.8165 xstd_1 = 0.8944 ans = 0.8944 ans = 0.8944 xcov = 0.6667 xycov = 0.6667 0.5000 0.5000 0.6667 ans = 0.5000 xcov_1 = 0.8000 xycov_1 = 0.8000 0.6000 0.6000 0.8000 ans = 0.6000 xycorrcoef = 1.0000 0.7500 0.7500 1.0000 xzcorrcoef = 1.0000

    2024年02月21日
    浏览(45)
  • 概率论中二项分布期望与方差的详细推导

    二项分布的期望和方差表达式非常简洁,但推导过程却很灵活,我们做如下推导: 概率论中,离散型随机变量期望的定义为 二项分布概率公式为 : 则其期望为 : 我们记   则 因为 所以 根据二项式展开定理,有 所以原式 概率论中,方差的定义为 因为上文已经得到E(X),所以

    2024年02月21日
    浏览(41)
  • 概率论与数理统计(3)--指数分布函数及其期望、方差

    设随机变量X具有如下形式的密度函数,那么则称X服从参数为θ的指数分布, 记为X~EXP(θ).  指数分布的分布函数为: ①数学期望 如果X 服从参数为λ (λ0)的指数分布,那么指数分布X~EXP(θ)的数学期望: λ  ②方差 设X 服从参数为λ (λ0)的指数分布, 指数分布X~EXP(θ)的方差:λ^2。

    2024年02月11日
    浏览(44)
  • 概率论的学习和整理17:EXCEL的各种期望,方差的公式

    目录 1 总结 1.1 本文目标总结方法 1.2 总结一些中间关键函数 2 均值和期望 2.1 求均值的公式 2.2 求随机变量期望的公式 2.3 求随机变量期望的朴素公式 3 方差 3.1 确定数的方差 3.2 统计数的方差公式 3.3 随机变量的方差公式 3.4 EXCEL提供的直接计算方差的公式 4  期望 和方差的公

    2024年02月16日
    浏览(41)
  • 概率论与数理统计中常见的随机变量分布律、数学期望、方差及其介绍

    设随机变量X的所有可能取值为0与1两个值,其分布律为 若分布律如上所示,则称X服从以P为参数的(0-1)分布或两点分布。记作X~ B(1,p) 0-1分布的分布律利用表格法表示为: X 0 1 P 1-P P 0-1分布的数学期望 E(X) = 0 * (1 - p) + 1 * p = p 二项分布的分布律如下所示: 其中P是事件在一次试验

    2024年02月05日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包