史上最简SLAM零基础解读(6) - 卡方分布(chi-square distribution)和()卡方检验(Chi-Squared Test) → 理论讲解与推导

这篇具有很好参考价值的文章主要介绍了史上最简SLAM零基础解读(6) - 卡方分布(chi-square distribution)和()卡方检验(Chi-Squared Test) → 理论讲解与推导。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本人讲解关于slam一系列文章汇总链接:史上最全slam从零开始
 
文末正下方中心提供了本人 联系方式, 点击本人照片即可显示 W X → 官方认证 {\color{blue}{文末正下方中心}提供了本人 \color{red} 联系方式,\color{blue}点击本人照片即可显示WX→官方认证} 文末正下方中心提供了本人联系方式,点击本人照片即可显示WX官方认证
 

一、前言

我们最终的目的是为了讲解如何在工程上使用卡方检验(Chi-Squared Test) ,在这之前我们需要了解两个重要的知识点,那就是卡方分布(chi-square distribution)和()卡方检验(Chi-Squared Test) 。为了方便大家理解,以通俗的方式进行讲解,然后再引入专业的相关名词。简单的说:

( 1 ) 卡方分布: \color{blue}(1)卡方分布: (1)卡方分布:若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)

( 2 ) 卡方检验: \color{blue}(2)卡方检验: (2)卡方检验:卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,基本思想是根据样本数据推断总体的频次与期望频次是否有显著性差异,经常通过小数量的样本容量去预估总体容量的分布情况。

先对卡方检验以及对应的一些实例进行简介,然后我们再来探讨卡方分布的由来 \color{red}先对 卡方检验 以及对应的一些实例进行简介,然后我们再来探讨卡方分布的由来 先对卡方检验以及对应的一些实例进行简介,然后我们再来探讨卡方分布的由来,在这之前,我们先来了解一个比较难理解的内容,那就是显著性水平。来看下图:
卡方分布gps,史上最全slam从零开始,概率论,人工智能,无人机,ORB-SLAM2,机器人在假设检验中,我们经常见到显著性水平这一说法,你可能有疑问了,它出镜率咋那么高,它到底是何方神圣呢?这张图就清晰的展示了,一个总体模型是被分为置信水平和显著性水平两部分。下面会通过一个通俗的例子会会它。

万能的朋友圈永远不乏微商的身影,而一向讨厌微商的你在平静的某天被一则微商产品所吸引,内容是:“减肥的灵丹妙药,成功率高达90%,女神们一起来吧!”虽然这则广告充满诱惑力,但你依然保持清醒,理智的思考解决对策。一鼓作气,打算自己检测一下宣传内容的真实性。

你随机调查了15个用过此产品的人,发现减肥成功的有12个人。如果广告为真的话,那么减肥成功的应该有15×0.9=13.5,现在12<13.5,你信心十足的告诉其他人不要轻易相信这款减肥产品!但是,你真的能确定它就是一则虚假广告吗?会不会是你自己出了差错呢?这时候,显著性水平就要华丽登场发挥作用了。

假设采用5%的显著性水平进行检验,如果某事件算得的P值小于5%,那它就是一件小概率事件,当小概率事件发生时,你就应该提高警惕了,概率这么小的事件都能遇到,那就有充分的理由拒绝宣传了。

由于试验次数一定,并且你的目标是减肥成功的人数,那么,成功的人数是符合二项分布(重复n次独立的试验,在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变)的,即,此时。

现在计算的P值是大于5%的,所以没有足够的证据证明减肥产品是骗人的,认为减肥成功率有90%(图1形象的展示了它们之间的关系)。所以啊,女神们可以在保证安全的前提下尝试一下这款产品。
卡方分布gps,史上最全slam从零开始,概率论,人工智能,无人机,ORB-SLAM2,机器人
对于任何一个问题的检验,我们只能是说有多大的把握去接受某一个假设,其中肯定存在犯错误的概率,而显著性水平就是 能承担该过程中犯错误的水平大小 \color{red}能承担该过程中犯错误的水平大小 能承担该过程中犯错误的水平大小,就像上述减肥产品一样,如果它对效果检测的偏差在我们可接受的范围内,我们依然可以接受产品的宣传。因此,显著性水平是很宽容的,它给了我们一定的犯错误的可能,至于是大是小,那就看自己的冒险精神了。但是不要无限的扩大它,如果允许犯错误的概率高达30%或40%,那研究也就没有意义了。

 

二、卡方检验(chi-square distribution)→引导示例

为了方便大家的理解,这里先做一个简单的例子,抽奖机,肯定都不陌生,现在一些商场超市门口都有放置。正常情况下出奖概率是一定的,综合来看,商家收益肯定大于支出。
倘若突然某段时间内总是出奖,甚是反常,那么到底是某阶段是小概率事件还是有人进行操作了?抽奖机怎么了?针对这种现象或者类似这种现象问题则可以借助卡方进行检验。下面是某台抽奖机的期望分布,其中X代表每局游戏的净收益(每局独立事件):    x     -2     23    48     73     98     P=(X=x)  0.977 0.008 0.008 0.006 0.001 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text { \color{Green} x }} & \mathbf {\text { \color{Green} -2 }} & \text { \color{Green} 23} & \text { \color{Green} 48 } & \text { \color{Green} 73 } & \text { \color{Green} 98 }\\ \hline \text { \color{Green} P=(X=x) } & 0.977 & 0.008 & 0.008 & 0.006 & 0.001 \\ \hline \end{array}   x   P=(X=x)   -2 0.977  230.008  48 0.008  73 0.006  98 0.001根据表格我们可以知道,每一局的成本价为两元,也就是说,你玩一局有0.997的概率损失2元,0.008的概率获利23元,依次类推。下面是实际观察中玩家收益的频数为:
   x     -2     23    48     73     98     频率  965 10 9 9 7 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text { \color{Green} x }} & \mathbf {\text { \color{Green} -2 }} & \text { \color{Green} 23} & \text { \color{Green} 48 } & \text { \color{Green} 73 } & \text { \color{Green} 98 }\\ \hline \text { \color{Green} 频率 } & 965 & 10 & 9 & 9 & 7 \\ \hline \end{array}   x   频率   -2 965  2310  48 9  73 9  98 7目的:在5%的显著性水平下,看看能否有足够证据证明判定抽奖机被人动了手脚。一般来说,使用卡方检验(Chi-Squared Test) ,主要包含四个步骤: 1.建立假设检验、2.计算理论值、3.计算卡方值、4. 查卡方表求P值。
 

1.建立假设检验

检验假设 ( 原假设 ) H 0 : \color{blue}检验假设(原假设)H0: 检验假设(原假设)H0老虎机每局收益符合如下概率分布:
   x     -2     23    48     73     98     P=(X=x)  0.977 0.008 0.008 0.006 0.001 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text { \color{Green} x }} & \mathbf {\text { \color{Green} -2 }} & \text { \color{Green} 23} & \text { \color{Green} 48 } & \text { \color{Green} 73 } & \text { \color{Green} 98 }\\ \hline \text { \color{Green} P=(X=x) } & 0.977 & 0.008 & 0.008 & 0.006 & 0.001 \\ \hline \end{array}   x   P=(X=x)   -2 0.977  230.008  48 0.008  73 0.006  98 0.001 备择假设 H 1 : \color{blue}备择假设H1: 备择假设H1老虎机每局收益不符合如上概率分布,显著水平 α=0.05。

也就是说这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%。
 

2.计算理论值

根据原假设,如果进行了1000局老虎机游戏,那么他的频数理论上应该如下:
   x     -2     23    48     73     98     频率 977 8 8 6 1 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text { \color{Green} x }} & \mathbf {\text { \color{Green} -2 }} & \text { \color{Green} 23} & \text { \color{Green} 48 } & \text { \color{Green} 73 } & \text { \color{Green} 98 }\\ \hline \text { \color{Green} 频率} & 977 & 8 & 8 & 6 & 1 \\ \hline \end{array}   x   频率  -2 977  238  48 8  73 6  98 1
下面是实际观察中玩家收益的频数为:
   x     -2     23    48     73     98     频率  965 10 9 9 7 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text { \color{Green} x }} & \mathbf {\text { \color{Green} -2 }} & \text { \color{Green} 23} & \text { \color{Green} 48 } & \text { \color{Green} 73 } & \text { \color{Green} 98 }\\ \hline \text { \color{Green} 频率 } & 965 & 10 & 9 & 9 & 7 \\ \hline \end{array}   x   频率   -2 965  2310  48 9  73 9  98 7下面我们把理论表格与实际表格进行合并,如下:
 x   观察频数     期望频数     -2   965    977    23   10    8    48   9    8    73   9    6    98   7    1 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text {\color{Green} x }} & \mathbf {\text {\color{Green} 观察频数 }}&\mathbf {\text { \color{Green} 期望频数 }}\\ \hline \text { \color{Green} -2} & ~965 & ~~977 \\ \hline \text { \color{Green} 23} & ~10 & ~~8 \\ \hline \text { \color{Green} 48} & ~9 & ~~8 \\ \hline \text { \color{Green} 73} & ~9 & ~~6 \\ \hline \text { \color{Green} 98} & ~7 & ~~1\\ \hline \end{array}  x   -2  23  48  73  98 观察频数  965 10 9 9 7  期望频数   977  8  8  6  1
 

3.计算卡方值

卡方检验求卡方的公式如下: χ 2 = ∑ ( A − T ) 2 T (01) \color{Green} \tag {01} \chi^{2}=\sum \frac{(A-T)^{2}}{T} χ2=T(AT)2(01)
其中,A为实际值,T为理论值,x2用于衡量实际值与理论值的差异程度(也就是卡方检验的核心思想),包含了以下两个信息:

①实际值与理论值偏差的绝对大小(由于平方的存在,差异是被放大的)
②差异程度与理论值的相对大小

那么带入实际值与理论值,计算过程如下:
χ 2 = ( 965 − 977 ) 2 977 + ( 10 − 8 ) 2 8 + ( 9 − 8 ) 2 8 + ( 9 − 6 ) 2 6 = ( 7 − 1 ) 2 1 = 38.272 (02) \color{Green} \tag {02} \chi^{2}=\frac{(965- 977)^2} {977}+\frac{(10 - 8)^2}{8}+ \frac{(9 -8)^2} {8} + \frac{(9 - 6)^2} {6} = \frac{(7 - 1)^2} {1} =38.272 χ2=977(965977)2+8(108)2+8(98)2+6(96)2=1(71)2=38.272(02)

4.查卡方表求P值

根据自由度,与显著水平查询检验统计量临界值.

自由度 : \color{blue}自由度: 自由度:其主要和表格的行数列数相关,这里的表格指实际观测的表格,并且一般频数需要以列的形式呈现,也即是前面实际观测的表格,应该转换为以下形式:
 x   观察频数     -2   965    23   10    48   9    73   9    98   7 \begin{array}{|l|l|l|l|l|l|} \hline \mathbf {\text {\color{Green} x }} & \mathbf {\text {\color{Green} 观察频数 }}\\ \hline \text { \color{Green} -2} & ~965 \\ \hline \text { \color{Green} 23} & ~10 \\ \hline \text { \color{Green} 48} & ~9 \\ \hline \text { \color{Green} 73} & ~9 \\ \hline \text { \color{Green} 98} & ~7\\ \hline \end{array}  x   -2  23  48  73  98 观察频数  965 10 9 9 7
对于单行或单列:自由度 = 组数-限制数,为5组,限制数为1,也就是 5-1=4。对于表格类:自由度 = (行数 - 1) * (列数 - 1)。后面我们会讲解一个多行多列的例子。现在我们根据自由度4,以及前面的显著水平 α=0.05。在如下表格中(F表示自由度)进行查找:
卡方分布gps,史上最全slam从零开始,概率论,人工智能,无人机,ORB-SLAM2,机器人

卡方分布表

那么其拒绝域为 χ > 9.14 \chi>9.14 χ>9.14,也就是说检验统计量大于9.49 位于拒绝域内。我们计算出来的 χ 2 = 38.272 \chi^2=38.272 χ2=38.272,明显是其是大于9.14的,也就是其位于拒绝域内,另外:

如果位于拒绝域内我们拒绝原假设H0,接受H1。
如果不在拒绝域内我们接受原假设H0,拒绝H1

于是拒绝原假设,也就是说抽奖机被人动了手脚。现在大家肯定还有一个疑惑,那就是上面的这个表格,是怎么来的,为了巩固知识,我们先再简介一个例子,再来推导上面的表格,也就是方分布(chi-square distribution)

 

二、卡方检验(chi-square distribution)→再度示例

以下为一个典型的四格卡方检验,我们想知道喝牛奶对感冒发病率有没有影响:
   感冒人数     末感冒人数     合计     感冒率     喝牛奶组  43 96 139 30.94 %    不喝牛奶组  28 84 112 25.00 %    合计  71 180 251 28.29 % \begin{array}{|l|l|l|l|l|} \hline & \mathbf {\text { \color{Green} 感冒人数 }} & \text { \color{Green} 末感冒人数 } & \text { \color{Green} 合计 } & \text { \color{Green} 感冒率 } \\ \hline \text { \color{Green} 喝牛奶组 } & 43 & 96 & 139 & 30.94 \% \\ \hline \text { \color{Green} 不喝牛奶组 } & 28 & 84 & 112 & 25.00 \% \\ \hline \text { \color{Green} 合计 } & 71 & 180 & 251 & 28.29 \% \\ \hline \end{array}   喝牛奶组   不喝牛奶组   合计   感冒人数 432871  末感冒人数 9684180  合计 139112251  感冒率 30.94%25.00%28.29%

1.建立假设检验

检验假设 H 0 : \color{blue}检验假设H0: 检验假设H0喝牛奶与感冒没有关系。
备择假设 H 1 : \color{blue}备择假设H1: 备择假设H1喝牛奶与感冒存在关系,显著性水平 α=0.01
 

2.计算理论值

基于 假设H0,喝牛奶与感冒没有关系,那么喝牛奶组与不喝牛奶组,他们感冒的几率应该是一样的,也就是理论表格应该如下:
   感冒人数     末感冒人数     合计     喝牛奶组  39.3231 99.6769 139    不喝牛奶组  31.6848 80.3152 112    合计  71 180 251 \begin{array}{|l|l|l|l|} \hline & \text { \color{Green} 感冒人数 } & \text { \color{Green} 末感冒人数 } & \text { \color{Green} 合计 } \\ \hline \text { \color{Green} 喝牛奶组 } & 39.3231 & 99.6769 & 139 \\ \hline \text { \color{Green} 不喝牛奶组 } & 31.6848 & 80.3152 & 112 \\ \hline \text { \color{Green} 合计 } & 71 & 180 & 251 \\ \hline \end{array}   喝牛奶组   不喝牛奶组   合计   感冒人数 39.323131.684871  末感冒人数 99.676980.3152180  合计 139112251那么很明显实际值与理论值,存在一定差距。
 

3.计算卡方值

χ 2 = ( 43 − 39.3231 ) 2 39.3231 + ( 28 − 31.6848 ) 2 31.6848 + ( 96 − 99.6769 ) 2 99.6769 + ( 84 − 80.3152 ) 2 80.3152 = 1.077 (03) \color{Green} \tag {03} \chi^{2}=\frac{(43 - 39.3231)^2} {39.3231}+\frac{(28 - 31.6848)^2}{31.6848}+ \frac{(96 - 99.6769)^2} { 99.6769} + \frac{(84 - 80.3152)^2} { 80.3152} = 1.077 χ2=39.3231(4339.3231)2+31.6848(2831.6848)2+99.6769(9699.6769)2+80.3152(8480.3152)2=1.077(03)
 

4.查卡方表求P值

首先计算自由度,这里用r表示表格的行数,c表示表格的列数,如下图:
卡方分布gps,史上最全slam从零开始,概率论,人工智能,无人机,ORB-SLAM2,机器人那么自由度的公式为:
v ( 自由度 ) = ( r − 1 ) ( c − 1 ) (04) \color{Green} \tag {04} v(自由度)=(r-1)(c-1) v(自由度)=(r1)(c1)(04)带入数据计算的 v = ( r − 1 ) ( c − 1 ) = ( 2 − 1 ) ∗ ( 2 − 1 ) = 1 v=(r-1)(c-1)=(2-1)*(2-1)=1 v=(r1)(c1)=(21)(21)=1,再结合前面的显著性水平 α=0.01,查询表格临界值为 6.64(在前面卡方分布表中查找),很明显我们计算出来的 χ 2 = 1.077 \chi^{2}=1.077 χ2=1.077 低于该值,也就是其没有位于拒绝域内,那么我们接受原假设H0,喝牛奶与感冒没有关系。下面我们就来看看我们查询的表格是怎么来的。

 

四、卡方分布(chi-square distribution)

先把博客前面的话拿过来→卡方分布:若n个相互独立的随机变量ξ₁,ξ₂,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)

也就是说,卡方分布是建立在n个相互独立的随机变满足正态分布的前提下,
 
 
 文章来源地址https://www.toymoban.com/news/detail-712618.html

到了这里,关于史上最简SLAM零基础解读(6) - 卡方分布(chi-square distribution)和()卡方检验(Chi-Squared Test) → 理论讲解与推导的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 史上最简单的Kafka安装教程

     解压apache-zookeeper-3.8.0-bin.tar.gz到指定目录,复制conf目录下zoo_sample.cfg到zoo.cfg,并修改配置。 进入bin目录,启动zookeeper 解压kafka_2.12-3.0.0.tgz到指定目录。 进入到config目录,修改server.properties配置 advertised.listeners才是真正的对外代理地址,listeners的作用不是对外提供服务代理,

    2024年02月07日
    浏览(37)
  • MySQL Workbench 操作详解(史上最细)

    右键新建的数据库BMI,设置为此次连接的默认数据库,接下来的所有操作都将在这个数据库下进行 将bmi下拉单展开,点击Table,右键创建Table: 给Table命名,添加Column,设置Column的Datatype,PrimaryKey等属性。点击Apply后,Workbench仍会自动生成SQL语句,再次点击Apply,成功创建新表

    2023年04月08日
    浏览(29)
  • C++:史上最坑小游戏

    史上最坑小游戏,先别使用,往后看! 破解: 输入1~4的破解方法(二次开机)或: 输入5,6:的破解方法(一旦运行此程序,只有按下Windows开始键(其实我也不知道它叫什么,就是那个按一下就能显示开始窗口的键)然后按 cmd就会弹出一个窗口,根平时代码运行时的窗口一

    2024年01月21日
    浏览(27)
  • 史上最详细的八大排序详解!(建议收藏)

    🚀write in front🚀 📜所属专栏:初阶数据结构 🛰️博客主页:睿睿的博客主页 🛰️代码仓库:🎉VS2022_C语言仓库 🎡您的点赞、关注、收藏、评论,是对我最大的激励和支持!!! 关注我,关注我,关注我 , 你们将会看到更多的优质内容!!   从今天开始,我们就进入

    2023年04月20日
    浏览(41)
  • OpenStack搭建史上最详细步骤 (快速入手)

    搭建openstack平台所需要的两个镜像包:CentOS-7-X86_64-DVD-1804.iso 和 chinaskill_cloud_iaas.iso镜像文件。 在VMware上准备两台虚拟机,分别作为controller(控制)节点和compute节点. 下面是VMware上虚拟机的基础配置。 computecontroller 双网卡,NAT模式和仅主机模式,配置硬盘各给50G 多添的一块

    2024年02月02日
    浏览(36)
  • 盘点史上最严重的五大黑客攻击事件

    黑客攻击事件频频发生 数据安全越发重要 索尼旗下PlayStation Network平台又遭黑客入侵,数百万用户的姓名、住址、账号密码等信息遭窃。这一消息被曝光以后,科技界再次聚焦互联网安全这个异常棘手但至关重要的话题。黑客入侵电脑网络并窃取用户数据并不是什么新鲜事,

    2024年02月16日
    浏览(31)
  • Hadoop为什么如此流行——史上最详解

    作者:禅与计算机程序设计艺术 Hadoop是一个开源的分布式计算框架,其出现主要是为了解决海量数据的存储、计算、分析、和处理问题。随着互联网的数据量不断增加,分布式系统越来越普及,Hadoop也越来越受到青睐。它具备高容错性、高可靠性、弹性扩展等特性,能够适应

    2024年02月08日
    浏览(39)
  • Java对接微信支付(史上最详细)

    本文将介绍如何使用Java对接微信支付,包括获取支付参数、支付回调处理等步骤。本文适用于已经熟悉微信支付基本原理的读者。 JDK 1.8 Maven Spring Boot 2.x 微信支付开发文档 为了进行支付,我们需要先获取微信支付的参数信息,包括appid、商户id、支付密钥等。 配置文件 我们

    2024年02月15日
    浏览(29)
  • Nacos 安装教程(史上最详细保姆级教程)

    作者:大三的土狗 专栏:SpringCloud    Nacos的全称是Dynamic Naming and Configuration Service,Na为naming/nameServer即注册中心,co为configuration即注册中心,service是指该注册/配置中心都是以服务为核心。   Nacos 致力于帮助您发现、配置和管理微服务。Nacos 提供了一组简单易用的特性集,

    2024年02月03日
    浏览(40)
  • 伽马分布,指数分布,卡方分布三者关系

    1.伽马分布 是一个连续概率分布,具有两个参数 α alpha α 和 λ lambda λ ,记为 Gamma ( α , λ ) text{Gamma}(alpha,lambda) Gamma ( α , λ ) 。伽马分布的概率密度函数为: f ( x ; α , λ ) = λ α x α − 1 e − λ x Γ ( α ) , x 0 , α 0 , λ 0 , f(x;alpha,lambda)=frac{lambda^{alpha}x^{alpha-1}e^{-lambda x

    2023年04月20日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包