模式识别 —— 第一章 贝叶斯决策理论
前言
新的学期开始了,当然是要给不爱吃香菜的月亮记录学习笔记呀~
没多久了,待夏花绚烂之时~人山人海,我们如约而至!
以后清河海风 溶溶月色 共赏之人 就在身侧 mua~
贝叶斯决策
先验概率
先验概率就是人们根据一些先验知识预先知道的一些概率。比如,南理工男女比例7:3.
类条件概率
就是在先验概率
w
i
w_i
wi的条件下发生
x
x
x事件的概率。
后验概率
由这张图也可以看出,最大后验概率决策其实就是最小错误决策。
最大后验概率决策(最小错误率决策)
后验概率形式:
条件概率形式
其实就是用贝叶斯公式展开后约去分母
似然比形式
通过上式移项得到。
对数形式
主要是方便求导,也可将之后的累乘化为累加。
最小风险决策
从不同性质的错误会引起不同程度的损失这一考虑出发,我们有时宁肯扩大一些总的错误率,也要使总的损失最小。这就提出了最小损失准则的决策方法。例如,有时2类代价相差很大,比如医疗诊断的场合、工业检测。
为了区分不同错误的代价,我们这里引入了决策代价。
对应的决策代价表如下:
在采取决策
a
j
a_j
aj的条件期望是:
看所有判决对应的期望,选最小的风险判决。
整体流程如下:
最小错误率判决(最大后验概率判决)与最小风险决策的似然比形式一样,只不过在判别阈值上最小风险决策要加上损失代价。
含拒取的最小损失判别规则
例如,人脸识别中有一些未识别的情况,而不是错误的将你识别成另外一个人。那么当后验概率小于多少时采取拒取呢?如下图推导:
N-P判决
在实际问题中,可能存在某一个错误较另一个错误更为重要。于是我们想在限定一类错误的概率下使得另一类错误的概率最小。
- 例如,在人脸识别中判断错误比未识别要严重许多。所以我们要求判断错误的概率要不超过 1 0 − 6 10^{-6} 10−6(要不超过6位密码的安全级才能投入使用)。在此基础上,我们尽量降低拒取的概率。这里用的是拉格朗日乘子法,不再详解。
判别函数和决策面
正态分布下的贝叶斯决策
对于二维正态分布有如下公式:
这里的
Σ
\Sigma
Σ是协方差矩阵
协方差方差矩阵
协方差定义
X、Y 是两个随机变量,X、Y 的协方差 cov(X, Y) 定义为:
协方差矩阵定义
矩阵中的数据按行排列与按列排列求出的协方差矩阵是不同的,这里默认数据是按行排列。即每一行是一个observation(or sample),那么每一列就是一个随机变量。
求解协方差矩阵的步骤
协方差代表的意义
正相关
负相关
不相关
-
当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) > 0 (X-EX)(Y-EY)>0 (X−EX)(Y−EY)>0 。
-
当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) < 0 (X-EX)(Y-EY)<0 (X−EX)(Y−EY)<0。
-
当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有 ( X − E X ) ( Y − E Y ) = 0 (X-EX)(Y-EY)=0 (X−EX)(Y−EY)=0 。
所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差.
c o v ( X , Y ) = E ( X − E X ) ( Y − E Y ) cov(X, Y) = E(X-EX)(Y-EY) cov(X,Y)=E(X−EX)(Y−EY)
当 c o v ( X , Y ) > 0 cov(X, Y)>0 cov(X,Y)>0时,表明 X与Y 正相关;
当 c o v ( X , Y ) < 0 cov(X, Y)<0 cov(X,Y)<0时,表明X与Y负相关;
当 c o v ( X , Y ) = 0 cov(X, Y)=0 cov(X,Y)=0时,表明X与Y不相关。
文章来源:https://www.toymoban.com/news/detail-736942.html
文章来源地址https://www.toymoban.com/news/detail-736942.html
到了这里,关于模式识别 —— 第一章 贝叶斯决策理论的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!