模式识别 —— 第一章 贝叶斯决策理论

这篇具有很好参考价值的文章主要介绍了模式识别 —— 第一章 贝叶斯决策理论。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

模式识别 —— 第一章 贝叶斯决策理论

前言

新的学期开始了,当然是要给不爱吃香菜的月亮记录学习笔记呀~

没多久了,待夏花绚烂之时~人山人海,我们如约而至!

以后清河海风 溶溶月色 共赏之人 就在身侧 mua~

贝叶斯决策

先验概率

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
先验概率就是人们根据一些先验知识预先知道的一些概率。比如,南理工男女比例7:3.

类条件概率

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
就是在先验概率 w i w_i wi的条件下发生 x x x事件的概率。
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

后验概率

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
由这张图也可以看出,最大后验概率决策其实就是最小错误决策。

最大后验概率决策(最小错误率决策)

后验概率形式:

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
条件概率形式
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
其实就是用贝叶斯公式展开后约去分母

似然比形式
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能通过上式移项得到。

对数形式
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
主要是方便求导,也可将之后的累乘化为累加。

最小风险决策

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
从不同性质的错误会引起不同程度的损失这一考虑出发,我们有时宁肯扩大一些总的错误率,也要使总的损失最小。这就提出了最小损失准则的决策方法。例如,有时2类代价相差很大,比如医疗诊断的场合、工业检测。

为了区分不同错误的代价,我们这里引入了决策代价。

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
对应的决策代价表如下:
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
在采取决策 a j a_j aj的条件期望是:

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

看所有判决对应的期望,选最小的风险判决。

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
整体流程如下:
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
最小错误率判决(最大后验概率判决)与最小风险决策的似然比形式一样,只不过在判别阈值上最小风险决策要加上损失代价。

含拒取的最小损失判别规则

例如,人脸识别中有一些未识别的情况,而不是错误的将你识别成另外一个人。那么当后验概率小于多少时采取拒取呢?如下图推导:

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

N-P判决

在实际问题中,可能存在某一个错误较另一个错误更为重要。于是我们想在限定一类错误的概率下使得另一类错误的概率最小。

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

  • 例如,在人脸识别中判断错误比未识别要严重许多。所以我们要求判断错误的概率要不超过 1 0 − 6 10^{-6} 106(要不超过6位密码的安全级才能投入使用)。在此基础上,我们尽量降低拒取的概率。这里用的是拉格朗日乘子法,不再详解。

判别函数和决策面

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

正态分布下的贝叶斯决策

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
对于二维正态分布有如下公式:
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
这里的 Σ \Sigma Σ是协方差矩阵

协方差方差矩阵

协方差定义
X、Y 是两个随机变量,X、Y 的协方差 cov(X, Y) 定义为:
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

协方差矩阵定义
矩阵中的数据按行排列与按列排列求出的协方差矩阵是不同的,这里默认数据是按行排列。即每一行是一个observation(or sample),那么每一列就是一个随机变量。
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
求解协方差矩阵的步骤
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

协方差代表的意义

正相关
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
负相关
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
不相关
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

  • 当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) > 0 (X-EX)(Y-EY)>0 (XEX)(YEY)>0

  • 当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) < 0 (X-EX)(Y-EY)<0 (XEX)(YEY)<0

  • 当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有 ( X − E X ) ( Y − E Y ) = 0 (X-EX)(Y-EY)=0 (XEX)(YEY)=0

所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差.

c o v ( X , Y ) = E ( X − E X ) ( Y − E Y ) cov(X, Y) = E(X-EX)(Y-EY) cov(X,Y)=E(XEX)(YEY)

c o v ( X , Y ) > 0 cov(X, Y)>0 cov(X,Y)>0时,表明 X与Y 正相关;

c o v ( X , Y ) < 0 cov(X, Y)<0 cov(X,Y)<0时,表明X与Y负相关;

c o v ( X , Y ) = 0 cov(X, Y)=0 cov(X,Y)=0时,表明X与Y不相关。

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能

贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能
贝叶斯最小最大决策,模式识别,概率论,机器学习,人工智能文章来源地址https://www.toymoban.com/news/detail-736942.html

到了这里,关于模式识别 —— 第一章 贝叶斯决策理论的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Javaweb第一章:Web前端的入门理论

    目录 前言 一.wed 💖wed是什么? 💖 wed的分类 二.HTML 和 CSS 💖HTML的介绍 HTML的标签 💖CSS的介绍 常用基本标签 💖实践 HTML结构标签特点 三.JavaScript 💖JavaScript的介绍 💖JS的学习内容 四.Vue 💖Vue的介绍  MVVM(Model-View-ViewModel)思想介绍 💖Vue的代码样式 安装Vue.js方法及其使用  

    2024年02月16日
    浏览(47)
  • 每天一道算法练习题--Day22&& 第一章 --算法专题 --- ----------最大公约数

    关于最大公约数有专门的研究。 而在 LeetCode 中虽然没有直接让你求解最大公约数的题目。但是却有一些间接需要你求解最大公约数的题目。 时间复杂度:最好的情况是执行一次循环体,最坏的情况是循环到 smaller 为 1,因此总的时间复杂度为 O ( N ) O(N) O ( N ) ,其中 N 为 a 和

    2024年02月03日
    浏览(54)
  • 第一章设计模式前置知识

    软件设计模式(Software Design Pattern),又称设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。它描述了在软件设计过程中的一些不断重复发生的问题,以及该问题的解决方案。也就是说,它是解决特定问题的一系列套路,是前辈们的代码

    2024年02月01日
    浏览(41)
  • 《微服务架构设计模式》第一章

    ​​​​​​​作者用国外FTGO公司(一家做线餐饮外卖)的应用程序举例,阐述了单体架构的优缺点。FTGO应用架构如下: 应用程序是单体应用,具有六边形架构,最内侧是业务逻辑,包含订单管理、配送管理、用户管理等。业务逻辑外边是实现用户界面的适配器和与外部系

    2024年02月09日
    浏览(39)
  • 实验五 贝叶斯分类器(模式识别与机器学习)

    目录 实验一  离散型数据的朴素贝叶斯分类  实验步骤:  NBtrain.m  NBtest.m  main.m 实验二  连续型数据的朴素贝叶斯分类 实验步骤:  naiveBayestrain.m navieBayestest.m main.m         data 数据集中含有 625 个样本,每个样本第 1 列为类别; 2~5 列为各样 本的属性。              

    2024年02月09日
    浏览(47)
  • (最优化理论与方法)第一章最优化简介-第二节:最优化典型实例之稀疏优化和低秩矩阵恢复

    考虑下面线性方程组的求解问题,其中 x ∈ R n , b ∈ R m xin R^{n},bin R^{m} x ∈ R n , b ∈ R m ,矩阵 A ∈ R m × n Ain R^{m×n} A ∈ R m × n ,且向量 b b b 的维数远小于向量 x x x 的维数,也即 m m m n n n A x = b Ax=b A x = b 在相关问题中,当我们建立这样的模型后,常常希望 解出向量

    2024年02月08日
    浏览(45)
  • RabbitMQ:第一章:6 种工作模式以及消息确认机制

    } System.out.println(“发送数据成功”); channel.close(); connection.close(); } } 消费者一: import com.liao.rabbitmq.utils.RabbitConstant; import com.liao.rabbitmq.utils.RabbitUtils; import com.rabbitmq.client.*; import java.io.IOException; /** 消费者1 */ public class ConsumerOne { public static void main(String[] args) throws Exception { Con

    2024年04月12日
    浏览(36)
  • 模式识别与机器学习(八):决策树

    决策树(Decision Tree),它是一种以树形数据结构来展示决策规则和分类结果的模型,作为一种归纳学习算法,其重点是将看似无序、杂乱的已知数据,通过某种技术手段将它们转化成可以预测未知数据的树状模型,每一条从根结点(对最终分类结果贡献最大的属性)到叶子结

    2024年01月24日
    浏览(35)
  • 第一章:AI大模型概述1.3 AI大模型的典型应用1.3.3 语音识别

    语音识别,也被称为语音转文本(Speech-to-Text),是人工智能领域中的一个重要技术。它旨在将人类的语音信号转换为文本形式,从而实现人机交互的自然语言处理。在过去的几年里,语音识别技术的发展取得了显著的进展,这主要归功于深度学习和大规模数据集的应用。 在

    2024年02月01日
    浏览(43)
  • 【C语言】交换最大、最小值。输入一个正整数n(1<n≤10),再输入n个整数(<=999),将最小值与第一个数交换,最大值与最后一个数交换,然后输出交换后的n个数。

    【问题描述】4.4 交换最大、最小值。输入一个正整数n(1n≤10),再输入n个整数(=999),将最小值与第一个数交换,最大值与最后一个数交换,然后输出交换后的n个数。 【输入输出样例】 【样例说明】 输入提示符后冒号为英文字符,后面没有空格。 输出整数序列时按照%4d格

    2024年02月05日
    浏览(57)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包