模式识别 第7、8章 特征的选择和提取

这篇具有很好参考价值的文章主要介绍了模式识别 第7、8章 特征的选择和提取。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、基本概念

1.问题的提出

2.基本概念

3.特征选择

4.特征的评价准则

二、类别可分离性判据

1.常用的特征判据

1. 基于类内类间距离的可分性判据

 2. 基于概率分布的可分性判据

 3. 基于熵的可分性判据

三、特征选择的最优和次优算法

1.特征选择的最优算法

1. 最优算法

2. 分枝定界法(branch and bound)

2.特征选择的次优算法

 1. 单独最优特征的组合

2. 顺序前进法

 3. 顺序后退法

4. 增l减r法(l-r法)

四、特征提取之PCA算法

1.问题的提出

2.主成分分析PCA

3.主成分分析的方法

1. 计算第一主成分

 2. 计算第二主成分

 3.计算主成分的贡献率(主成分数量的确定方法)

4. 主成分分析的理解

 5. 三维主成分分析示意图

6. 总结主成分分析的步骤

 7. 主成分分析方法应用举例

五、特征提取之K-L变换

K--L变换

1. K-L展开式

2. 均方误差

 3. K-L变换与产生矩阵

 4. K-L变换进行特征提取的步骤

 5. 例题

6.  K-L变换与主成分分析法的对比

7.K-L变换用于监督模式识别的方法 --从类均值中提取判别信息

应用举例

总结


一、基本概念

1.问题的提出

特征→ 特征空间:  每一个特征对应特征空间的一个维度 ;特征越多,特征空间的维度越高
原则:在保证分类效果的前提下用尽量少的特征来完成分类

2.基本概念

(1)特征形成:由仪器直接测量出来的数值,或者是根据仪器的数据进行计算后的结果

(2)特征选择:用计算的方法从一组给定的特征中选择一部分特征进行分类

(3)特征提取:通过适当的变换把原有的D个特征转换为d(<D)个特征

3.特征选择

一是对 特征的评价 ,也就是怎样衡量一组特征对分类的有效性
二是 寻优的算法 ,就是怎样更快地找到性能最优或比较优的特征组合

4.特征的评价准则

利用分类器的错误率作为准则是最直接的想法,但是不可行;  定义与错误率有一定关系但又便于计算的类别可分性准则Jij   用来衡量在一组特征下第i类和第j类之间的可分程度
对判据的要求 : 单调、可加、度量
根据贡献率提取特征,模式识别,算法,python,人工智能

二、类别可分离性判据

1.常用的特征判据

1. 基于类内类间距离的可分性判据

(1)基本思想:计算各类特征向量之间的平均距离,考虑最简单的两类情况,可以用两类中任意两两样本间的平均来代表两个类之间的距离。

(2)判据的表达式:

根据贡献率提取特征,模式识别,算法,python,人工智能

(3)矩阵形式的类间距离的表达式

 根据贡献率提取特征,模式识别,算法,python,人工智能

 (4)其它的基于类内类间距离的判据

根据贡献率提取特征,模式识别,算法,python,人工智能

 2. 基于概率分布的可分性判据

用两类分布密度函数间的距离(或重叠程度)来度量可分性 , 构造基于概率分布的可分性判据
重叠程度反应了概密函数间的相似程度
(1)定义:两个密度函数之间的距离
根据贡献率提取特征,模式识别,算法,python,人工智能
(2)Bhattacharyya距离(巴氏距离)
根据贡献率提取特征,模式识别,算法,python,人工智能
(3)Chernoff界(切诺夫界)

 根据贡献率提取特征,模式识别,算法,python,人工智能

(4)散度----人们在似然比的基础上定义了散度来作为类别可分性的度量

 根据贡献率提取特征,模式识别,算法,python,人工智能

 3. 基于熵的可分性判据

 (1)定义:借用的概念来描述各类的可分性

在特征的某个取值下: 如果样本属于各类的后验概率越平均,则该特征越不利于分类;  如果后验概率越集中于某一类,则特征越有利于分类。在信息论中,熵表示不确定性,熵越大不确定性越大

(2)思路:
根据贡献率提取特征,模式识别,算法,python,人工智能

(3)常用的熵度量

①  Shannon熵
根据贡献率提取特征,模式识别,算法,python,人工智能

 ②  平方熵

根据贡献率提取特征,模式识别,算法,python,人工智能
③ 基于熵的可分性判据
根据贡献率提取特征,模式识别,算法,python,人工智能

三、特征选择的最优和次优算法

1.特征选择的最优算法

根据贡献率提取特征,模式识别,算法,python,人工智能

1. 最优算法

最基本的方法就是 穷举法 ,就是穷举所有这些可能,从中选择判据最优的组合
另外一种取得最优解的方法是 分枝定界法

2. 分枝定界法(branch and bound)

 自顶向下:从包含所有候选特征开始,逐步去掉不被选中的特征

•  回溯:考虑到所有可能的组合

 基本思想:从左到右建树 → 从右到左搜索 → 回溯避免不必要计算 → 找到最优解

 计算量:在d大约为D的一半时,分枝定界法比穷举法节省的计算量最大

 算法要点:根节点为全体特征,每个结点上舍弃一个特征,各个叶结点代表选择的各种组合 等

根据贡献率提取特征,模式识别,算法,python,人工智能根据贡献率提取特征,模式识别,算法,python,人工智能

2.特征选择的次优算法

 1. 单独最优特征的组合

•  计算各特征单独使用时的判据值并加以排队,取前d 个作为选择结果。

•   这一结果 与所采用的特征选择的准则函数有关 ,只有当所采用的判据是每个特征上的判据之和或
之积时,这种做法选择出的才是最优的特征

2. 顺序前进法

最简单的“ 自下而上 ”的搜索方法
每次从未入选的特征中选择一个特征,使得它与已入选的特征组合在一起时所得判据J值为最大,直到特征数增加到d 为止.

 3. 顺序后退法

是一种“自上而下”的方法。
从全体特征开始每次剔除一个,所剔除的特征应使仍然保留的特征组的判据J值最大,直到特征数减少到d 为止

4. 增l减r法(l-r法)

在第k步可先用顺序前进法一个个加入特征到 k+l 个, 然后再用顺序后退法一个个剔去 r 个特征,我们把这样一种 算法叫增 l 减 r 法(l–r 法)

四、特征提取之PCA算法

1.问题的提出

根据贡献率提取特征,模式识别,算法,python,人工智能

2.主成分分析PCA

主成分分析PCA 是一种常用的基于变量协方差矩阵对信息进行处理、压缩和抽提的有效方法。

出发点是从一组特征中计算出一组按重要性从大到小排列的新特征,它们是原有特征的线性组合,并且相互之间是不相关的。

主成分分析的目的:压缩变量个数,用较少的变量去解释原始数据中的大部分变量,剔除冗余信息

一般来说,我们希望能用 一个或少数几个综合指标 (分 数)来代替原来分数表做统计分析,而且希望新的综合指标 能够尽可能地保留原有信息,并 具有最大的方差。

3.主成分分析的方法

是通过适当的变换把D个特征转换为d个新特征
这里的特征提取专指从一组已有的特征通过一定的数学运算得到一组新特征,有时也把这种特征提取称为特征变换
根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

1. 计算第一主成分

ξ1称作第一主成分,它在原始特征的所有线性组合里是方差最大的

根据贡献率提取特征,模式识别,算法,python,人工智能

用求拉格朗日函数的极值的方法来求解新特征的系数

根据贡献率提取特征,模式识别,算法,python,人工智能

 2. 计算第二主成分

要求:方差最大,模为1,还必须与第一主成分不相关
a2是∑的第二大本征值对应的本征向量,ξ2被称作第二主成分。

根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

 3.计算主成分的贡献率(主成分数量的确定方法)

根据贡献率提取特征,模式识别,算法,python,人工智能
可以事先确定希望新特征所能代表的数据总方差的比例
例如,80%或90%,根据上面的式子来试算出合适的k值。

4. 主成分分析的理解

通过构造原特征的适当的线性组合,以产生一系列互不相关的新特征,从中选出少数几个新特征并使它们含有尽可能多的原特征带有的信息,从而使得用这几个新特征代替原特征分析问题和解决问题成为可能。
根据贡献率提取特征,模式识别,算法,python,人工智能根据贡献率提取特征,模式识别,算法,python,人工智能

 5. 三维主成分分析示意图

根据贡献率提取特征,模式识别,算法,python,人工智能

6. 总结主成分分析的步骤

根据贡献率提取特征,模式识别,算法,python,人工智能

 7. 主成分分析方法应用举例

根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

主成分的特点:
1)主成分是原变量的线性组合
2)各个主成分之间互不相关
3)主成分按照方差从大到小依次排列,第一主成分对应最大的方差(特征值);
4)每个主成分的均值为0、其方差为协方差阵对应的特征值
5)不同的主成分轴(载荷轴)之间相互正交

特征提取之K-L变换

K--L变换

1. K-L展开式

根据贡献率提取特征,模式识别,算法,python,人工智能

2. 均方误差

 根据贡献率提取特征,模式识别,算法,python,人工智能

根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

 3. K-L变换与产生矩阵

根据贡献率提取特征,模式识别,算法,python,人工智能

 4. K-L变换进行特征提取的步骤

 根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

 5. 例题

两个模式类的样本分别为

根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

6.  K-L变换与主成分分析法的对比

根据贡献率提取特征,模式识别,算法,python,人工智能

7.K-L变换用于监督模式识别的方法 --从类均值中提取判别信息

根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

应用举例

根据贡献率提取特征,模式识别,算法,python,人工智能

根据贡献率提取特征,模式识别,算法,python,人工智能

根据贡献率提取特征,模式识别,算法,python,人工智能

 根据贡献率提取特征,模式识别,算法,python,人工智能

总结

根据贡献率提取特征,模式识别,算法,python,人工智能文章来源地址https://www.toymoban.com/news/detail-777710.html

到了这里,关于模式识别 第7、8章 特征的选择和提取的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【语音识别入门】特征提取(Python完整代码)

    1.1数字信号处理基础 在科学和工程中遇到的大多数信号都是连续模拟信号,例如电压随着时间变化,一天中温度的变化等等,而计算机智能处理离散的信号,因此必须对这些连续的模拟信号进行转化。通过 采样–量化 来转换成数字信号。 以 正弦波 为例: x ( t ) = s i n ( 2 Π

    2024年01月17日
    浏览(41)
  • 语音识别 — 特征提取 MFCC 和 PLP

            语音识别是一种技术,通过计算机和软件系统,将人们的口头语言转换为计算机可读的文本或命令。它使用语音信号处理算法来识别和理解人类语言,并将其转换为计算机可处理的格式。语音识别技术被广泛应用于许多领域,如语音助手、语音控制、语音翻译、语

    2024年02月15日
    浏览(43)
  • OpenCV 入门教程:人脸识别和特征提取

    人脸识别是计算机视觉中的热门研究领域,通过对人脸图像或视频进行分析和比对,实现对个体身份的自动识别。人脸特征提取是人脸识别中的重要步骤,它用于从人脸图像中

    2024年02月13日
    浏览(92)
  • 【RT-DETR有效改进】利用EMAttention加深网络深度提高模型特征提取能力(特征选择模块)

    本文给大家带来的改进机制是 EMAttention注意力机制 ,它的 核心思想是 ,重塑部分通道到批次维度,并将通道维度分组为多个子特征,以保留每个通道的信息并减少计算开销。EMA模块通过编码全局信息来重新校准每个并行分支中的通道权重,并通过跨维度交互来捕获像素级别

    2024年02月21日
    浏览(47)
  • 语音识别入门第二节:语音信号处理及特征提取

    目录 数字信号处理基础 基础知识 傅里叶分析 常用特征提取 特征提取流程 Fbank MFCC 模拟信号到数字信号转化(ADC) :在科学和工程中,遇到的大多数信号都是连续的模拟信号,而计算机只能处理离散的信号,因此,必须对这些连续的模拟信号进行转化,通过采样和量化,转

    2024年02月10日
    浏览(45)
  • 矩阵分析与计算机视觉:从特征提取到对象识别

    计算机视觉是人工智能领域的一个重要分支,它涉及到计算机对图像和视频等多媒体数据进行处理和理解的技术。矩阵分析是线性代数的一个重要分支,它涉及到矩阵的运算、分解、求解等方面。在计算机视觉中,矩阵分析起到了关键的支持作用,因为图像和视频数据都可以

    2024年01月19日
    浏览(45)
  • 基于3D卷积的图像序列特征提取与自注意力的车牌识别方法

    【摘  要】 近年来,基于自注意力机制的神经网络在计算机视觉任务中得到广泛的应用。随着智能交通系统的广泛应用,面对复杂多变的交通场景,车牌识别任务的难度不断提高,准确识别的需求更加迫切。因此提出一个基于自注意力的免矫正的车牌识别方法T-LPR。首先对图

    2023年04月09日
    浏览(35)
  • opencv基础57-模板匹配cv2.matchTemplate()->(目标检测、图像识别、特征提取)

    OpenCV 提供了模板匹配(Template Matching)的功能,它允许你在图像中寻找特定模板(小图像)在目标图像中的匹配位置。模板匹配在计算机视觉中用于目标检测、图像识别、特征提取等领域。 以下是 OpenCV 中使用模板匹配的基本步骤: 加载图像 : 首先,加载目标图像和要匹配

    2024年02月13日
    浏览(48)
  • 【前端】深入解析CSS:选择器、显示模式、背景属性和特征剖析

    CSS(层叠样式表)作为前端开发的核心技术之一,为网页赋予了美观和交互性。本文将深入探讨CSS的复合选择器、元素显示模式、背景属性以及其三大特征,帮助读者更好地理解和应用CSS。 后代选择器 又称为 包含选择器 ,可以选择父元素里边子元素,其写法就是把外层标签

    2024年02月11日
    浏览(41)
  • 量化特征贡献度函数:feature_importances_函数/LGBMClassifier/XGBClassifier

    feature_importances_是scikit-learn机器学习库中许多模型对象的属性,在训练模型之后调用该属性可以输出各个特征在模型中的重要性。 示例代码: 在上述代码中,我们训练了一个随机森林回归模型,并使用feature_importances_输出了各个特征的重要性。输出结果为:[0.08519548, 0.397990

    2024年02月11日
    浏览(33)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包