什么是归一化,它与标准化的区别是什么?

这篇具有很好参考价值的文章主要介绍了什么是归一化,它与标准化的区别是什么?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 综述

本文主要讲述的是标准化与归一化之间的区别、相同点和联系,以及各自的应用场景

归一化:主要应用与没有距离计算的地方(丢失分布与距离,保留权值信息)— 奇异数据,小数据场景

标准化:主要应用于不关乎权重的地方(保留分布与距离,丢失权值信息)—-需要距离来度量相似性,有异常值和噪声

2. 不同点

什么是归一化,它与标准化的区别是什么?

标准差权重:

标准差越大,权重应当越大

某个指标数据对应的数据集标准差过大,说明其不确定性增加,所提供的信息量也会增加,因此在进行综合指标评价的时候,权重也会对应的增大.—-类似熵权法

3. 相同点及其联系

(1)联系:

归一化广义上是包含标准化的,Z-Score方法也是归一化的方法之一,在这里主要是从狭义上,区分两者

(2)本质上都是进行特征提取,数据都通过先平移(分子相减)后缩放(分母)进行进行提取;

(3)都是为了缩小范围.便于后续的数据处理.

(4) 作用:(重点)

i) 加快梯度下降,损失函数收敛;—速度上

ii) 提升模型精度–也就是分类准确率.(消除不同量纲,便于综合指标评价,提高分类准确率)—质量上

iii) 防止梯度爆炸(消除因为数据输入差距(1和2000)过大,而带来的输出差距过大(0.8,999),进而在 反向传播的过程当中,导致梯度过大(因为反向传播的过程当中进行梯度计算,会使用的之前对应层的输入x),从而形成梯度爆炸)—稳定性上

说明:特征缩放其实并不需要太精确,其目的只是为了让梯度下降能够运行得更快一点,让梯度下降收敛所需的循环次数更少一些而已。

4 归一化(广义)(缩放数据)场景

A. 除非本来各维数据的分布范围就比较接近,否则必须进行标准化,以免模型参数被分布范围较大 或较小的数据支配

B. 数据分布差异比较大–标准化,奇异数据(单个有影响的也要)–归一化

4.1. 特征/数据需要归一化的场景

logistic regression模型:逻辑回归,虽然迭代若几次没有影响,但实际当中远不止若干次,这样就会导致逻辑回归模型的目标函数过于扁化,导致梯度很难下降,不容易得到较好的模型参数.

SVM模型:因为涉及到向量/数据的距离(向量之间差异过大/过小,就会导致最佳分离超平面可能会由最大/远或者最小/近的几个向量支配,导致鲁棒性较差,因此需要进行标准化—可以保留向量间的模型)

NeuralNetwork模型:初始输入值过大,反向传播时容易梯度爆炸(上面有解释)

SGD:加快梯度下降.

4.2. 不需要归一化的场景

1 0/1取值的特征通常不需要归一化,归一化会破坏它的稀疏性

2 决策树

3 基于平方损失的最小二乘法OLS不需要归一化(因为本质上是一个抛物线,强凸函数,下降速度快.)

5. 归一化(狭义)注意事项

5.1 归一化的方法

5.1.1 小数定标标准化

这种方法通过移动数据的小数点位置来进行标准化。小数点移动多少位取决于属性A的取值中的最大绝对值。将属性A的原始值x使用decimal scaling标准化到x’的计算方法是:

x'=x/(10^j),其中,j是满足条件的最小整数。例如 假定A的值由-986到917,A的最大绝对值为986,为使用小数定标标准化,我们用1000(即,j=3)除以每个值,这样,-986被规范化为-0.986。

5.1.2 softmax对数归一化

什么是归一化,它与标准化的区别是什么?

5.1.3 L2归一化

什么是归一化,它与标准化的区别是什么?

5.2 归一化的使用前提

在存在奇异样本数据的情况下,进行训练之前最好进行归一化,如果不存在奇异样本数据,则可以不用归一化

6.标准化的过程

即零-均值标准化

其中 u是样本数据的均值(mean),是样本数据的标准差(std)。

什么是归一化,它与标准化的区别是什么?

上图则是一个散点序列的标准化过程:原图->减去均值(均值为0–>数据以原点为中心)->除以标准差对应到三维图像(以损失函数为例)

什么是归一化,它与标准化的区别是什么?

机器学习的目标无非就是不断优化损失函数,使其值最小。在上图中,J(w,b)就是我们要优化的目标函数,在上图中,我们可以看到,损失函数,未处理之前:梯度的方向就会偏离最小值的方向,走很多弯路,经过标准化处理之后,我们损失函数的曲线也变得比较圆,有利于加快梯度下降,加快找到最佳模型参数.具体如下图:文章来源地址https://www.toymoban.com/news/detail-442118.html

什么是归一化,它与标准化的区别是什么?
什么是归一化,它与标准化的区别是什么?

到了这里,关于什么是归一化,它与标准化的区别是什么?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【机器学习】一文搞懂标准化,归一化,正则化

    对于机器学习中的标准化,归一化和正则化的理解,一直都比较模糊,而且在许多技术书籍中,对于它们的使用基本都是一笔带过,不理解概念的话,就不知具体对数据做了哪些操作。因此,在这里专门对这几个概念做学习与总结。 学习之前,先抛出几个问题: 这几个概念

    2024年02月03日
    浏览(50)
  • 【机器学习】数据预处理 - 归一化和标准化

    「作者主页」: 士别三日wyx 「作者简介」: CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」: 对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 处理数据之前,通常会使用一些转换函数将 「特征数据」 转换成更适合 「

    2024年02月15日
    浏览(55)
  • matlab中矩阵的归一化和标准化处理

    1、归一化:将数据映射到0-1的区间中。 matlab中矩阵的归一化处理: X=(value-value_min) / (value_max-value_min) 函数:mapminmax(A,M),A—需要处理的矩阵,M—需要映射到的范围,M通默认为[-1,1],也可设置为常用的0和1之间。 结果: 2、标准化:将数据映射到方差为1,均值为0的数据。

    2024年04月13日
    浏览(38)
  • 深入理解机器学习——数据预处理:归一化 (Normalization)与标准化 (Standardization)

    分类目录:《深入理解机器学习》总目录 归一化 (Normalization)和标准化 (Standardization)都是特征缩放的方法。特征缩放是机器学习预处理数据中最重要的步骤之一,可以加快梯度下降,也可以消除不同量纲之间的差异并提升模型精度。 归一化(Normalization)是将一组数据变

    2024年02月08日
    浏览(45)
  • 归一化 (Normalization)、标准化 (Standardization)和中心/零均值化 (Zero-centered)

    目录 一、概念 1、归一化(Normalization):  2、标准化(Standardization): 3、中心化/零均值化(zero-centered): 二、联系和差异: 三、标准化和归一化的多种方式 三、为什么要归一化/标准化? 3.1、数据的量纲不同;数量级差别很大 3.2、避免数值问题:太大的数会引发数值问

    2024年02月04日
    浏览(35)
  • 蛋白质组学两个定量方法(iBAQ和LFQ)的区别及常见的标准化方法

    首先,在使用Maxquant软件进行查库的时候,有两个参数值得大家关注:LFQ和iBAQ。 当我们在进行搜库时,如果两个参数都选择,将会在结果文件中有三个定量结果:Intensity,IBAQ和LFQ。 接下来,我们来详细解释一下这三个定量结果的区别: Intensity:将Protein Group中的所有Unique和

    2024年02月04日
    浏览(45)
  • 标准化拉普拉斯矩阵特征值范围为什么小于等于2?(证明)

    谱图使用标准化拉普拉斯矩阵 L n o r m L^{norm} L n or m 的一个重要原因就是, L n o r m L^{norm} L n or m 比拉普拉斯矩阵 L L L 稳定。很多资料只是简单地介绍了 L n o r m L^{norm} L n or m ,在kipfGCN中也只是简单地提到 L n o r m L^{norm} L n or m 的特征值不大于2。本文搜集了相关lecture,并推导

    2024年02月11日
    浏览(66)
  • 标准化体系建设(上):如何建立应用标准化体系和模型?

    今天我专门来讲讲标准化这个工作。可以说这项工作是运维过程中最基础、最重要的,但也是最容易被忽视的一个环节。 我做过多次公开演讲,每次讲到这个环节,通常会有单独的一页PPT,就放四个字,字号加大加粗,重复三遍,这四个字就是“标准先行”,然后演讲过程中

    2024年02月08日
    浏览(45)
  • python实现z-score标准化和0-1标准化

    目录 标准化处理 0-1标准化: z-score标准化: 1、用自带的函数来操作 实现z-score标准化 实现0-1标准化 2、自定义函数实现 实现z-score标准化 实现0-1标准化 对输出结果范围有要求,数据较为稳定的,不存在极端的最大最小值 数据存在异常值和较多的噪音,可以间接通过中心化避

    2024年02月11日
    浏览(44)
  • LA@二次型标准形@标准化问题介绍和合同对角化@二次型可标准化定理

    如果二次型只含有变量的平方项,则称之为 二次型的标准形 或 法式 ,即 f ( y 1 , ⋯   , y n ) f(y_1,cdots,y_n) f ( y 1 ​ , ⋯ , y n ​ ) = ∑ i = 1 n k i y i 2 sum_{i=1}^{n}k_iy_i^2 ∑ i = 1 n ​ k i ​ y i 2 ​ 标准形的矩阵式 f ( y 1 , ⋯   , y n ) = ∑ i n k i y i 2 = ( y 1 , y 2 , ⋯   , y n ) ( k 1 0 ⋯

    2024年02月09日
    浏览(55)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包