Dropout原理及作用

这篇具有很好参考价值的文章主要介绍了Dropout原理及作用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        Dropout是作为缓解卷积神经网络CNN过拟合而被提出的一种正则化方法,它确实能够有效缓解过拟合现象的发生,但是Dropout带来的缺点就是可能会减缓模型收敛的速度,因为每次迭代只有一部分参数更新,可能导致梯度下降变慢。

1、 Dropout原理

       Dropout叫做随机失活,简单来说就是在模型训练阶段的前向传播过程中,让某些神经元的激活值以一定的概率停止工作,如下图所示,这样可以使模型的泛化性更强。

Dropout原理及作用

        下面以一个例子来讲解Dropout的具体工作流程:假设要训练如下图所示的神经网络,输入是,输出是。正常的训练流程是首先把输入通过网络进行前向传播,然后把误差反向传播以决定如何更新参数。

Dropout原理及作用

        加入Dropout之后,训练过程变成如下:

(1)首先让所有神经元以一定概率p失活,输入输出的神经元保持不变,如下图所示;

Dropout原理及作用

(2)让输入通过部分神经元失活的新网络(如上图)进行前向传播,然后计算损失并把损失反向传播,一小批样本执行完这个过程后,根据梯度下降算法更新参数(w,b);

(3)不断重复这一过程:

        ①恢复失活的神经元;

        ②重新让所有神经元以一定概率p失活(这次失活的和上次失活的神经元并不一定相同);

        ③让输入通过部分神经元失活的新网络进行前向传播,然后计算损失并把损失反向传播,新的一批样本执行完这个过程后,根据梯度下降算法更新参数(w,b);

        但是Dropout一般只在网络的训练阶段使用,而测试阶段不使用Dropout,也就是说训练时前向传播只使用没有失活的那部分神经元,而测试时使用的是全部的神经元,那么训练和测试阶段就会出现数据尺度不同的问题。所以测试时,所有权重参数都要乘以,以保证训练和测试时尺度变化一致。为了更好的理解这个数据尺度变化的问题,小编举个例子来讲解:假设输入是100个特征,没有使用Dropout之前,隐藏层第一层的第一个神经元的值可以表示为:

不妨取,那么此时。训练阶段使用Dropout时,若失活率,可以理解成只有70个神经元起作用,此时 ;而测试时没有Dropout,使用的是全部神经元,也就是,不难发现使用Dropout后少了,这就是训练阶段和测试阶段数据的尺度不一致。为了保证尺度的一致性,测试时所有权重参数都要乘以,即,这样使用Dropout的训练集和不使用Dropout的测试集的尺度就一致了。所以Dropout在训练和测试时是不一样的,代码实现时要注意这点,即训练前要用train()函数,表示模型进入训练阶段,该阶段Dropout是正常工作的,测试前要用eval()函数,表示模型进入测试阶段,Dropout就会停止工作。

2、 Dropout缓解过拟合现象的原因

        (1)集成学习的作用: 先回到标准的模型即没有Dropout,我们用相同的训练数据去训练5个不同的神经网络,一般会得到5个不同的结果,此时我们可以采用 “5个结果取均值”或者“多数取胜的投票策略”去决定最终结果,这种“综合起来取平均”的策略通常可以有效防止过拟合问题。因为不同的网络可能产生不同的过拟合,取平均则有可能让一些“相反的”拟合互相抵消。Dropout掉不同的隐藏神经元就类似在训练不同的网络,随机删掉部分隐藏神经元导致网络结构已经不同,整个Dropout过程就相当于对很多个不同的神经网络取平均,从这个角度看有点类似于集成学习的特点。

       (2)正则项的作用: 因为Dropout导致两个神经元不一定每次都在一个dropout网络中出现,这样权值的更新不再依赖于有固定关系的隐含节点的共同作用,阻止了某些特征仅仅在其它特定特征下才有效果的情况 ,迫使网络去学习更加鲁棒的特征 ,这些特征在其它的神经元的随机子集中也存在。正因为这样,网络由于不知道浅层的哪些神经元会失活,导致网络不敢赋予浅层神经元太大的权重,这样就减轻了网络对某些局部特征的依赖,换句话说网络不会对一些特定的线索片段太过敏感,即使丢失特定的线索,它也可以从众多其它线索中学习一些共同的特征。从这个角度看Dropout就类似于L1,L2正则,减少权重使得网络对丢失特定神经元连接的鲁棒性提高。文章来源地址https://www.toymoban.com/news/detail-451683.html

到了这里,关于Dropout原理及作用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 卷积原理(卷积,padding填充,步长,多通道卷积)

    卷积可以用于对输入数据进行特征提取,特征提取的过程可以理解为通过卷积对输入特征进行加权运算,提取输入中的重要信息。 卷积运算的过程就是通过卷积核扫描输入矩阵的元素,将卷积核和扫描对应的元素相乘再相加,得到一个输出,通过不断地滑动,得到最后的输出

    2024年02月09日
    浏览(29)
  • 1. 卷积原理

    ① 卷积核不停的在原图上进行滑动,对应元素相乘再相加。 ② 下图为每次滑动移动1格,然后再利用原图与卷积核上的数值进行计算得到缩略图矩阵的数据,如下图右所示。 结果:  效果: 结果 : 效果:

    2024年02月11日
    浏览(16)
  • 29. 深度学习进阶 - 卷积的原理

    Hi,你好。我是茶桁。 在结束了RNN的学习之后,咱们今天开始来介绍一下CNN。 CNN是现代的机器深度学习一个很核心的内容,就假如说咱们做图像分类、图像分割,图像的切分等等。 其实这些过程就是你让计算机能够自动识别,不仅能够识别图像里有什么,还能识别图像里这些

    2024年02月04日
    浏览(24)
  • Type c口和Micro USB作为电源接口,原理图设计

    1、Type C接口目前适用于各种充电器接头,应用十分广泛,在设计一些PCB板时,对于板载供电,可以考虑TYPE C接口方式。 上图即为TYPE C接口原理图,其中设计关键点是要在CC1/CC2上任意选择一个,加入Rd 5.1k电阻,将PCB板设置为SNK,以供外接充电器作为SRC,可以识别到该设备,建

    2024年02月12日
    浏览(31)
  • 家用电脑如何才能作为公网服务器使用?底层原理是什么?

    想要将家用电脑用作公网服务器,需要进行一系列的操作和设置,包括: 1.申请公网IP地址。公网IP地址是唯一标识一个设备在互联网上的地址,需要向网络服务提供商申请。 2.配置路由器。将家用电脑连接到路由器,并在路由器上设置端口映射,将来自公网的请求转发到家用

    2024年02月11日
    浏览(25)
  • 基于GUI的卷积神经网络和长短期神经网络的语音识别系统,卷积神经网的原理,长短期神经网络的原理

    背影 卷积神经网络CNN的原理 卷积神经网络CNN的定义 卷积神经网络CNN的神经元 卷积神经网络CNN的激活函数 卷积神经网络CNN的传递函数 长短期神经网络的原理 基于GUI的卷积神经网络和长短期神经网络的语音识别系统 代码下载链接:基于MATLABGUI编程的卷积神经网络和长短期神

    2024年02月12日
    浏览(20)
  • 卷积神经网络(CNN)详细介绍及其原理详解

      本文总结了关于卷积神经网络(CNN)的一些基础的概念,并且对于其中的细节进行了详细的原理讲解,通过此文可以十分全面的了解卷积神经网络(CNN),非常适合于作为Deep Learning的入门学习。下面就是本篇博客的全部内容!   卷积神经网络(Convolutional Neural Networks, C

    2024年02月08日
    浏览(28)
  • 光耦的原理和作用

    光耦又叫光电耦合器。 这个是四脚光耦的电路符号,12之间是一个发光二极管,34之间是一个光电三极管,光藕就相当于把发光二极管和光电三极管封装在一个密闭的壳体中的器件。 当光耦发光二极管两端没有电压或电压不足使他导通时,发光二极管不会产生光信号,光电三

    2024年02月12日
    浏览(16)
  • SpringBoot Starter 作用及原理

    本文会以 mybatis 为例,通过对比 mybatis-spring 和 mybatis-spring-boot-starter 代码示例,了解 Starter 的作用。并对 mybatis-spring-boot-starter 进行简单剖析,了解 Starter 原理。 下面还有投票,一起参与进来吧👍 有没有在入行后直接基于 SpringBoot 开发项目,没有 spring、servlet 开发经历的,

    2023年04月20日
    浏览(20)
  • 动手学深度学习—卷积神经网络(原理解释+代码详解)

    多层感知机对图像处理是百万维度,模型不可实现。 如果要在图片中找到某个物体,寻找方法应该和物体位置无关。 适合 计算机视觉 的神经网络架构: 平移不变性 :不管检测对象出现在图像中的哪个位置,神经网络前几层应该对相同图像区域有相似的反应。 局部性 :神

    2024年02月14日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包