深度学习5:长短期记忆网络 – Long short-term memory | LSTM

这篇具有很好参考价值的文章主要介绍了深度学习5:长短期记忆网络 – Long short-term memory | LSTM。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

什么是 LSTM?

LSTM的核心思路


什么是 LSTM?

长短期记忆网络——通常被称为 LSTM,是一种特殊的RNN,能够学习长期依赖性。由 Hochreiter 和 Schmidhuber(1997)提出的,并且在接下来的工作中被许多人改进和推广。LSTM 在各种各样的问题上表现非常出色,现在被广泛使用。

LSTM 被明确设计用来避免长期依赖性问题。长时间记住信息实际上是 LSTM 的默认行为,而不是需要努力学习的东西!

所有递归神经网络都具有神经网络的链式重复模块。在标准的 RNN 中,这个重复模块具有非常简单的结构,例如只有单个 tanh 层。

深度学习5:长短期记忆网络 – Long short-term memory | LSTM,2023 AI,深度学习,lstm,人工智能

LSTM 也具有这种类似的链式结构,但重复模块具有不同的结构。不是一个单独的神经网络层,而是四个,并且以非常特殊的方式进行交互。

深度学习5:长短期记忆网络 – Long short-term memory | LSTM,2023 AI,深度学习,lstm,人工智能

 

不要担心细节。稍后我们将逐步浏览 LSTM 的图解。现在,让我们试着去熟悉我们将使用的符号。

深度学习5:长短期记忆网络 – Long short-term memory | LSTM,2023 AI,深度学习,lstm,人工智能

在上面的图中,每行包含一个完整的向量,从一个节点的输出到其他节点的输入。粉色圆圈表示逐点运算,如向量加法;而黄色框表示学习的神经网络层。行合并表示串联,而分支表示其内容正在被复制,并且副本将转到不同的位置。

LSTM的核心思路

LSTM 的关键是细胞状态,即图中上方的水平线。

细胞状态有点像传送带。它贯穿整个链条,只有一些次要的线性交互作用。信息很容易以不变的方式流过。

深度学习5:长短期记忆网络 – Long short-term memory | LSTM,2023 AI,深度学习,lstm,人工智能

LSTM 可以通过所谓“门”的精细结构向细胞状态添加或移除信息。

门可以选择性地以让信息通过。它们由 S 形神经网络层和逐点乘法运算组成。

深度学习5:长短期记忆网络 – Long short-term memory | LSTM,2023 AI,深度学习,lstm,人工智能

S 形网络的输出值介于 0 和 1 之间,表示有多大比例的信息通过。0 值表示“没有信息通过”,1 值表示“所有信息通过”。

一个 LSTM 有三种这样的门用来保持和控制细胞状态。

长短期记忆人工神经网络(Long-Short Term Memory,LSTM)

由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。

LSTM的表现通常比时间递归神经网络及隐马尔科夫模型(HMM)更好,比如用在不分段连续手写识别上。2009年,用LSTM构建的人工神经网络模型赢得过ICDAR手写识别比赛冠军。LSTM还普遍用于自主语音识别,2013年运用TIMIT自然演讲数据库达成17.7%错误率的纪录。作为非线性模型,LSTM可作为复杂的非线性单元用于构造更大型深度神经网络。

长短期记忆(LSTM)单位是递归神经网络(RNN)的单位。由LSTM单元组成的RNN通常称为LSTM网络(或仅称为LSTM)。公共LSTM单元由单元,输入门,输出门和忘记门组成。该单元记住任意时间间隔内的值,并且三个门控制进出单元的信息流。

LSTM网络非常适合基于时间序列数据进行分类,处理和预测,因为在时间序列中的重要事件之间可能存在未知持续时间的滞后。开发LSTM是为了处理在训练传统RNN时可能遇到的爆炸和消失的梯度问题。对于间隙长度的相对不敏感性是LSTM相对于RNN,隐马尔可夫模型和其他序列学习方法在许多应用中的优势。文章来源地址https://www.toymoban.com/news/detail-675224.html

到了这里,关于深度学习5:长短期记忆网络 – Long short-term memory | LSTM的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 长短期记忆网络(LSTM)原理解析

            长短期记忆网络(Long Short-Term Memory,简称LSTM)是一种常用于处理序列数据的深度学习模型。它在循环神经网络(Recurrent Neural Network,RNN)的基础上进行了改进,旨在解决传统RNN中的梯度消失和梯度爆炸问题,同时能够更好地捕捉长期依赖关系。         LSTM的

    2024年02月13日
    浏览(24)
  • 长短期记忆神经网络关键名词解释

    长短期记忆神经网络(LSTM)是一种特殊的递归神经网络(RNN),它在处理时间序列数据和学习长期依赖关系方面表现出色。以下是一些与LSTM相关的必懂名词及其解释: 递归神经网络(RNN) :RNN是一种用于处理序列数据的神经网络,它通过在网络中添加循环来保持对先前信息

    2024年03月24日
    浏览(30)
  • 回归算法|长短期记忆网络LSTM及其优化实现

    本期文章将介绍LSTM的原理及其优化实现 序列数据有一个特点,即“没有曾经的过去则不存在当前的现状”,这类数据以时间为纽带,将无数个历史事件串联,构成了当前状态,这种时间构筑起来的事件前后依赖关系称其为时间依赖,利用这类依赖关系进行建模是对其进行学

    2024年02月08日
    浏览(28)
  • 【Matlab】LSTM长短期记忆神经网络时序预测算法(附代码)

     资源下载: https://download.csdn.net/download/vvoennvv/88688439  资源合集:https://download.csdn.net/download/vvoennvv/88700669 【Matlab】BP 神经网络时序预测算法 【Matlab】CNN卷积神经网络时序预测算法 【Matlab】ELM极限学习机时序预测算法 【Matlab】基于遗传算法优化BP神经网络 (GA-BP)的数据时序

    2024年02月03日
    浏览(27)
  • 【神经网络】循环神经网络RNN和长短期记忆神经网络LSTM

    欢迎访问Blog总目录! 一文看尽RNN(循环神经网络) - 知乎 (zhihu.com) 一文搞懂RNN(循环神经网络)基础篇 - 知乎 (zhihu.com) 循环神经网络(Recurrent Neural Network, RNN)是一类以 序列 (sequence)数据为输入,在序列的演进方向进行 递归 (recursion)且所有节点(循环单元)按链式连

    2024年04月10日
    浏览(23)
  • 故障诊断模型 | Maltab实现LSTM长短期记忆神经网络故障诊断

    故障诊断模型 | Maltab实现LSTM长短期记忆神经网络故障诊断 长短记忆神经网络——通常称作LSTM,是一种特殊的RNN,能够学习长的依赖关系。 他们由Hochreiter&Schmidhuber引入,并被许多人进行了改进和普及。 LSTM是为了避免长依赖问题而精心设计的。 记住较长的历史信息实际上是

    2024年02月07日
    浏览(36)
  • 故障诊断模型 | Maltab实现BiLSTM双向长短期记忆神经网络故障诊断

    故障诊断模型 | Maltab实现BiLSTM双向长短期记忆神经网络故障诊断 利用各种检查和测试方法,发现系统和设备是否存在故障的过程是故障检测;而进一步确定故障所在大致部位的过程是故障定位。故障检测和故障定位同属网络生存性范畴。要求把故障定位到实施修理时可更换的

    2024年02月07日
    浏览(33)
  • 【Matlab】基于长短期记忆网络的数据分类预测(Excel可直接替换数据)

    “基于长短期记忆网络的数据分类预测”是一种利用长短期记忆网络(Long Short-Term Memory, LSTM)进行数据分类任务的方法。LSTM是一种特殊的循环神经网络(Recurrent Neural Network, RNN),它能够有效地处理序列数据,并且对于长期依赖性问题有很好的表现。在数据分类预测任务中,

    2024年02月15日
    浏览(18)
  • 【Matlab】基于长短期记忆网络的数据回归预测(Excel可直接替换数据)

    “基于长短期记忆网络(Long Short-Term Memory, LSTM)的数据回归预测”是一种利用LSTM神经网络进行数据回归预测的方法。回归预测是指根据过去的数据模式和趋势,预测未来的数值或趋势。LSTM是一种特殊的循环神经网络(Recurrent Neural Network, RNN),专门用于处理具有时间序列结

    2024年02月15日
    浏览(17)
  • 区间预测 | Matlab实现LSTM-Adaboost-ABKDE的集成学习长短期记忆神经网络自适应带宽核密度估计多变量回归区间预测

    效果一览 基本介绍 1.Matlab实现LSTM-Adaboost-ABKDE的集成学习长短期记忆神经网络结合自适应带宽核函数密度估计的多变量回归区间预测(完整源码和数据) 2.LSTM-Adaboost-ABKDE的集成学习长短期记忆神经网络结合自适应带宽核函数密度估计的多变量回归区间预测(点预测+概率预测

    2024年01月17日
    浏览(26)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包