RNN：Long Short-term Memory（中）

9月前作者：狂放不羁霸分类：Toy博客阅读(49) 违法举报

这篇具有很好参考价值的文章主要介绍了RNN：Long Short-term Memory（中）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

目录

1 LSTM 的简图

2 LSTM 的整体结构

2.1 结构图

2.2 流程图

3 举个例子

3.1 简单看看

3.2 代入 LSTM

4 Original Network v.s. LSTM

5 细看 LSTM

原视频：李宏毅 2020：Recurrent Neural Network (Part I)

1 LSTM 的简图

LSTM 实际上就是一种特殊的神经元，只是长得比较复杂罢了。可以看出，它就是在 memory 的基础上加了三个门：输入门（Input Gate）、遗忘门（Forget Gate）和输出门（Output Gate），四者关系如下图所示：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

LSTM 三个门的作用：

输入门（Input Gate）：控制 LSTM 是否接收当前的输入
遗忘门（Forget Gate）：控制 LSTM 是否丢掉 memory 中的内容
输出门（Output Gate）：控制 LSTM 是否允许对处理结果进行输出

三个门的开或闭均由信号（signal）控制，这些信号均来自网络的其他部分。

LSTM 的特点是：

四个输入，图中用红线表示，输入均来自网络的其他部分
一个输出，图中用绿线表示，输出也将送往网络的其他部分

如何理解 Long Short-term Memory 这个名称？它的意思就是 Long 的 Short-term 的 Memory，即虽然长但毕竟还是短期的记忆。在 RNN 中，一旦计算出当前时刻隐层的输出，那么 memory 中的内容会立马被冲掉或者说是被替换掉。而在 LSTM 中，有了输入门（Input Gate）和遗忘门（Forget Gate）的控制，memory 中的内容可能不变，也可能只变一部分。因此在一定程度上，LSTM 延长了对某些信息的记忆时间，所以是 Long 的。

2 LSTM 的整体结构

这一节来看 LSTM 具体长啥样。

2.1 结构图

下图就是把 LSTM 中的内容细化了，没有想象的那么复杂：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

图中的黑色虚线指明了输入门（Input Gate）、遗忘门（Forget Gate）和输出门（Output Gate）其实就是激活函数的输出。这里的激活函数用的是 Sigmod，输出的值在 0 到 1 之间，用于表示开门的程度。

门不是想象中的要么开要么闭，而是可以半开半闭。

2.2 流程图

下图使用各种变量符号标注了 LSTM 的处理流程：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

可以看出，LSTM 门控的方式就是 “乘法”（multiply）。乘的数字越接近于 1，输入、记住、或输出的越多；乘的数字越接近于 0，输入、记住、或输出的越少。

遗忘门（Forget Gate）是反着来的，越接近于 1 遗忘的越少，越接近于 0 遗忘的越多。

3 举个例子

李宏毅老师先是直接让我们感受各个门的作用，然后才是代入 LSTM 中进行说明。

3.1 简单看看

下图中，x_1、x_2 和 x_3 是一个输入向量的不同维度，并不是三个输入。这里没有让我们通过激活函数算各个门的值，而是用底部的三句话指明了处理规则：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

三句话的含义：

若 x_2 = 1，则把 x_1 的值送入 memory 中与其内容相加
若 x_2 = -1，则把 memory 中的内容清空，即进行遗忘
若 x_3 = 1，则输出处理结果，否则不输出

根据这三条规则，我们便画出了上图。

3.2 代入 LSTM

假设这是我们训练好的 LSTM，黑色箭头上的数字表示这条线权重：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

我们可以先来看看。对于左上角的那组权重，如果 x_3 较大，那么经 Sigmoid 处理的结果就会接近于 1，表示输出门（Output Gate）打开。反之，如果 x_3 较小，那么经 Sigmoid 处理的结果就会接近于 0，表示输出门（Output Gate）关闭。

由于画图过于痛苦，所以这里只演示一组处理过程：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

为了简化例子，李宏毅老师还是假设除 Sigmoid 以外的激活函数均为线性函数，并且权重均为 1 。

4 Original Network v.s. LSTM

或许我们会认为 LSTM 这么复杂，看起来和 FFN 没有什么关系啊？事实上，LSTM 只是把 FFN 中的神经元替换为了 LSTM 单元罢了，并且 LSTM 单元也就是个特殊的神经元。

在 FFN 中，一个神经元只要求 x_1 和 x_2 输入一次。而在 LSTM 中，一个 LSTM 单元要求 x_1 和 x_2 输入四次：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

同样地，x_1 和 x_2 是一个输入向量的不同维度，而不是两个输入。此外，图中相同颜色的连线，只表示 x_1 和 x_2 使用的是同一组权重，而不代表它们各自乘的权值相同。

5 细看 LSTM

t 时刻的输入 x_t 是一个输入向量，而不是一个维度。x_t 与不同的权值矩阵相乘后得到 z_f、z_i、z、z_o，z_f、z_i、z、z_o 也是一个向量而不是一个维度。最后分别把 z_f、z_i、z、z_o 的各个维度送入到各个 LSTM 单元的不同门处：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

c_{t-1} 也是一个向量而不是一个维度，它是 t-1 时刻所有 memory 内容的集合。

有请神图 1 号登场：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

通过这张图可以看出，从输入 x_t 到输出 y_t 都是用的矩阵运算。即每次处理的对象都是整个矩阵，而不是挨个输入 x_t 的每个维度，再挨个计算。

有请神图 2 号登场：

RNN：Long Short-term Memory（中）,深度学习,rnn,深度学习,人工智能

这张图完美诠释了 LSTM 是怎么将不同时刻的输入关联起来的。

图中的红色虚线是指，在高级的 LSTM 中，memory 的内容 c_t 和隐层输出 h_t 也会被拉来和 x_{t+1} 一起当输入。

写完这篇再也不想画图了（bushi）文章来源地址https://www.toymoban.com/news/detail-807908.html

到了这里，关于RNN：Long Short-term Memory（中）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

[论文阅读笔记20]MotionTrack: Learning Robust Short-term and Long-term Motions for Multi-Object Tracking

论文地址: https://arxiv.org/pdf/2303.10404.pdf 代码: 未开源目前是MOT20的第二名这篇文章着力于解决长时跟踪的问题. 当前大多数方法只能依靠Re-ID特征来进行长时跟踪, 也就是轨迹长期丢失后的再识别. 然而, Re-ID特征并不总是有效的. 尤其是在拥挤和极度遮挡的情况下. 为此, 这篇

2024年02月16日
浏览(48)
【深度学习】RNN学习笔记

将单词序列转换为向量，这里有五个单词，然后对于每一个单词都进行独热编码，编码成一个特定的向量。对于RNN网络，需要一次性读取多个句子，那么涉及到batch_size，这里第二个表达就是：batch,单词，单词的表达方式这里生成一个5 x 100的向量，对于每一个单词我们都

2024年02月15日
浏览(42)
人工智能：CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的知识梳理

卷积神经网络（CNN），也被称为ConvNets或Convolutional Neural Networks，是一种深度学习神经网络架构，主要用于处理和分析具有网格状结构的数据，特别是图像和视频数据。CNN 在计算机视觉任务中表现出色，因为它们能够有效地捕获和识别图像中的特征，具有平移不变性（transla

2024年02月05日
浏览(62)
深度学习--RNN基础

RNN（Recurrent Neutral Network，循环神经网络），主要应用于自然语言处理NLP。因为Pytorch中没有String类型数据，需要引入序列表示法(sequence representation)对文本进行表示。表示方法：[seq_len:一句话的单词数,feature_len：每个单词的表示方法] 文本信息的表达方式： one-hot：多少个

2023年04月25日
浏览(31)
深度学习——RNN解决回归问题

2024年02月16日
浏览(38)
机器学习&&深度学习——循环神经网络RNN

👨‍🎓作者简介：一位即将上大四，正专攻机器学习的保研er 🌌上期文章：机器学习深度学习—语言模型和数据集 📚订阅专栏：机器学习深度学习希望文章对你们有所帮助在之前介绍了n元语法模型，其中单词xt在时间步t的概率仅取决于前n-1个单词。对于时间步t-(n-1)之前

2024年02月13日
浏览(50)
深度学习05-RNN循环神经网络

循环神经网络（Recurrent Neural Network，RNN）是一种具有循环连接的神经网络结构，被广泛应用于自然语言处理、语音识别、时序数据分析等任务中。相较于传统神经网络，RNN的主要特点在于它可以处理序列数据，能够捕捉到序列中的时序信息。 RNN的基本单元是一个循环单元（

2024年02月12日
浏览(44)
深度学习（2）---循环神经网络(RNN)

1. 在深度学习中，序列数据（Sequence data）是指具有前后顺序关联的数据。常见的时间序列数据、文本数据（单词序列或字符序列）、语音数据等。这种数据不仅十分常见，而且往往具有很高的应用价值，比如我们可以通过过去的天气数据来预测未来的天气状况，通过以往

2024年02月07日
浏览(46)
机器学习&&深度学习——NLP实战（情感分析模型——RNN实现）

👨‍🎓作者简介：一位即将上大四，正专攻机器学习的保研er 🌌上期文章：机器学习深度学习——NLP实战（情感分析模型——数据集） 📚订阅专栏：机器学习深度学习希望文章对你们有所帮助与词相似度和类比任务一样，我们也可以将预先训练的词向量应用于情感分析。

2024年02月11日
浏览(34)
机器学习&&深度学习——RNN的从零开始实现与简洁实现

👨‍🎓作者简介：一位即将上大四，正专攻机器学习的保研er 🌌上期文章：机器学习深度学习——循环神经网络RNN 📚订阅专栏：机器学习深度学习希望文章对你们有所帮助我们将在之前所说的《时光机器》数据集上训练，先读取数据集：回想一下，在train_iter中，每个词

2024年02月13日
浏览(43)