pytorch笔记：RNN 系列

9月前作者：_森罗万象分类：Toy博客阅读(53) 违法举报

这篇具有很好参考价值的文章主要介绍了pytorch笔记：RNN 系列。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

来自B站视频，API查阅，TORCH.NN

RNN可以处理变长序列，是因为其每个时刻的参数是共享的
RNN每算出一个时刻都可以输出，适合流式输出，但串行计算比较慢，无法获取太长的历史信息
RNN 初始隐状态不提供默认是0，输出包括两部分：所有时刻的输出 (batch_size,seq_len,out_hidden_size*num_direction) 和最后一个时刻的隐状态 (num_layers*num_direction,batch_size,out_hidden_size)。竖向的是第一个元素，横向的是最后一个元素。即实际上第一个输出的最后一个元素就是第二个元素（冗余的）

这里的RNN没有提供 $O_t=H_tW_{hq}+b_q$ ，输出只是 $H_t$

LSTM 中指定 proj_size 后是 LSTM 的一个变体，hidden_size 会经过 $W_{hr}$ 压缩成 proj_size，减少了模型参数添加链接描述
LSTM 的输入比 RNN 多了 C，如果不提供默认C 和 H 都是全0，输入的时候如果是多层或者双向，h的第一个维度不是1，需要1的话可以h.unsqueeze(0)

pytorch笔记：RNN 系列文章来源地址https://www.toymoban.com/news/detail-501456.html

$F_t,I_t,O_t$ 都是直接通过 $X_t,H_{t-1}$ 得到，激活函数是 $\sigma$ ， $\tilde C_t$ 也是 $X_t,H_{t-1}$ 得到，激活函数是 $t anh$ ，计算的时候可以四个 W concat 起来做矩阵乘法然后需要的时候用切片截取，计算并行性好
$C_t=F_t\odot C_{t-1}+I\odot \tilde C_t$ ， $H_t=O_t\odot tanh(C_t)$
GRU 的参数和计算量只是 LSTM 的 3/4
$R_t,Z_t$ 都是直接通过 $X_t,H_{t-1}$ 得到
$\tilde H_t=tanh(X_tW_{xh}+(R_t\odot H_{t-1})W_{hh}+b_h)$
$H_t=Z_t\odot H_{t-1}+(1-Z_t)\odot \tilde H_t$

到了这里，关于pytorch笔记：RNN 系列的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Pytorch：torch.nn.Module

torch.nn.Module 是 PyTorch 中神经网络模型的基类，它提供了模型定义、参数管理和其他相关功能。以下是关于 torch.nn.Module 的详细说明： 1. torch.nn.Module 的定义： torch.nn.Module 是 PyTorch 中所有神经网络模型的基类，它提供了模型定义和许多实用方法。自定义的神经网络模型应该继

2024年01月16日
浏览(48)
【Pytorch】torch.nn.LeakyReLU()

Hello！非常感谢您阅读海轰的文章，倘若文中有错误的地方，欢迎您指出～ ଘ(੭ˊᵕˋ)੭ 昵称：海轰标签：程序猿｜C++选手｜学生简介：因C语言结识编程，随后转入计算机专业，获得过国家奖学金，有幸在竞赛中拿过一些国奖、省奖…已保研学习经验：扎实基础 + 多做

2024年02月02日
浏览(37)
Pytorch-----torch.nn.Module.modules()

在使用pytorch构建神经网络时，定义的网络模型必须要继承自torch.nn.Module这一父类。在Module类中，有一个函数可以返回网络中所有模块的迭代器。这就是torch.nn.Module.modules() 提示：以下是本篇文章正文内容，下面案例可供参考源码中的解释如下：不只是返回网络中的某一层，

2024年02月14日
浏览(48)
PyTorch中的torch.nn.Parameter() 详解

今天来聊一下PyTorch中的torch.nn.Parameter()这个函数，笔者第一次见的时候也是大概能理解函数的用途，但是具体实现原理细节也是云里雾里，在参考了几篇博文，做过几个实验之后算是清晰了，本文在记录的同时希望给后来人一个参考，欢迎留言讨论。先看其名，parameter，中文

2023年04月08日
浏览(93)
深度学习之pytorch 中 torch.nn介绍

pytorch 中必用的包就是 torch.nn，torch.nn 中按照功能分，主要如下有几类： 1. Layers（层）：包括全连接层、卷积层、池化层等。 2. Activation Functions（激活函数）：包括ReLU、Sigmoid、Tanh等。 3. Loss Functions（损失函数）：包括交叉熵损失、均方误差等。 4. Optimizers（优化器）：包括

2024年02月22日
浏览(45)
PyTorch中的torch.nn.Linear函数解析

torch.nn是包含了构筑神经网络结构基本元素的包，在这个包中，可以找到任意的神经网络层。这些神经网络层都是nn.Module这个大类的子类。torch.nn.Linear就是神经网络中的线性层，可以实现形如y=Xweight^T+b的加和功能。 nn.Linear()：用于设置网络中的全连接层，需要注意的是全连接

2024年02月16日
浏览(40)
Pytorch：torch.nn.Module.apply用法详解

torch.nn.Module.apply 是 PyTorch 中用于递归地应用函数到模型的所有子模块的方法。它允许对模型中的每个子模块进行操作，比如初始化权重、改变参数类型等。以下是关于 torch.nn.Module.apply 的示例： 1. 语法 Module：PyTorch 中的神经网络模块，例如 torch.nn.Module 的子类。 fn：要应用到

2024年01月15日
浏览(51)
深入浅出Pytorch函数——torch.nn.Linear

分类目录：《深入浅出Pytorch函数》总目录对输入数据做线性变换 y = x A T + b y=xA^T+b y = x A T + b 语法参数 in_features ：[ int ] 每个输入样本的大小 out_features ：[ int ] 每个输出样本的大小 bias ：[ bool ] 若设置为 False ，则该层不会学习偏置项目，默认值为 True 变量形状输入变量：

2024年02月12日
浏览(46)
深入浅出Pytorch函数——torch.nn.Softmax

分类目录：《深入浅出Pytorch函数》总目录相关文章： · 机器学习中的数学——激活函数：Softmax函数 · 深入浅出Pytorch函数——torch.softmax/torch.nn.functional.softmax · 深入浅出Pytorch函数——torch.nn.Softmax 将Softmax函数应用于 n n n 维输入张量，重新缩放它们，使得 n n n 维输出张量的

2024年02月15日
浏览(57)
深入浅出Pytorch函数——torch.nn.Module

分类目录：《深入浅出Pytorch函数》总目录 Pytorch中所有网络的基类，我们的模型也应该继承这个类。 Modules 也可以包含其它 Modules ,允许使用树结构嵌入他们，我们还可以将子模块赋值给模型属性。语法方法 torch.nn.Module.apply 实例通过上面方式赋值的 submodule 会被注册，当调

2024年02月12日
浏览(68)