PyTorch 简单易懂的 Embedding 和 EmbeddingBag - 解析与实践

这篇具有很好参考价值的文章主要介绍了PyTorch 简单易懂的 Embedding 和 EmbeddingBag - 解析与实践。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

torch.nn子模块Sparse Layers详解

nn.Embedding

用途

主要参数

注意事项

使用示例

从预训练权重创建嵌入

nn.EmbeddingBag

功能和用途

主要参数

使用示例

从预训练权重创建

总结


torch.nn子模块Sparse Layers详解

nn.Embedding

torch.nn.Embedding 是 PyTorch 中一个重要的模块,用于创建一个简单的查找表,它存储固定字典和大小的嵌入(embeddings)。这个模块通常用于存储单词嵌入并使用索引检索它们。接下来,我将详细解释 Embedding 模块的用途、用法、特点以及如何使用它。

用途

  • 单词嵌入:在自然语言处理中,Embedding 模块用于将单词(或其他类型的标记)映射到一个高维空间,其中相似的单词在嵌入空间中彼此靠近。
  • 特征表示:在非自然语言处理任务中,嵌入可以用于任何类型的分类特征的密集表示。

主要参数

  • num_embeddings(int):嵌入字典的大小。
  • embedding_dim(int):每个嵌入向量的大小。
  • padding_idx(int,可选):如果指定,padding_idx 处的嵌入不会在训练中更新。
  • max_norm(float,可选):如果指定,将重新归一化超过此范数的嵌入向量。
  • norm_type(float,可选):用于max_norm选项的p-范数的p值,默认为2。
  • scale_grad_by_freq(bool,可选):如果为True,将按单词在批次中的频率的倒数来缩放梯度。
  • sparse(bool,可选):如果为True,权重矩阵的梯度将是一个稀疏张量。

注意事项

  • 当使用max_norm参数时,Embedding的前向方法会就地修改权重张量。如果需要对Embedding.weight进行梯度计算,则在调用前向方法前,需要在max_norm不为None时克隆它。
  • 仅有少数优化器支持稀疏梯度。

使用示例

import torch
import torch.nn as nn

# 创建一个包含10个大小为3的嵌入的Embedding模块
embedding = nn.Embedding(10, 3)

# 一个包含4个索引的2个样本的批次
input = torch.LongTensor([[1, 2, 4, 5], [4, 3, 2, 9]])

# 通过Embedding模块获取嵌入
output = embedding(input)

此示例创建了一个嵌入字典大小为10、每个嵌入维度为3的 Embedding 模块。然后它接受一个包含索引的输入张量,并返回对应的嵌入向量。

从预训练权重创建嵌入

还可以使用from_pretrained类方法从预先训练的权重创建Embedding实例:

# 预训练的权重
weight = torch.FloatTensor([[1, 2.3, 3], [4, 5.1, 6.3]])

# 从预训练权重创建Embedding
embedding = nn.Embedding.from_pretrained(weight)

# 获取索引1的嵌入
input = torch.LongTensor([1])
output = embedding(input)

在这个示例中,Embedding 模块是从一个给定的预训练权重张量创建的。这种方法在迁移学习或使用预先训练好的嵌入时非常有用。

nn.EmbeddingBag

torch.nn.EmbeddingBag 是 PyTorch 中一个高效的模块,用于计算“bags”(即序列或集合)的嵌入的总和或平均值,而无需实例化中间的嵌入。这个模块特别适用于处理具有不同长度的序列,如在自然语言处理任务中处理不同长度的句子或文档。下面我将详细介绍 EmbeddingBag 的功能、用法以及特点。

功能和用途

  • 高效计算EmbeddingBag 直接计算整个包的总和或平均值,比逐个嵌入后再求和或取平均更加高效。
  • 支持不同聚合方式:可以选择 "sum", "mean" 或 "max" 模式来聚合每个包中的嵌入。
  • 支持加权聚合EmbeddingBag 还支持为每个样本指定权重,在 "sum" 模式下进行加权求和。

主要参数

  • num_embeddings(int):嵌入字典的大小。
  • embedding_dim(int):每个嵌入向量的大小。
  • max_norm(float,可选):如果给定,将重新规范化超过此范数的嵌入向量。
  • mode(str,可选):聚合模式,可以是 "sum"、"mean" 或 "max"。
  • sparse(bool,可选):如果为True,权重矩阵的梯度将是一个稀疏张量。
  • padding_idx(int,可选):如果指定,padding_idx 处的嵌入将不会在训练中更新。

使用示例

import torch
import torch.nn as nn

# 创建一个包含10个大小为3的嵌入的EmbeddingBag模块
embedding_bag = nn.EmbeddingBag(10, 3, mode='mean')

# 一个示例包含4个索引的输入
input = torch.tensor([1, 2, 4, 5, 4, 3, 2, 9], dtype=torch.long)

# 指定每个包的开始索引
offsets = torch.tensor([0, 4], dtype=torch.long)

# 通过EmbeddingBag模块获取嵌入
output = embedding_bag(input, offsets)

在这个示例中,创建了一个嵌入字典大小为10、每个嵌入维度为3的 EmbeddingBag 模块,并设置为 "mean" 模式。输入是一个索引序列,offsets 指定了每个包的开始位置。EmbeddingBag 会计算每个包的平均嵌入向量。

从预训练权重创建

EmbeddingBag 也可以从预训练的权重创建:

# 预训练的权重
weight = torch.FloatTensor([[1, 2.3, 3], [4, 5.1, 6.3]])

# 从预训练权重创建EmbeddingBag
embedding_bag = nn.EmbeddingBag.from_pretrained(weight)

# 获取索引1的嵌入
input = torch.LongTensor([[1, 0]])
output = embedding_bag(input)

 这种方法在需要使用预先训练好的嵌入或在迁移学习中非常有用。EmbeddingBag 通过高效地处理不同长度的序列数据,在自然语言处理等领域中发挥着重要作用。

总结

 本篇博客探讨了 PyTorch 中的 nn.Embeddingnn.EmbeddingBag 两个关键模块,它们是处理和表示离散数据特征的强大工具。nn.Embedding 提供了一种有效的方式来将单词或其他类型的标记映射到高维空间中,而 nn.EmbeddingBag 以其独特的方式处理变长序列,通过聚合嵌入来提高计算效率。这两个模块不仅在自然语言处理中发挥关键作用,也适用于其他需要稠密特征表示的任务。此外,这些模块支持从预训练权重初始化,使其在迁移学习和复杂模型训练中极为重要。综上所述,nn.Embeddingnn.EmbeddingBag 是理解和应用 PyTorch 中嵌入层的基础。文章来源地址https://www.toymoban.com/news/detail-824167.html

到了这里,关于PyTorch 简单易懂的 Embedding 和 EmbeddingBag - 解析与实践的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Pytorch常用的函数(二)pytorch中nn.Embedding原理及使用

    图像数据表达不需要特殊的编码,并且有天生的顺序性和关联性,近似的数字会被认为是近似的特征。 正如图像是由像素组成,语言是由词或字组成,可以把语言转换为词或字表示的集合。 然而,不同于像素的大小天生具有色彩信息,词的数值大小很难表征词的含义。最初

    2024年02月09日
    浏览(30)
  • PyTorch简单理解ChannelShuffle与数据并行技术解析

    目录 torch.nn子模块详解 nn.ChannelShuffle 用法与用途 使用技巧 注意事项 参数 示例代码 nn.DataParallel 用法与用途 使用技巧 注意事项 参数 示例 nn.parallel.DistributedDataParallel 用法与用途 使用技巧 注意事项 参数 示例 总结 torch.nn.ChannelShuffle 是 PyTorch 深度学习框架中的一个子模块,它

    2024年01月25日
    浏览(27)
  • 深入理解PyTorch中的nn.Embedding

    太长不看版: NLP任务所依赖的语言数据称为语料库。 详细介绍版: 语料库(Corpus,复数是Corpora)是组织成数据集的真实文本或音频的集合。 此处的真实是指由该语言的母语者制作的文本或音频。 语料库可以由从报纸、小说、食谱、广播到电视节目、电影和推文的所有内容

    2024年02月09日
    浏览(43)
  • pytorch复习笔记--nn.Embedding()的用法

    目录 1--nn.Embedding()的用法 2--实例展示: 3--注意的问题 nn.Embedding()产生一个权重矩阵weight,其shape为(num_embeddings, embedding_dim),表示生成num_embeddings个具有embedding_dim大小的嵌入向量; 输入input的形状shape为(batch_size, Seq_len),batch_size表示样本数(NLP句子数),Seq_len表示序列

    2024年02月16日
    浏览(24)
  • 【Pytorch:nn.Embedding】简介以及使用方法:用于生成固定数量的具有指定维度的嵌入向量embedding vector

    首先我们讲解一下关于嵌入向量embedding vector的概念 1) 在自然语言处理NLP领域,是将单词、短语或其他文本单位映射到一个固定长度的实数向量空间中 。嵌入向量具有较低的维度,通常在几十到几百维之间,且每个维度都包含一定程度上的语义信息。这意味着在嵌入向量空

    2024年02月12日
    浏览(21)
  • pytorch nn.Embedding 读取gensim训练好的词/字向量(有例子)

      *也许看了上面你依然会一脸懵(别着急,下面给你举个例子)

    2024年02月07日
    浏览(28)
  • Pytorch transformers tokenizer 分词器词汇表添加新的词语和embedding

    在NLP领域,基于公开语料的预训练模型,在专业领域迁移时,会遇到专业领域词汇不在词汇表的问题,本文介绍如何添加专有名词到预训练模型。 例如,在bert预训练模型中,并不包含财经词汇,比如‘市盈率’等财务指标词汇,本文将介绍: 如何把专业名词添加到词汇表中

    2024年02月13日
    浏览(31)
  • PyTorch深度学习快速入门教程(绝对通俗易懂!!!)

    1.官网下载最新版Anaconda,完成后打开Anaconda Prompt,显示(base)即安装成功 2. conda create -n pytorch python=3.6 建立一个命名为pytorch的环境,且环境python版本为3.6 3. conda activate pytorch 激活并进入pytorch这个环境;linux:source activate pytorch 4. pip list 来查看环境内安装了哪些包,可以发现并

    2024年02月16日
    浏览(31)
  • 通俗易懂解释python和anaconda和pytorch以及pycharm之间的关系

    Python :Python 就像是一门编程语言的工具箱,你可以把它看作是一种通用的编程语言,就像是一把多功能的工具刀。你可以使用 Python 来编写各种类型的程序,就像使用工具刀来制作各种不同的手工艺品一样。 Anaconda :Anaconda 就像是一个装有不同种类工具的大工具箱。这个工

    2024年01月20日
    浏览(54)
  • pytorch深度学习实践

    B站-刘二大人 参考-PyTorch 深度学习实践_错错莫的博客-CSDN博客

    2024年02月10日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包