预训练Bert添加new token的问题

10月前作者：hhy不许摸鱼分类：Toy博客阅读(40) 违法举报

这篇具有很好参考价值的文章主要介绍了预训练Bert添加new token的问题。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

问题

最近遇到使用transformers的AutoTokenizer的时候，修改vocab.txt中的[unused1]依然无法识别相应的new token。

实例：
我将[unused1]修改为了[TRI]，句子中的[TRI]并没有被整体识别，而是识别为了[,T,RI,]。这明显是有问题的。

解决

若去掉[TRI]的方括号，问题就消失了。
所以可以认定，Bert对带有方括号的token统一按special token处理，所以要使用

tokenizer.add_special_tokens({})

来添加此类token。文章来源地址https://www.toymoban.com/news/detail-706562.html

到了这里，关于预训练Bert添加new token的问题的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

NLP文本匹配任务Text Matching [有监督训练]：PointWise（单塔）、DSSM（双塔）、Sentence BERT（双塔）项目实践

本项目对3种常用的文本匹配的方法进行实现：PointWise（单塔）、DSSM（双塔）、Sentence BERT（双塔）。文本匹配（Text Matching）是 NLP 下的一个分支，通常用于计算两个句子之间的相似程度，在推荐、推理等场景下都有着重要的作用。举例来讲，今天我们有一堆评论数据，我们

2024年02月12日
浏览(37)
基于Bert+Attention+LSTM智能校园知识图谱问答推荐系统——NLP自然语言处理算法应用(含Python全部工程源码及训练模型)+数据集

这个项目充分利用了Google的Bert模型，这是一种基于Attention的大规模语料预训练模型，以及LSTM命名实体识别网络。项目的目标是设计一套通用的问答系统处理逻辑，以实现智能问答任务。首先，我们采用了Bert模型，这是一种在自然语言处理领域非常强大的预训练模型。它具备

2024年02月09日
浏览(67)
bert模型训练，加载保存的模型Can‘t load tokenizer for ‘/content/drive/MyDrive/Colab Notebooks/classification_mode

哈喽！我用Bert预测评论分数，训练好模型保存到文件夹后，再一次加载它出现了上述错误，不太明白为什么，请教各位！这是第二次训练这模型，也就是说我训练了一次之后，再把第一次训练的模型用新的数据训练，提高它的精确度，是可以的把，为什么第一次训练没有报

2024年02月11日
浏览(48)
[NLP] BERT模型参数量

BERT_base模型的110M的参数具体是如何组成的呢，我们一起来计算一下：刚好也能更深入地了解一下Transformer Encoder模型的架构细节。借助transformers模块查看一下模型的架构：得到的模型参数为：其中，BERT模型的参数主要由三部分组成： Embedding层参数 Transformer Encoder层参数 L

2024年02月11日
浏览(48)
【NLP】BERT和原理揭示

BERT（来自transformer的双向编码器表示）是Google AI Language研究人员最近发表的一篇论文。它通过在各种NL

2024年02月15日
浏览(41)
NLP之Bert实现文本分类

首先，概述一下代码的主要目的和流程。主要目的：此代码的主要目的是使用BERT模型进行序列分类。具体来说，它似乎是在处理某种情感分析任务，因为代码中读取了标签和文本，并试图用BERT模型来进行分类（假设为正面或负面情感，因为 num_labels=2 ）。整体流程：导入

2024年02月05日
浏览(45)
NLP——ELMO；BERT；Transformers

ELMo（Embeddings from Language Models）是一个在2018年由Allen AI研究所开发的新型深度语义词嵌入（word embedding）。 ELMo词嵌入是基于上下文的，这意味着对于任何给定的词，它的表示都会根据它出现的上下文而变化。这是一个重要的进步，因为传统的词嵌入，如Word2Vec或GloVe，为每个

2024年02月09日
浏览(53)
NLP之Bert介绍和简单示例

官网访问：https://huggingface.co/ 注意力模型，可以参考知乎博客：https://zhuanlan.zhihu.com/p/37601161 即适合于图形和图像，也适合于自然语言处理。可以帮助我们快速识别重点。例如在识别一张图片的时候，我们并不知道哪个地方是重点。在开始读一本书的时候，不知道哪个章节是

2024年02月05日
浏览(39)
Guides new learners through bert‘s internals!

作者：禅与计算机程序设计艺术 BERT(Bidirectional Encoder Representations from Transformers)是一个自然语言处理(NLP)预训练模型，由Google AI团队于2018年提出，它被证明能够提升多种自然语言理解任务的性能。本文将介绍BERT的基本概念、术语、算法原理、实现方法、数学原理及应用。希望

2024年02月07日
浏览(36)
nlp系列（7）实体识别（Bert）pytorch

本项目是使用Bert模型来进行文本的实体识别。 Bert模型介绍可以查看这篇文章： NLP系列（2）文本分类（Bert）pytorch_bert文本分类-CSDN博客 Bert模型的模型结构：数据网址：https://github.com/buppt//raw/master/data/people-relation/train.txt 实体1 实体2 关系文本输入中文句子

2024年02月10日
浏览(36)