Transformer(四)--实现验证：transformer 机器翻译实践

9月前作者：吕秀才分类：Toy博客阅读(264) 违法举报

这篇具有很好参考价值的文章主要介绍了Transformer(四)--实现验证：transformer 机器翻译实践。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

转载请注明出处：https://blog.csdn.net/nocml/article/details/125711025

本系列传送门：
Transformer(一)–论文翻译：Attention Is All You Need 中文版
Transformer(二)–论文理解：transformer 结构详解
Transformer(三)–论文实现：transformer pytorch 代码实现
Transformer(四)–实现验证：transformer 机器翻译实践

1 文章说明

此篇文章是衔接上一篇的后续，在这篇blog中，我们会使用之前实现的代码，在真实的大规模语料上来训练一个机器翻译模型，用实际效果来检验我们实现的代码。
这个实验是我很早之前，也就是刚写完代码时做的，只不过模型结果没有经过系统评估，连bleu分也没计算，所以当时就没有整理成blog。最近想了想，还是把结果粘上来，大家看一下。然后transformer这块就结束了。最近一直在搞chatgpt相关的事情，有时间了也会整理下。

2. 模型训练

2.1 训练数据

训练数据使用中英平行语料，共1000W。

2.2 训练设备

服务器型号：T7920 塔式机
gpu: 2080ti 11G 单卡 (由于只是验证模型的正确性，所以只使用了一块卡)
cpu: 至强 5218N * 2
内存：128G

2.3 训练参数

$lr ：{6.26} ×10^{-5}$
$ba t c h s i ze : 16$
$\ max \ length: 128$
$warm\ step : 10000$
$token\ num:45000$
$e p oc h : 6$

2.4 训练过程

训练时长：7d（一个epoch 大概需要一天多）
训练损失：从百分位降到千分位，具体见下图
- 训练初始：
- 训练结束：

2.5 模型结果

结果展示：
Transformer(四)--实现验证：transformer 机器翻译实践
注：最后一个例子超过我设置的解码长度了，没有翻译完。

2.6 结果分析

没有计算具体的评估指标，主要是当时忙着做其它项目，没有过多的时间，且当时训练的目的也只是为了通过实验来看看代码是否有致命缺陷。从结果来看，已经有一定的翻译效果了。文章来源地址https://www.toymoban.com/news/detail-515273.html

到了这里，关于Transformer(四)--实现验证：transformer 机器翻译实践的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

机器学习&&深度学习——机器翻译（序列生成策略）

👨‍🎓作者简介：一位即将上大四，正专攻机器学习的保研er 🌌上期文章：机器学习深度学习——seq2seq实现机器翻译（详细实现与原理推导） 📚订阅专栏：机器学习深度学习希望文章对你们有所帮助上一节已经实现了机器翻译的模型训练和预测，逐个预测输出序列，直

2024年02月12日
浏览(43)
【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）

【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）【如何训练一个中英翻译模型】LSTM机器翻译模型训练与保存（二）【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）【如何训练一个中英翻译模型】LSTM机器翻译模型部署之onnx（python）（四）模型部

2024年02月15日
浏览(40)
OJ# 376 机器翻译

题目描述小李的电脑上安装了一个机器翻译软件，他经常用这个软件来翻译英语文章。这个翻译软件的原理很简单，它只是从头到尾，依次将每个英文单词用对应的中文含义来替换。对于每个英文单词，软件会先在内存中查找这个单词的中文含义，如果内存中有，软件

2024年02月11日
浏览(247)
NLP——Translation 机器翻译

基于统计的机器翻译任务通常通过翻译模型（Translation Model）和语言模型（Language Model）的结合来学习更强大的翻译模型。这种结合被称为统计机器翻译（SMT）。翻译模型（Translation Model）：翻译模型主要关注如何将源语言句子翻译成目标语言句子。它使用双语语料库进行训练

2024年02月09日
浏览(94)
【如何训练一个中英翻译模型】LSTM机器翻译模型训练与保存（二）

【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）【如何训练一个中英翻译模型】LSTM机器翻译模型训练与保存（二）【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）【如何训练一个中英翻译模型】LSTM机器翻译模型部署之onnx（python）（四）基于

2024年02月15日
浏览(39)
几个nlp的小任务（机器翻译）

2024年02月10日
浏览(40)
【如何训练一个中英翻译模型】LSTM机器翻译模型部署之onnx（python）（四）

系列文章【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）【如何训练一个中英翻译模型】LSTM机器翻译模型训练与保存（二）【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）【如何训练一个中英翻译模型】LSTM机器翻译模型部署之onnx（python）（四

2024年02月15日
浏览(38)
【如何训练一个中英翻译模型】LSTM机器翻译模型部署之ncnn（python）（五）

系列文章【如何训练一个中英翻译模型】LSTM机器翻译seq2seq字符编码（一）【如何训练一个中英翻译模型】LSTM机器翻译模型训练与保存（二）【如何训练一个中英翻译模型】LSTM机器翻译模型部署（三）【如何训练一个中英翻译模型】LSTM机器翻译模型部署之onnx（python）（四

2024年02月15日
浏览(61)
【动手学深度学习】--机器翻译与数据集

学习视频：机器翻译数据集【动手学深度学习v2】官方笔记：机器翻译与数据集机器翻译（machine translation）指的是将序列从一种语言自动翻译成另一种语言。事实上，这个研究领域可以追溯到数字计算机发明后不久的20世纪40年代，特别是在第二次世界大战中使用计算机破

2024年02月09日
浏览(42)
什么是自然语言处理的机器翻译？

机器翻译（Machine Translation，MT）是一种自然语言处理技术，旨在将一种语言的文本自动翻译成另一种语言。机器翻译是自然语言处理领域的重要应用之一，它可以帮助人们在跨语言交流、文档翻译和信息检索等方面更加便捷和高效。本文将详细介绍自然语言处理的机器翻译。

2024年02月05日
浏览(42)