了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034-Toy模板网

这篇具有很好参考价值的文章主要介绍了了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034

我们会先来说预训练有什么用,其实

了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034

之前说的机器学习,其实都是跟数学相关性很大的,比如,支持向量机,回归算法,

1.最早的时候,做机器学习,就是偏数学的,比如用的决策树,支持向量机,线性回归,逻辑回归等算法.

这种是偏向数学的,偏向统计的.

了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034

然后这个深度学习,其实就是偏大数据的,需要大量的数据来训练,需要大数据支持.

了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034

但是呢实际上,很多的项目是没有大数据的支持的,比如,我们有个猫狗分类问题,

我给你100张图片,让你去训练,然后再给你一张图片,让你用你的模型分辨是猫还是狗,很显然

数量太少对吧,训练的效果好,如果给1000张,10000张还可以试试对吧.那怎么办呢?

这个时候就有人想办法,虽然我没有一个猫狗分类的,经过大量数据训练的模型,但是我知道有个别人

做好的一个鸭鹅的,用了10万张数据训练好的模型了.那就可以用这个已经做好的鹅鸭的模型来做了

比如我们成为这个鹅鸭的模型是A文章来源地址https://www.toymoban.com/news/detail-421044.html

到了这里，关于了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

了解Transformer架构的前奏_什么是预训练_理解预训练---人工智能工作笔记0034