链接到文 — https://arxiv.org/pdf/2010.11929.pdf
术语说明:
1)transformer:对应的汉译是”转换器、变形金刚、变压器“等,文中见到类似语句一律理解为transformers。
2)ViT:是 VISION TRANSFORMER 的意义。即视觉转换器。文章来源:https://www.toymoban.com/news/detail-647421.html
一、说明
如今,在自然语言处理(NLP)任务中,转换器已成为goto架构(例如BERT,GPT-3等)。另一方面,变压器在计算机视觉任务中的使用仍然非常有限。大多数研究人员直接使用卷积层,或者将某些注意力块与卷积块一起添加到计算机视觉应用(如Xception,ResNet,EfficientNet,De文章来源地址https://www.toymoban.com/news/detail-647421.html
到了这里,关于变形金刚在图像识别方面比CNN更好吗?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!