Pytorch项目报错:
CUDA kernel errors might be asynchronously reported at some other API call
在运行基于pytorch的深度学习项目时,有时候会遇到上述错误,并且在报错时没有定位到正确的位置。
原因分析:
这里查阅了很多网上的相关资料,说是分类数目和模型里的实际分类数目不匹配,大家可以仔细查看一下这个。也有说是在计算logits之前先进性softmax归一化,大家也可以试试这个方法。
我仔细检查自己的项目分类数目,发现并不是上述原因,因此需要先定位到实际导致错误的代码位置。
解决方案:
我们的目的是定位到实际导致报错的代码位置,只需要在最开头添加:文章来源:https://www.toymoban.com/news/detail-543328.html
import os
os.environ['CUDA_LAUNCH_BLOCKING'] = '1'
这时候报错会定位到实际位置,大家对症下药解决即可。文章来源地址https://www.toymoban.com/news/detail-543328.html
到了这里,关于CUDA kernel errors might be asynchronously reported at some other API call 错误解决的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!