问题
在训练到一定迭代次数之后报错:
RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling cublasSgemm( handle, opa, opb, m, n, k, &alpha, a, lda, b, ldb, &beta, c, ldc)
可能的原因
- shape维度不匹配
- 变量不在同一个device上
- pytorch和cuda版本不匹配
解决方案文章来源:https://www.toymoban.com/news/detail-511615.html
在train.py文件的开头加上 os.environ['CUDA_VISIBLE_DEVICES'] = '0'
,并且设置device='cuda'
。
但是有 一个很奇怪的现象:如果不设置可见gpu,而是指定device='cuda:0'
的话,也会报错。文章来源地址https://www.toymoban.com/news/detail-511615.html
到了这里,关于【bug记录】RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!