使用yolov5l模型训练时出现报错,但是昨天使用yolov5s模型时是可以正常训练的。
RuntimeError: Unable to find a valid cuDNN algorithm to run convolution
发生报错的原因是gpu内存占用过高,terminal输入nvidia-smi查看gpu的使用情况。
我们需要把bach_size调小,一般建议是8的倍数,内存不够用时尽量调低,此处我设置成了16。
parser.add_argument('--batch-size', type=int, default=16, help='total batch size for all GPUs, -1 for autobatch')
结果运行正常。
文章来源:https://www.toymoban.com/news/detail-516276.html
使用yolov5模型时,s和n模型的深度和通道层数都比较小,batch-size设置的稍大一些,gpu可以跑的动,但使用l和x模型跑的时候就不一定可以跑的动了。使用指令nvidia-smi,根据gpu的使用情况调整batch-size的大小,尽量缩短每次训练模型的时间。文章来源地址https://www.toymoban.com/news/detail-516276.html
到了这里,关于RuntimeError: Unable to find a valid cuDNN algorithm to run convolution的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!