缓存不够!!!!并非内存容量不够
错误提示: torch.cuda.0utofMemoryError: CUDA out of memory.Tried to allocate 2.00 MiB (PU 0; 23.69 GiB total capacity; 237 BiB already allocated; 18.38 MiB fre; 2.50 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation.See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
通过查资料,说内存不够用,换个好显卡,可但是通过运行指示nvidia-smi
发现在执行程序时仅使用极少的内存(图片-1%),因此不是内存不足,考虑可能是缓存爆了!
观察下面的进程发现12757(准备执行的程序aplaca)占比GPU显存很大,用sudo skill -9 12757
杀掉它后重新执行待训练的程序。
成功执行,再次验证一下猜想是否正确,再次在终端输入nvidia-smi
,发现从1%升到95%,问题解决!
文章来源地址https://www.toymoban.com/news/detail-506879.html
文章来源:https://www.toymoban.com/news/detail-506879.html
到了这里,关于Ubuntu下跑Aplaca报错:torch.cuda.0utofMemoryError: CUDA out of memory.解决办法(查看CUDA占用情况&清除GPU缓存)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!