RuntimeError: DataLoader worker (pid(s) 46220) exited unexpectedly

这篇具有很好参考价值的文章主要介绍了RuntimeError: DataLoader worker (pid(s) 46220) exited unexpectedly。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

raise runtimeerror('dataloader worker (pid(s) {}) exited unexpectedly'.forma,错误集锦,python,人工智能,深度学习

raise RuntimeError(‘DataLoader worker (pid(s) {}) exited unexpectedly’.format(pids_str)) from e
   RuntimeError: DataLoader worker (pid(s) 46220) exited unexpectedly

其实吧,这个问题说难不难,说简单也简单。
出现这个Error很明显,就是CPU加载数据和GPU处理数据速度不匹配了,而且不是以往那种CPU利用率拉满,而GPU虽然占用率拉满,但实际利用率不高的情况。打个比方,以前是cpu加载数据要个20-30s,但gpu零点几秒就处理完成了,从而一直等待。这种情况只会让模型运行时间变长而已。

torch.utils.data.DataLoader(datasets[x], batch_size=batch_size, shuffle=True, num_workers=8, pin_memory=True)

现在则是两极反转,Dataloader的batchsize设置的比较大(64,128),而且还使用多个num_workers去多进程load数据,比如16-32个,甚至还把pin_memory设为True了。导致cpu加载数据快到飞起,反而GPU跟不上了,就会出现异常,然后杀死进程,出现如上结果。

解决方案

就是根据以上提的三点来呗

  1. batchsize减小
  2. num_workers设的小一点,比如2,甚至不设置(默认为1)
  3. pin_memory = False

以上3点使用一至两种一般就能解决,不行就都用。

并且把数据加载,预/后处理这种IO任务让GPU去做, load checkpoint的时候 map_location也别设成cpu了,这么拉后腿,肯定可以成功。文章来源地址https://www.toymoban.com/news/detail-741701.html

到了这里,关于RuntimeError: DataLoader worker (pid(s) 46220) exited unexpectedly的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包