CL_MVSNet复现可能会出现的问题汇总

这篇具有很好参考价值的文章主要介绍了CL_MVSNet复现可能会出现的问题汇总。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1.最好按照说明文档要求配好python3.7和pytorch1.0

安装pytorch1.0

conda install pytorch==1.10.1 torchvision==0.11.2 torchaudio==0.10.1 cudatoolkit=11.3 -c pytorch -c conda-forge

报错,执行下面再重执行安装

conda install conda=23.10.0

安装各种包

安装cv2:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple  opencv-python

安装tensorboard

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorboardX
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorboard

安装torch-tb-profiler

 pip install torch-tb-profiler

安装

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple  plyfile

如何执行shell脚本
在终端中输入“chmod +x 文件名.sh”,将文件设置为可执行文件。
在终端中输入“./文件名.sh”,即可运行shell脚本。

2. 【已解决】 FutureWarning: The module torch.distributed.launch is deprecated and will be removed in future.

torch.distributed.launch被弃用,考虑使用torchrun模块进行替换。
解决方案:
将训练脚本中的torch.distributed.launch替换为torchrun。例如,如果原始命令如下

python -m torch.distributed.launch --nproc_per_node=2 train.py
将其修改为下面的命令:
python -m torch.distributed.run --use-env --nproc_per_node=2 train.py

如果还是报错如下:
CL_MVSNet复现可能会出现的问题汇总,深度学习,深度学习
删掉–use-env

torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 0 (pid: 2344619) of binary: /home/vgg/anaco

ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 0 (pid: 1105295) of binary: /home/vgg/anaconda3/envs/kunpython37/bin/python

3. 【已解决】ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 0 (pid: 1447037) of binary: /usr/bin/python

解决方案:
在dataloader时参数shuffle默认False即可

4.【已解决】torch.distributed.elastic.multiprocessing.api:Sending process 2344620 closing signal SIGTERM

单卡跑就行,解决方案看5

5. 【已解决】module ‘progressbar’ has no attribute ‘Variable’

解决方案
卸载掉progressbar2和progressbar模块重装

pip uninstall progressbar2
pip uninstall progressbar

重装,建议安装低版本的progressbar2

pip install progressbar2==3.51
pip install progressbar==2.1

6. 【已解决】RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cuda:1! (when checking argument for argument weight in method wrapper__cudnn_convolution)

问题原因:参与运算的变量不在同一个gpu上,考虑将所有数据移动到同一个gpu上运行,或者干脆使用单卡运行,在训练脚本中改为:就是单卡跑

CUDA_VISIBLE_DEVICES=0,--nproc_per_node=1

7. 【已解决】CUDA out of memory.

使用查看显卡空间

 gpustat

然后切换成有空的显卡

CUDA_VISIBLE_DEVICES=有空的显卡号

8. 【已解决】训练意外中断,使用检查点文件继续训练

找到.log文件夹下的检查点文件,复制路径
CL_MVSNet复现可能会出现的问题汇总,深度学习,深度学习
在主函数里找到训练
找到训练里的第10个参数resume,添加default = ‘检查点文件地址’
如下:
CL_MVSNet复现可能会出现的问题汇总,深度学习,深度学习文章来源地址https://www.toymoban.com/news/detail-719344.html

到了这里,关于CL_MVSNet复现可能会出现的问题汇总的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 电脑启动后出现白屏问题的可能原因及解决方案

    电脑开机后出现白屏问题是一种常见的故障,可能由多种原因引起。在本文中,我将介绍一些可能的原因,并提供相应的解决方案,以帮助您解决这个问题。 显示器故障:首先,检查显示器是否正常工作。可以尝试连接另一个显示器或电视,看看是否仍然出现白屏问题。如果

    2024年02月04日
    浏览(46)
  • 在安装和启动vivado 2017.1时可能出现的问题以及解决方法

    system: windows 10,11 cpp version: visual studio redistributable 2017(未安装redistributable 2015) 可能出现的问题:(一些情况出现个别,另一些情况会依次出现) 在打开vivado 2017.1时,弹出一个类似于提示“ vs redistributable 2015安装失败:已存在更高版本,须删除 ”的弹窗; 完成第一步后仍然会有

    2024年02月07日
    浏览(38)
  • 数据库四种事务隔离级别的区别以及可能出现的问题

    当两个或多个事务读入同一数据并修改,会发生丢失修改问题,前一个事务修改的结果会被后一事务所做的修改覆盖。 当一个事务修改某个数据后,另一事务对该数据进行了读取,由于某种原因 前一事务撤销 了对该数据的修改,即将修改后的数据恢复原值,相当于没有执行

    2024年02月07日
    浏览(77)
  • a-textarea(textarea)出现模糊问题的可能解决方案

    项目介绍 :本项目是一个vue3+ant-design-vue4.x开发,是一个客服机器人的组件。其它项目通过iframe+js文件来引入(iframe的内容就是表单,入口按钮是通过js文件进行dom操作创建)。 通过js监听页面宽度,然后通过transform来适配不同分辨率。 iframe+transform,出bug似乎也不奇怪 ~ 这期间

    2024年04月25日
    浏览(34)
  • [Linux] CentOS7 中 pip3 install 可能出现的 ssl 问题

    由于解决问题之后, 才写的博客, 所以没有图片记录. 尽量描述清楚一些 今天写代码的时候, 突然发现 文件里用了 #define 定义宏之后, coc.nvim 的 coc-clangd 补全就用不了 :checkhealth 了一下, 发现 nvim 忘记支持 python3 了 尝试 pip3 install neovim 的时候, 发现会警告然后安装失败. 截图就没

    2024年02月16日
    浏览(48)
  • Pycharm 出现 进程已结束,退出代码-1073741819 (0xC0000005) 的问题 可能的解决方法

    Pycharm 出现 进程已结束,退出代码-1073741819 (0xC0000005) 的问题 可能的解决方法 这个错误代码表示进程遇到了一个无效的内存地址,可能是由于以下原因: 1. Pycharm的问题,需要更换或卸载一些安装包,如h5py或pyQt 2. Pytorch的问题,需要检查是否使用了GPU环境,并更新驱动和版本

    2024年02月16日
    浏览(44)
  • TCP为什么是三次握手和四次挥手以及可能出现的问题

    如果是4次,多了一次没啥意义还慢了,如果是两次握手逻辑可能存在下列问题: (这两个方面也可以理解为握手过程中可能出现的问题) 不可靠 TCP协议是可靠的 ,那么 建立的连接也需要确保是双向,可靠的 ; 根据连接过程分析,只有一方收到了另一方的ack确认报文,才能证

    2024年02月03日
    浏览(52)
  • 如何在linux服务器部署pgsql,安全版以及可能出现各种问题解决(保姆级教程)

    提示:市面上那些在linux服务器部署pgsql好多都是水货,效果良莠不齐,笔者花了两天时间成功部署了pgsql,记录下方便自己以后部署,也方便其他有需要的码农 服务器环境: postgresql版本 坚决不要通过镜像下载,道路千万条,安全第一条,镜像源不一定安全,自己老老实实去

    2023年04月08日
    浏览(46)
  • ZYNQ出现问题及解决办法汇总(一直更新)

    开发板:MZ7XA-7020 软件:vitis2020.2(vivado2020.2) 7020板的教学视频和文档均是基于vivado2017版本的,因此在实际操作过程中会遇到不少问题,本篇博客就是记录这些不同和一些开发文档中未提到的问题。 build project卡在17%或49%,或者出现下图所示的描述: 这里是vitis 2017版和2020版本

    2024年02月07日
    浏览(46)
  • 安全扫描出现的响应头缺失安全问题汇总

    测试抓包扫出有响应头缺失的漏洞,写了一个全局的拦截器,解决方案如下: 解决安全漏洞:检测到目标服务器启用了OPTIONS方法 点击劫持:X-Frame-Options未配置 检测到目标Referrer-Policy响应头缺失 Content-Security-Policy响应头确实 检测到目标X-Permitted-Cross-Domain-Policies响应头缺失 检

    2024年02月13日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包