Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答

这篇具有很好参考价值的文章主要介绍了Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


背景:跟李沐老师一起探索RTX 3090的深度学习浮点运算性能,需要安装apex进行半精度运算,本文总结了Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答

环境:
Ubuntu20.04
AMD 5800 8-core 16-Thread
NVIDIA RTX 3090
Pytorch1.13(gpu)
Python3.9
CUDA11.7

一. 安装CUDA

确保你的apex跟CUDA版本对应,如果不对应,则在运行程序时会产生各类kernel fusion之类的错误。

wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
sudo sh cuda_11.7.1_515.65.01_linux.run

网不好可以先用浏览器下载,然后再安装。
安装时一直确认就可以了,如果已经安装过NVIDIA驱动可以去掉驱动的选项。
添加环境变量:

vim ~/.bashrc
export CUDA_HOME=/usr/local/cuda

source ~/.bashrc

如何进行软链接来对不同CUDA版本进行切换,看我其他专栏的相关文章写的很详细。

二. 安装apex

此前记得安装gcc g++ make,并确保三者都可以在命令行中直接找到。


git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./

正常安装成功是没有任何error信息的,会显示成功安装:

ubuntu安装apex,深度学习算法与原理,深度学习,人工智能,电脑

三. 各类报错问题解决

3.1 C++编译错误

报错信息:

subprocess.CalledProcessError: Command '['which', 'c++']' returned non-zero

原因:
ubuntu提供了这样一个包 build-essential,编译c/c++的,安装build-essential:

sudo apt-get install build-essential

3.2 Apex优化算子错误

报错信息:

RuntimeError: apex.optimizers.FusedAdam requires cuda extensions

原因:Apex缺少cuda_ext 库,一定是没有正确安装好apex,需要卸载重装:

pip uninstall apex

3.3 CUDA错误

报错信息:

RuntimeError: Error compiling objects for extension

原因:没有正确安装CUDA库,或者CUDA版本与所安装的Pytorch版本不对应。
解决:重新安装正确版本的CUDA

3.4 g++或gcc错误

报错信息:

subprocess.calledprocesserror command ' 'which' 'g++' ' returned non-zero exit status 1

原因:gcc与g++不是同一个大版本,编译失败。
解决:文章来源地址https://www.toymoban.com/news/detail-517886.html

sudo apt remove g++ 
sudo apt remove gcc
sudo apt-get update
sudo apt-get install build-essential
sudo apt-get install gcc-9 g++-9
#建立强链接
sudo ln -s /usr/bin/gcc-9 /usr/bin/gcc -f
sudo ln -s /usr/bin/g++-9 /usr/bin/g++ -f

到了这里,关于Ubuntu20.04安装NVIDIA混合精度计算库apex全流程及各类报错问题解答的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Ubuntu20.04安装Nvidia显卡驱动教程

    nouveau是Ubuntu自带的显卡驱动,但他是核显,我这里想安装独显,就得把他禁掉。 1、创建文件,如果没有下载vim编辑器,将vim换成gedit即可 2、在文件中插入以下内容,将nouveau加入黑名单,默认不开启 3、输入以下命令使禁用生效然后重启 4、重启后验证 如果回车后无反应,则

    2024年02月07日
    浏览(46)
  • ubuntu20.04如何安装nvidia-docker?

    导入 NVIDIA GPG 密钥 添加 NVIDIA Docker 存储库 安装 nvidia-container-toolkit 检查nvidia-docker是否安装成功 如果 nvidia-docker 安装成功,命令将启动一个包含 NVIDIA GPU 的容器并运行 nvidia-smi 命令,该命令可以显示有关 GPU 状态的信息。输出结果将显示 GPU 型号、显存大小、温度等信息。 如

    2024年02月15日
    浏览(38)
  • 【Ubuntu20.04安装Nvidia驱动、CUDA和CUDNN】

    官网链接:https://www.nvidia.cn/Download/index.aspx?lang=cn 或者https://www.nvidia.cn/geforce/drivers/ 注 :Ubuntu系统是不区别显卡类别的显卡驱动,一般来说,下载最新版本的驱动即可;Win系统是需要根据显卡来选择具体的驱动版本。 1.2.1 NVIDIA 驱动与 Nouveau 驱动不兼容 由于系统当前正在使用

    2024年02月11日
    浏览(59)
  • Docker笔记--Ubuntu20.04安装Nvidia-Docker

    目录 1--添加软件包存储库 2--安装Nvidia-Docker2 3--测试         安装 nvidia-docker2 软件包并重新加载 docker 守护程序配置:         执行 sudo apt-get install -y nvidia-docker2,可能会出现以下错误:E: Unable to locate package nvidia-docker2,解决方法是完整执行完第 1 步;         重启

    2024年02月16日
    浏览(32)
  • Ubuntu20.04安装Nvidia驱动——4060显卡(黑屏解决方法)

    如果按照正常方法安装不成功(如无法连接第二屏幕,nvidia-smi无显示),先尝试在安装后不管什么方法进入桌面后在应用程序中找到NVIDIA X Server Settings,在最后一项PRIME Profiles将NVIDIA On-Demand改为Performance Mode,重启后正常,安装深度学习环境也无问题,但是我的神州刷新率还

    2024年02月07日
    浏览(42)
  • 记录Ubuntu20.04的NVIDIA显卡驱动安装和CUDA安装

    我的电脑显卡是RTX 3070Ti。 在安装Ubuntu系统的时候选择的也是Mini安装。 而且对比了官方的NVIDIA驱动安装和系统自带的“软件和更新”附加驱动安装。我这边选择了更加稳定的官方的NVIDIA驱动安装。 由于课题的原因,并没有在CUDA之后安装相关的cudnn的补丁。 进入终端后,运行

    2024年02月05日
    浏览(42)
  • ubuntu 20.04 docker及nvidia-docker2安装

            使用GPU经常会到要使用nivida-docker2的情况,网上吧老有些不负责人的给安装步骤造成误导,不能一次成功,现将自己一次成功的经验分享如下: 1、安装docker(command by command) # Add Docker\\\'s official GPG key: sudo apt-get update sudo apt-get install ca-certificates curl gnupg sudo install

    2024年01月18日
    浏览(29)
  • 【ubuntu环境配置】超详细ubuntu20.04/22.04安装nvidia驱动/CUDA/cudnn

    nvidia显卡驱动安装方式有三种:使用ubuntu附加驱动的方式;使用命令行方式安装;使用.run文件的方式进行安装, 点击菜单中的Additional Drivers选择适合的驱动版本进行安装,该方法最方便快捷(但有时会翻车) 更新所有的软件包 安装显卡驱动 详见我的另一篇博客Ubunut20.04/2

    2024年01月22日
    浏览(66)
  • 【AI】惠普暗夜精灵9安装Ubuntu20.04+nvidia驱动

    NVIDIA驱动安装很是矫情,为了谨慎起见,还是禁用快速启动吧 在Win11下,进入控制面板–》硬件和声音–》电源选项–》更改电源按钮的功能 禁止“启用快速启动” 关闭设备加密,否则安装过程中会报:bitlocker加密需要解除 在启动选项中,将安全启动模式关闭;否则在安装

    2024年02月05日
    浏览(90)
  • ubuntu20.04到ubuntu18.04安装英伟达(nvidia)显卡驱动的血泪史

    吐槽!:跟舍友在Ubuntu18.04上装了三天三夜的NVIDIA显卡驱动,真的是快装吐了(是一整天都在搞环境,找各种缺的包、看各种教程。。。差点给我气咯pi了...不过终于在第三天晚上我成功的配好了)我实验室有个2060的好看小姐姐配了一个周,我真的是佩服(严肃脸) 在这感谢

    2023年04月08日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包