Linux Ubuntu20.04深度学习环境快速配置命令记录

这篇具有很好参考价值的文章主要介绍了Linux Ubuntu20.04深度学习环境快速配置命令记录。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

安装前最好测试一遍 步骤三,避免安装失败,浪费时间。

一、驱动安装

1、更新系统包

sudo apt-get update
 
sudo apt-get upgrade
sudo apt install build-essential 

2、安装显卡驱动

使用apt方式安装驱动,多数情况不容易成功,

使用一下方法更佳:

1.查看合适显卡的驱动版本

ubuntu-drivers devices

NVIDIA GeForce 驱动程序 - N 卡驱动 | NVIDIANVIDIA GeForce 驱动程序官方提供下载最新版的 Geforce 驱动程序,可提升 PC 游戏体验和应用程序速度。更多关于更新显卡驱动程序以及显卡驱动程序下载的信息,请访问 NVIDIA 官网。https://www.nvidia.cn/geforce/drivers/选择合适版本的驱动,下载后直接可以安装

Linux Ubuntu20.04深度学习环境快速配置命令记录,深度学习,linux,服务器

 下载推荐版本

Linux Ubuntu20.04深度学习环境快速配置命令记录,深度学习,linux,服务器

两种方式:①有桌面的,直接双击进行安装。

②命令行:


sudo dpkg -i XXX.deb

2.minicoda 见前面的文章 。Miniconda — conda documentationhttps://docs.conda.io/en/latest/miniconda.html#linux-installers

3、安装cuda

查看版本对应

CUDA 12.2 Release Notes — cuda-toolkit-release-notes 12.2 documentationThe Release Notes for the CUDA Toolkit.https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

Linux Ubuntu20.04深度学习环境快速配置命令记录,深度学习,linux,服务器

查看pytorch版本对应

Previous PyTorch Versions | PyTorchAn open source machine learning framework that accelerates the path from research prototyping to production deployment.https://pytorch.org/get-started/previous-versions/

安装 11.7版本cuda比较通用

CUDA Toolkit 11.7 Update 1 Downloads | NVIDIA DeveloperResources CUDA Documentation/Release NotesMacOS Tools Training Sample Code Forums Archive of Previous CUDA Releases FAQ Open Source PackagesSubmit a BugTarball and Zip Archive Deliverableshttps://developer.nvidia.com/cuda-11-7-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=deb_local

不要使用network版本安装,它会直接安装最新版本,使用离线安装,两个时间差不多

Linux Ubuntu20.04深度学习环境快速配置命令记录,深度学习,linux,服务器

4、安装cudnn

cuDNN Archive | NVIDIA DeveloperExplore and download past releases from cuDNN GPU-accelerated primitive library for deep neural networks.https://developer.nvidia.com/rdp/cudnn-archive

主要对应版本,intel 选86_64 , 系统 20.04.只需要下载一个文件,这里和老版本不太一样。同样双击就可以安装。

Linux Ubuntu20.04深度学习环境快速配置命令记录,深度学习,linux,服务器

 最后一把配置环境变量

export PATH="/usr/local/cuda-11.7/bin${PATH:+:${PATH}}"
export LD_LIBRARY_PATH="/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}"

 torch安装,参考18.04版本

Ubuntu 18.04 深度学习环境快速配置命令记录_瑾怀轩的博客-CSDN博客sudo apt-get install ubuntu-drivers-common #安装。4、在线安装不行,离线安装ok。5、安装miniconda。10、安装cudann。6、初始化conda。https://blog.csdn.net/ckq707718837/article/details/130884384?spm=1001.2014.3001.5502

二、驱动卸载

卸载cuda:

sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \
 "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"

 卸载nvidia驱动

sudo apt-get --purge remove "*nvidia*" "libxnvctrl*"

 卸载不用的依赖包

sudo apt-get autoremove

三、可能会遇到的问题:

问题一、

ERROR: An 
NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel

ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel

安装驱动的报错信息为:

ERROR: An NVIDIA kernel module 'nvidia-uvm' appears to already be loaded in your kernel.  This may be because it is 
in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if 
your kernel was configured without support for module unloading.  Please be sure to exit any programs that may be us
ing the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your k
ernel supports module unloading, and you still receive this message, then an error may have occurred that has corrup
ted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer.
 

or

ERROR: An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel.  This may be because it is 
in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this may also happen if 
your kernel was configured without support for module unloading.  Please be sure to exit any programs that may be us
ing the GPU(s) before attempting to upgrade your driver.  If no GPU-based programs are running, you know that your k
ernel supports module unloading, and you still receive this message, then an error may have occurred that has corrup
ted an NVIDIA kernel module's usage count, for which the simplest remedy is to reboot your computer.

正常情况:

解决办法如下: 目的是移去kernel中包含NVIDIA的进程,举个栗子:

命令:

lsmod | grep nvidia

nvidia_uvm            995356  2 
nvidia_drm             53134  0 
nvidia_modeset       1195268  1 nvidia_drm
nvidia              35237551  14 nvidia_modeset,nvidia_uvm
drm_kms_helper        179394  2 i915,nvidia_drm
drm                   429744  5 i915,drm_kms_helper,nvidia,nvidia_drm
 

 数字代表依赖进程数量,卸载时,需要重后置位不存在依赖项的开始卸载,比如这里要从

nvidia-smi开始

sudo rmmod nvidia-drm
sudo rmmod nvidia-modeset
sudo rmmod nvidia

现在再使用:

lsmod | grep nvidia

会发现基本上没有信息了打印了,如何还有,就用上面的命令卸载过程中还会出现意外情况,就是 某个模块被占用,卸载不掉

rmmod: ERROR: Module nvidia_drm is in use

 如果是 nvidia-uvm可以使用top命令,查看进程,kill掉进程,再执行上面步骤。

如果是 nvidia-drm 会发现没在进程中,这是进入无图形化界面

sudo systemctl isolate multi-user.target

这个过程可能黑屏,不用慌张,关机重启,再尝试该操作,登录账号后,同样的操作,

lsmod | grep nvidia
sudo rmmod nvidia-drm

也可以使用下面命令 

sudo modprobe -r nvidia-drm

如果还有其他的一次性卸载完。卸载完后,使用下面命令进入图形化界面

sudo systemctl start graphical.target

进入后 ,检查一下

lsmod | grep nvidia

没有依赖项可以安装了

问题二、安装是要注意版本,安装时注意选项选择

sudo sh NVIDIA-Linux-x86_64-535.42.run -no-x-check -no-nouveau-check -no-opengl-files

 后面可加参数,选择选项,跟着默认项选即可。

这里注意的是,安装32位库会根据显卡版本,修改系统内核。所以在安装前选好版本后,尽量和系统推荐版本,与内核版本保持一致。

查看内核版本

less /proc/version
cat /proc/driver/nvidia/version
ubuntu-drivers devices

安装好后nvidia驱动,使用nvidia-smi如果不需要低版本cuda需求,尽量使用nvidia-smi上面推荐的cuda版本

问题3

Failed to initialize NVML: Driver

这个问题 一般情况重启就能解决, 注意前提

1、安装好显卡驱动

2、安装好cuda和cudnn

3、配置好环境变量

解决办法: 关机 --》开机

如果还解决不了,从头再来,大概率是安装显卡驱动版本选错了,或者提示选项选错了。文章来源地址https://www.toymoban.com/news/detail-704186.html

到了这里,关于Linux Ubuntu20.04深度学习环境快速配置命令记录的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ubuntu20.04配置ros noetic和cuda,cudnn,anaconda,pytorch深度学习的环境

    这里介绍下本篇文章的目的,为了方便自己日后在其他主机上搭建环境,也为了帮助遇到相同问题的人。本篇文章主要是解决ubuntu20.04搭建机械臂视觉抓取的环境部署问题。第一个环境了ROS环境,第二个环境是深度学习yolov5的环境。 这里推荐鱼香ros的便携式安装方法,这里感

    2024年02月07日
    浏览(92)
  • 【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch)

    【深度学习环境配置】ubuntu 20.04+4060 Ti+CUDA 11.8+pytorch(装机、显卡驱动、CUDA、cudnn、pytorch) 📆 安装时间 2023.11.08-2023.11.10 Windows 和 Ubuntu 双系统的安装和卸载 B站教程 【本文基本上跟这个详细教程一致,优先推荐看这个!】ubuntu20.04 下深度学习环境配置 史上最详细教程 【精

    2024年02月04日
    浏览(65)
  • Ubuntu 20.04 RTX 4090显卡 深度学习环境配置(Nvidia显卡驱动、CUDA11.6.0、cuDNN8.5)

    参考文献:从零到一保姆级Ubuntu深度学习服务器环境配置教程 看文献中“ 三、 NVIDIA驱动安装 ” 安装NVIDIA驱动,这也是安装CUDA10.0及其对应版本的CuDNN和tensorflow的重要步骤。 1.1.1 英伟达中国驱动官网 进入英伟达中国驱动官网 1.1.2 输入显卡型号查询 1.1.3 查看搜索结果 1.2.1 方

    2024年02月04日
    浏览(112)
  • 【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】

    Ubuntu安装步骤参考文章 知乎:Ubuntu 20.04系统安装及初始配置 先在Ubuntu官网下载系统镜像(或直接bing搜索对应版本)。【Ubuntu官网】 参考这篇文章 https://blog.csdn.net/qq_21386397/article/details/129894803 需要准备一个U盘(使用之前将U盘中内容做好备份,做成启动盘后U盘内文件将被清

    2024年02月09日
    浏览(72)
  • 【Linux】Ubuntu20.04版本配置pytorch环境2023.09.05【教程】

    首先进入Anaconda官网下载linux版本的安装文件 Anaconda3-2023.07-2-Linux-x86_64.sh ,进入安装文件路径,运行下面的脚本进行安装 安装需要阅读用户协议,一直按 enter 就行了,到当前页面时需要输出 yes 进行确认即可开始安装。 然后按照提示进行操作即可完成安装。 Anaconda基本环境管

    2024年02月09日
    浏览(42)
  • fabric 环境快速搭建--Ubuntu20.04系统下使用fabric官方脚本搭建

    由于是初识hyper ledger fabric在安装的时候遇到了很多的问题,最后在师兄的帮助下终于删了从头到尾安装了一遍,因此想记录一下,并且给和我遇到相同问题的小伙伴提供一些帮助。如果你是萌新,找我就对啦! 直接去官方下载即可 其他帖子上面有很多详细步骤,这里不多赘

    2024年02月14日
    浏览(45)
  • Ubuntu 20.04 系统配置 OpenVINO 2022.3 环境

    由于 OpenVINO 2021 版本在调用 IECore 时会出现 Segmentation fault 的问题,因此需要将其升级为 2022 版本的。 1. 卸载原来版本的 OpenVINO 进入OpenVINO的卸载目录,通常在 /opt/intel 文件夹下, 之后执行卸载程序,一路next即可 之后将 ~/.bashrc 中原本的 source 那行注释掉 注释以下这行 至此

    2024年02月03日
    浏览(62)
  • ubuntu20.04配置OpenCV的C++环境

    这里以opencv-3.4.16为例 复现https://github.com/raulmur/ORB_SLAM2此项目,需安装opencv及其他依赖,可见README.md详情 https://opencv.org/releases/ https://github.com/opencv/opencv_contrib 如果在执行第三个命令时提示“Unable to locate package libjasper-dev”,应该是下载源的问题。解决方法如下: 然后再执行一

    2024年02月05日
    浏览(68)
  • Ubuntu20.04系统配置Pytorch环境(GPU版)

    Ubuntu和NVIDIA Driver的安装请参考其他博主的文章,主要是当时安装的时候没记录,现在不想再折腾这两个东西了。 需要补充的几个点: 安装Ubuntu系统前,多看几遍教程,如果是笔记本安装双系统,最好是看和自己品牌相同的笔记本对应的博客,因为不同厂家的BIOS设置有一些差

    2024年04月09日
    浏览(67)
  • Ubuntu 20.04下安装配置Qt开发环境的步骤

    下面是在Ubuntu 20.04下安装配置Qt开发环境的步骤: 安装Qt Creator 在终端中输入以下命令以安装Qt Creator: 在终端中输入以下命令以安装Qt 5开发库: 安装g++和gcc编译工具 配置Qt Creator 打开Qt Creator,进入“Tools”菜单,选择“Options”,在弹出的对话框中选择“Build Run”,然后选择

    2024年02月15日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包