cuda 安装和卸载 (Ubuntu 2204)

这篇具有很好参考价值的文章主要介绍了cuda 安装和卸载 (Ubuntu 2204)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

cuda需要Nvidia显卡或计算卡,AMD或intel显卡不行(但是也有套他们的标准)
就算是亮机卡也可使用,比如GT710这种
建议使用ubuntu来装,因为cuda就是在这个平台上开发的,当然别的linux系统也行
以下操作在ubuntu server 2204、debian12、debian11中都操作过,如果没有安装linux系统,可以参考

Ubuntu server安装图解
Debian 安装图解


注意!请根据需要安装对应版本的cuda!不同版本安装大同小异
主要思路:安装N卡(硬件),安装cuda的依赖(主要是c的编译器)、安装N卡驱动,安装nvcc、安装cuda
另外,你可能还需要pytorch、tf,在选择版本前务必根据你自己的需要选取,部分组件对操作系统也有要求,为了少做重复劳动,先把所有需要的组件版本对应好,然后再一个个安装。
官方文档永远是最好的:cuda官方安装文档

一、检查硬件软件环境和删除Nouveau

不要省略这一步,检查环境确定符合基本需求

1.确定系统识别了N卡

lspci | grep -i nvidia

显示类似如下信息(下图分别是rtx3090 24G和rtx4090 24G):
cuda 安装和卸载 (Ubuntu 2204)cuda 安装和卸载 (Ubuntu 2204)

2.检查gcc编译器

gcc --version

如果正常,会显示版本,类似如下信息
cuda 安装和卸载 (Ubuntu 2204)

如果没有,建议安装这个c的一大堆套件集合,一劳永逸

apt-get install build-essential

3.安装配套的linux内核头

apt-get install linux-headers-$(uname -r)

4.删除Nouveau

(这一步不一定要做,根据实际情况,如果提示需要卸载就卸载)
linux默认安装了N卡的开源驱动,即Nouveau。

检查Nouveau工作状态

lsmod | grep nouveau

如果出来很多信息,就说明这个驱动还在,卸载
编辑新文件,名字不一定取这个,其它也行

vi /etc/modprobe.d/nouveau.conf

内容如下

blacklist rivafb
blacklist vga16fb
blacklist nouveau
blacklist nvidiafb
blacklist rivatv
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

应用到内核

update-initramfs -u

完成后重启电脑,然后再查看,没有信息了即可
如果没有重启电脑,还是显示会有的。

lsmod | grep nouveau

二、使用cuda Toolkit安装

推荐使用,这样全家桶就装好了:N卡驱动+cuda+nvcc
注意:这种方法不需要先装驱动,也省去了查找兼容性的问题
cuda要求的驱动版本是最低的版本,也就是说可以用最新的驱动配早期的cuda版本
官方地址: cuda toolkit
再次提示:版本根据你的需求进行选取,比如你要用pytorch、tensorflow等,以那个需要为准,不同版本安装方法都一样
cuda 安装和卸载 (Ubuntu 2204)
记得点前面的连接,不要点后面的Versioned …链接 ,那个是英文的详细文档,看起来麻烦。

这样选择,下面会出来安装的命令,直接复制用就行
这里装的是12.1版本,在上面的官方地址可以选取自己需要的版本,方法都是类似的
不同系统也在这里可以看到对应的安装方法,然后把下面的命令一个个复制进去就行
cuda 安装和卸载 (Ubuntu 2204)
cuda 安装和卸载 (Ubuntu 2204)
下面根据命令一步步操作:
上面的图有具体的操作,直接复制就行,我这边再写一下

(一)ubuntu系统参考这个

1.先切换到程序下载目录

mkdir /usr/local/my_cuda && cd /usr/local/my_cuda

2.安装操作

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin

移动配置文件

mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600

下载安装包

wget https://developer.download.nvidia.com/compute/cuda/12.1.0/local_installers/cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb

安装

dpkg -i cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb

安装key

cp /var/cuda-repo-ubuntu2204-12-1-local/cuda-*-keyring.gpg /usr/share/keyrings/

更新

apt-get update

安装cuda,这一步时间较长,耐心等待

apt-get -y install cuda

安装完成后重启电脑,否则可能会出各种问题

(二)debian系统参考这个

选择的是本地的安装方法

1.进入操作的目录

cd /usr/local

2.下载key并装入系统

wget https://developer.download.nvidia.com/compute/cuda/repos/debian11/x86_64/cuda-keyring_1.0-1_all.deb
dpkg -i cuda-keyring_1.0-1_all.deb
add-apt-repository contrib

如果上面那条命令提示出错,则使用下面的命令

apt-get install software-properties-common

3.安装

时间较长,耐心等待

apt-get update
apt-get -y install cuda

安装完成后重启电脑,否则可能会出各种问题

三、测试

cuda版本以nvcc显示出来的为准,如果N卡驱动较新,nvidia-smi显示的版本会是新的cuda版本,而实际调用是通过nvcc

1.测试nvcc(cuda编译器)

nvcc -V

正常显示如下(如果出错,请看第四节问题处理部分,有解决方法):
cuda 安装和卸载 (Ubuntu 2204)

2.测试nvidia-smi

nvidia-smi

如果这两步都出现问题,第四节处理

四、问题处理

1.nvcc 显示没有

查找nvcc

find / -name "nvcc"

比如出现下面目录
cuda 安装和卸载 (Ubuntu 2204)

vi ~/.bashrc

最后的部分添加上(如果你不是装的12.1版本,要改目录中的版本)

export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64
export PATH=$PATH:/usr/local/cuda-12.1/bin

保存后,刷新环境变量

source ~/.bashrc

再次使用命令(注意V是大写)

nvcc -V

见到如下的,是不是很亲切?
cuda 安装和卸载 (Ubuntu 2204)

2.nvidia-smi错误

据说重启解决80%问题
比如如下图提示,如果错误,重启即可,因为上面已经装过了,很多问题重启就能解决
注意:还有一种情况,就是开启了secury boot,在bios里关闭即可,否则重启还是报错
cuda 安装和卸载 (Ubuntu 2204)或者这种找不到硬件的,重启(还有一种可能显卡没有插好!)
cuda 安装和卸载 (Ubuntu 2204)

再次使用nvidia-smi可以看到类似下面的信息(左上角是N卡驱动版本,右上角是cuda版本)
cuda版本以nvcc为准
cuda 安装和卸载 (Ubuntu 2204)

五、cuda卸载

如果需要换不同的版本,建议多版本并存,这里先不涉及,如果要彻底卸载,根据以下操作
权限不够前面加sudo,我这里用root进行安装

1.准备删除cuda

apt-get remove cuda

2.自动卸载

apt autoremove 

3.删除其它的cuda

apt autoremove cuda*

4.删除下载安装包(也可以不删除)

rm /usr/local/my_cuda/cuda-repo-ubuntu2204-12-1-local_12.1.0-530.30.02-1_amd64.deb

5.查找包相关并删除

dpkg -l |grep cuda

类似于如下图的一些包,手动删除相关的包。否则再安装别的版本会失败
cuda 安装和卸载 (Ubuntu 2204)把上面的名称填到下面进行删除

dpkg -P cuda-repo-ubuntu2204-12-1-local cuda-toolkit-12-1-config-common cuda-toolkit-12-config-common cuda-toolkit-config-common cuda-visual-tools-12-1

6.或者

apt-get purge nvidia*

六、补充说明

1.升级显卡

如果更换了显卡,通常不需要重新安装,如果无法用,则重新安装即可

2.限制功耗(谨慎,一般不要搞)

有的显卡限制功耗可以有效降低温度,同时性能损失很小
以下仅作参考,通常情况不要动

进入持久化模式

nvidia-smi -pm 1

限制卡0功耗为200w

nvidia-smi -pl 200 -i 0

3.安装更老的cuda版本

cuda版本虽然有驱动版本的限制,但是这个限制的版本是最低的版本驱动版本。
比如rtx4090的初始驱动版本是522.25,而cuda11.8的默认cuda版本是522.06(默认无法直接安装)。如果需要这个版本的cuda。
应该先安装N卡驱动,然后在运行cuda tookit11.8,这时候程序会默认跳过驱动,使用nvcc -V和nvidia-smi显示的cuda版本不一致,因为两者原理不同,cuda是通过nvcc来运行的,所以以nvcc为准,特别是在windows下,如果你不小心升级了N卡驱动也不要紧,cuda的实际版本是不会变的。文章来源地址https://www.toymoban.com/news/detail-444039.html

到了这里,关于cuda 安装和卸载 (Ubuntu 2204)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Ubuntu 20.04-NVIDIA显卡驱动-安装和卸载-解决黑屏问题

    202300704更新,黑屏问题主要由linux内核更新导致 20230706 22:46 更新:好像这一步也没有用!!! The PCI ID Repository可以按照十六进制数字代码找到相应的显卡型号。 按照显卡型号下载驱动 (ctrl+鼠标点击-》跳转)下载官网建议的.run文件,下载完成后移动到主目录。 推荐直接在ub

    2024年02月12日
    浏览(60)
  • Ubuntu 20.04 安装NVIDIA显卡驱动+cuda 11.7+cudnn 8.4

    参考: https://zhuanlan.zhihu.com/p/59618999 https://blog.csdn.net/linhai1028/article/details/79445722/ Windows+Ubuntu从双系统安装到CUDA cuDNN docker 配置K21 https://blog.csdn.net/qq_45831128/article/details/127060475 https://blog.csdn.net/kunhe0512/article/details/125061911 Ubuntu 20.04 英伟达 RTX 3050 Ti 显卡 1)Ubuntu下查看Nvidia显卡的

    2023年04月10日
    浏览(38)
  • Ubuntu 20.04 LTS 系统下 安装Nvidia 显卡驱动、CUDA、cuDNN, 并可进行CUDA版本切换

    因为做深度学习的研究项目,为全新机器在Ubuntu 20.04 LTS 系统下 安装Nvidia 显卡驱动、Cuda、Cudnn。并进行CUDA版本切换 成功安装完成了,写个记录。 步骤一: 安装更新软件列表和依赖项 在安装Nvidia显卡驱动之前,需要更新软件列表和必要的依赖项。 步骤二: 查看GPU型号,并

    2024年02月13日
    浏览(45)
  • 超详细教程——Ubuntu20.04 安装英伟达NVIDIA显卡驱动、CUDA、Cmake以及不同版本的CUDA切换

    在windows和linux双系统下,为ubuntu安装nvidia、cuda、cmake等程序是一个可能会难到各个计算机小白的问题,本文将一步步地带您学会安装以上内容。 一、安装英伟达NVIDIA显卡驱动 对于新安装的linux操作系统,我们需要为它安装nvidia显卡驱动(ubuntu有自带的显卡驱动但更推荐安装

    2024年02月02日
    浏览(41)
  • Ubuntu18.04配置ZED_SDK 4.0, 安装Nvidia显卡驱动、cuda12.1

    首先卸载nvidia相关的、卸载cuda sudo apt-get purge nvidia* sudo apt-get autoremove sudo apt-get remove --auto remove nvidia-cuda-toolkit sudo apt-get purge nvidia-cuda-toolkit 官方卸载cuda的方法: 检查cuda还在不在: locate libcudart9.1 在软件更新中心里,手动安装显卡驱动。 ubuntu桌面-左下角九宫格-software upda

    2024年02月14日
    浏览(40)
  • 最新版ubuntu22.04安装NVIDIA显卡驱动以及CUDA、CUDNN,和安装驱动gcc版本问题解决。

    1.驱动安装参考下述链接 1.1 NVIDIA显卡驱动、 CUDA 的安装参考这个博主的具体安装步骤,但是最后一步的 cudnn 的安装参考另一个博主,见链接。 1.2 可以选择最新版本的驱动,需要在官网去找最新的版本对应。 2.最新版本我遇到的错误以及解决方法 2.1.在进入tty1界面后ubuntu安装

    2024年04月24日
    浏览(40)
  • Ubuntu20.04安装Nvidia显卡驱动、CUDA11.3、CUDNN、TensorRT、Anaconda、ROS/ROS2

    打开终端,输入指令:  选择 【5】 更换系统源,后面还有一个要输入的选项,选择 【0】 退出,就会自动换源。 这一步最痛心了家人们,网上的教程太多了,我总是想着离线安装,每次安装都无法开机,要不就卡在锁屏界面,要不就黑屏,要不就卡在snaped界面,重装系统装

    2024年01月17日
    浏览(60)
  • Ubuntu 卸载重装 Nvidia 显卡驱动

    我使用 airsim 的时候,发现 UE4 没法使用显卡,导致非常卡顿 输入 有显卡型号等信息的输出,但是进程 process 里面没有显示 airsim 和其他软件占用显卡情况 因此,我选择了卸载重装 卸载 这里我输入第一句后就基本上卸载干净了,再输入第二句就显示找不到命令了 输入 nvidi

    2024年02月02日
    浏览(29)
  • [CUDA][Ubuntu]如何卸载cuda和cudnn和nvidia driver

    百度有很多牛鬼蛇神的办法,试了一晚上,都不行。 包括:通过安装方式卸载,我tm根本不知道当初这个机器是怎么安装的cuda,我怎么卸载??? 通过删除文件夹和自带uninstall程序,试了,也删了,但是nvcc-v之后照样有,我踏马,这个cuda怎么比我的师姐还xx! 调到google上搜

    2024年02月11日
    浏览(34)
  • Ubuntu 20.04 RTX 4090显卡 深度学习环境配置(Nvidia显卡驱动、CUDA11.6.0、cuDNN8.5)

    参考文献:从零到一保姆级Ubuntu深度学习服务器环境配置教程 看文献中“ 三、 NVIDIA驱动安装 ” 安装NVIDIA驱动,这也是安装CUDA10.0及其对应版本的CuDNN和tensorflow的重要步骤。 1.1.1 英伟达中国驱动官网 进入英伟达中国驱动官网 1.1.2 输入显卡型号查询 1.1.3 查看搜索结果 1.2.1 方

    2024年02月04日
    浏览(62)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包