深度学习三件套安装依赖指南（linux）-Toy模板网

这篇具有很好参考价值的文章主要介绍了深度学习三件套安装依赖指南（linux）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

安装依赖指南

标准的深度学习三件套包括pytorch, cuda, cudnn。根据经验，一般安装顺序如下：

为GPU安装驱动和cuda。到官网安装cuda toolkit
用conda安装cudatoolkit。用conda安装cudaconda install cudatoolkit==11.7，使用清华源(到官网确认安装了符合pytorch要求的cuda版本)
用pip安装pytorch，使用清华源。
安装合适版本的cudnn。

如何安装cuda

到官网下载cuda安装包 https://blog.csdn.net/h3c4lenovo/article/details/119003405
安装方式有deb、在线deb和runfile可选，本人用在线deb安装。它会为你同时安装driver和toolkit。

安装后，运行nvidia-smi和ls/usr/local查看nvdiia cuda版本。

nvidia cuda 安装失败，报错"you are running x server … installation failed "

如果报错"you are running x server"，说明有程序在使用显卡，要关闭lghtdm。
https://blog.csdn.net/lien0906/article/details/54312166

英文版。高赞回答
https://unix.stackexchange.com/questions/25668/how-to-close-x-server-to-avoid-errors-while-updating-nvidia-driver

sudo service lightdm stop

ubuntu driver/library version mismatch：重装驱动

驱动和library的版本不一致，需要检查版本，并卸载重装驱动！

如何查看驱动版本
https://xujinzh.github.io/2022/05/25/nvidia-driver-library-version-mismatch/

…系统运行中的 NVIDIA 驱动版本（查看方法：cat /proc/driver/nvidia/version）与安装的驱动版本（查看方法：sudo dpkg -l | grep nvidia）不一致

如何卸载驱动
https://itslinuxfoss.com/fix-failed-initialize-nvml-driver-library-version-mismatch-error/

sudo apt purge nvidia*

安装conda cudatoolkit

用conda安装即可：conda install cudatoolkit==11.7，conda可以使用国内清华源。

如何下载pytorch gpu离线版本

参考博客 https://blog.csdn.net/qq_51206550/article/details/127835129

下载pytorch gpu版本太慢，到官方镜像 https://download.pytorch.org/whl/torch/，下载需要的GPU版本，比如torch-1.13.1+cu117-cp39-cp39-win_amd64.whl，其中cu117代表cuda版本为11.7，cp37代表python版本为3.7。

https://blog.csdn.net/qq_41710226/article/details/125548986