在服务器上安装pytorch并配置CUDA环境变量

这篇具有很好参考价值的文章主要介绍了在服务器上安装pytorch并配置CUDA环境变量。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、安装pytorch

1.预备工作——检查服务器上CUDA与NVIDIA的配置;

(1) 使用以下命令来查看安装在服务器上的NVIDIA驱动程序版本:

nvidia-smi

这将显示有关安装的NVIDIA驱动程序的详细信息,包括版本号。
(2)使用以下命令来查看CUDA版本:

nvcc --version

本服务器上NVIDIA驱动程序版本:460.56;CUDA版本:11.2

2.正式安装

(1)打开终端或命令提示符,并激活您的Anaconda环境(如果尚未激活)。

(2)使用以下命令创建一个新的虚拟环境,并指定所需的Python版本(例如3.8):

conda create --name myenv python=3.8

则创建了名为myenv的虚拟环境,python版本为3.8;
(3)激活新创建的虚拟环境:

conda activate myenv

(4)安装适用于CUDA 11.2的PyTorch:

conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch

这将安装与CUDA 11.2兼容的PyTorch、TorchVision和TorchAudio。(正常来说要安装11.2版本,但是服务器只支持11.1版本,且是兼容的)
(5)验证安装:
尝试导入PyTorch来验证安装是否成功。在Python交互式环境中执行以下命令:

import torch
print(torch.__version__)
print(torch.cuda.is_available())

如果没有错误并且输出显示与安装的PyTorch版本匹配的版本号,以及CUDA可用性为True,则表示安装成功。
当然,若此时未配置好CUDA环境,则大概率还是显示False的,因此,我们再来说说CUDA环境配置。

二、CUDA环境配置

如果没配置好环境,在运行pytorch时会报错

No CUDA runtime is found, using CUDA_HOME='/usr/local/cuda'

因此我们配置环境需要分两步:

1. 检查并配置CUDA环境变量

通过运行以下命令检查环境变量:

echo $CUDA_HOME

如果未输出任何内容,则表示CUDA环境变量未设置。可以通过将以下行添加到您的shell配置文件(如.bashrc或.bash_profile)中来设置环境变量

export CUDA_HOME=/usr/local/cuda

保存文件后,运行以下命令使环境变量生效:

source ~/.bashrc

2. 检查并配置LD_LIBRARY_PATH环境变量

通过运行以下命令查看当前LD_LIBRARY_PATH的值:

echo $LD_LIBRARY_PATH

如果LD_LIBRARY_PATH为空或未包含CUDA库路径,则可以使用以下命令将CUDA库路径添加到LD_LIBRARY_PATH中:

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

这将把/usr/local/cuda/lib64添加到现有的LD_LIBRARY_PATH路径中。如果CUDA库位于其他路径下,需要相应地修改上述命令中的路径。
使用以下命令验证LD_LIBRARY_PATH是否正确设置:

echo $LD_LIBRARY_PATH

确保输出中包含CUDA库路径。

二、配置程序包环境

1. 在服务器上安装程序包,优先选用conda install 命令

conda install 包名=版本号   ##如果不加,默认最新版本

如果出现安装找不到包名,

Solving environment: failed with initial frozen solve. Retrying with flexible solve.

PackagesNotFoundError: The following packages are not available from current channels:

  - 包名

Current channels:

  - https://conda.anaconda.org/default/linux-64
  - https://conda.anaconda.org/default/noarch
  - https://conda.anaconda.org/conda-forge/linux-64
  - https://conda.anaconda.org/conda-forge/noarch
  - https://conda.anaconda.org/nvidia/linux-64
  - https://conda.anaconda.org/nvidia/noarch
  - https://conda.anaconda.org/pytorch/linux-64
  - https://conda.anaconda.org/pytorch/noarch

To search for alternate channels that may provide the conda package you're
looking for, navigate to

    https://anaconda.org

and use the search bar at the top of the page.

可能是因为,该包是一个外部的Python库,你可以使用pip来安装它。

pip install 包名

特别地,有些外部包,需要先连接到网址,再pip安装。以下以“tltorch”为例进行演示

git clone https://github.com/tensorly/torch   ##此链接是tltorch程序包所处仓库,一般可从官方文档或是GitHub上找到

以下会出现

Cloning into 'torch'...
remote: Enumerating objects: 3037, done.
remote: Counting objects: 100% (302/302), done.
remote: Compressing objects: 100% (112/112), done.
remote: Total 3037 (delta 219), reused 217 (delta 188), pack-reused 2735
Receiving objects: 100% (3037/3037), 3.85 MiB | 6.35 MiB/s, done.
Resolving deltas: 100% (2156/2156), done.
Checking connectivity... done.

表示连接成功。使用如下命令即可完成安装文章来源地址https://www.toymoban.com/news/detail-858500.html

pip install tltorch

到了这里,关于在服务器上安装pytorch并配置CUDA环境变量的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 服务器安装 anaconda & conda: command not found [解决方案] & bashrc文件中环境变量配置错误,导致linux命令无法正常使用的解决方案

    由于连接的服务器,无法直接在anaconda官网上下载安装文件,所以使用如下方法: 之后一直按 enter ,直到出现提示要输入 yes or no ,输入 yes 显示以下信息即为安装成功 在终端输入conda info --envs查看anaconda是否安装成功,发现报错:conda: command not found 原因在于: ~/.bashrc文件没

    2024年02月06日
    浏览(95)
  • 服务器安装annaconda并安装pytorch等环境教程【完整】

    实验室服务器自带的解释器环境太过老旧,且经常报错,因此安装一个自己的anaconda环境创建属于自己的pytorch配置。 1、首先进入anaconda官网下载anaconda安装包 Free Download | Anaconda 我这里是Linux服务器因此选择Linux版本,这里的python3.11是指anaconda的基础环境(base)的python版本是3.1

    2024年04月17日
    浏览(37)
  • nvidia驱动 && docker镜像cuda ,anaconda,pytorch下载ubuntu20.04&&pycharm远程连接远端服务器docker中的conda环境(完整操作)

    内含一整套操作,从设置容器到远程连接。 操作环境: 服务器:ubuntu 20.04 本机:win10 IDE:pycharm 专业版 下载驱动很容易的,下面我们来介绍一种最简单的方法。    插个小曲,删除驱动代码 参考网站里有很详细的解说,我们只再列出需要的代码。  当输入这个命令时 sudo d

    2024年02月04日
    浏览(63)
  • 服务器机器学习环境搭建(包括AanConda的安装和Pytorch的安装)

    在学校中,我们在学校中是以用户的身份进行访问学校的服务器的。整体框架大致如下: 我们与root用户共享服务器的一些资源,比如显卡驱动,Cuda以及一些其他的公共软件。 一般情况下, 只有root用户,才有权力管理公共资源。比如Cuda的安装,更新等等。 普通用户可以进

    2024年03月17日
    浏览(60)
  • 在GPU服务器(Linux)上安装Anaconda和PyTorch环境

    Anaconda官网:https://repo.anaconda.com/archive/ 根据自己需要,复制安装包名字,以Anaconda3-2023.07-2-Linux-x86_64.sh为例 命名规则:Anaconda3-版本号-Linux-x86_64.sh 在终端输入命令, 下载 安装包 运行安装脚本 ,可以指定路径 bash 安装包名字 -p PATH -u 安装完成后, 设置环境变量 ,把Anaconda下

    2024年02月11日
    浏览(52)
  • 远程服务器配置 Anaconda 并安装 PyTorch 详细教程

    进入 anaconda 官网,因为服务器是 Linux 系统,所以点击下图图标: 点击下图位置(一般情况下下载这个即可),即可开始下载 安装anaconda所需的文件,我这里是 Anaconda3-2022.10-Linux-x86_64.sh (后续更新版本会有差别): 下载好后我们将 Anaconda3-2022.10-Linux-x86_64.sh 文件上传到远程

    2023年04月21日
    浏览(44)
  • linux服务器安装python环境配置

    跳板机是一个可以从公共网络访问的服务器,它允许用户通过 SSH 连接进入私有网络中的其他服务器。如上图所示通过跳板机可以连接上7个私有的服务器 当你连接到跳板机时,你可以使用 SSH 隧道或代理来访问私有网络中的其他服务器。当你使用 SSH 隧道或代理时,你实际上

    2024年02月06日
    浏览(137)
  • 基于远程服务器安装配置Anaconda环境及创建python虚拟环境详细方案

    清华大学开源软件镜像站:点击打开链接 参考文章:点击打开《基于Windows下Anaconda创建python虚拟环境教程》文章 Pytorch各版本下载网页:点击打开链接 pytorch-geometric各版本下载网页:点击打开链接

    2023年04月09日
    浏览(67)
  • Ubuntu环境下的Tomcat服务器安装及其自启动配置

    仅供自己记录所用 1、 Tomcat 下载与安装         注意:在安装tomcat之前需要安装Java,JDK                 首先到官网下载安装包:Apache Tomcat® - Welcome! 下载到/usr/local/tomcat/下面并解压:tar -zxvf apache-tomcat-8.5.87.tar.gz 接下来就是给Tomcat文件添加使用权限:sudo chmod 755 -R apa

    2024年02月02日
    浏览(74)
  • 服务器端安装jupyter notebook并在本地使用与环境配置一条龙服务【服务器上跑ipynb】

    路径是 ~/.jupyter/jupyter_notebook_config.py 上述代码会生成一个密钥,记住该密钥。 打开配置文件后,shift+g跳到末尾,i进入编辑模式,插入以下代码: (最后一行我没有用到,需要的可以取消注释) esc退出编辑,shift + :wq保存 如 最后,然后在本地打开浏览器输入以下内容: 初次

    2024年02月14日
    浏览(62)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包