tensorflow-GPU环境搭建

这篇具有很好参考价值的文章主要介绍了tensorflow-GPU环境搭建。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


title: tensorflow-GPU环境搭建
description: 整理一次成功的安装过程以及注意事项
date: 2024-01-15 11:49:55
categories: tensorflow 环境安装
主页:  https://knockharder.github.io/

背景

最近在学习AI相关知识,需要使用 gpu 运行 tensorflow 代码,选择在腾讯云上搭建环境

要点总结

1 版本号对齐

安装 tensorflow 与 GPU 支持需要对齐以下软件的版本号(按依赖顺序排列):

  • GPU 驱动版本号
  • CUDA 版本号
  • cudnn 版本号
  • tensorflow 版本号

由于 tensorflow 位于最下游,因此更新时机最晚,因此实际安装时应从 tensorflow 的版本号反向推导上游的版本号信息。
各软件包的版本号可以参见 tensorflow 的官方网站

GPU驱动的版本号,可以通过驱动下载页查看。
需要找到适配目标CUDA版本的驱动版本

2 环境安装

2.1 使用腾讯云自动安装环境

在腾讯云上创建 GPU 实例时,可以选择 GPU驱动、cuda、cudnn版本号,在实例启动后自动安装。需要注意的是腾讯云默认的版本号并没有对齐,
需要自动调整需要的版本号

这里我们的操作系统选择了 20.04 而不是最近的 22.04 ,就是因为 22.04 的 GPU 驱动最低支持的 cuda 版本是 11.7 ,
与 tensorflow 的 cuda 版本不匹配

环境安装好后,按安装手册中的描述,使用 pip 安装 tensorflow 即可

pip install tensorflow==2.4.0

2.2 手动安装环境

本次安装的目标版本如下表

python tensorflow cudnn cuda nvidia driver
3.9 2.6.0 8.1 11.2 460.106.00

a.安装 N 卡驱动

按安装手册中说明安装驱动。
需要注意的是安装手册中的驱动安装命令,需要替换成你需要的驱动版本

sudo apt-get -y install cuda-drivers-460

由于ubuntu 系统安装后,有默认的驱动,在安装 Nvidia 驱动后禁用默认驱动nouveau:
打开/etc/modprobe.d/blacklist.conf文件,并添加以下内容:

blacklist nouveau
options nouveau modeset=0

然后重启服务器,并输入nvidia-smi命令,当出现以下输出时,说明 nvidia 驱动已启用

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.106.00   Driver Version: 460.106.00   CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            On   | 00000000:00:08.0 Off |                    0 |
| N/A   33C    P8     9W /  70W |      4MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1454      G   /usr/lib/xorg/Xorg                  4MiB |
+-----------------------------------------------------------------------------+

b.安装 cuda

按安装手册描述安装cuda,同样的安装命令需要替换成目标版本。

sudo apt install cuda-toolkit-11-2

cuda 的安装时间比较长,为避免断开连接,可以使用 tmux 管理会话

c.安装 cudnn

按安装手册描述安装 cudnn。
cudnn 的可用版本号可以通过apt-cache命令查看,然后选择对应的版本

apt-cache madison libcudnn8 | grep 11.2
cudnn_version=8.1.1.33 && cuda_version=cuda11.2

d.安装 tensorflow

按安装手册中的描述创建虚环境,并安装 tensorflow。

pip install tensorflow==2.6.0

3 检查环境安装结果

安装 tensorflow

pip install tensorflow==2.4.0

执行 python 代码

import tensorflow as tf
print(tf.config.list_physical_devices('GPU'))

得到以下输出,说明环境安装成功文章来源地址https://www.toymoban.com/news/detail-799076.html

[PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

到了这里,关于tensorflow-GPU环境搭建的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Windows安装tensorflow-gpu(1050Ti,cuda11.6,cuDNN7.6.5,python3.6,tensorflow-gpu2.3.0)

    参考:https://blog.csdn.net/qq_43215538/article/details/123852028 首先查看本机GPU对应的cuda版本,如下图所示,本机cuda版本为11.6,后面选择的cuda版本不要超过这里的版本就好。 https://developer.nvidia.com/cuda-toolkit-archive选择相应的cudatoolkit版本下载,如这里选择版本一定要注意,因为cuda版本

    2023年04月08日
    浏览(51)
  • MacOS M2:配置Tensorflow-GPU版

    本文主要介绍MacOS 12.x系统下的Tensorflow配置。总的来说,配置Mac版本的Tensorflow只需要三步:第一步配置一个虚拟环境,建议选择miniconda;第二步创建conda环境;第三步安装Tensorflow。 1、安装 Miniconda 1.1 彻底删除anaconda (1)下载  anaconda-clean   用于删除相关配置文件 2)删除

    2024年04月13日
    浏览(78)
  • win10 安装 tensorflow-gpu 2.10.0

    系统配置 系统 win10 x64 显卡 GTX 1660 Ti CUDA 12.2 cudnn 8.9 查看版本对应: https://tensorflow.google.cn/install/source_windows#gpu Version Python version Compiler Build tools cuDNN CUDA tensorflow_gpu-2.10.0 3.7-3.10 MSVC 2019 Bazel 5.1.1 8.1 11.2 这里查看我 系统配置 我安装 python 3.10 和 tensorflow_gpu-2.10.0 安装 conda 安装

    2024年02月14日
    浏览(47)
  • tensorflow,tensorflow-gpu, CUDA, cuDNN,Python, numpy对应版本

    本机GPU是NVIDIA GeForce GTX 1650, 支持的最高版本CUDA是12.0。想要在Windows下使用GPU跑深度学习模型,需要使用tensorflow-gpu,其目前最高版本是2.6.0。所以其他依赖环境均按照tensorflow-gpu的需求来配置。 Tensorflow-gpu 2.6.0 (目前为止最高版本) Python 3.9.18 (能够支持tensorflow-GPU的最高Python版

    2024年04月17日
    浏览(79)
  • ubuntu20.04 docker 下编译 tensorflow-gpu

    配置: 系统 ubuntu 20.04 LTS 显卡 GTX 1060 6G 1 安装cudatoolkit (我选 CUDA Toolkit 12.2 ) NVIDIA CUDA Installation Guide for Linux https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#prepare-ubuntu 选择 2.7 步骤,下载 deb 包,本地安装 2.7. Download the NVIDIA CUDA Toolkit https://developer.nvidia.com/cuda-downloa

    2024年02月13日
    浏览(48)
  • Docker【部署 05】docker使用tensorflow-gpu安装及调用GPU踩坑记录

    Other than the name, the two packages have been identical since TensorFlow 2.1 也就是说安装2.1版本的已经自带GPU支持。 不同型号的GPU及驱动版本有所区别,环境驱动及CUDA版本如下: 在Docker容器中的程序无法识别CUDA环境变量,可以尝试以下步骤来解决这个问题: 检查CUDA版本:首先,需要确认

    2024年02月08日
    浏览(53)
  • 解决CUDA 11.6版本对应的tensorflow-gpu版本问题

    个人电脑相关配置版本信息 (超级超级新的版本,以至于适配方面花了很长时间来搞) cuda  11.6 cudnn  8.9.0 python  3.10 对应安装的gpu版本 tensorflow-gpu  2.10.0 对应代码 具体怎么安装的我已经放在文章底部啦,改镜像源什么的也不多说~ 感谢参考嘿(-v- ---------------------------------

    2024年02月08日
    浏览(59)
  • [conda]tf_agents和tensorflow-gpu安装傻瓜式教程

    1.打开终端或Anaconda Prompt(Windows用户)。 2.输入以下命令创建新的Python环境:    其中, env_name 是您想要创建的环境名称, version 是您想要安装的Python版本号。例如,要创建名为 python37 的Python 3.7环境,请输入以下命令: 3.进入到要使用的环境去使用pip安装应用 进入后显示如

    2024年02月11日
    浏览(46)
  • tensorflow-gpu 2.3.0安装 及 相关对应版本库安装(Anaconda安装)

    目录 如需转载,请标明出处,谢谢。 一、安装tensorflow-gpu2.3.0 二、配置其他相关的库 很多人以为安装完tensorflow-gpu就是一切都结束了,但是殊不知,python中的很多库,比如numpy,matplotlib等库,就与我们的tensorflow的版本有对应 总结 对于anaconda的下载,网上的教程很多,而且很

    2024年02月02日
    浏览(70)
  • CUDA 11.7 版本下安装Tensorflow-gpu以及Keras (Windows以及Ubuntu)

    ​ 记录:在复现论文代码时碰到使用keras环境,于是在自己windows系统的台式机(RTX 3080;CUDA 11.7)上进行了安装,但是发现台式机的显存无法支持程序的运行。于是将一摸一样的环境配置到更大现存的Ubuntu服务器(CUDA 11.7)上,但配置环境出错,一直无法调用GPU。经过一天的

    2024年02月01日
    浏览(63)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包