PaddleDetection系列2--NCCL安装及测试

这篇具有很好参考价值的文章主要介绍了PaddleDetection系列2--NCCL安装及测试。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

安装paddle 环境,使用多卡训练,需要安装NCCL,注意,需要先安装NCCL,再安装paddle

1 系统信息查看

1.1 查看本机的操作系统和位数信息:

uname -m && cat /etc/*release

我的系统输出为
CentOS Linux release 7.9.2009

1.2 确认处理器架构

python3 -c "import platform;print(platform.architecture()[0]);print(platform.machine())"

我的系统输出为x86_64,代表x86_64架构(或称作 x64、Intel 64、AMD64)架构。

1.3 确认cuda版本

nvcc -V

我的系统输出

Cuda compilation tools, release 11.1, V11.1.105

2 NCCL安装

2.1 根据上面的系统架构以及CUDA版本,进入官网下载匹配的nccl,若想获取旧版本,进入旧版本链接

2.2 选择下图的安装版本和安装方式

PaddleDetection系列2--NCCL安装及测试,PaddleDetection,深度学习,paddle

具体命令为

for RedHat/CentOS 7

sudo yum-config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-rhel7.repo

For RHEL/Centos:

sudo yum install libnccl-2.8.4-1+cuda11.1 libnccl-devel-2.8.4-1+cuda11.1 libnccl-static-2.8.4-1+cuda11.1

提示如下,证明安装成功

已安装:
  libnccl.x86_64 0:2.8.4-1+cuda11.1              libnccl-devel.x86_64 0:2.8.4-1+cuda11.1              libnccl-static.x86_64 0:2.8.4-1+cuda11.1             

完毕!

2.3 测试

$ git clone https://github.com/NVIDIA/nccl-tests.git
$ cd nccl-tests
$ make
$ ./build/all_reduce_perf -b 8 -e 256M -f 2 -g <ngpus>

# nThread 1 nGpus 4 minBytes 8 maxBytes 268435456 step: 2(factor) warmup iters: 5 iters: 20 agg iters: 1 validation: 1 graph: 0
#
# Using devices
#  Rank  0 Group  0 Pid 200875 on  localhost device  0 [0x3b] Tesla T4
#  Rank  1 Group  0 Pid 200875 on  localhost device  1 [0x5e] Tesla T4
#  Rank  2 Group  0 Pid 200875 on  localhost device  2 [0x86] Tesla T4
#  Rank  3 Group  0 Pid 200875 on  localhost device  3 [0xaf] Tesla T4

输出上面信息证明测试成功

3 paddle安装

paddle对CUDA 11.1支持的版本比较少,因此先进入如下链接
查找能够支持的版本,最终选择2.3.2版本paddle,安装命令如下

python3 -m pip install paddlepaddle-gpu==2.3.2.post111 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安装后输出如下信息证明安装成功

Installing collected packages: paddlepaddle-gpu
Successfully installed paddlepaddle-gpu-2.3.2.post111

进入python 环境,输入如下命令以及提示信息,证明nccl已安装成功,可以多卡训练。文章来源地址https://www.toymoban.com/news/detail-757191.html

>>> import paddle
>>> paddle.utils.run_check()

PaddlePaddle works well on 4 GPUs.
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.

到了这里,关于PaddleDetection系列2--NCCL安装及测试的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 深度学习系列——“试错”发展直觉

            试错法以发展直觉 :面对复杂的深度学习问题时,学习者可以通过不断尝试不同解决方案,并观察其对模型性能的影响,逐渐形成一套针对特定任务的有效策略。这些经验有助于提升对深度学习模型工作原理的直观理解。         那么试错法是如何发展直觉的呢?

    2024年02月21日
    浏览(29)
  • 深度学习系列59:文字识别

    使用google加的tesseract,效果不错。 首先安装tesseract,在mac直接brew install即可。 python调用代码: 使用百度家的paddleocr可以达成如下效果: 安装方法:pip install “paddleocr=2.2”,调用代码。 其中画图的部分如果要用的话,需要下载字体库:!git clone https://gh.api.99988866.xyz/https://g

    2024年02月22日
    浏览(33)
  • 深度学习快速入门系列---损失函数

    在深度学习中,损失函数的作用是量化预测值和真实值之间的差异,使得网络模型可以朝着真实值的方向预测,损失函数通过衡量模型预测结果与真实标签之间的差异,反映模型的性能。同时损失函数作为一个可优化的目标函数,通过最小化损失函数来优化模型参数。在本篇

    2024年02月12日
    浏览(36)
  • 深度学习(24)——YOLO系列(3)

    今天YOLOv4理论版 只增强训练成本,但是能显著提高精度,但是不影响推理速度 数据增强:调整亮度,对比度,色调,随机缩放… 网络正则化的方法:dropout,dropblock 类别不平衡——损失函数设计 参考cutmix,以前就存在,将增强的四张图像拼接在一张进行训练(相当于间接增

    2024年02月11日
    浏览(36)
  • 深度学习(22)——YOLO系列(3)

    今天YOLOv4理论版 只增强训练成本,但是能显著提高精度,但是不影响推理速度 数据增强:调整亮度,对比度,色调,随机缩放… 网络正则化的方法:dropout,dropblock 类别不平衡——损失函数设计 参考cutmix,以前就存在,将增强的四张图像拼接在一张进行训练(相当于间接增

    2024年02月09日
    浏览(46)
  • 深度学习(23)——YOLO系列(2)

    yolo-V3完整项目请造访Jane的GitHub :在这里等你哦 今天先写YOLO v3的代码,后面再出v5,v7。 **特此说明:训练使用的COCO数据量太大了,我不想下载,我就直接用test做测试了,但是里面的代码核心还是一样的。当然我会把train的代码也放在这里大家可以用在自己的数据上训练。

    2024年02月11日
    浏览(32)
  • 深度学习入门系列之doc

    这周老师让把深度学习的名词过一遍,小玛同学准备在过一遍Deep Learning名词的同时把基本的模型也过一遍。 感谢杰哥发我深度学习入门系列能让我有机会快速入门。 下面就来doc一些学到的东西 线性感知器 感知器(线性单元)有个问题就是当面对的数据集不是线性可分的时

    2023年04月22日
    浏览(18)
  • 深度学习(28)——YOLO系列(7)

    咱就是说,需要源码请造访:Jane的GitHub :在这里 上午没写完的,下午继续,是一个小尾巴。其实上午把训练的关键部分和数据的关键部分都写完了,现在就是写一下推理部分 在推理过程为了提高效率,速度更快: 1.1 attempt_load(weights) weights是加载的yolov7之前训练好的权重 刚

    2024年02月16日
    浏览(48)
  • 深度学习(27)——YOLO系列(6)

    咱就是说,需要源码请造访:Jane的GitHub :在这里等你哦 嗨,好久不见,昨天结束了yolov7的debug过程,真的在尽力句句理解,我想这应该是我更新的yolo系列的最后一篇,但是仅限于yolo,detect的话题还不会结束,还会继续进行,detect结束以后再说segmentation。和往常以一样的过程

    2024年02月15日
    浏览(38)
  • 【唐宇迪 深度学习-3D点云实战系列】学习笔记

     课程目录如下: https://download.csdn.net/learn/35500/529919 3D点云领域都关注了哪些方向? 课程核心系列-PointNet系列 :点云数据如何处理、点云数据如何进行特征提取。 后续无论是分类、分割、补全、配准检测, 首先都要先对点云数据进行特征提取。 PointNet系列就是重点系列。

    2023年04月25日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包