slurm安装遇到的问题以及解决办法

这篇具有很好参考价值的文章主要介绍了slurm安装遇到的问题以及解决办法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、如何初始化分区(节点)状态(将drain状态转为idel)

sudo scontrol update NodeName=roota-X299-UD4-Pro State=RESUME

2、如何删除节点上的任务(占用的和申请中的)

(149条消息) SLURM 节点状态总是drained问题_kongxx的博客-CSDN博客_slurm drain

scancel 16(进程号)

3、查看分区信息和节点信息

查看分区信息 scontrol show partition

查看节点信息 scontrol show node

4、启动slurmd和slurmctld报错(slurmd.service: Failed with result 'exit-code'.)

在Ubuntu 16.04桌面上安装/模拟SLURM:slurmd无法启动 中国服务器网 (zgserver.com)

解决办法:

sudo slurmctld -dvvv

sudo slurmd -dvvv

5、sudo systemctl start slurmd失败,并且systemctl status slurmd中出现Failed to start slurm node daemon.时候,同时cat /var/log/slurm.log后看到cannot create proctrack context for proctrack/cgroup错误的时候。

systemctl status slurmd中修改ProctrackType的值为proctrack/linuxproc

6、slurmctld报错fatal: Invalid SelectTypeParameters: CR_MEMORY (16), You need at least CR_(CPU|CORE|SOCKET)*

引用:slurm作业系统只能同时运行一个任务 - 计算机使用与Linux交流 (Computer Usage and Linux) - 计算化学公社 (keinsci.com)

SelectType=select/cons_tres
SelectTypeParameters=CR_Core文章来源地址https://www.toymoban.com/news/detail-769698.html

到了这里,关于slurm安装遇到的问题以及解决办法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 安装unity时遇到的问题与解决办法

    我遇到的问题 unity package manager error, vs安装时提示网络问题, hub个人许可证不见了且申请不了   百度真是个好东西,对我这种小白极为友好,写一下我踩的坑   1.unityhub版本问题 下最新版也不是不好,但我还是觉得2.5版本好(我安装最新版会弄不出许可证) 注意,安装un

    2023年04月10日
    浏览(29)
  • 安装opencv-python遇到的问题及解决办法

           由于本人是小白,课程作业为不限软件不限语言进行横缝检测,想通过opencv进行相应的图片处理,本文是在安装导入过程中遇到的问题及解决办法,谨以此文感谢我实验室大佬。 环境:anaconda,python3.8, PyCharm2020 首先是我在导入过程中几个参考的看起来很靠谱的文章:

    2024年02月09日
    浏览(49)
  • UE4及Airsim安装时遇到的问题及解决办法

    我根据知乎上一篇博主的教程来进行安装UE4和Airsim,期间遇到了一些问题,在这里总结并给出可能的解决方法 教程:(解密AirSim-初稿)第一章:初识AirSim - 知乎 (zhihu.com) UE4是在Epic平台上的,而这个游戏平台在几家游戏平台里面虽然不是最慢的,但是速度也不稳定,我连接校

    2024年02月15日
    浏览(33)
  • 在使用Python爬虫时遇到503 Service Unavailable错误解决办法汇总

    在进行Python爬虫的过程中,有时会遇到503 Service Unavailable错误,这意味着所请求的服务不可用,无法获取所需的数据。为了解决这个常见的问题,本文将提供一些解决办法,希望能提供实战价值,让爬虫任务顺利完成。 首先了解503 Service Unavailable错误 503 Service Unavailable错误是

    2024年02月14日
    浏览(23)
  • ChatGLM2-6B安装详解(Windows/Linux)及遇到的问题解决办法

    最近ChatGLM-6B发布了第二代ChatGLM2-6B,于是果断部署了一下试试水。下面讲解详细部署过程,并讲解部署时候遇到的问题以及解决办法。 1. 安装python、git等必须工具 在要部署项目之前,需要部署必须的一些工具。下面详细讲解每一步所需的工具安装步骤。 1.1 安装python 对于如

    2024年02月15日
    浏览(29)
  • python 3.10安装Box2D遇到的问题及解决办法汇总

    近期在入门强化学习,搭建环境过程遇到很多问题,网上资料比较分散,本人查阅了许多资料才得以解决,将问题与解决方法整理汇总如下。 本人电脑上同时有python3.6和python3.10两个版本,均在同一盘符下,首先尝试直接在pycharm内安装Box2D包,即在pycharm上通过:文件-设置-项

    2024年02月06日
    浏览(51)
  • 【ElasticSearch】一键安装ElasticSearch与Kibana以及解决遇到的问题

    目录 一、安装ES 二、安装Kibana 三、遇到的问题 按顺序复制即可 docker network create es-net # 创建网络 docker pull elasticsearch:7.12.1 # 拉取镜像 mkdir -p /root/es/data # 创建数据卷 mkdir -p /root/es/plugins # 创建数据卷 chmod 777 /root/es/** # 设置权限 docker run -d --name=es -e \\\"ES_JAVA_OPTS=-Xms512m -Xmx512m\\\" -

    2024年02月12日
    浏览(35)
  • Jenkins在Linux环境下的安装与配置,包含遇到的问题以及解决方法

    Jenkins是一个开源软件项目,是基于Java开发的一种持续集成(CI)工具,用于解决持续重复的部署、监控工作;它一个开放易用的软件平台,大大简化软件的持续集成。 目前持续集成(CI)已成为许多软件开发团队的常见做法。它是一种实践,旨在缓和和稳固软件的构建过程,并

    2024年02月02日
    浏览(40)
  • Ubuntu20.04安装sql server(内含多个可能遇到的问题以及解决方法)

    这学期的课程有数据库,因此今天(2022.3.6)在ubuntu上安装了sql server2019 即使根据官方指引进行安装也会遇到不少问题,因此为在这里总结了我自己遇到的所有问题,以及给出了相应的解决方案,希望能为后来的人解决一些困惑和麻烦 根据指引,在终端输入第一条语句:(导入

    2024年02月05日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包