在Ubuntu系统上,scontrol命令用于管理和控制Slurm集群。以下是一些常见的scontrol命令及其用法:

  1. 显示Slurm集群的状态:

    scontrol show cluster
    
  2. 显示所有节点的状态:

    scontrol show nodes
    
  3. 显示特定节点的状态:

    scontrol show node <node_name>
    
  4. 显示特定作业的状态:

    scontrol show job <job_id>
    
  5. 显示所有作业的状态:

    scontrol show jobs
    
  6. 杀死一个作业:

    scontrol cancel job <job_id>
    
  7. 暂停一个作业:

    scontrol suspend job <job_id>
    
  8. 恢复一个作业:

    scontrol resume job <job_id>
    
  9. 设置作业的优先级:

    scontrol update job <job_id> Priority=<priority>
    
  10. 设置节点的状态:

    scontrol update nodename=<node_name> state=<state>
    

这些只是scontrol命令的一部分,还有其他更多的命令和选项可以使用。你可以通过运行scontrol --help命令查看scontrol的完整帮助文档

Ubuntu系统slurm的scontrol命令

原文地址: http://www.cveoy.top/t/topic/hHcQ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录