Ubuntu系统slurm的scontrol命令
在Ubuntu系统上,scontrol命令用于管理和控制Slurm集群。以下是一些常见的scontrol命令及其用法:
-
显示Slurm集群的状态:
scontrol show cluster -
显示所有节点的状态:
scontrol show nodes -
显示特定节点的状态:
scontrol show node <node_name> -
显示特定作业的状态:
scontrol show job <job_id> -
显示所有作业的状态:
scontrol show jobs -
杀死一个作业:
scontrol cancel job <job_id> -
暂停一个作业:
scontrol suspend job <job_id> -
恢复一个作业:
scontrol resume job <job_id> -
设置作业的优先级:
scontrol update job <job_id> Priority=<priority> -
设置节点的状态:
scontrol update nodename=<node_name> state=<state>
这些只是scontrol命令的一部分,还有其他更多的命令和选项可以使用。你可以通过运行scontrol --help命令查看scontrol的完整帮助文档
原文地址: http://www.cveoy.top/t/topic/hHcQ 著作权归作者所有。请勿转载和采集!