scontrol cancel命令用于取消正在运行的Slurm作业或任务。它的语法如下:

scontrol cancel [JobId | TaskId | NodeList | PartitionName | JobName]

其中,参数可以是作业ID(JobId)、任务ID(TaskId)、节点列表(NodeList)、分区名称(PartitionName)或作业名称(JobName)。

使用scontrol cancel命令取消作业时,可以使用以下选项:

  • -b:在后台模式下取消作业。
  • -H:取消指定作业并将其保持在HOLD状态。
  • -r:取消作业并重新排队。
  • -f:强制取消作业。

例如,要取消作业ID为12345的作业,可以使用以下命令:

scontrol cancel 12345

要取消名为myjob的作业,可以使用以下命令:

scontrol cancel myjob

要取消节点列表为node1,node2的任务,可以使用以下命令:

scontrol cancel NodeList=node1,node2

要取消分区为gpu的所有作业,可以使用以下命令:

scontrol cancel PartitionName=gpu

请注意,取消作业或任务需要有相应的权限

Ubuntu系统slurm的scontrol cancel

原文地址: https://www.cveoy.top/t/topic/hHcX 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录