Ubuntu 系统下 Slurm 节点状态变为 Drain 的解决方法
当您在 Ubuntu 系统下修改了 Slurm 配置文件后,节点状态变成了'drain',可能是因为您在配置文件中启用了'drain'属性。'drain'属性用于将节点从集群中暂时删除,以便进行维护或升级操作。
要解决这个问题,您可以按照以下步骤操作:
-
在 slurm.conf 配置文件中,找到'drain'属性,并将其设置为'NO'。
-
保存并关闭配置文件。
-
在终端中运行以下命令,以重新加载 Slurm 配置文件:
sudo systemctl restart slurmctld
-
运行以下命令,以查看节点状态:
sinfo
如果节点状态已经恢复正常,则说明您已经成功解决了问题。
如果以上步骤无法解决问题,您可以尝试重启 Slurm 服务或重新启动节点,以恢复节点的正常状态。
原文地址: https://www.cveoy.top/t/topic/oYTJ 著作权归作者所有。请勿转载和采集!