当您在 Ubuntu 系统下修改了 Slurm 配置文件后,节点状态变成了'drain',可能是因为您在配置文件中启用了'drain'属性。'drain'属性用于将节点从集群中暂时删除,以便进行维护或升级操作。

要解决这个问题,您可以按照以下步骤操作:

  1. 在 slurm.conf 配置文件中,找到'drain'属性,并将其设置为'NO'。

  2. 保存并关闭配置文件。

  3. 在终端中运行以下命令,以重新加载 Slurm 配置文件:

    sudo systemctl restart slurmctld

  4. 运行以下命令,以查看节点状态:

    sinfo

    如果节点状态已经恢复正常,则说明您已经成功解决了问题。

如果以上步骤无法解决问题,您可以尝试重启 Slurm 服务或重新启动节点,以恢复节点的正常状态。

Ubuntu 系统下 Slurm 节点状态变为 Drain 的解决方法

原文地址: https://www.cveoy.top/t/topic/oYTJ 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录