Ubuntu 下 Slurm 配置文件:如何设置节点 CPU 数
在 Ubuntu 系统下,Slurm 的配置文件是 slurm.conf,可以使用以下步骤来配置节点 CPU 数:
- 打开 slurm.conf 文件,该文件通常位于 /etc/slurm-llnl/ 目录下,可以使用以下命令来打开该文件:
sudo nano /etc/slurm-llnl/slurm.conf
- 找到 NodeName 选项,该选项用于定义节点名称和节点属性,例如:
NodeName=node1 NodeAddr=192.168.1.1 CPUs=8
其中,node1 是节点名称,192.168.1.1 是节点 IP 地址,CPUs=8 表示该节点有 8 个 CPU。
- 如果需要配置多个节点,可以在 NodeName 选项下添加多个节点,例如:
NodeName=node1 NodeAddr=192.168.1.1 CPUs=8
NodeName=node2 NodeAddr=192.168.1.2 CPUs=16
-
保存 slurm.conf 文件并退出编辑器。
-
重新启动 slurm 服务,以使配置生效,可以使用以下命令重新启动 slurm 服务:
sudo systemctl restart slurmd.service
- 使用 sinfo 命令来查看节点信息,例如:
sinfo -N
该命令将显示所有节点的信息,包括节点名称、状态、CPU 数等。
注意:在配置节点 CPU 数之前,需要先安装和配置 Slurm 集群,确保集群中所有节点都可以正常工作。
原文地址: https://www.cveoy.top/t/topic/oYME 著作权归作者所有。请勿转载和采集!