在 Slurm 中,如果计算节点上的路径下没有文件,需要先在计算节点上创建相应的文件,以便任务能够访问它们。可以使用以下命令在计算节点上创建文件:

srun -N <node_count> -n <task_count> -w <node_name> touch <file_path>

在上面的命令中,<node_count> 表示节点数量,<task_count> 表示任务数量,<node_name> 表示节点名称,<file_path> 表示要创建的文件路径。

对于节点用户名不一致的情况,可以通过在 Slurm 配置文件中指定节点的用户名来解决。可以在 /etc/slurm-llnl/slurm.conf 文件中添加以下行:

NodeName=node1 Procs=2 RealMemory=1000 State=UNKNOWN NodeHostName=node1 NodeAddr=192.168.0.1 Sockets=1 CoresPerSocket=2 ThreadsPerCore=1  SocketsPerBoard=1  Boards=1  Gres=gpu:2  UserName=user1

在上面的配置中,NodeName 表示节点名称,UserName 表示节点的用户名。可以为每个节点指定不同的用户名。

然后,可以使用以下命令在计算节点上运行任务:

srun -N <node_count> -n <task_count> -w <node_name> -u <node_username> <command>

在上面的命令中,<node_count><task_count><node_name> 与上面的命令相同,<node_username> 表示节点的用户名,<command> 表示要运行的命令。

Slurm 中处理计算节点不同用户名和文件访问问题

原文地址: https://www.cveoy.top/t/topic/oYkH 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录