slurm.conf是Slurm集群管理系统的配置文件,用于定义和配置Slurm的各种参数和选项。以下是slurm.conf的全参数的讲解:

  1. ControlMachine:指定Slurm控制节点的主机名或IP地址。
  2. AuthType:指定Slurm的身份验证类型,可以是auth/munge、auth/none、auth/ssl或auth/tls。
  3. CacheGroups:指定缓存组的名称,用于缓存用户和组的信息。
  4. ClusterName:指定集群的名称。
  5. CryptoType:指定用于加密通信的加密算法类型,可以是cipher/aes、cipher/arcfour、cipher/blowfish等。
  6. JobCompType:指定作业完成记录的类型,可以是jobcomp/filetxt或jobcomp/mysql等。
  7. JobCompLoc:指定作业完成记录的位置,可以是/var/log/slurm/jobcomp.log或mysql://user:password@host/database等。
  8. JobAcctGatherType:指定作业帐户信息的收集类型,可以是jobacct/none、jobacct/gather_job和jobacct/gather_interactive。
  9. JobAcctGatherFrequency:指定作业帐户信息的收集频率,可以是jobacct/none、jobacct/minute、jobacct/hourly、jobacct/daily和jobacct/weekly。
  10. MpiDefault:指定MPI作业的默认启动程序,可以是mpich、mvapich、openmpi等。
  11. PlugStackConfig:指定插件堆栈的配置文件路径。
  12. ProctrackType:指定进程跟踪类型,可以是proctrack/pgid或proctrack/cgroup。
  13. ReturnToService:指定作业重新提交到服务的超时时间。
  14. SuspendExcNodes:指定暂停排除节点的名称。
  15. SuspendRate:指定暂停速率,即每秒暂停的作业数。
  16. SuspendTimeLimit:指定作业的暂停时间限制。
  17. SlurmctldPort:指定slurmctld的监听端口。
  18. SlurmctldLogFile:指定slurmctld的日志文件路径。
  19. SlurmdPort:指定slurmd的监听端口。
  20. SlurmdLogFile:指定slurmd的日志文件路径。
  21. SlurmdDebug:指定slurmd的调试级别。
  22. SlurmdSpoolDir:指定slurmd的工作目录。
  23. SlurmUser:指定Slurm系统所使用的用户。
  24. StateSaveLocation:指定状态保存文件的位置。
  25. SuspendTimeLimit:指定作业的暂停时间限制。

以上是slurm.conf的全参数的讲解,这些参数可以根据需要进行相应的配置

ubuntu系统slurmconf全参数讲解

原文地址: https://www.cveoy.top/t/topic/hK7Q 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录