温馨提示×

Ubuntu系统中Slurm集群的搭建教程是什么

小樊
118
2024-08-16 02:21:41
栏目: 智能运维

在Ubuntu系统中搭建Slurm集群的步骤如下:

  1. 安装Slurm软件包: 在所有节点上安装Slurm软件包,可以使用以下命令:

    sudo apt-get update
    sudo apt-get install slurm-wlm
    
  2. 配置Slurm集群:

    • 在主节点上编辑Slurm配置文件 /etc/slurm/slurm.conf,配置节点信息、用户信息、队列信息等。
    • 在所有节点上创建Slurm工作目录,例如:
      sudo mkdir -p /var/spool/slurmctld
      sudo mkdir -p /var/spool/slurmd
      sudo chown slurm: /var/spool/slurmctld
      sudo chown slurm: /var/spool/slurmd
      
  3. 启动Slurm服务: 在主节点上启动Slurm控制节点服务:

    sudo systemctl start slurmctld
    

    在所有计算节点上启动Slurm工作节点服务:

    sudo systemctl start slurmd
    
  4. 测试Slurm集群:

    • 在主节点上使用 sinfo 命令查看集群状态:
      sinfo
      
    • 在主节点上使用 srun 命令提交任务进行测试:
      srun -N2 hostname
      

以上是在Ubuntu系统中搭建Slurm集群的基本步骤,根据实际情况可能还需要进行其他配置和调整。建议参考Slurm官方文档以获取更详细的配置和使用说明。

0