在Ubuntu系统中搭建Slurm集群的步骤如下:
安装Slurm软件包: 在所有节点上安装Slurm软件包,可以使用以下命令:
sudo apt-get update
sudo apt-get install slurm-wlm
配置Slurm集群:
/etc/slurm/slurm.conf
,配置节点信息、用户信息、队列信息等。sudo mkdir -p /var/spool/slurmctld
sudo mkdir -p /var/spool/slurmd
sudo chown slurm: /var/spool/slurmctld
sudo chown slurm: /var/spool/slurmd
启动Slurm服务: 在主节点上启动Slurm控制节点服务:
sudo systemctl start slurmctld
在所有计算节点上启动Slurm工作节点服务:
sudo systemctl start slurmd
测试Slurm集群:
sinfo
命令查看集群状态:sinfo
srun
命令提交任务进行测试:srun -N2 hostname
以上是在Ubuntu系统中搭建Slurm集群的基本步骤,根据实际情况可能还需要进行其他配置和调整。建议参考Slurm官方文档以获取更详细的配置和使用说明。