什么是slurm集群的最小计算机数量

时间:2014-12-29 07:55:34

标签: cluster-computing slurm

我想设置一个SLURM cluster。我至少需要多少台机器?我可以从两台机器开始(一台只是客户端,一台是客户端和服务器)?

2 个答案:

答案 0 :(得分:2)

你可以开始只使用一台机器,但是2台机器将是最标准的配置,一台机器是控制器,另一台机器是"工人"节点。使用此模型,您可以向群集中添加尽可能多的计算机" worker"节点。这样服务器就不会执行作业,也不会受到工作干扰。

答案 1 :(得分:2)

正如@Carles所写,如果需要,您只能使用一台计算机,同时运行控制器(slurmctld)和工作器(slurmd)守护程序。

如果要测试某些配置并观察Slurm的行为,您甚至可以使用-N <hostname>选项在一台计算机上运行多个worker守护程序来模拟更大的集群。

如果要实际完成某些计算,可以在同一节点上运行控制器和工作守护程序。如果你希望系统仍能响应,只需配置Slurm就可以让它相信系统有1个核心和2GB的RAM,而不是实际为操作系统和Slurm守护进程留出一些空间。

作为旁注,您在问题中链接的页面对应于非常旧版本的Slurm。较新版本的文档托管在Schedmd's website