是SLURM控制器和"工人"在同一个节点中可能吗?

时间:2018-03-29 08:38:01

标签: ubuntu slurm

我有四个节点,它们被设计成" worker"计算节点。因为我缺少另一台机器作为" head"我想将其中一个节点用作"控制器",但也可以是" worker"同时。这种设置可行吗?我怎样才能做到这一点?如果是这样,这样做是否明智?

1 个答案:

答案 0 :(得分:1)

  

这种设置可以吗?

只需将节点添加到分区即可。

例如,如果我的前端是:

ControlMachine=frontend

我会在我的节点列表中配置它:

NodeName=frontend CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...
NodeName=node00 CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...
NodeName=node01 CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...  
NodeName=node02 CoresPerSocket=6 Sockets=2 ThreadsPerCore=1 ...

最后我会将它们添加到分区中:

PartitionName=main Nodes=frontend,node00,node01,node02
  

如果是这样,这样做是否明智?

我猜它不是一个生产集群,所以它不会成为问题。当然,该节点的负载会更多,但您不太可能注意到它。