我正在使用GE2011.11。以前,我使用的是Torque / Maui。在毛伊岛,有一个分区的概念,我们可以在逻辑上划分集群。节点不能属于多个分区。
在GE,我正在考虑主机组来实现这一目标,但是节点(主机)可以属于多个主机组,这是不可取的。任何想法,我们如何实现与主机组的分区?
在GE,有一项称为多聚类的功能。我们可以使用此功能来实现分区吗?任何想法,我们如何使用它?
答案 0 :(得分:0)
使用SGE,您可以手动修改主机组,以便主机(节点)仅存在于单个主机组中。然后,您可以创建仅使用单个主机组的队列。然后,用户将作业提交到特定队列(其本身可受用户限制)以访问特定主机组。这将有效地划分你的网格。
执行此设置时需要注意的基本事项与all.q队列和@allhosts主机组有关。如果从@allhosts组中删除所有主机,您应该可以这样做。
如果您有其他问题,请告诉我,我很乐意为您提供帮助,因为我多年来一直在管理SGE群集。
答案 1 :(得分:0)
由于管理员定义了主机组的成员资格,因此只需定义组以便不重叠。如果要控制哪些用户可以在哪个分区上运行,可以通过为每组用户定义grid engine acls / usersets并使用增强的队列配置语法将不同的列表与队列定义中的每个主机组相关联来实现。
user_lists chemists,[@physicshosts=physicists],[@biologyhosts=biologists]
如果您要做的是确保给定作业在一组主机上运行,或者另一组但不是混合,那么您需要定义多个相同的并行环境并使用类似的技巧将每个PE与不同的主机组相关联
pe_list mpich-A,[@switchb=mpich-B],[@switchc=mpich-C]
用户在提交作业时请求通配符PE:
#$ -pe mpich-* 8