Hydra MPI的最佳进展是什么?

时间:2011-05-22 23:00:14

标签: mpi mpich

我正在研究自动与MPICH2一起发布的新进程管理器,但直到现在我还无法弄清楚这个实现有什么大的进步,有人知道一个很好的教程或有一些经验吗?
氩维基是一种太简单的方法:http://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager

2 个答案:

答案 0 :(得分:9)

从我工作的角度来看,最大的单一进步是流程启动的可扩展性。使用基于MPICH2的MPI实现中的先前进程启动器启动8000多个任务作业非常缓慢,并且由于超时或其他网络问题而经常失败,这些问题几乎排除了基于MPICH2的MPI用于我们最大的工作。但Hydra有一个很好的分层启动模型,它也可以利用您的资源管理器。

拓扑感知分配策略也很好,但与作业启动失败(或花费数小时)和作业成功之间的差异相比,它是二阶效应。

答案 1 :(得分:5)

我完全同意乔纳森关于工作启动时间的实质性改善。此外,在几乎每个方面,hydra通常比以前的流程管理器更有用,更强大。它启动更可靠,具有更多功能(进程核心绑定,基于格式的输出文件重定向,资源管理器和批处理调度程序集成等),并且比MPICH2的所有先前进程管理器具有更少的神秘错误消息。

另一个关键考虑因素是积极维护hydra,而此时几乎所有其他PM都已弃用和/或不受支持。因此,如果您报告九头蛇的错误,它可能会得到修复,这对于MPD或外壳来说是不正确的。

AFAIK,如果您知道自己在做什么,也可以使用hydra来启动非MPI工作,例如UPC计划。