我正在研究自动与MPICH2一起发布的新进程管理器,但直到现在我还无法弄清楚这个实现有什么大的进步,有人知道一个很好的教程或有一些经验吗?
氩维基是一种太简单的方法:http://wiki.mcs.anl.gov/mpich2/index.php/Using_the_Hydra_Process_Manager
答案 0 :(得分:9)
从我工作的角度来看,最大的单一进步是流程启动的可扩展性。使用基于MPICH2的MPI实现中的先前进程启动器启动8000多个任务作业非常缓慢,并且由于超时或其他网络问题而经常失败,这些问题几乎排除了基于MPICH2的MPI用于我们最大的工作。但Hydra有一个很好的分层启动模型,它也可以利用您的资源管理器。
拓扑感知分配策略也很好,但与作业启动失败(或花费数小时)和作业成功之间的差异相比,它是二阶效应。
答案 1 :(得分:5)
我完全同意乔纳森关于工作启动时间的实质性改善。此外,在几乎每个方面,hydra通常比以前的流程管理器更有用,更强大。它启动更可靠,具有更多功能(进程核心绑定,基于格式的输出文件重定向,资源管理器和批处理调度程序集成等),并且比MPICH2的所有先前进程管理器具有更少的神秘错误消息。
另一个关键考虑因素是积极维护hydra,而此时几乎所有其他PM都已弃用和/或不受支持。因此,如果您报告九头蛇的错误,它可能会得到修复,这对于MPD或外壳来说是不正确的。
AFAIK,如果您知道自己在做什么,也可以使用hydra来启动非MPI工作,例如UPC计划。