“集群”软件与MPI相关的作用是什么?

时间:2011-08-25 05:01:56

标签: c linux mpi cluster-computing openmpi

关于集群实现(“Beowulf集群”)如何与诸如MPI之类的通信协议相关,我有点困惑。使用类似OpenMPI的东西建立“集群”需要哪些软件组件?

3 个答案:

答案 0 :(得分:3)

如您所知,群集是一群联网在一起的计算机。如果进行此类配置,通常会安装并使用以下命令:

  • MPI,用于进程间的通信
  • NFS,使网络磁盘可见并与所有节点共享
  • NTP,用于同步节点的时间,以便您可以比较日志事件和时间戳
  • bootp从远程节点启动节点,以便每个节点重新启动,保证良好且统一的设置。
  • 一组集群实用程序,可以让您的生活更轻松,例如分布式ssh可以同时在所有节点上执行相同的命令。
  • 任务调度程序或队列管理器,例如Condor,LFS或其他人,它们允许您确定作业提交的优先级,并最终测量它们以进行限制/定价。
  • 一个看门狗,如果它被卡住,就自动重启一个节点。
  • UPS的软件控制(以便在长时间断电的情况下自动关闭)

还有更多。所有这些东西都是MPI的补充。 MPI只是流程之间的沟通渠道。仅MPI并不“制造集群”。

答案 1 :(得分:1)

正如您所指出的,MPI将仅提供进程之间的通信。如果不会有几个人使用群集,你真的不需要更多(除了一些脚本在所有节点上启动你的程序)。

但实际上,我们很遗憾地很少拥有我们的个人集群。那是你需要一个调度程序的时候。调度程序通常处理作业提交和资源分配,可能还会处理优先级,用户管理和其他事情,以使您的生活更轻松。

答案 2 :(得分:0)

查看Oracle Grid Engine(即Sun Grid Engine或CODINE)。