建立分布式计算网络

时间:2010-09-16 17:53:11

标签: distributed-computing

我需要为我建立的新科学应用程序提供大量计算能力。

由于我的预算有限,而且由于应用程序需要大量CPU但内存很少(400MB),朋友建议我购买许多“旧”机器(Pentium 4,3Ghz,1GB内存)并使用它们运行我的应用程序的实例(每个应用程序实例彼此独立,并进行大量计算和I \ O)。

有些商店似乎提供廉价的这种机器(每件100美元)。

我的问题是,在这些机器上安装ubuntu linux有多难,在网络中设置它并在其上安装python / cython之类的东西?

安装condor有多难,所以我可以“提交作业”到中心节点,计算将在各个节点/单元中进行?

2 个答案:

答案 0 :(得分:2)

Condor是这项工作的正确工具,在这样简单的配置中设置Condor相对容易。你可能想看看像rocksclusters.org这样的东西,用于设置操作系统和机器集群本身。

现在,我肯定会首先对这些机器进行基准测试。您可能会惊讶于旧机器的速度有多慢,以及您的应用程序性能与时钟速度没有直接关系。当然,最快,最新,最高核心数的机器不会是最具成本效益的机器,但是下面也是最古老,最慢的单向机器。

答案 1 :(得分:0)

我认为你可以设置一台这样的机器并拍摄磁盘的图像。然后,您可以在群集的其余部分上使用该磁盘映像。

尽管如此,我想知道如果你的机器有不同的配置,它会有多好用。