Condor,Sun Grid Engine,还是其他什么?

时间:2009-12-06 11:31:53

标签: cluster-computing sungridengine condor

我正在努力研究是否应该尝试使用Condor或Sun Grid Engine(或者其他可能的东西)。

我们经常有许多未使用的WinXp工作站。希望我们可以使用局域网唤醒,运行所有工作,然后自动关闭。我们主要运行Matlab,Java或Python模拟蒙特卡罗或参数探索。

由于我对Condor的了解有限,听起来使用vm Universe可能是一种处理快照的便捷方式,而无需修改现有代码。

对于这类工作,SGE或其他什么比秃鹰更好吗?

7 个答案:

答案 0 :(得分:4)

SGE不支持 支持窗口。它附带all kinds of caveats and missing bits on Windows

我已经运行Condor池多年了,它是Linux和Windows机器上用于循环窃取和专用,永远在线硬件的卓越HTPC设置。最近添加的Rooster daemon允许您在作业周期之间让机器进入休眠状态,并在池中出现新工作时将其唤醒。他们还拥有一个积极且非常有帮助的支持社区。 Checkpointing是Windows上唯一没有的Condor功能。其他一切都在那里。随着VM Universe的增加,检查点越来越有用。真的:要成功使用检查点,您需要能够重新链接整个代码堆栈。因此,如果您正在运行Matlab作业,即使在Linux上,也无法实现检查点。

如果您有关于在Windows上运行Condor的具体问题,我很乐意回答它们,分享我的经验。我在全球4个游泳池中运行Condor,所有游泳池共有大约1500台专用机器,还有大约1000台桌面机器可供用户随时捐赠。

答案 1 :(得分:3)

我从Condor开始。它对Windows有很好的支持,并且当作业可以在某些机器上运行时,较新的版本内置支持以非常可配置的方式发送wake-on-lan。它还可以根据用户定义的策略关闭计算机。

答案 2 :(得分:3)

对于专用硬件,我会使用Grid Engine。

为了清理可能正在使用的机器上的时钟周期,我会选择Condor。

对于您有固定时间段专用访问权限的硬件,例如隔夜和周末,我可能仍然会使用Condor,但可能会说服自己使用Grid Engine。

答案 3 :(得分:3)

在甲骨文收购SGE(Sun Grid Engine)之后,还有Open Grid Scheduler项目仍然提供开源Grid Engine。

http://gridscheduler.sourceforge.net/

答案 4 :(得分:1)

我最近必须在condor和SGE之间为客户项目做出选择。我赞成SGE(因为我对这个环境比较熟悉),但Condor终于赢了,因为:

  • 客户基础架构是面向Windows的,SGE解决方案需要用于中央管理器的Unix或Linux机器,+在计算主机上安装用于Unix的MS服务
  • Condor在Windows上的支持和安装过程要简单得多。

但是,您无法在Windows上使用Condor最有趣的功能:检查点不可用,也不能使用Condor特定的IO。我没有使用VM世界,所以我不能评论这个方面。

答案 5 :(得分:0)

我只尝试过Condor,尝试设置是一件痛苦的事。如果您需要所有时钟周期,您可以完全使用,请使用Condor。

我即将尝试SGE,我会告诉你它是怎么回事。然而在我的公司,人们有建立SGE的经验,所以我可能会说SGE更容易。

答案 6 :(得分:0)

SGE不存在......它是OGE,而且非常昂贵。和Condor一起去。