大学集群的使用思路

时间:2009-07-12 19:50:51

标签: linux

我目前是一所中等规模大学的学生工作者。我在科学学院工作(包括数学,统计学,综合科学,物理学,化学和生物学)和“技师”;这基本上是一个基本的故障排除和修复教师计算机,设置计算机实验室,编写自定义程序,管理Web和数据库服务器。

我们目前有3组相当新的计算机设置为群集,但它们没有被使用和放弃。我想做一些集群项目,但我最大的障碍是在集群上做什么。如果我知道哪些应用程序或项目可以利用群集,我可以从那里开始。我读过有关用于视频渲染的集群,生成彩虹表/密码破解和高可用性Web服务器的信息。但我正在寻找更具学术性的东西;可以作为实际的学术可用性呈现给教授和院长的东西。没有永远不会被使用的东西。

我真的不想进行视频渲染,因为不需要渲染视频。密码破解对大学没什么用处。高可用性Web群集没有用,因为我们不会托管一些静态教师页面和我们的站点(网络和大学的网站是另一个部门)。我可以提供给数学,物理或化学系的工具是理想的。但是我愿意接受想法或例子。

设置/管理Linux或任何操作系统或程序不是问题。它是如何处理群集的。

tl / dr:在学术环境中如何处理群集。

5 个答案:

答案 0 :(得分:3)

有许多应用程序可以使用集群。最好的问部门。

但仅举几个例子:

答案 1 :(得分:0)

我没有考虑项目,folding@home确定可以使用您的群集!

答案 2 :(得分:0)

查看BOINC,可供选择的大量项目。

答案 3 :(得分:0)

做机器学习项目! Here是许多标准数据集,here是许多机器学习算法的实现(另请参阅MALLET)。

natural language processing,例如machine translation自然语言!培训翻译模型可能非常耗时,因此通常会使用许多机器。

答案 4 :(得分:0)

设置一个Hadoop集群,包含所有的铃声和​​口哨声(Pig,Oozie,HBase等),找到大量数据的来源(Netflix数据集可以下载,Spinn3r我听说供应学者免费),并且学生或教授将能够找到合适的项目。

设置所有框架并获取数据是一件麻烦事。在Map Reduce之上构建一些有趣的数据分析是单个学期项目的一个可行项目。