哪个Linux发行版最适合Nutch-Hadoop?

时间:2010-06-01 09:02:39

标签: hadoop nutch

我们正在试图弄清楚哪种Linux发行版最适合Nutch-Hadoop集成? 我们计划通过Nutch使用Clusters来抓取大量内容。 让我知道您是否需要对此问题进行更多澄清?

谢谢你。

2 个答案:

答案 0 :(得分:1)

在这种情况下,任何主要的Linux发行版之间没有太大区别。但我建议你准备一个hadoop包。我在debian上使用Cloudera的Hadoop发行版,效果非常好。

答案 1 :(得分:1)

hadoop和hbase软件包将在下一个Debian Stable版本中使用:

http://packages.debian.org/search?keywords=hadoop