标签: hadoop nutch
我们正在试图弄清楚哪种Linux发行版最适合Nutch-Hadoop集成? 我们计划通过Nutch使用Clusters来抓取大量内容。 让我知道您是否需要对此问题进行更多澄清?
谢谢你。
答案 0 :(得分:1)
在这种情况下,任何主要的Linux发行版之间没有太大区别。但我建议你准备一个hadoop包。我在debian上使用Cloudera的Hadoop发行版,效果非常好。
答案 1 :(得分:1)
hadoop和hbase软件包将在下一个Debian Stable版本中使用:
http://packages.debian.org/search?keywords=hadoop