如何在AWS集群

时间:2017-02-26 08:13:44

标签: hadoop apache-spark hdfs

我是Hadoop和大数据的新手。我在AWS中设置了一个4节点工作Hadoop集群。我想知道我可以在其上安装哪些不同的工具以及如何安装它们。我的计划是将Twitter数据流式传输到HDFS,然后寻找特定的模式。有哪些工具可用于此任务。

提前致谢。 拉吉

1 个答案:

答案 0 :(得分:0)

您可以非常轻松地查看在请求集群时可以使用哪些技术,AWS将负责安装。

只需转到EMR,创建一个群集,然后点击高级选项,您将看到如下内容:

aws emr

如果您在询问哪种技术最适合您的特定用例,那么当您确切地知道自己要做的事情时,也许应该发布一个单独的问题。