标签: hadoop apache-spark hdfs
我是Hadoop和大数据的新手。我在AWS中设置了一个4节点工作Hadoop集群。我想知道我可以在其上安装哪些不同的工具以及如何安装它们。我的计划是将Twitter数据流式传输到HDFS,然后寻找特定的模式。有哪些工具可用于此任务。
提前致谢。 拉吉
答案 0 :(得分:0)
您可以非常轻松地查看在请求集群时可以使用哪些技术,AWS将负责安装。
只需转到EMR,创建一个群集,然后点击高级选项,您将看到如下内容:
如果您在询问哪种技术最适合您的特定用例,那么当您确切地知道自己要做的事情时,也许应该发布一个单独的问题。