应用错误收集

AWS EMR通过数据存储激发Hadoop

时间：2018-09-25 23:19:09

标签： apache-spark hadoop amazon-emr

我是AWS EMR的新手，正在尝试创建一个集群来处理来自S3的数据。

我有一个用例，每小时有增量数据馈入集群。现在，我将使用Hadoop和Spark启动集群。处理完数据后，我将终止集群。

将数据存储在hadoop上并使用spark处理数据是否有效？任何链接都很好。

0 个答案:

没有答案