在几分钟内处理1TB数据,而无需使用hadoop,spark和弹性搜索

时间:2018-08-14 18:00:33

标签: apache-spark hadoop elasticsearch

有没有一种解决方案,可以在几分钟内处理1TB数据而无需使用hadoop,spark和弹性搜索?

因为我在使用火花和弹性搜索时遇到问题。

使用Spark时:我使用的是Yarn。谁博士启动了许多工作,我想处理的实际工作陷于接受阶段。

使用弹性搜索时:我没有得到任何Java引用来编写程序。即使我已经尝试了elastic.co的官方JAVA API,但没有成功,某些类却无法识别。

1 个答案:

答案 0 :(得分:-1)

火花是完成工作的最可行方法。如果遇到纱线问题,可以使用其他群集管理器,例如独立的群集管理器,易于集成和使用