有没有一种解决方案,可以在几分钟内处理1TB数据而无需使用hadoop,spark和弹性搜索?
因为我在使用火花和弹性搜索时遇到问题。
使用Spark时:我使用的是Yarn。谁博士启动了许多工作,我想处理的实际工作陷于接受阶段。
使用弹性搜索时:我没有得到任何Java引用来编写程序。即使我已经尝试了elastic.co的官方JAVA API,但没有成功,某些类却无法识别。
答案 0 :(得分:-1)
火花是完成工作的最可行方法。如果遇到纱线问题,可以使用其他群集管理器,例如独立的群集管理器,易于集成和使用