是否可以在hadoop中进行实时交互式查询?
当我使用Hive超过YARN / tez时,延迟仍然太高,即使它超过了镶木地板/ ocr。
有什么建议吗?
提前致谢
答案 0 :(得分:1)
Hadoop不适合实时或近实时查询。在Hadoop中运行任何东西的延迟开销都很高。考虑使用Apache Spark(因为我希望你有一个批处理系统,因为你正在使用Hadoop)。 Spark使用spark shell提供交互式查询。您还可以使用Impala对存储在HDFS中的数据进行查询。我认为,与Hive相比,Impala提供了更快的查询。