应用错误收集

在Hive

时间：2015-07-06 07:41:16

标签： hadoop apache-spark hive hdfs apache-spark-sql

我实际上是在问自己关于使用Spark SQL和Hive进行实时分析的表现。我知道Hive是为批处理而创建的，而Spark则用于快速查询。

但是，使用带有Hive的Spark SQL会让我进行实时查询吗？或者它只是提出最快的查询但不是实时的。我应该使用其他数据仓库而不是像Hbase那样的Hive吗？

提前致谢，弗洛里安

1 个答案:

答案 0 :(得分：1)

虽然Spark可以比蜂巢快得多，但它仍然可能不是理想的服务网站的解决方案。因此，如果Spark SQL可以实现＆＃34;实时＆＃34;查询与否在很大程度上取决于您认为实时的时间轴类型，数据集是否足够小以便在内存中缓存，以及查询是否能够利用分区。