生产环境中的Hive vs Spark

时间:2018-06-05 04:01:32

标签: apache-spark hive apache-spark-sql bigdata hiveql

我正在寻找Hive vs Spark在实际生产环境中的用例。这两种技术是否在生产环境中共存?如果是,通过HiveQL进行什么样的转换以及通过SparkSQL处理哪些情况?

1 个答案:

答案 0 :(得分:0)

根据我们的经验,我们使用:

  1. Spark for ETL
  2. Hive for Analytical processing。
  3. 虽然有一点需要考虑 - 是Hive下面的东西。例如,Hiz on Tez将比分析火花更快。但如果Hive将使用MapReduce,那么使用Spark进行分析会更好。