应用错误收集

为什么HIVE加入需要花费大量时间执行？

时间：2017-05-17 11:01:41

标签： hadoop hive hdfs

我正在尝试在hive中加入两个具有几乎相同数量记录的表。查询需要很长时间才能执行。为什么在蜂巢JOINS需要很长时间才能执行？两个表中的记录数约为50k。

1 个答案:

答案 0 :(得分：-1)

Hive查询在内部转换为Map Reduce并执行，因此执行它需要几分钟。您可以通过不同的方式来提高性能。您可以按照此link来提高查询效果。

使用hive或Hadoop的主要原因是处理大量数据。因此，当您处理大量数据时，与其他关系数据库相比，您将看到绝对巨大的性能提升。但是对于你提到的数据量可能不是Hive的好用例。