为什么HIVE加入需要花费大量时间执行?

时间:2017-05-17 11:01:41

标签: hadoop hive hdfs

我正在尝试在hive中加入两个具有几乎相同数量记录的表。查询需要很长时间才能执行。 为什么在蜂巢JOINS需要很长时间才能执行? 两个表中的记录数约为50k。

1 个答案:

答案 0 :(得分:-1)

Hive查询在内部转换为Map Reduce并执行,因此执行它需要几分钟。您可以通过不同的方式来提高性能。您可以按照此link来提高查询效果。

使用hive或Hadoop的主要原因是处理大量数据。因此,当您处理大量数据时,与其他关系数据库相比,您将看到绝对巨大的性能提升。但是对于你提到的数据量可能不是Hive的好用例。

相关问题