我正在尝试在hive中加入两个具有几乎相同数量记录的表。查询需要很长时间才能执行。 为什么在蜂巢JOINS需要很长时间才能执行? 两个表中的记录数约为50k。
答案 0 :(得分:-1)
Hive查询在内部转换为Map Reduce并执行,因此执行它需要几分钟。您可以通过不同的方式来提高性能。您可以按照此link来提高查询效果。
使用hive或Hadoop的主要原因是处理大量数据。因此,当您处理大量数据时,与其他关系数据库相比,您将看到绝对巨大的性能提升。但是对于你提到的数据量可能不是Hive的好用例。