Hive:加入Performance - String vs Int

时间:2016-02-11 08:41:19

标签: hive

加入表的Hive查询运行12个小时以上。

此查询加入字符串列。因此,对于每个列,hive必须进行字符串比较。加入字符串是合乎逻辑的。

将字符串列转换为int是否有意义?或者一般认为影响太低了?

1 个答案:

答案 0 :(得分:1)

我建议尝试通过在hive查询中添加一些可以更好地加入的属性来提高连接性能。

set hive.auto.convert.join=false;
set hive.auto.convert.join.noconditionaltask=false;

我已经看到上述参数多次发生变化。也许如果你给我们提供更多关于你加入多少桌子以及它们有多大的信息。会有更好的解决方案。