HIVE比较连接中的字符串

时间:2016-09-20 10:05:27

标签: hive

我在hive查询中有键是字符串。 Joing看起来像是永远的。我可以创建索引而不是?

select
*
from e 

left join tabele a
on e.string1=a.string2

如何改善它会更快?

1 个答案:

答案 0 :(得分:0)

仅针对性能问题,尝试将hive表格设置为ORC格式。 尝试在查询中使用Map join并尝试。 http://grisha.org/blog/2013/04/19/mapjoin-a-simple-way-to-speed-up-your-hive-queries/

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC