标签: hive query-optimization hiveql
我遇到了一个Hive查询,它在没有分组的情况下计算了count distinct,这运行非常慢。所以我想知道Hive中如何实现此功能,为此是否有UDAFCountDistinct?
count distinct
UDAFCountDistinct
答案 0 :(得分:1)
Hive 1.2.0+提供auto-rewrite optimization for count(distinct)。检查此设置:
hive.optimize.distinct.rewrite=true;