蜂巢计数UDAF

时间:2020-01-18 05:09:38

标签: hive query-optimization hiveql

我遇到了一个Hive查询,它在没有分组的情况下计算了count distinct,这运行非常慢。所以我想知道Hive中如何实现此功能,为此是否有UDAFCountDistinct

1 个答案:

答案 0 :(得分:1)

Hive 1.2.0+提供auto-rewrite optimization for count(distinct)。检查此设置:

hive.optimize.distinct.rewrite=true;