我需要以下查询的帮助。社区中的某人可以检查一下并让我知道我所缺少的吗。
我在HIVE中的查询下面运行。我发现的问题是,Percentile()
在同一查询中时,Count(distinct colA)
函数未执行。
我尝试了很多事情,包括仅使用percentile()
或仅使用count(distinct)来运行查询,这很好用,但我需要在同一条select语句中运行并执行count(distinct customer_id)
,因为有多行对于相同的ID,我只需要计数不同。
注意:它正在Hive环境中运行。
Select customer, sum(price), percentile(price, 0.95), count(distinct
customer_id) from customer group by customer;
Hive完成了“映射”过程,但“减少”过程以以下错误结束:
org.apache.hadoop.hive.ql.exec.GroupByOperator.initializeOp(GroupByOperator.java:371)