我需要做多次计数并做一个小组,我在蜂巢中尝试这个,但它的错误输出,任何身体好的hiveQL都可以在这里帮助,如何在hive / pig中做同样的事情
第一次计数的逻辑
Select col1,clo2 ,col3 , count (distinct col4, col5) from table1 where col6 = 1 group by col1,clo2 ,col3
第二次计数的逻辑
Select col1,clo2 ,col3 , count (distinct col4, col5) from table1 where col7 = 1 group by col1,clo2 ,col3
最终OP预计如下:
col1,clo2 ,col3 ,count1 ,count2
答案 0 :(得分:0)
@Navneet,您为什么要找出count (distinct col4, col5)
?因为这总是会给你输出1
。那么你的count1 and count2 will be always 1
。