如何在配置单元中输出多个组

时间:2014-04-04 10:56:47

标签: sql hadoop hive apache-pig

我需要做多次计数并做一个小组,我在蜂巢中尝试这个,但它的错误输出,任何身体好的hiveQL都可以在这里帮助,如何在hive / pig中做同样的事情

第一次计数的逻辑

Select col1,clo2 ,col3 , count (distinct col4, col5) from table1 where col6 = 1 group by col1,clo2 ,col3

第二次计数的逻辑

Select col1,clo2 ,col3 , count (distinct col4, col5) from table1 where col7 = 1 group by col1,clo2 ,col3

最终OP预计如下:

col1,clo2 ,col3 ,count1 ,count2 

1 个答案:

答案 0 :(得分:0)

@Navneet,您为什么要找出count (distinct col4, col5)?因为这总是会给你输出1。那么你的count1 and count2 will be always 1