标签: hadoop mapreduce hive
表的架构就像这个page(id,userid)
page(id,userid)
e.g。如果表的内容是:
1 NULL 1 NULL 2 NULL 2 U2 2 U3 3 U1 3 U2 4 U1 4 U4 5 NULL 5 NULL
答案应该是= 6 访问ID 1和& 5我们有2个用户和其他4个独特用户。
如何在蜂巢中完成此操作?