德鲁伊查询唯一计数

时间:2018-07-23 21:44:48

标签: druid

我使用Druid监视指标数据。数据可以表示如下:

timestamp   |  file  |  user_id  |  size  
================================================
ts1         |  file1 |  id1      |  0
ts1         |  file2 |  id1      |  0
ts1         |  file3 |  id1      |  0
ts2         |  file1 |  id1      |  10
ts2         |  file2 |  id1      |  10
ts3         |  file4 |  id1      |  0
ts3         |  file5 |  id1      |  0

我还定义了一个聚合,以获取文件大小的总和。
假设-

    ts1,ts2,ts3是1天内的时间戳。

我想要什么数据-
我想知道user_id为id1的文件为空。

从上表中,我看到file3,file4和file5在一天中的大小为0。但是,文件1和文件2的大小一天为10。

我的最终输出应该是-

timestamp   |   user_id   |  count
==================================
Day1        |   id1       |  3

我拥有过去1个月的数据,因此,最终,我的结果将显示过去1个月中每天的空白文件数。

我的思维过程基本上是对具有Sum(size)== 0的GroupBy查询。但是,我找不到找到这些值的Count的方法。

任何帮助,不胜感激!

0 个答案:

没有答案