使用apache spark基于周分组数据

时间:2016-01-17 06:28:16

标签: java apache-spark nosql-aggregation

我是新的蜜蜂,我在mongo中有大约15 TB的数据

ApplicationName  Name        IPCategory Success   Fail  CreatedDate
  abc            a.com        cd          3      1      25-12-2015 00:00:00
  def            d.com        ty          2      2      25-12-2015 01:20:00
  abc            b.com        cd          5      0      01-01-2015 06:40:40

我正在寻找基于ApplicationName,groupby(Name,IpCategory)的一周数据。我能够从mongo获取数据并将输出保存到mongo。我正在使用java。

注意: - 从一个月的数据我只需要上周。它应该是groupby(Name,IPCategory)。

0 个答案:

没有答案