Java Streams:分组,求和和计数

时间:2016-03-15 19:41:34

标签: java lambda java-stream collectors

我是溪流的新手,但对这种可能性非常感兴趣。

我正在尝试编写一个同时进行分组,计数和求和的流。所涉及的数据实际上非常简单,但是编写我需要的流式语句证明是具有挑战性的,而且我没有看到任何真正有用的谷歌搜索。

首先,让我描述一下我的数据,然后我会告诉你我是如何解决问题的三分之二。也许你可以告诉我如何适应缺失的部分。

数据是销售音乐会门票的公司的门票销售。每笔销售包括代理商代码,订单号,订单日期和售出的门票数量。因此,它看起来像这样:

AgencyCode  OrderNumber OrderDate  TicketsSold
----------  ----------- ---------  -----------
TW          111111  2016-03-01          4
TW          111112  2016-03-01          2
CP          201000  2016-03-01          3
TW          111113  2016-03-01          8
CP          201001  2016-03-02          2
EL          300001  2016-03-01          4
AS          400000  2016-03-02          2

我想要从这些数据中获得的是一个摘要,显示每个代理商代码的订单总数以及同一代理商代码的销售门票总数。因此,我想要为这组特定数据获取的值是:

AgencyCode  Orders   TicketsSold
TW               3            14
CP               2             5
EL               1             4
AS               1             2

我的分组工作以及售出的门票数量。这只是我想要获得的订单的计数。

以下是我如何获得代理商出售的门票:

 Map<String, Integer> salesByAgency
     = ticketOrders.stream()
         .collect(Collectors.groupingBy(TicketSale::getAgencyCode,
                 Collectors.summingInt(TicketSale::getTicketsSold)));

TicketSale是包含单个故障单订单的类。我的收藏集ticketOrders是一个LinkedHashSet,其中包含一堆TicketSale条记录。

如何调整我所拥有的每个代理商代码的订单数量?

2 个答案:

答案 0 :(得分:2)

您可以使用

Map<String, Integer> orders = ticketOrders
  .stream()
  .collect(Collectors.groupingBy(TicketSale::getAgencyCode,
                                 Collectors.summingInt(x -> 1)));

Map<String, Long> orders = ticketOrders
  .stream()
  .collect(Collectors.groupingBy(TicketSale::getAgencyCode,
                                 Collectors.counting()));

按代理商获取订单数量。

如果要同时对计数和订单进行分组,则必须定义自己的收集器,例如

Map<String, int[]> grouped = ticketOrders
  .stream()
  .collect(Collectors.groupingBy(TicketSale::getAgencyCode,
                                 Collector.of(
                                     () -> new int[2],
                                     (a, t) -> { a[0] += 1; a[1] += t.getTicketsSold(); },
                                     (a, b) -> { a[0] += b[0]; a[1] += b[1]; return a; })));

但是,这种贬义可能很难理解。 : - )

[编辑] 在这种情况下,收集器由三部分组成。 第一行是供应商,它创建一个新的结果容器,在本例中是一个包含两个元素的数组:一个用于计数,一个用于总和。 第二行是累加器;它将数据添加到现有结果容器中。 第三行是 combiner ,用于将两个结果容器合并为一个。

有关详细说明,您可以一如既往地查阅Java API documentation

答案 1 :(得分:1)

最简单的解决方案是使用Collectors.summarizingInt()

Map<String, IntSummaryStatistics> salesByAgency
     = ticketOrders.stream()
         .collect(Collectors.groupingBy(TicketSale::getAgencyCode,
                 Collectors.summarizingInt(TicketSale::getTicketsSold)));

IntSummaryStatistics类维护计数,总和,最小值和最大值。所以在此之后你可以获得一些组的总和:

long sum = salesByAgency.get(agencyCode).getSum();

但你也可以得到数:

long count = salesByAgency.get(agencyCode).getCount();