Java 8流按3个字段分组,按sum和count聚合产生单行输出

时间:2017-05-20 18:00:03

标签: lambda java-8 java-stream chaining collectors

我知道在论坛中提出了类似的问题,但他们似乎都没有完全解决我的问题。现在我对Java 8非常陌生,所以请耐心等待。 我有一个产品列表,例如:

Input:
name    category    type    cost
prod1       cat2     t1      100.23
prod2       cat1     t2      50.23
prod1       cat1     t3      200.23
prod3       cat2     t1      150.23
prod1       cat2     t1      100.23


Output:
Single line (name, category, type) summing the cost and count of products.




Product {
    public String name;
    public String category;
    public String type;
    public int id;
    public double cost;

}

我需要按名称,类别和类型对此进行分组,并生成一个结果 总结这些数据并产生每种产品的总成本和数量。大多数示例显示了按两个字段进行分组并使用单个条件进行聚合。

根据关于forumn的建议,我想出了这个分组:

    public class ObjectKeys {

    ArrayList<Object> keys;

    public ObjectKeys(Object...searchKeys) {

         keys = new ArrayList<Object>();

            for (int i = 0; i < searchKeys.length; i++) {
                keys.add( searchKeys[i] );
            }
    }

}

然后使用如下:

Map<String, Map<String, Map<String, List<Product>>>> productsByNameCategoryType =
    products.stream().collect(groupingBy(new ObjectKeys(l.name(), l.category(),l.type())))

但是如何将计数和总和链接到上面的代码?特别是对于超过2个领域的团体。 有一个更好的方法吗?

就像我提到的,我的Java8不太好,请帮忙。

2 个答案:

答案 0 :(得分:4)

前提条件

class Product {
    public String name;
    public String category;
    public String type;
    public int id; 
    //todo:implement equals(), toString() and hashCode()
 }

class Item{
   public Product product;
   public double cost;
}

汇总方式

您可以使用Collectors#groupingBy&amp;来概括按产品分组的项目。 Collectors#summarizingDouble

List<Item> items = ...; 
Map<Product, DoubleSummaryStatistics> stat = items.stream().collect(groupingBy(
            it -> it.product,
            Collectors.summarizingDouble(it -> it.cost)
));

// get some product summarizing
long count = stat.get(product).getCount();
double sum = stat.get(product).getSum();

//list all product summarizing
stat.entrySet().forEach(it ->
  System.out.println(String.format("%s - count: %d, total cost: %.2f"
        , it.getKey(),it.getValue().getCount(), it.getValue().getSum()));
);

合并具有相同产品的商品

首先,您需要在qty类中添加Item字段:

class Item{
   public int qty;
   //other fields will be omitted

   public Item add(Item that) {
        if (!Objects.equals(this.product, that.product)) {
            throw new IllegalArgumentException("Can't be added items"
                     +" with diff products!");
        }
        return from(product, this.cost + that.cost, this.qty + that.qty);
    }

    private static Item from(Product product, double cost, int qty) {
        Item it = new Item();
        it.product = product;
        it.cost = cost;
        it.qty = qty;
        return it;
    }

}

然后您可以使用Collectors#toMap合并具有相同产品的项目:

Collection<Item> summarized = items.stream().collect(Collectors.toMap(
        it -> it.product,
        Function.identity(),
        Item::add
)).values();

最后

你可以看到两种方式做同样的事情,但第二种方法更容易在流上运行。以及我在github中检查的两种方式的测试,您可以点击并查看更多详细信息:summarizing items&amp; merge items方式。

答案 1 :(得分:3)

这是快速而肮脏的解决方案:

    Map<String, String> productsByNameCategoryType = products.stream()
            .collect(Collectors.groupingBy(p 
                            -> p.getName() + '-' + p.getCategory() + '-' + p.getType(),
                    Collectors.collectingAndThen(
                            Collectors.summarizingDouble(Product::getCost),
                            dss -> String.format("%7.2f%3d", 
                                                 dss.getSum(), dss.getCount()))));

您可能希望为键和结果映射的值构建自己的类。在任何情况下,使用您的数据和上面的代码,地图包含四个条目:

prod1-cat1-t3:  200,23  1
prod1-cat2-t1:  200,46  2
prod3-cat2-t1:  150,23  1
prod2-cat1-t2:   50,23  1

总和以逗号作为小数点打印,因为我的计算机具有丹麦语区域设置(如果需要,可以将语言环境传递给String.format()以控制语言环境。)

您的朋友是Collectors.collectingAndThen()Collectors.summarizingDouble()的组合。我从this answer那里拿走了它。