如何在java流中对groupBy应用过滤

时间:2018-01-16 02:00:42

标签: java java-8 java-stream java-9 collectors

如何先分组,然后使用Java流应用过滤?

示例:请考虑此Employee课程: 我希望按部门分组,列出薪水超过2000的员工。

public class Employee {
    private String department;
    private Integer salary;
    private String name;

    //getter and setter

    public Employee(String department, Integer salary, String name) {
        this.department = department;
        this.salary = salary;
        this.name = name;
    }
}   

我就是这样做的

List<Employee> list   = new ArrayList<>();
list.add(new Employee("A", 5000, "A1"));
list.add(new Employee("B", 1000, "B1"));
list.add(new Employee("C", 6000, "C1"));
list.add(new Employee("C", 7000, "C2"));

Map<String, List<Employee>> collect = list.stream()
    .filter(e -> e.getSalary() > 2000)
    .collect(Collectors.groupingBy(Employee::getDepartment));  

输出

{A=[Employee [department=A, salary=5000, name=A1]],
 C=[Employee [department=C, salary=6000, name=C1], Employee [department=C, salary=7000, name=C2]]}

因为B部门没有员工的薪水超过2000.所以B部门没有关键: 但实际上,我希望将该密钥与空列表相关联 -

预期输出

{A=[Employee [department=A, salary=5000, name=A1]],
 B=[],
 C=[Employee [department=C, salary=6000, name=C1], Employee [department=C, salary=7000, name=C2]]}

我们怎么做?

5 个答案:

答案 0 :(得分:21)

您可以使用Java-9中引入的 Collectors.filtering API:

Map<String, List<Employee>> output = list.stream()
            .collect(Collectors.groupingBy(Employee::getDepartment,
                    Collectors.filtering(e -> e.getSalary() > 2000, Collectors.toList())));

API备注

非常重要
  
      
  • 过滤()收集器在多级缩减中最有用,例如groupingBypartitioningBy的下游。

  •   
  • 过滤收集器与流filter()操作不同。

  •   

答案 1 :(得分:16)

nullpointer’s answer显示了直截了当的方式。如果您无法更新到Java 9,没问题,这个filtering收集器并不神奇。这是Java 8兼容版本:

public static <T, A, R> Collector<T, ?, R> filtering(
    Predicate<? super T> predicate, Collector<? super T, A, R> downstream) {

    BiConsumer<A, ? super T> accumulator = downstream.accumulator();
    return Collector.of(downstream.supplier(),
        (r, t) -> { if(predicate.test(t)) accumulator.accept(r, t); },
        downstream.combiner(), downstream.finisher(),
        downstream.characteristics().toArray(new Collector.Characteristics[0]));
}

您可以将它添加到您的代码库中,并以与Java 9相同的方式使用它,因此如果您使用import static,则无需以任何方式更改代码。

答案 2 :(得分:6)

使用Map#putIfAbsent(K,V)填写过滤后的空白

Map<String, List<Employee>> map = list.stream()
              .filter(e->e.getSalary() > 2000)
              .collect(Collectors.groupingBy(Employee::getDepartment, HashMap::new, toList()));
list.forEach(e->map.putIfAbsent(e.getDepartment(), Collections.emptyList()));

注意:由于groupingBy返回的地图不保证是可变的,因此您需要指定一个地图供应商以确定(感谢shmosel指出这一点)。

另一个(不推荐)解决方案是使用toMap而不是groupingBy,它的缺点是为每个员工创建一个临时列表。它看起来有点乱 -

Predicate<Employee> filter = e -> e.salary > 2000;
Map<String, List<Employee>> collect = list.stream().collect(
        Collectors.toMap(
            e-> e.department, 
            e-> new ArrayList<Employee>(filter.test(e) ? Collections.singleton(e) : Collections.<Employee>emptyList()) , 
            (l1, l2)-> {l1.addAll(l2); return l1;}
        )
);

答案 3 :(得分:2)

在Java 8中没有更简洁的方法: Holger在java8中显示了明确的方法here接受了答案。

这就是我在java 8中的表现:

步骤:1 按部门分组

步骤:2 循环抛出每个元素并检查部门是否有员工工资&gt; 2000

步骤:3 根据noneMatch

更新新地图中的地图
Map<String, List<Employee>> employeeMap = list.stream().collect(Collectors.groupingBy(Employee::getDepartment));
Map<String, List<Employee>> newMap = new HashMap<String,List<Employee>>();
         employeeMap.forEach((k, v) -> {
            if (v.stream().noneMatch(emp -> emp.getSalary() > 2000)) {
                newMap.put(k, new ArrayList<>());
            }else{
                newMap.put(k, v);
           }

        });

Java 9:Collectors.filtering

java 9首先在此组中添加了新的收集器Collectors.filtering,然后应用过滤。 过滤收藏家旨在与分组一起使用。

Collectors.Filtering采用过滤输入元素的函数和收集过滤元素的收集器:

list.stream().collect(Collectors.groupingBy(Employee::getDepartment),
 Collectors.filtering(e->e.getSalary()>2000,toList());

答案 4 :(得分:1)

Java 8版本:您可以按部门进行分组,然后流式传输条目集,并通过在过滤器中添加谓词来再次进行收集:

    Map<String, List<Employee>> collect = list.stream()
        .collect(Collectors.groupingBy(Employee::getDepartment)).entrySet()
        .stream()
        .collect(Collectors.toMap(Map.Entry::getKey,
            entry -> entry.getValue()
                .stream()
                .filter(employee -> employee.getSalary() > 2000)
                .collect(toList())
            )
        );