groupingBy并一步过滤

时间:2016-01-12 16:01:33

标签: java lambda java-8 java-stream collectors

我有Stream<String>,我想要一个Map<Integer, String>。让我们调用我的分类器函数getKey(String) - 它可能很昂贵。有时它返回零,这意味着String应该被丢弃并且不包括在结果映射中。

所以,我可以使用这段代码:

Stream<String> stringStream;
Map<Integer, String> result = 
    stringStream.collect(Collectors.groupingBy(this::getKey, Collectors.joining());
result.remove(0);

首先将不需要的字符串添加到由零键入的Map,然后将其删除。可能会有很多。是否有一种优雅的方法可以避免首先将它们添加到地图中?

我不想在分组之前添加过滤步骤,因为这意味着要执行两次决策/分类代码。

2 个答案:

答案 0 :(得分:3)

你说调用getKey是很昂贵的,但你仍然可以在过滤之前预先映射流的元素。在这种情况下,对getKey的调用只会执行一次。

Map<Integer, String> result =
    stringStream.map(s -> new SimpleEntry<>(this.getKey(s), s))
                .filter(e -> e.getKey() != 0)
                .collect(groupingBy(Map.Entry::getKey, mapping(Map.Entry::getValue, joining()))); 

请注意,标准API中没有元组类。您可以自己动手或使用AbstractMap.SimpleEntry替代。

或者,如果您认为第一个版本创建了大量条目,则可以使用collect方法,您可以自己提供供应商,累加器和组合器。

Map<Integer, String> result = stringStream
    .collect(HashMap::new, 
             (m, e) -> {
                 Integer key = this.getKey(e);
                 if(key != 0) {
                     m.merge(key, e, String::concat);
                 }
              }, 
              Map::putAll);

答案 1 :(得分:2)

你可以使用这样的一对流:

stringStream.map(x -> new Pair(getKey(x), x))
            .filter(pair -> pair.left != 0) // or whatever predicate
            .collect(Collectors.groupingBy(pair -> pair.left,
                        Collectors.mapping(pair -> pair.right, Collectors.joining())));

此代码假定简单的Pair类包含两个字段leftright

某些第三方库(例如我的StreamEx)提供了删除样板的其他方法:

StreamEx.of(stringStream)
        .mapToEntry(this::getKey, x -> x)
        .filterKeys(key -> key != 0) // or whatever
        .grouping(Collectors.joining());