我在jdk-8下看Collectors.toSet
实现,几乎看到了显而易见的事情:
public static <T> Collector<T, ?, Set<T>> toSet() {
return new CollectorImpl<>(
(Supplier<Set<T>>) HashSet::new,
Set::add,
(left, right) -> { left.addAll(right); return left; }, // combiner
CH_UNORDERED_ID);
暂时查看combiner
;这已经在here之前讨论过,但想法是a combiner folds from the second argument into the first
。这显然发生在这里。
然后我调查了jdk-9
实现并看到了这个:
public static <T> Collector<T, ?, Set<T>> toSet() {
return new CollectorImpl<>(
(Supplier<Set<T>>) HashSet::new,
Set::add,
(left, right) -> {
if (left.size() < right.size()) {
right.addAll(left); return right;
} else {
left.addAll(right); return left;
}
},
CH_UNORDERED_ID);
现在为什么发生这种情况有点明显 - 添加less elements to a bigger Set, then the other way around
所需的时间更少。但这是否比普通addAll
便宜,考虑分支的额外开销呢?
这也打破了我的法律总是左折......
有人可以在这里说清楚吗?
答案 0 :(得分:10)
Collector
的合并器功能将接收 left
和right
,如果有需要维护的遭遇订单,则会正常到Collector
,它将如何实际组合这两个论点。
接受两个部分结果并合并它们的函数。组合器函数可以将状态从一个参数折叠到另一个参数并返回该参数,或者可以返回新的结果容器。
要收集到List
,如果我们只是将left.addAll(right)
交换为right.addAll(left)
,那将是灾难性的,但对于无序Set
,这并不重要。 toSet()
收集器甚至会报告UNORDERED
特征,以提示Stream
(或任何客户端代码),即使提供哪个参数left
或{ {1}},所以并行流可以组合任意部分结果,无论先完成什么,换句话说,它可能表现得像一个无序流,即使源有一个遭遇顺序(Java 8的实现不使用那个机会) )。
关于它是否值得...我们正在比较一个额外的分支与可能保存的数千个right
操作,每个承载多个内部条件分支......