我正在尝试计算列表中值的平方和。 以下是三种变体,它们都计算出所需的值。 我想知道哪一个最有效率。我期待第三个 更有效率,因为自动装箱只进行一次。
// sum of squares
int sum = list.stream().map(x -> x * x).reduce((x, y) -> x + y).get();
System.out.println("sum of squares: " + sum);
sum = list.stream().mapToInt(x -> x * x).sum();
System.out.println("sum of squares: " + sum);
sum = list.stream().mapToInt(x -> x).map(x -> x * x).sum();
System.out.println("sum of squares: " + sum);
答案 0 :(得分:10)
如有疑问,请测试!使用jmh,我在100k元素列表中得到以下结果(以微秒为单位,越小越好):
Benchmark Mode Samples Score Error Units
c.a.p.SO32462798.for_loop avgt 10 119.110 0.921 us/op
c.a.p.SO32462798.mapToInt avgt 10 129.702 1.040 us/op
c.a.p.SO32462798.mapToInt_map avgt 10 129.753 1.516 us/op
c.a.p.SO32462798.map_reduce avgt 10 1262.802 12.197 us/op
c.a.p.SO32462798.summingInt avgt 10 134.821 1.203 us/op
所以你有,从快到慢:
for(int i : list) sum += i*i;
mapToInt(x -> x * x).sum()
和mapToInt(x -> x).map(x -> x * x).sum()
collect(Collectors.summingInt(x -> x * x))
map(x -> x * x).reduce((x, y) -> x + y).get()
请注意,结果很大程度上取决于JIT优化。如果映射中的逻辑更复杂,则某些优化可能不可用(更长的代码=更少的内联),在这种情况下,流版本可能比for循环花费多4-5倍的时间 - 但如果该逻辑是CPU重的话差异将再次减少。分析您的实际应用程序将为您提供更多信息。
基准代码供参考:
@State(Scope.Benchmark)
@BenchmarkMode(Mode.AverageTime)
public class SO32462798 {
List<Integer> list;
@Setup public void setup() {
list = new Random().ints(100_000).boxed().collect(toList());
}
@Benchmark public int for_loop() {
int sum = 0;
for (int i : list) sum += i * i;
return sum;
}
@Benchmark public int summingInt() {
return list.stream().collect(Collectors.summingInt(x -> x * x));
}
@Benchmark public int mapToInt() {
return list.stream().mapToInt(x -> x * x).sum();
}
@Benchmark public int mapToInt_map() {
return list.stream().mapToInt(x -> x).map(x -> x * x).sum();
}
@Benchmark public int map_reduce() {
return list.stream().map(x -> x * x).reduce((x, y) -> x + y).get();
}
}
答案 1 :(得分:1)
我希望第二个是最快的。
第二个和第三个例子都没有装箱(如果列表中已包含已装箱的元素)。但是,有拆箱。
您的第二个示例可能有两个拆箱(一个用于x
中的每个x*x
),而第三个示例仅拆箱一次。但是,取消装箱很快,我认为不值得优化,因为带有额外函数调用的较长管道肯定会减慢它。
旁注:一般来说,您不应期望Stream
比数组或列表上的常规迭代更快。在进行数学计算时,速度很重要(比如这样),最好采用另一种方式:简单地遍历元素。如果您的输出是聚合值,则聚合它,如果它是映射,则分配一个相同大小的新数组或列表,并用计算值填充它。
答案 2 :(得分:-1)
mapToInt()方法,这是map操作的一种变体(变体 如mapToInt(),mapToDouble()等,创建类型专用的流,例如 作为IntStream和DoubleStream)。映射流后,只要需要使用任何IntStream Class方法,就可以使用mapToINT()。