Arrays.sort和Arrays.parallelSort函数行为

时间:2015-05-05 13:09:41

标签: java java-8

我有以下代码,

import java.util.Arrays;


public class ParellelStream {

    public static void main(String args[]){
        Double dbl[] = new Double[1000000];
        for(int i=0; i<dbl.length;i++){
            dbl[i]=Math.random();
        }

        long start = System.currentTimeMillis();
        Arrays.parallelSort(dbl);
        System.out.println("time taken :"+((System.currentTimeMillis())-start));

    }

}

当我运行此代码时需要大约700到800毫秒的时间,但是当我将行Arrays.parallelSort替换为Arrays.sort时,需要500到600毫秒。我读到了Arrays.parallelSort和Arrays.sort方法,该方法说Arrays.parellelSort在数据集较小时性能较差但在这里我使用的是1000000个元素的数组。什么可能是parallelSort性能不佳的原因??我正在使用java8。

2 个答案:

答案 0 :(得分:5)

parallelSort函数将为您机器上的每个cpu核心使用一个线程。特别是parallelSort在ForkJoin公共线程池上运行任务。如果您只有一个核心,那么您将看不到单线程排序的改进。

如果您只有多个核心,那么您将需要一些与创建新线程相关的前期成本,这意味着对于相对较小的阵列,您将不会看到线性性能提升。

比较双打的比较功能不是一项昂贵的功能。我认为在这种情况下,可以安全地认为1000000个元素很小,并且创建这些线程的前期成本超过了使用多个线程的好处。由于前期成本将得到修复,您应该会看到更大阵列的性能提升。

答案 1 :(得分:4)

  

我读到了Arrays.parallelSort和Arrays.sort方法   当数据集很小时,Arrays.parellelSort表现不佳   但在这里我使用的是1000000个元素的数组。

这不是唯一需要考虑的事情。这很大程度上取决于你的机器(你的CPU如何处理多线程等)。

这里引用了The Java Tutorials的Parallelism部分

  

请注意,并行性不会自动快于执行速度   串行操作,但如果你有足够的数据和   处理器核心 [...]您仍然有责任确定是否   您的应用程序适合并行化。

您可能还想查看java.util.ArraysParallelSortHelpers的代码,以便更好地理解算法。

请注意,parallelSort方法使用Java 7中引入的ForkJoinPool来充分利用计算机中的每个处理器,如javadoc中所述:

  

使用给定的目标并行度级构建ForkJoinPool;   默认情况下,等于可用处理器的数量。

请注意,如果数组的长度小于1 << 13,则将使用适当的Arrays.sort方法对数组进行排序。

另见