我有以下代码,
import java.util.Arrays;
public class ParellelStream {
public static void main(String args[]){
Double dbl[] = new Double[1000000];
for(int i=0; i<dbl.length;i++){
dbl[i]=Math.random();
}
long start = System.currentTimeMillis();
Arrays.parallelSort(dbl);
System.out.println("time taken :"+((System.currentTimeMillis())-start));
}
}
当我运行此代码时需要大约700到800毫秒的时间,但是当我将行Arrays.parallelSort替换为Arrays.sort时,需要500到600毫秒。我读到了Arrays.parallelSort和Arrays.sort方法,该方法说Arrays.parellelSort在数据集较小时性能较差但在这里我使用的是1000000个元素的数组。什么可能是parallelSort性能不佳的原因??我正在使用java8。
答案 0 :(得分:5)
parallelSort函数将为您机器上的每个cpu核心使用一个线程。特别是parallelSort在ForkJoin公共线程池上运行任务。如果您只有一个核心,那么您将看不到单线程排序的改进。
如果您只有多个核心,那么您将需要一些与创建新线程相关的前期成本,这意味着对于相对较小的阵列,您将不会看到线性性能提升。
比较双打的比较功能不是一项昂贵的功能。我认为在这种情况下,可以安全地认为1000000个元素很小,并且创建这些线程的前期成本超过了使用多个线程的好处。由于前期成本将得到修复,您应该会看到更大阵列的性能提升。
答案 1 :(得分:4)
我读到了Arrays.parallelSort和Arrays.sort方法 当数据集很小时,Arrays.parellelSort表现不佳 但在这里我使用的是1000000个元素的数组。
这不是唯一需要考虑的事情。这很大程度上取决于你的机器(你的CPU如何处理多线程等)。
这里引用了The Java Tutorials的Parallelism部分
请注意,并行性不会自动快于执行速度 串行操作,但如果你有足够的数据和 处理器核心 [...]您仍然有责任确定是否 您的应用程序适合并行化。
您可能还想查看java.util.ArraysParallelSortHelpers
的代码,以便更好地理解算法。
请注意,parallelSort
方法使用Java 7中引入的ForkJoinPool
来充分利用计算机中的每个处理器,如javadoc中所述:
使用给定的目标并行度级构建ForkJoinPool; 默认情况下,等于可用处理器的数量。
请注意,如果数组的长度小于1 << 13
,则将使用适当的Arrays.sort
方法对数组进行排序。
另见