Java中的Collections.sort()是否有更快的速度?

时间:2015-08-10 12:48:16

标签: java algorithm performance sorting arraylist

我制作了中值滤波算法,我想优化它。目前它需要大约1秒来过滤2MM行(一个文件读入ArrayList elements),我试图将其减少到更少(可能是一半的时间?)我使用的是ArrayLists对于我的算法,并尽量减少嵌套循环的使用,以避免增加时间,但我仍然无法达到低于0.98秒的顶部。

这是一个执行中值过滤器的代码段:

//Start Filter Algorithm 2
        int index=0;
        while(index<filterSize){
            tempElements.add(this.elements.get(index+counter)); //Add element to a temporary arraylist
            index+=1;
            if(index==filterSize){
                outputElements.add(tempElements.get((filterSize-1)/2)); //Add median Value to output ArrayList
                tempElements.clear(); //Clear temporary ArrayList
                index = 0; //Reset index
                counter+=1; //Counter increments by 1 to move to start on next element in elements ArrayList                    
            }
            if(elementsSize-counter <filterSize){
                break; //Break if there is not enough elements for the filtering to work
            }
        }

我正在发生的事情是,我正在为我提供的elements filterSize arraylist进行循环播放。然后我将元素添加到临时(tempElements)arraylist,使用Collections.sort()对其进行排序(这是我想要避免的),找到中值并将其添加到我的最终输出arraylist中。然后我清除tempElements arraylist并继续我的循环,直到由于缺少元素(小于filterSize)而无法再过滤。

我正在寻找一种优化它并加快速度的方法。我试图使用TreeSet但我无法从它获得索引值。

由于

2 个答案:

答案 0 :(得分:9)

Java Collections.sort()实现与排序(双轴快速排序)时的速度一样快。

这里的问题不在于细节,而在于你正在排序的事实!您只需要找到中位数,并且有线性算法(排序是对数线性的)。请参阅selection获取一些灵感。您可能需要自己编写代码,因为我不认为Java库有任何可用的公共实现。

我建议的另一件事是使用固定大小的数组(创建一次)而不是ArrayList。因为你事先知道过滤器的大小会给你一个小的速度提升。

此外,我还没有看到避免循环如何以任何方式帮助提高性能。除非你对它进行了分析并证明它是正确的,否则我只能编写最易读的代码。

最后,TreeSet或任何其他类型的排序数据结构都不会有帮助,因为 n 插入的时间复杂度是对数线性的。

答案 1 :(得分:2)

作为Giovanni Botta出色答案的替代选择:

假设您有一个数组[7, 3, 8, 4, 6, 6, 2, 4, 6]和一个filterSize为4.那么我们的第一个临时数组将是[7, 3, 8, 4],我们可以对其进行排序以获得[3, 4, 7, 8]。当我们计算下一个临时数组时,我们可以在线性(或更好?)时间内完成,如下所示:

  1. 删除7
  2. 在排序位置插入6
  3. 我们可以在初始排序后对所有临时数组重复此操作。如果您花费大量时间对子阵列进行排序,这可能不是一个糟糕的方法。诀窍是它增加了所需的存储空间,因为你需要记住删除条目的顺序,但这不应该是一个大问题(我不会想到)。