我制作了中值滤波算法,我想优化它。目前它需要大约1秒来过滤2MM行(一个文件读入ArrayList elements
),我试图将其减少到更少(可能是一半的时间?)我使用的是ArrayLists对于我的算法,并尽量减少嵌套循环的使用,以避免增加时间,但我仍然无法达到低于0.98秒的顶部。
这是一个执行中值过滤器的代码段:
//Start Filter Algorithm 2
int index=0;
while(index<filterSize){
tempElements.add(this.elements.get(index+counter)); //Add element to a temporary arraylist
index+=1;
if(index==filterSize){
outputElements.add(tempElements.get((filterSize-1)/2)); //Add median Value to output ArrayList
tempElements.clear(); //Clear temporary ArrayList
index = 0; //Reset index
counter+=1; //Counter increments by 1 to move to start on next element in elements ArrayList
}
if(elementsSize-counter <filterSize){
break; //Break if there is not enough elements for the filtering to work
}
}
我正在发生的事情是,我正在为我提供的elements
filterSize
arraylist进行循环播放。然后我将元素添加到临时(tempElements
)arraylist,使用Collections.sort()
对其进行排序(这是我想要避免的),找到中值并将其添加到我的最终输出arraylist中。然后我清除tempElements
arraylist并继续我的循环,直到由于缺少元素(小于filterSize
)而无法再过滤。
我正在寻找一种优化它并加快速度的方法。我试图使用TreeSet但我无法从它获得索引值。
由于
答案 0 :(得分:9)
Java Collections.sort()
实现与排序(双轴快速排序)时的速度一样快。
这里的问题不在于细节,而在于你正在排序的事实!您只需要找到中位数,并且有线性算法(排序是对数线性的)。请参阅selection获取一些灵感。您可能需要自己编写代码,因为我不认为Java库有任何可用的公共实现。
我建议的另一件事是使用固定大小的数组(创建一次)而不是ArrayList
。因为你事先知道过滤器的大小会给你一个小的速度提升。
此外,我还没有看到避免循环如何以任何方式帮助提高性能。除非你对它进行了分析并证明它是正确的,否则我只能编写最易读的代码。
最后,TreeSet
或任何其他类型的排序数据结构都不会有帮助,因为 n 插入的时间复杂度是对数线性的。
答案 1 :(得分:2)
作为Giovanni Botta出色答案的替代选择:
假设您有一个数组[7, 3, 8, 4, 6, 6, 2, 4, 6]
和一个filterSize
为4.那么我们的第一个临时数组将是[7, 3, 8, 4]
,我们可以对其进行排序以获得[3, 4, 7, 8]
。当我们计算下一个临时数组时,我们可以在线性(或更好?)时间内完成,如下所示:
我们可以在初始排序后对所有临时数组重复此操作。如果您花费大量时间对子阵列进行排序,这可能不是一个糟糕的方法。诀窍是它增加了所需的存储空间,因为你需要记住删除条目的顺序,但这不应该是一个大问题(我不会想到)。