ArrayList remove vs removeAll

时间:2015-03-01 12:50:36

标签: java performance arraylist collections removeall

如果我想从arraylist中删除一个集合,最好使用什么? 我认为ArrayList中的removeAll方法是为这个任务编写的,但是在我写的一个测试中,只是迭代遍历对象并删除它们个人的速度要快几秒。

你为此目的使用了什么?

编辑:

我在grepcode上找到的removeAll代码调用batchRemove(c,false):

private boolean更多... batchRemove(Collection c,boolean complement){

700         final Object[] elementData = this.elementData;
701         int r = 0, w = 0;
702         boolean modified = false;
703         try {
704             for (; r < size; r++)
705                 if (c.contains(elementData[r]) == complement)
706                     elementData[w++] = elementData[r];
707         } finally {
708             // Preserve behavioral compatibility with AbstractCollection,
709             // even if c.contains() throws.
710             if (r != size) {
711                 System.arraycopy(elementData, r,
712                                  elementData, w,
713                                  size - r);
714                 w += size - r;
715             }
716             if (w != size) {
717                 // clear to let GC do its work
718                 for (int i = w; i < size; i++)
719                     elementData[i] = null;
720                 modCount += size - w;
721                 size = w;
722                 modified = true;
723             }
724         }
725         return modified;
726     }

我其实不明白..

我的测试代码是这样的:

public class RemoveVsRemovall {

    public static void main(String[] args){
        ArrayList<String> source = new ArrayList<>();
        ArrayList<String> toRemove = new ArrayList<>();
        for(int i = 0; i < 30000; i++){
            String s = String.valueOf(System.nanoTime());
            source.add(s);
            if(i % 2 == 0) toRemove.add(s);
        }
        long startTime = System.nanoTime();
        removeList1(source, toRemove);
        long endTime = System.nanoTime();
        System.out.println("diff: " + (endTime - startTime) * 1e-9);
    }

    static void removeList1(ArrayList<String> source, ArrayList<String> toRemove){
        source.removeAll(toRemove);
    }

    static void removeList2(ArrayList<String> source, ArrayList<String> toRemove){
        for(String s : toRemove){
            source.remove(s);
        }
    }
}

使用不同的列表大小调用它几次并在两种方法之间切换。

2 个答案:

答案 0 :(得分:4)

有几个原因很难对这个问题给出一般答案。

首先,您必须了解这些性能特征是依赖于实现的。实现很可能取决于JDK的平台和版本。

话虽如此,实施removeAll主要有两种策略:

  1. 对于ArrayList的每个元素,请检查它是否在另一个Collection中;如果是这样,请将其删除。
  2. 对于Collection的每个元素,请检查它是否在ArrayList;如果是这样,请将其删除。
  3. 如果Collection执行包含恒定时间,则策略1(渐近地)获胜。另一方面,如果通过扫描整个连接执行contains并且Collection迭代非常缓慢,则策略2通常具有边缘,因为它仅在Collection上迭代一次;但即使在这种情况下,如果Collection非常大且ArrayList的大多数元素都是Collection的第一个元素,那么策略1再次获胜......没有结束它。

    你可能最好相信removeAll()的实施;如果失败,请尝试更改数据结构;如果这也失败了,请从经验基准中实施自己的方法。

答案 1 :(得分:2)

要考虑的另一件事:

Java的代码经过长时间的争夺,并且是为了适应许多不同的特殊情况而编写的(参见注释Preserve behavioral compatibility with AbstractCollection)。

所以,实际上你可能会编写自己的方法实现,运行速度会更快。但另一方面,您确定可以处理自Java诞生以来Java开发人员面临的所有特殊情况吗?

还要考虑到某些Java函数可能正在使用某些C实现来加快速度。这显然不是这里的情况,但它可以。