.toArray(new MyClass [0])或.toArray(new MyClass [myList.size()])?

时间:2008-10-06 12:38:00

标签: java performance coding-style

假设我有一个ArrayList

ArrayList<MyClass> myList;

我想打电话给阿瑞,是否有使用

的表现理由
MyClass[] arr = myList.toArray(new MyClass[myList.size()]);

MyClass[] arr = myList.toArray(new MyClass[0]);

我更喜欢第二种风格,因为它不那么冗长,我认为编译器会确保空数组不会真正被创建,但我一直在想这是不是真的。

当然,在99%的情况下,这种方式并没有什么不同,但我希望在我的普通代码和优化的内部循环之间保持一致的风格......

9 个答案:

答案 0 :(得分:120)

ArrayList in Java 5开始,如果数组具有正确的大小(或更大),则数组将被填充。因此

MyClass[] arr = myList.toArray(new MyClass[myList.size()]);

将创建一个数组对象,填充它并将其返回到“arr”。另一方面

MyClass[] arr = myList.toArray(new MyClass[0]);

将创建两个数组。第二个是长度为0的MyClass数组。因此,对象的对象创建将立即被丢弃。就源代码而言,编译器/ JIT无法对此进行优化,因此不会创建它。此外,使用零长度对象会导致在toArray()方法中进行强制转换。

请参阅ArrayList.toArray()的来源:

public <T> T[] toArray(T[] a) {
    if (a.length < size)
        // Make a new array of a's runtime type, but my contents:
        return (T[]) Arrays.copyOf(elementData, size, a.getClass());
    System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

使用第一种方法,以便只创建一个对象并避免(隐式但是昂贵的)铸件。

答案 1 :(得分:72)

违反直觉,Hotspot 8上最快的版本是:

MyClass[] arr = myList.toArray(new MyClass[0]);

我使用jmh运行微基准测试,结果和代码如下所示,表明具有空数组的版本始终优于具有预设数组的版本。请注意,如果您可以重用正确大小的现有数组,结果可能会有所不同。

基准测试结果(以微秒为单位的得分,更小=更好):

Benchmark                      (n)  Mode  Samples    Score   Error  Units
c.a.p.SO29378922.preSize         1  avgt       30    0.025 ▒ 0.001  us/op
c.a.p.SO29378922.preSize       100  avgt       30    0.155 ▒ 0.004  us/op
c.a.p.SO29378922.preSize      1000  avgt       30    1.512 ▒ 0.031  us/op
c.a.p.SO29378922.preSize      5000  avgt       30    6.884 ▒ 0.130  us/op
c.a.p.SO29378922.preSize     10000  avgt       30   13.147 ▒ 0.199  us/op
c.a.p.SO29378922.preSize    100000  avgt       30  159.977 ▒ 5.292  us/op
c.a.p.SO29378922.resize          1  avgt       30    0.019 ▒ 0.000  us/op
c.a.p.SO29378922.resize        100  avgt       30    0.133 ▒ 0.003  us/op
c.a.p.SO29378922.resize       1000  avgt       30    1.075 ▒ 0.022  us/op
c.a.p.SO29378922.resize       5000  avgt       30    5.318 ▒ 0.121  us/op
c.a.p.SO29378922.resize      10000  avgt       30   10.652 ▒ 0.227  us/op
c.a.p.SO29378922.resize     100000  avgt       30  139.692 ▒ 8.957  us/op

供参考,代码:

@State(Scope.Thread)
@BenchmarkMode(Mode.AverageTime)
public class SO29378922 {
  @Param({"1", "100", "1000", "5000", "10000", "100000"}) int n;
  private final List<Integer> list = new ArrayList<>();
  @Setup public void populateList() {
    for (int i = 0; i < n; i++) list.add(0);
  }
  @Benchmark public Integer[] preSize() {
    return list.toArray(new Integer[n]);
  }
  @Benchmark public Integer[] resize() {
    return list.toArray(new Integer[0]);
  }
}

您可以在博文Arrays of Wisdom of the Ancients中找到类似的结果,完整的分析和讨论。总结一下:JVM和JIT编译器包含几个优化,使它能够廉价地创建和初始化一个新的正确大小的数组,如果你自己创建数组,则不能使用这些优化。

答案 2 :(得分:14)

现代JVM在这种情况下优化了反射阵列结构,因此性能差异很小。在这样的样板代码中将集合命名两次并不是一个好主意,所以我要避免使用第一种方法。第二个优点是它适用于同步和并发集合。如果要进行优化,请重用空数组(空数组是不可变的,可以共享),或者使用分析器(!)。

答案 3 :(得分:12)

来自JetBrains Intellij Idea检查:

  

将集合转换为数组有两种样式:使用   一个预先调整大小的数组(如 c.toArray(new String [c.size()]))或   使用空数组(如 c.toArray(new String [0])

In   建议使用预先大小的数组的旧Java版本   反射调用,这是创建适当大小的数组所必需的   很慢。但是由于OpenJDK 6的最新更新此次调用   是内在的,使得空阵列版本的性能   与预先规模相比,相同甚至更好   版。传递预先调整大小的数组对于并发或者也是危险的   同步集合作为数据竞争是可能的    size toArray 调用可能会导致额外的空值   在数组的末尾,如果集合同时缩小   在手术期间。

此检查允许遵循   统一样式:使用空数组(建议使用)   现代Java)或使用预先调整大小的数组(可能更快)   较旧的Java版本或基于非HotSpot的JVM)。

答案 4 :(得分:4)

第一种情况更有效。

那是因为在第二种情况下:

MyClass[] arr = myList.toArray(new MyClass[0]);

运行时实际上创建了一个空数组(大小为零),然后在toArray方法内创建另一个数组以适合实际数据。使用以下代码(取自jdk1.5.0_10)使用反射完成此创建:

public <T> T[] toArray(T[] a) {
    if (a.length < size)
        a = (T[])java.lang.reflect.Array.
    newInstance(a.getClass().getComponentType(), size);
System.arraycopy(elementData, 0, a, 0, size);
    if (a.length > size)
        a[size] = null;
    return a;
}

通过使用第一个表单,可以避免创建第二个数组,也可以避免使用反射代码。

答案 5 :(得分:3)

toArray检查传递的数组是否具有正确的大小(即,足够大以适合列表中的元素),如果是,则使用它。因此,如果数组的大小小于所需数量,则会反射性地创建一个新数组。

在你的情况下,一个大小为零的数组是不可变的,因此可以安全地提升到一个静态的最终变量,这可能会使你的代码更清晰,这避免了在每次调用时创建数组。无论如何,将在方法内部创建一个新数组,因此它是可读性优化。

可以说更快的版本是传递正确大小的数组,但除非你能证明这个代码是性能瓶颈,否则更喜欢可读性和运行时性能,直到证明不是这样。

答案 6 :(得分:-1)

对正确大小的数组使用'toArray'会表现得更好,因为替代方法将首先创建零大小的数组,然后创建正确大小的数组。但是,正如你所说,差异可能微乎其微。

另请注意,javac编译器不执行任何优化。目前,所有优化都是由JIT / HotSpot编译器在运行时执行的。我不知道在任何JVM中围绕'toArray'的任何优化。

然后,你的问题的答案在很大程度上取决于风格,但为了保持一致性,应该成为你所遵守的任何编码标准的一部分(无论是否有文件记录)。

答案 7 :(得分:-1)

第二个可读性稍差,但是没有什么改进,这是不值得的。第一种方法更快,在运行时没有任何缺点,所以这就是我使用的方法。但我是第二种方式,因为输入速度更快。然后我的IDE将其标记为警告并提供修复它。只需一次击键,它就可以将代码从第二种类型转换为第一种类型。

答案 8 :(得分:-4)

整数的示例代码:

Integer[] arr = myList.toArray(new integer[0]);