我写了一个试图测试两件事的测试:
ArrayList
我对结果感到惊讶
Integer
vs int
)并不比原始版本慢得多ArrayList
的速度是相应数组的两倍多。ArrayList
这么慢? 0% Scenario{vm=java, trial=0, benchmark=SmallArray} 34.57 ns; ?=0.79 ns @ 10 trials
17% Scenario{vm=java, trial=0, benchmark=SmallBoxed} 40.40 ns; ?=0.21 ns @ 3 trials
33% Scenario{vm=java, trial=0, benchmark=SmallList} 105.78 ns; ?=0.09 ns @ 3 trials
50% Scenario{vm=java, trial=0, benchmark=BigArray} 34.53 ns; ?=0.05 ns @ 3 trials
67% Scenario{vm=java, trial=0, benchmark=BigBoxed} 40.09 ns; ?=0.23 ns @ 3 trials
83% Scenario{vm=java, trial=0, benchmark=BigList} 105.91 ns; ?=0.14 ns @ 3 trials
benchmark ns linear runtime
SmallArray 34.6 =========
SmallBoxed 40.4 ===========
SmallList 105.8 =============================
BigArray 34.5 =========
BigBoxed 40.1 ===========
BigList 105.9 ==============================
vm: java
trial: 0
此代码是使用Java 7和Google caliper 0.5-rc1在Windows中编写的(因为最后我检查1.0在Windows中不起作用)。
快速概述:在所有6个测试中,在循环的每次迭代中,它都会在数组的前128个单元格中添加值(无论数组有多大),并将其添加到总值中。 Caliper告诉我测试应该运行多少次,所以我将这个添加循环128次。
6项测试包含int[]
,Integer[]
和ArrayList<Integer>
的大型(131072)和小型(128)版本。你可以找出名字中的哪一个。
import java.util.ArrayList;
import java.util.List;
import java.util.Random;
import com.google.caliper.Runner;
import com.google.caliper.SimpleBenchmark;
public class SpeedTest {
public static class TestBenchmark extends SimpleBenchmark {
int[] bigArray = new int[131072];
int[] smallArray = new int[128];
Integer[] bigBoxed = new Integer[131072];
Integer[] smallBoxed = new Integer[128];
List<Integer> bigList = new ArrayList<>(131072);
List<Integer> smallList = new ArrayList<>(128);
@Override
protected void setUp() {
Random r = new Random();
for(int i = 0; i < 128; i++) {
smallArray[i] = Math.abs(r.nextInt(100));
bigArray[i] = smallArray[i];
smallBoxed[i] = smallArray[i];
bigBoxed[i] = smallArray[i];
smallList.add(smallArray[i]);
bigList.add(smallArray[i]);
}
}
public long timeBigArray(int reps) {
long result = 0;
for(int i = 0; i < reps; i++) {
for(int j = 0; j < 128; j++) {
result += bigArray[j];
}
}
return result;
}
public long timeSmallArray(int reps) {
long result = 0;
for(int i = 0; i < reps; i++) {
for(int j = 0; j < 128; j++) {
result += smallArray[j];
}
}
return result;
}
public long timeBigBoxed(int reps) {
long result = 0;
for(int i = 0; i < reps; i++) {
for(int j = 0; j < 128; j++) {
result += bigBoxed[j];
}
}
return result;
}
public long timeSmallBoxed(int reps) {
long result = 0;
for(int i = 0; i < reps; i++) {
for(int j = 0; j < 128; j++) {
result += smallBoxed[j];
}
}
return result;
}
public long timeBigList(int reps) {
long result = 0;
for(int i = 0; i < reps; i++) {
for(int j = 0; j < 128; j++) {
result += bigList.get(j);
}
}
return result;
}
public long timeSmallList(int reps) {
long result = 0;
for(int i = 0; i < reps; i++) {
for(int j = 0; j < 128; j++) {
result += smallList.get(j);
}
}
return result;
}
}
public static void main(String[] args) {
Runner.main(TestBenchmark.class, new String[0]);
}
}
答案 0 :(得分:5)
首先......
ArrayLists的速度是数组的两倍多吗?
作为概括,没有。对于可能涉及“更改”列表/数组长度的操作,ArrayList
将比数组更快...除非使用单独的变量来表示数组的逻辑大小。
对于其他操作,ArrayList
可能会更慢,但性能比很可能取决于操作和JVM实现。请注意,您只测试了一个操作/模式。
为什么ArrayList这么慢?
因为ArrayList内部有一个不同的数组对象。
操作通常涉及额外的间接(例如,获取列表的大小和内部数组),还有额外的边界检查(例如检查列表的size
和数组的长度)。典型的JIT编译器(显然)无法优化这些。 (事实上,你不希望优化内部数组,因为这是允许ArrayList增长的原因。)
对于基元的数组,相应的列表类型涉及包装的基元类型/对象,这增加了开销。例如,您的result += ...
涉及“列表”案例中的拆箱。
我的基准写得好吗?换句话说,我的结果是否准确?
技术上没有任何问题。但这还不足以证明你的观点。首先,您只测量一种操作:数组元素获取及其等价物。而你只是测量原始类型。
最后,这很大程度上忽略了使用List
类型的重点。我们使用它们是因为它们几乎总是比普通数组更容易使用。 (例如)2的性能差异通常对整体应用程序性能不重要。
答案 1 :(得分:4)
请记住,在使用ArrayList时,实际上是在调用一个函数,在get()
的情况下,实际上会调用另外两个函数。 (其中一个是范围检查,我怀疑这可能是延迟的一部分)。
ArrayList的重要之处在于,与直接数组相比,它的速度和速度要快得多,但它的访问时间总是不变的(如数组)。在现实世界中,您几乎总会发现增加的延迟可以忽略不计。特别是如果您有一个甚至考虑连接到数据库的应用程序。 :)
简而言之,我认为您的测试(和结果)是合法的。
答案 2 :(得分:0)
这些结果并不让我感到惊讶。 List.get(int)
涉及演员阵容,这很慢。 Java的泛型是通过类型擦除实现的,这意味着任何类型的List<T>
实际上都是List<Object>
,并且你输出类型的唯一原因是因为强制转换。 ArrayList
的来源如下:
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
// snip...
private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
// snip...
@SuppressWarnings("unchecked")
E elementData(int index) {
return (E) elementData[index];
}
rangeCheck
和函数调用的开销是微不足道的,它是强制转换为E
的。{/ p>
答案 3 :(得分:0)
如果您存储了数百万个对象,那么Add或Contains函数将会超级慢。最好的方法是使用Arrays的hashMap拆分它。虽然类似的算法可以用于其他类型的对象,但这就是我对1000万个字符串的处理速度提高1000倍(所占用的内存是2-3倍)
public static class ArrayHashList {
private String temp1, temp2;
HashMap allKeys = new HashMap();
ArrayList curKeys;
private int keySize;
public ArrayHashList(int keySize) {
this.keySize = keySize;
}
public ArrayHashList(int keySize, String fromFileName) {
this.keySize = keySize;
String line;
try{
BufferedReader br1 = new BufferedReader(new FileReader(fromFileName));
while ((line = br1.readLine()) != null)
addString(line);
br1.close();
}catch(Exception e){
e.printStackTrace();
}
}
public boolean addString(String strToAdd) {
if (strToAdd.length()<keySize)
temp1 = strToAdd;
else
temp1 = strToAdd.substring(0,keySize);
if (!allKeys.containsKey(temp1))
allKeys.put(temp1,new ArrayList());
curKeys = (ArrayList)allKeys.get(temp1);
if (!curKeys.contains(strToAdd)){
curKeys.add(strToAdd);
return true;
}
return false;
}
public boolean haveString(String strCheck) {
if (strCheck.length()<keySize)
temp1 = strCheck;
else
temp1 = strCheck.substring(0,keySize);
if (!allKeys.containsKey(temp1))
allKeys.put(temp1,new ArrayList());
curKeys = (ArrayList)allKeys.get(temp1);
return curKeys.contains(strCheck);
}
}
初始化并使用它:
ArrayHashList fullHlist = new ArrayHashList(3, filesPath+"\\allPhrases.txt");
ArrayList pendingList = new ArrayList();
BufferedReader br1 = new BufferedReader(new FileReader(filesPath + "\\processedPhrases.txt"));
while ((line = br1.readLine()) != null) {
wordEnc = StrUtil.GetFirstToken(line,",~~~,");
if (!fullHlist.haveString(wordEnc))
pendingList.add(wordEnc);
}
br1.close();