Question

例如：

a） int [x][y][z]

vs
b） int[x*y*z]

最初我认为我会选择a）以简化

我知道Java不像C那样在内存中线性存储数组。但是这对我的计划有什么影响？

Answer 1

通常，在搜索此类问题时，最好的办法是查看如何将选项编译为JVM字节码：

multi = new int[50][50];
single = new int[2500];

这被翻译成：

BIPUSH 50
BIPUSH 50
MULTIANEWARRAY int[][] 2
ASTORE 1
SIPUSH 2500
NEWARRAY T_INT
ASTORE 2

所以，正如你所看到的， JVM已经知道我们正在谈论多维数组。

进一步保持：

for (int i = 0; i < 50; ++i)
    for (int j = 0; j < 50; ++j)
    {
        multi[i][j] = 20;
        single[i*50+j] = 20;
    }

将其翻译（跳过周期）：

ALOAD 1: multi
ILOAD 3: i
AALOAD
ILOAD 4: j
BIPUSH 20
IASTORE

ALOAD 2: single
ILOAD 3: i
BIPUSH 50
IMUL
ILOAD 4: j
IADD
BIPUSH 20
IASTORE

所以，如你看到的，多维数组在VM内部处理，无用的指令没有产生任何开销，而使用单个指令则使用更多指令，因为偏移是手动计算的。

我认为表现不会是这样的问题。

编辑：

我做了一些简单的基准测试，看看这里发生了什么。我选择尝试不同的例子：线性读取，线性写和随机访问。时间以毫秒表示（并使用System.nanoTime()计算。结果如下：

线性写

尺寸：100x100（10000）多：5.786591 单身：6.131748
尺寸：200x200（40000）多：1.216366 单身：0.782041
尺寸：500x500（250000）多：7.177029 单身：3.667017
尺寸：1000x1000（1000000）多：30.508131 单身：18.064592
尺寸：2000x2000（4000000）多：185.3548 单身：155.590313
尺寸：5000x5000（25000000）多：955.5299 单身：923.264417
尺寸：10000x10000（100000000）多个：4084.798753 单身：4015.448829

线性阅读

尺寸：100x100（10000）多：5.241338 单身：5.135957
尺寸：200x200（40000）倍数：0.080209 单身：0.044371
尺寸：500x500（250000）倍数：0.088742 单身：0.084476
尺寸：1000x1000（1000000）多：0.232095 单身：0.167671
尺寸：2000x2000（4000000）多：0.481683 单身：0.33321
尺寸：5000x5000（25000000）多：1.222339 单身：0.828118 大小：10000x10000（100000000）多：2.496302 单身：1.650691

随机阅读

尺寸：100x100（10000）多人：22.317393 单身：8.546134
尺寸：200x200（40000）多：32.287669 单身：11.022383
尺寸：500x500（250000）多：189.542751 单身：68.181343
尺寸：1000x1000（1000000）多：1124.78609 单身：272.235584
尺寸：2000x2000（4000000）多人：6814.477101 单身：1091.998395
尺寸：5000x5000（25000000）多：50051.306239 单身：7028.422262

随机的一个有点误导，因为它为多维数组生成2个随机数，而单个维生成一个（而PNRG可能会占用一些CPU）。

请注意，我试图让JIT只在第20次运行相同循环后才能通过基准测试。为了完整性，我的java VM如下：

java版“1.6.0_17” Java（TM）SE运行时环境（版本1.6.0_17-b04） Java HotSpot（TM）64位服务器VM（内置14.3-b01，混合模式）

Answer 2

在当前的CPU上，非缓存内存访问速度比算术缓慢几百倍（参见this presentation和阅读What every programmer should know about memory）。 a）选项将导致大约3次内存查找，而b）选项将导致大约1次内存查找。 CPU的预取算法也可能不起作用。因此b）选项在某些情况下可能更快（它是一个热点，并且数组不适合CPU的缓存）。多快了？ - 这取决于申请。

我个人首先会使用a）选项，因为它会产生更简单的代码。如果探查器显示数组访问是瓶颈，那么我会将其转换为b）选项，以便有一对帮助方法来读取和写入数组值（这样凌乱的代码将被限制在那两个方法）。

我做了一个基准，用于将三维int数组（“Multi”列）与等效的1维int数组（“Single”列）进行比较。代码为here并测试here。我使用JVM选项-server -Xmx3G -verbose:gc -XX:+PrintCompilation在64位jdk1.6.0_18，Windows 7 x64，Core 2 Quad Q6600 @ 3.0 GHz，4 GB DDR2上运行它（我已从以下结果中删除了调试输出）。结果是：

Out of 20 repeats, the minimum time in milliseconds is reported.

Array dimensions: 100x100x100 (1000000)
            Multi   Single
Seq Write   1       1
Seq Read    1       1
Random Read 99      90    (of which generating random numbers 59 ms)

Array dimensions: 200x200x200 (8000000)
            Multi   Single
Seq Write   14      13
Seq Read    11      8
Random Read 1482    1239    (of which generating random numbers 474 ms)

Array dimensions: 300x300x300 (27000000)
            Multi   Single
Seq Write   53      46
Seq Read    34      24
Random Read 5915    4418    (of which generating random numbers 1557 ms)

Array dimensions: 400x400x400 (64000000)
            Multi   Single
Seq Write   123     111
Seq Read    71      55
Random Read 16326   11144    (of which generating random numbers 3693 ms)

这表明1维数组更快。虽然差异很小，但对于99％的应用来说，它并不值得注意。

我还做了一些测量，通过将preventOptimizingAway += array.get(x, y, z);替换为preventOptimizingAway += x * y * z;来估算随机读取基准中生成随机数的开销，并将测量值手动添加到上述结果表中。生成随机数需要随机读取基准测试总时间的1/3或更少，因此内存访问在预期基准测试中占主导地位。用4维和更多维的数组重复这个基准测试会很有趣。可能会使速度差异更大，因为多维数组的最高级别适合CPU的缓存，只有其他级别需要内存查找。

Answer 3

使用第一个变体（3维），因为它更容易理解，并且产生一些逻辑错误的机会更少（特别是如果你用它来建模三维空间）

Answer 4

如果您选择后一种路线，那么您将不得不为每个阵列访问执行算术运算。这将是一个痛苦和容易出错的错误（除非你将它包装在提供此功能的类中）。

我不相信在选择平面阵列时有任何（重大）优化（特别是考虑到将其编入索引的算法）。与优化一样，您需要执行一些测量并确定它是否真的值得。

Java：多维数组与一维数组

4 个答案: