Question

从two-d array和C这两个角度为memory-management中的speed分配内存的最佳方法是什么？

另外，哪个更好用，two-d array（并为其分配内存）或double pointer？有人可以详细解释一下，内部会发生什么，为什么一种方法比另一种更好？

Answer 1

为了获得最佳性能和最佳可读性，应始终将此类数组分配为连续的内存块：

type (*array) [X][Y] = malloc( sizeof(type[X][Y]) );

你应该避免这种情况：

// BAD METHOD, not a real array

type** lookup_table = malloc( X*sizeof(type*) );
for(size_t i=0; i<Y; i++)
{
  lookup_table[i] = malloc( Y*sizeof(type) );
}

由于种种原因，前者更快。它被分配在一个连续的内存块中，而不是在整个堆中进行分段。分段版本阻止了所有形式的代码优化和高效的片上数据缓存使用，而且实际分配也慢得多。

上面的“坏”版本有一个优点，那就是当您希望各个维度具有可变长度时，例如在为字符串创建查找表时。然后你必须使用那个表格。但是如果你想要一个真正的2D阵列，就没有理由不使用前者。

请注意，第一个版本通常写为

type (*array) [Y] = malloc( sizeof(type[X][Y]) );

允许更方便的使用：array[i][j]，而不是可读性较低的(*array)[i][j]。

Answer 2

data_type (*mat)[size_2] = malloc(size_1 * size_2 * sizeof(data_type));

这将为数组数组（“2d数组”）分配连续的内存。如果你不需要荒谬的¹空间，这就是你要走的路。由于使用了malloc，您将减少内存碎片，提高缓存友好性并避免过多的开销。

¹ _{对某些（特定应用）荒谬的定义}

Answer 3

给定固定大小，您可以简单地说twoDimArray[100][100]，它将在堆栈上分配它。但是，在堆上分配时（无论是因为大小非常大还是因为大小是动态的），您有更多选择。

您可以分配一个指针数组，然后循环为每一行分配内存。这对于缓存局部性来说是有问题的，但如果大小非常大并且您的访问是连续的，则非常好;它允许合理数量的碎片而不会对性能产生巨大影响，因为阵列阵列可以与阵列本身分开，每个阵列可以彼此分开。在线性访问方案中，主要不会在内存区域之间跳转;相反，您甚至可能在移动到新区域之前访问整条线路。

第二种方法是线性化访问并一次性分配所有访问权限;即为sizex * sizey分配足够的内存，然后用(positiony * sizex) + positionx对其进行索引;也就是说，倒计数一些行然后跨越一些列。这非常适合随机访问并改善缓存局部性，因为内存是连续的，但如果没有足够的连续内存可用，它可能会失败（如果您需要的内存多于缓存，则缓存位置优势不适用）。

在C中为二维数组分配内存的最佳方法是什么？

3 个答案: