Question

给定 M 行和 N 列的矩阵，并将其分配为M*N个元素的字节数组（这些元素最初设置为零），我将根据以下规则修改此矩阵：必须将在某个元素的邻域中找到的元素设置为给定值。换句话说，给定一个矩阵，我应该设置矩阵的一个区域：为此，我应该访问不是连续的数组部分。

为了执行上述操作，我可以访问以下信息：

指向邻域中心的元素的指针（在上述操作期间不得更改此指针）;还提供了此元素的位置（行和列）;
邻域的大小L*L（ L 总是奇数）。

实现此操作的代码应该在C ++中尽可能快地执行：因此我想到使用上面的指针来访问数组的不同部分。相反，邻域的中心元素的位置（行和列）可以允许我检查指定区域是否超过矩阵的维度（例如，区域的中心可能位于矩阵的边缘）：在这种情况下，我应该只设置位于矩阵中的那部分区域。

int M = ... // number of matrix rows
int N = ... // number of matrix columns

char* centerPtr = ... // pointer to the center of the region
int i = ... // position of the central element
int j = ... // of the region to be modified

char* tempPtr = centerPtr - (N+1)*L/2;
for(int k=0; k < L; k++)
{
    memset(tempPtr,value,N);
    tempPtr += N;
}

如何改进代码？如何处理一个区域可能超出矩阵尺寸的事实？如何使代码在执行时间方面更有效？

Answer 1

对于区域不与矩阵外部重叠的一般情况，您的代码可能是最佳的。使用这种代码可能导致的主要效率问题是使外循环遍历列而不是行。这会破坏缓存和分页性能。你还没有那样做。

使用指针与大多数现代编译器几乎没有速度优势。优化器将提供来自普通数组索引的非常好的指针代码。在某些情况下，我看到数组索引代码运行速度比手动调整指针代码快得多。因此，如果索引算法更清晰，请不要使用指针算法。

有8个边界案例：北，西北，西，......，东北。其中每个都需要一个自定义版本的循环来触摸正确的元素。我将展示西北的案例，让你解决剩下的问题。

处理案例的最快方法是3级“if”树：

if (j < L/2) {  // northwest, west, or southwest
  if (i < L/2) {  
    // northwest
    char* tempPtr = centerPtr - (L/2 - i) * N - (L/2 - j);
    for(int k = 0; k < L; k++) {
      memset(tempPtr, value, L - j);
      tempPtr += N;
    }
  } else if (i >= M - L/2) { 
    // southwest
  } else { 
    // west
  }
} else if (j >= N - L/2) { // symmetrical cases for east.
  if (i < L/2) {  
    // northeast
  } else if (i >= M - L/2) { 
    // southeast
  } else { 
    // east
  }
} else { 
  if (i < L/2) {  
    // north
  } else if (i >= M - L/2) { 
    // south
  } else { 
    // no overlap
  }
}

这样做很麻烦，但每个地区的比较不会超过3次。

如何有效地改变矩阵的连续部分？

1 个答案: