如何有效地改变矩阵的连续部分?

时间:2013-01-19 01:18:15

标签: c++ performance algorithm

给定 M 行和 N 列的矩阵,并将其分配为M*N个元素的字节数组(这些元素最初设置为零),我将根据以下规则修改此矩阵:必须将在某个元素的邻域中找到的元素设置为给定值。换句话说,给定一个矩阵,我应该设置矩阵的一个区域:为此,我应该访问不是连续的数组部分。

为了执行上述操作,我可以访问以下信息:

  • 指向邻域中心的元素的指针(在上述操作期间不得更改此指针);还提供了此元素的位置(行和列);
  • 邻域的大小L*L L 总是奇数)。

实现此操作的代码应该在C ++中尽可能快地执行:因此我想到使用上面的指针来访问数组的不同部分。相反,邻域的中心元素的位置(行和列)可以允许我检查指定区域是否超过矩阵的维度(例如,区域的中心可能位于矩阵的边缘) :在这种情况下,我应该只设置位于矩阵中的那部分区域。

int M = ... // number of matrix rows
int N = ... // number of matrix columns

char* centerPtr = ... // pointer to the center of the region
int i = ... // position of the central element
int j = ... // of the region to be modified

char* tempPtr = centerPtr - (N+1)*L/2;
for(int k=0; k < L; k++)
{
    memset(tempPtr,value,N);
    tempPtr += N;
}

如何改进代码? 如何处理一个区域可能超出矩阵尺寸的事实? 如何使代码在执行时间方面更有效?

1 个答案:

答案 0 :(得分:1)

对于区域不与矩阵外部重叠的一般情况,您的代码可能是最佳的。使用这种代码可能导致的主要效率问题是使外循环遍历列而不是行。这会破坏缓存和分页性能。你还没有那样做。

使用指针与大多数现代编译器几乎没有速度优势。优化器将提供来自普通数组索引的非常好的指针代码。在某些情况下,我看到数组索引代码运行速度比手动调整指针代码快得多。因此,如果索引算法更清晰,请不要使用指针算法。

有8个边界案例:北,西北,西,......,东北。其中每个都需要一个自定义版本的循环来触摸正确的元素。我将展示西北的案例,让你解决剩下的问题。

处理案例的最快方法是3级“if”树:

if (j < L/2) {  // northwest, west, or southwest
  if (i < L/2) {  
    // northwest
    char* tempPtr = centerPtr - (L/2 - i) * N - (L/2 - j);
    for(int k = 0; k < L; k++) {
      memset(tempPtr, value, L - j);
      tempPtr += N;
    }
  } else if (i >= M - L/2) { 
    // southwest
  } else { 
    // west
  }
} else if (j >= N - L/2) { // symmetrical cases for east.
  if (i < L/2) {  
    // northeast
  } else if (i >= M - L/2) { 
    // southeast
  } else { 
    // east
  }
} else { 
  if (i < L/2) {  
    // north
  } else if (i >= M - L/2) { 
    // south
  } else { 
    // no overlap
  }
}

这样做很麻烦,但每个地区的比较不会超过3次。