给定 M 行和 N 列的矩阵,并将其分配为M*N
个元素的字节数组(这些元素最初设置为零),我将根据以下规则修改此矩阵:必须将在某个元素的邻域中找到的元素设置为给定值。换句话说,给定一个矩阵,我应该设置矩阵的一个区域:为此,我应该访问不是连续的数组部分。
为了执行上述操作,我可以访问以下信息:
L*L
( L 总是奇数)。实现此操作的代码应该在C ++中尽可能快地执行:因此我想到使用上面的指针来访问数组的不同部分。相反,邻域的中心元素的位置(行和列)可以允许我检查指定区域是否超过矩阵的维度(例如,区域的中心可能位于矩阵的边缘) :在这种情况下,我应该只设置位于矩阵中的那部分区域。
int M = ... // number of matrix rows
int N = ... // number of matrix columns
char* centerPtr = ... // pointer to the center of the region
int i = ... // position of the central element
int j = ... // of the region to be modified
char* tempPtr = centerPtr - (N+1)*L/2;
for(int k=0; k < L; k++)
{
memset(tempPtr,value,N);
tempPtr += N;
}
如何改进代码? 如何处理一个区域可能超出矩阵尺寸的事实? 如何使代码在执行时间方面更有效?
答案 0 :(得分:1)
对于区域不与矩阵外部重叠的一般情况,您的代码可能是最佳的。使用这种代码可能导致的主要效率问题是使外循环遍历列而不是行。这会破坏缓存和分页性能。你还没有那样做。
使用指针与大多数现代编译器几乎没有速度优势。优化器将提供来自普通数组索引的非常好的指针代码。在某些情况下,我看到数组索引代码运行速度比手动调整指针代码快得多。因此,如果索引算法更清晰,请不要使用指针算法。
有8个边界案例:北,西北,西,......,东北。其中每个都需要一个自定义版本的循环来触摸正确的元素。我将展示西北的案例,让你解决剩下的问题。
处理案例的最快方法是3级“if”树:
if (j < L/2) { // northwest, west, or southwest
if (i < L/2) {
// northwest
char* tempPtr = centerPtr - (L/2 - i) * N - (L/2 - j);
for(int k = 0; k < L; k++) {
memset(tempPtr, value, L - j);
tempPtr += N;
}
} else if (i >= M - L/2) {
// southwest
} else {
// west
}
} else if (j >= N - L/2) { // symmetrical cases for east.
if (i < L/2) {
// northeast
} else if (i >= M - L/2) {
// southeast
} else {
// east
}
} else {
if (i < L/2) {
// north
} else if (i >= M - L/2) {
// south
} else {
// no overlap
}
}
这样做很麻烦,但每个地区的比较不会超过3次。