我有一个包含体积数据的线性数组。数据是灰度级的,即整数值从0到255。
int width = 100;
int height = 100;
int depth = 100;
int *texture3DVolume = new int[width*height*depth];
memset(texture3DVolume,0,sizeof(int)*width*height*depth);
我正在使用常数值的球形区域填充数组的某些部分:
int radius= 5;
int radius2=radius*radius;
int centerx = // some value in [5-95]
int centery = // some value in [5-95]
int centerz = // some value in [5-95]
int cxmin=centerx-radius;
int cxmax=centerx+radius;
int cymin=centery-radius;
int cymax=centery+radius;
int czmin = centerz-radius;
int czmax = centerz+radius;
for ( int x= cxmin; x<cxmax; x++)
{
int x2 = (x-centerx)*(x-centerx);
for ( int y=cymin; y<cymax; y++)
{
int x2y2= x2+(y-centery)*(y-centery);
int slice = textureSizeX* y + x;
for ( int z=czmin; z<czmax; z++)
{
int x2y2z2 = x2y2+(z-centerz)*(z-centerz);
if ( x2y2z2 < radius2 )
{
texture3DVolume[ txty*z+slice]=255;
}
}
}
}
这里的问题是我需要访问线性阵列来增强缓存局部性。我认为这种方法虽然正确并不是最快的,因为在z
的内循环中,我需要循环连续的值,在我的情况下不是txty*z
跳1> em>对于txty
的每次迭代。
我应该如何修改循环以增强数据访问位置?
答案 0 :(得分:1)
如果可能,您应该使用std::array
array<array<array<int, 100>, 100>, 100> texture3DVolume;
然后,你应该以某种方式编写循环,最里面的坐标也是最里面的循环。假设您已经检查过,您的最小值和最大值都在您获得的数组边界内,例如:
for (size_t z=czmin; z<czmax; ++z)
{
for (size_t y=cymin; z<cymax; ++y)
{
for (size_t x=cxmin; z<cxmax; ++x)
{
texture3DVolume[z][y][x] = 255;
}
}
}