访问3索引数组的最快方法

时间:2013-08-26 12:16:01

标签: c++ loops optimization memory-management

我有一个包含体积数据的线性数组。数据是灰度级的,即整数值从0到255。

int width  = 100;
int height = 100;
int depth  = 100;

int *texture3DVolume = new int[width*height*depth];
memset(texture3DVolume,0,sizeof(int)*width*height*depth);

我正在使用常数值的球形区域填充数组的某些部分:

    int radius= 5;
    int radius2=radius*radius;
    int centerx =  // some value in [5-95] 
    int centery =  // some value in [5-95] 
    int centerz =  // some value in [5-95] 

    int cxmin=centerx-radius;
    int cxmax=centerx+radius;
    int cymin=centery-radius;
    int cymax=centery+radius;
    int czmin = centerz-radius;
    int czmax = centerz+radius;

    for ( int x= cxmin; x<cxmax; x++)
    {
        int x2 = (x-centerx)*(x-centerx);
        for ( int y=cymin; y<cymax; y++)
        {
            int x2y2= x2+(y-centery)*(y-centery);
            int slice =  textureSizeX* y + x;
            for ( int z=czmin; z<czmax; z++)
            {
                int x2y2z2 = x2y2+(z-centerz)*(z-centerz);
                if ( x2y2z2  < radius2 )
                {
                    texture3DVolume[ txty*z+slice]=255;
                }
            }
        }
    }

这里的问题是我需要访问线性阵列来增强缓存局部性。我认为这种方法虽然正确并不是最快的,因为在z的内循环中,我需要循环连续的值,在我的情况下不是txty*z em>对于txty的每次迭代。

我应该如何修改循环以增强数据访问位置?

1 个答案:

答案 0 :(得分:1)

如果可能,您应该使用std::array

array<array<array<int, 100>, 100>, 100> texture3DVolume;

然后,你应该以某种方式编写循环,最里面的坐标也是最里面的循环。假设您已经检查过,您的最小值和最大值都在您获得的数组边界内,例如:

for (size_t z=czmin; z<czmax; ++z)
{
    for (size_t y=cymin; z<cymax; ++y)
    {
        for (size_t x=cxmin; z<cxmax; ++x)
        {
            texture3DVolume[z][y][x] = 255;
        }
    }
}