由nvcc编译后的分段错误

时间:2013-12-18 06:52:30

标签: c++ c cuda segmentation-fault nvcc

我使用NVIDIA的nvcc编译器测试了以下简单代码。当我尝试运行程序时,如果N的值小于或等于512,则运行正常。但是当我尝试将N设置为大于512并运行时,它会产生分段错误。这是什么原因?

#define N 1024 //changing value
int main(int argc, char *argv[]) {

    float hA[N][N], hB[N][N], hC[N][N];

    for (int i = 0; i < N; i++) {
        for (int j = 0; j < N; j++) {
            hA[i][j] = 1;
            hB[i][j] = 1;
        }
    }
}

1 个答案:

答案 0 :(得分:1)

基本上有两种方法可以分配矩阵,最常见的是使用指向浮点的指针,然后首先分配外部维度,然后在循环中分配内部维度: / p>

float** hA = new float*[N];
for (size_t i = 0; i < N; ++i)
    hA[i] = new float[N];

第二种方法是使用指向数组的指针,然后分配:

float (*hA)[N] = new (float[N])[N];

但是所有这一切都没有实际意义,因为您可能会改为使用std::vector

std::vector<std::vector<float>> hA(N);
for (size_t i = 0; i < N; ++i)
    hA[i].push_back(std::vector<float>(N));