我使用NVIDIA的nvcc编译器测试了以下简单代码。当我尝试运行程序时,如果N的值小于或等于512,则运行正常。但是当我尝试将N设置为大于512并运行时,它会产生分段错误。这是什么原因?
#define N 1024 //changing value
int main(int argc, char *argv[]) {
float hA[N][N], hB[N][N], hC[N][N];
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
hA[i][j] = 1;
hB[i][j] = 1;
}
}
}
答案 0 :(得分:1)
基本上有两种方法可以分配矩阵,最常见的是使用指向浮点的指针,然后首先分配外部维度,然后在循环中分配内部维度: / p>
float** hA = new float*[N];
for (size_t i = 0; i < N; ++i)
hA[i] = new float[N];
第二种方法是使用指向数组的指针,然后分配:
float (*hA)[N] = new (float[N])[N];
但是所有这一切都没有实际意义,因为您可能会改为使用std::vector
:
std::vector<std::vector<float>> hA(N);
for (size_t i = 0; i < N; ++i)
hA[i].push_back(std::vector<float>(N));