cuda编译,矢量添加不正确

时间:2013-10-16 13:40:44

标签: ubuntu vector cuda runtime nvidia

我在ubuntu 12.04上使用cuda-5.5在我的gtx570上运行一个简单的代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <math.h>
#include <time.h>
#include <unistd.h>

#include <cuda_runtime_api.h>
#include <cuda.h>
#include "book.h"

__global__ void add(int *a, int *b, int *c){
int tid = blockIdx.x;
if (tid < 10)
        c[tid] = a[tid] + b[tid];
}


int main(void) {

int a[10],b[10],c[10];
int *dev_a,*dev_b,*dev_c;

cudaError_t err = cudaMalloc( ( void**)&dev_a, 10 * sizeof(int) ) ;
if(err != cudaSuccess){
     printf("The error is %s", cudaGetErrorString(err));
}


cudaError_t err2 = cudaMalloc( ( void**)&dev_b, 10 * sizeof(int) ) ;
if(err2 != cudaSuccess){
     printf("The error is %s", cudaGetErrorString(err));
}
cudaError_t err3 = cudaMalloc( ( void**)&dev_c, 10 * sizeof(int) ) ;
if(err3 != cudaSuccess){
     printf("The error is %s", cudaGetErrorString(err));
}


for (int i = 0; i<10 ; i++)
        {
        a[i] = -i;
        b[i] = i*i;
        }


cudaError_t err4 = cudaMemcpy( dev_a,a,10*sizeof(int), cudaMemcpyHostToDevice ) ;
if(err4 != cudaSuccess){
     printf("The error is %s", cudaGetErrorString(err));
}

cudaError_t err5 =cudaMemcpy( dev_b,b,10*sizeof(int), cudaMemcpyHostToDevice ) ;
if(err5 != cudaSuccess){
     printf("The error is %s", cudaGetErrorString(err));
}

add<<<10,1>>>(dev_a,dev_c,dev_c);
if (cudaPeekAtLastError() != cudaSuccess) {
    printf("The error is %s", cudaGetErrorString(cudaGetLastError()));
}
cudaError_t err6 = cudaMemcpy(c,dev_c,10*sizeof(int), cudaMemcpyDeviceToHost);
if(err6 != cudaSuccess){
     printf("The error is %s", cudaGetErrorString(err));
}


for (int i = 0; i<10; i++)
        {
        printf("%d + %d = %d\n", a[i],b[i],c[i]);
        }


cudaFree( dev_a);
cudaFree( dev_b);
cudaFree( dev_c);

return 0 ;
}

此代码编译时没有错误,但提供了无意义的答案:

0 + 0 = -1087278592
-1 + 1 = -1245725046
-2 + 4 = 2139095032
-3 + 9 = 780509949
-4 + 16 = 1195091696
-5 + 25 = -921707890
-6 + 36 = 33554408
-7 + 49 = 936179122
-8 + 64 = 1026206341
-9 + 81 = -1090519076
是的,我从cuda网站上获得了cuda代码 https://developer.nvidia.com/cuda-downloads 是的,我从nvidia网站获得了nvidia驱动程序 http://www.geforce.com/drivers/results/67567

我之前运行过这个,但后来我超级笨拙地破坏了我的ubuntu分区,现在我遇到了麻烦。

编辑: 解决了它,至少它似乎工作。我使用valgrind来发现函数fwrite是segfaulting。奇怪的是fwrite在我的计算机上发生了段错误,但在我之前运行模拟的服务器上却没有。

1 个答案:

答案 0 :(得分:3)

请仔细检查代码的这一行

add<<<10,1>>>(dev_a,dev_c,dev_c);

dev_c未初始化,您要将dev_a值添加到未初始化的值。那是废话发生的地方。